Министерство образования и науки Российской Федерации
УДК 57:51-76; 57.02.001.57
ГРНТИ 34.03.23
Инв. №
УТВЕРЖДЕНО:
Исполнитель:
федеральное государственное бюджетное
образовательное учреждение высшего
профессионального образования «Новосибирский
национальный
исследовательский государственный университет»
От имени Руководителя организации
/ В. А. Собянин / М.П.
НАУЧНО-ТЕХНИЧЕСКИЙ
ОТЧЕТ о выполнении 1 этапа Государственного контракта № 14.740.12.0819 от 15 апреля 2011 г.Исполнитель: федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Новосибирский национальный исследовательский государственный университет»
Программа (мероприятие): Федеральная целевая программа «Научные и научнопедагогические кадры инновационной России» на 2009-2013 гг., в рамках реализации мероприятия № 1.4 Развитие внутрироссийской мобильности научных и научнопедагогических кадров путем выполнения научных исследований молодыми учеными и преподавателями в научно-образовательных центрах.
Проект: «Исследования в области молекулярной биологии, вирусологии, микробиологии и биотехнологии с использованием унифицированной биоинформатической платформы UGENE»
1. Поиск локальной гомологии между вирусными и человеческими белками. 2. Создание рекомбинантных химерных антигенов B.burgdorferi s.l. для диагностики болезни Лайма.
3. Маркеры вирулентности штаммов энтомопатогенных аскомицетов – потенциальных продуцентов микоинсектицидных препаратов. 4. Молекулярное моделирование белкового комплекса протеазы вируса клещевого энцефалита. 5. Изучение глубоководных байкальских губок. 6. Поиск последовательностей гомологичных пептиду-иммуномиметику бензо[a]пирена в протеоме человека и их функциональная аннотация. 7. Поиск флексибильных сайтов по всему геному человека, составление карты флексибильных сайтов генома человека, сопоставление их с Fra-сайтами и с сайтами частых хромосомных перестроек в опухолевых клетках человека. 8. Создание функциональной генной сети с участием нейрофибромина I и II типов (NF1 и NF2): поиск их взаимодействия. 9. Исследования структуры ферментов репарации E. coli и человека методами молекулярной динамики. 10. Исследования процессивности урацил-ДНК-глико-зилазы E. Coli. 11. Иерархический анализ протяженных генетических последовательностей. 12. Поиск протеомных маркеров шизофрении.
Руководитель проекта:
_ / Жарков Дмитрий Олегович / (подпись) Содержание Введение
Заключение
Приложение А (обязательное) Работа с вычислительными задачами молодых ученых по темам краткосрочных исследований
Приложение Б (обязательное) Результаты анкетирования молодых ученых...... Приложение В (обязательное) Методическое пособие по работе с платформой UGENE
Приложение Г (обязательное) Программа курсов повышения квалификации молодых ученых
Реферат Полный отчет выоплнен на 303 с., 1 ч., 15 рис., 8 табл., 86 источн., 16 прил.
анализ вычислительных задач ; биоинформатика, высокопроизводительные вычисления ;
генетическая инженерия, молекулярная вирусология ; молекулярная иммунология ;
молекулярная паразитология ; молекулярная эволюция ; мутагенез ; канцерогенез ;
репарация ДНК ; структурная геномика ; функциональная геномика ; физика биополимеров В отчете представлены результаты исследований, выполненных по 1 этапу Государственного контракта № 14.740.12.0819 «Исследования в области молекулярной биологии, вирусологии, микробиологии и биотехнологии с использованием унифицированной биоинформатической платформы UGENE» 1. Поиск локальной гомологии между вирусными и человеческими белками. 2. Создание рекомбинантных химерных антигенов B.burgdorferi s.l. для диагностики болезни Лайма. 3. Маркеры вирулентности штаммов энтомопатогенных аскомицетов — потенциальных продуцентов микоинсектицидных препаратов. 4. Молекулярное моделирование белкового комплекса протеазы вируса клещевого энцефалита. 5. Изучение глубоководных байкальских губок.
6. Поиск последовательностей гомологичных пептиду-иммуномиметику бензо[a]пирена в протеоме человека и их функциональная аннотация. 7. Поиск флексибильных сайтов по всему геному человека, составление карты флексибильных сайтов генома человека, сопоставление их с Fra-сайтами и с сайтами частых хромосомных перестроек в опухолевых клетках человека. 8. Создание функциональной генной сети с участием нейрофибромина I и II типов (NF1 и NF2): поиск их взаимодействия. 9. Исследования структуры ферментов репарации E. coli и человека методами молекулярной динамики. 10. Исследования процессивности урацил-ДНК-глико-зилазы E. Coli. 11. Иерархический анализ протяженных генетических последовательностей. 12. Поиск протеомных маркеров шизофрении.» (шифр «2011-1.4-501-001») от 15 апреля 2011 г. по направлению «Проведение поисковых научноисследовательских работ в целях развития общероссийской мобильности в области биологии, сельскохозяйственных наук и технологий живых систем» в рамках мероприятия 1.4 «Развитие внутрироссийской мобильности научных и научно-педагогических кадров путем выполнения научных исследований молодыми учеными и преподавателями в научнообразовательных центрах», мероприятия 1.4 «Развитие внутрироссийской мобильности научных и научно-педагогических кадров путем выполнения научных исследований молодыми учеными и преподавателями в научно-образовательных центрах», направления «Стимулирование закрепления молодежи в сфере науки, образования и высоких технологий» федеральной целевой программы «Научные и научно-педагогические кадры инновационной России» на 2009-2013 годы.
Цель работы — 1. Получение и применение новых знаний по информационным технологиям для конкретных исследовательских тематик в области молекулярной биологии, вирусологии, микробиологии и биотехнологии. 2. Генерация и анализ новых научных результатов. 3. Повышение уровня квалификации и мобильности научных и научнопедагогических кадров.
Микробиологические, биохимические, молекулярно-биологические, радиологические методы — амплификация фрагментов ДНК методом ПЦР; выделение плазмидной ДНК из E.coli; гидролиз ДНК эндонуклеазами рестрикции II типа; выделение ДНК из агарозного геля; легирование фрагментов ДНК; трансформация компетентных клеток E. coli;
приготовление компетентных клеток E. coli (штамм Rosetta 2, фирма «Novagen»); анализ белков методом электрофореза в ПААГ; аффинная хроматография; твёрдофазный иммуноферментный анализ; молекулярно-генетические маркеры; методы выделения нуклеиновых кислот; ПЦР в реальном времени; олигодезоксирибонуклеотиды (ОДН) разной длины; радиоактивное мечение; легирование; экспонирование геля; радиолюминесцентное сканирование; аффинная хроматография, концентрирование белков, электрофорез по методу Laemmli, трипсинолиз, MALDI-TOF масс-спектрометрия, анализа масс-спектров;
идентификация белков; выделение, очистка и характеризация штаммов; биотестирование культур; ВЭЖХ; спектрофотометрия; секвенирование ITS региона ядерной р.ДНК;
полногеномное секвенирование. Методы биоинформатики, молекулярного моделирования BLAST; HMMER; моделирование рекомбинантных ДНК и структуры белков; выравнивание с имеющимися в компьютерных базах данных GenBank; амплификация ДНК с ISSR праймерами; скрининг по гомологии; скрининг с кластеризацией; конструирование трехмерной структуры белка; построение филогенетических деревьев; множественное выравнивание; поиск и сравнительный анализа структурных элементов ДНК/мтДНК;
реляционный (логико-вероятностный) метод извлечения знаний Discovery; поиск по базам данных.
Микробиологическое, биохимическое, молекулярно-биологическое, радиологическое оборудование, реактивы — ДНК-лигазы бактериофага Т4 («СибЭнзим», Россия; «Promega», США) электропоратор («PeqLab, Biotechnologie GmbH, Германия»), E.coli штамм Rosetta («Novagen»), аффинный сорбент (“Quiagen”); Ридер «Multiscan» (Финляндия). Боксы, ротационные шейкеры BioSan, автоклавы, термостаты, микроинъекторы, весы Pioneer, центрифуги Eppendorf, световые микроскопы Zeizz); термохроны, гигрохроны Relsib, UV радиометры PCE; спектрофотометр Multiscan Ascent (Thermo scientific), жидкостный хроматограф Agilent 1100 series: ПЦР-боксы; амплификатор"БИС"- М112, секвенатор, трансиллюминатор WUV-M20 (DAIHAN Scientific), система гель-документации WGD-20;
Кит для выделения ДНК DNeasy Plant Mini Kit (50) (Qiagen), набор для очистки ДНК (Цитокин). Набор Genome Lab DTCS_Quick Start Kit (“Beckman Coulter”), секвенатор CEQ 8800 (“Beckman Coulter”). Радиолюминесцентный экран Image Screen K (Kodak, США), система Molecular Imager FX (Bio-Rad, США). Хроматограф Agilent Technologies, прибор для электрофореза Protean II xi Cell (Bio – Rad, США), набор белков фирмы «Bruker Daltonics»
(Германия), MALDI-TOF масс-спектрометр Autoflex («Bruker Daltonics», Германия).
Программное обеспечение — Платформа UGENE версия 1.9.4 (Унипро, Россия); SigmaStat 3;
MS Excel; Statistica 6.4; программа UCSF Chimera v 1.5.2; пакет MrBayes v. 3.1.2; сервер Mfold v. 3.2, программа ANDCell; PDB Validator пакета GUI-BioPASED; программа BioPASED; суперкомпьютер NKS-30T ССКЦ; программа MDTRA; программа QuantityOne v.4.6.8. (Bio-Rad, США); программа SigmaPlot v 9.0 (SPSS, США). программа DynaFit 4. (Biokin, США); программа Maple v.13 (Канада); Программное обеспечение FlexControl 2.4, FlexAnalysis 2.4, фирмы «Bruker Daltonics» (Германия), программы Mascot («Matrix Science», США), программный модуль ExpertDiscovery.
1. Найдено два неохарактеризованных мембранных белка человека, гомологичных с белками вируса иммунодефицита человека. Для белков вирусов гепатита C и гриппа A найдены гомологичные человеческие белки.
2. Впервые получены продуценты рекомбинантных химерных белков, состоящие из антигенов OspC западносибирских изолятов B.garinii и B.afzelii и фрагмента антигена р B.garinii. Выделены соответствующие рекомбинантные химерные антигены, оценены их свойства с точки зрения пригодности для диагностики болезни Лайма.
специализацию в паразитической или в некротрофной фазе жизненного цикла патогена.
Выделена группа степных штаммов, проявляющих толерантность к высоким температурам и пониженной влажности.
группспецифичными заменами, ведущими к изменению физико-химических свойств аминокислот, и, следовательно, пространственной структуры вирусных белков, является делеция в капсидном белке С (позиция 111) и мутации в неструктурном белке NS3: RK (позиция 16) и 1534 SF (позиция 45).
митохондриального генома у 36 губок, из которых 31 принадлежит байкальским эндемичным губкам (Lubomirskiidae, 8 видов) и 5 – космополитным губкам (Spongillidae, вида). Впервые показано, что вариабельные некодирующие последовательности мтДНК могут быть использованы в качестве диагностического маркера при идентификации видов губок семейства Lubomirskiidae, а также пригодны для популяционного анализа. Показано, что глубоководные образцы байкальских губок, поднятые с глубин от 550 до 1342 метров, принадлежат видам B. intermedia profundalis (4 образца), B. martinsoni (3 образца) и B.
bacillifera (1 образец).
6. Получен пептид-иммуномиметик, который рассматривается как потенциальная гаптен-специфическая компонента антиканцерогенной вакцины. Показано отсутствие последовательностей гомологичных пептиду-иммуномиметику бензо[a]пирена в протеоме животных Mus. Musculus и человека.
7. Создан прототип карты флексибильных районов генома человека. Получены данные о том, что флексибильные сайты лежат в основе частых сайтов ломкости на хромосоме 7.
Получены экспериментальные данные, подтверждающие участие флексибильных сайтов в механизмах внутрихромосомной амплификации.
принадлежащих семействам CRE и SP1. Обнаружены общие функциональные пути и взаимосвязь предсказанных транскрипционных факторов с нейрофибромином I и II типов.
Обнаружен медицинский препарат с положительным эффектом на модели NF1 у мышей.
9. Показано, что из четырех возможных зарядовых состояний каталитических аминокислотных остатков Pro1 и Glu2 оптимальными для катализа являются депротонированный нейтральный остаток Pro1 и протонированный нейтральный остаток Glu2. Установлено, что при наличии аденина напротив oxoG остаток Arg109, который в норме интеркалирован внутрь спирали ДНК, изменяет конформацию, что приводит к искажению структуры активного центра.
10. Разработан новый метод изучения коррелированного поиска специфических мишеней в ДНК ферментами репарации. Получены данные о процессивности урацил-ДНКгликозилаз и АП-эндонуклеаз человека и E. coli. Показано что хоппинг вносит основной вклад в общий механизм транслокации Ung по ДНК, а характерная дистанция слайдинга составляет примерно 9 пар нуклеотидов.
11. Подготовлено методическое пособие по практическим аспектам реляционного метода извлечения знаний. Создан модуль ExpertDiscovery, интегрированный в программный пакет UGENE с сохранением своей полной функциональности.
12. Получена сводная таблица всех белков, выделенных из сыворотки крови больных шизофренией, встречающихся хотя бы у одного больного шизофренией, и не встречающихся у здоровых людей. Выявлены различия в электрофоретическом распределении белков у больных шизофренией, в отличие от группы здоровых лиц. Получены белки, которые предположительно могут играть роль маркера, или регуляторного белка, участвующего в патогенезе шизофрении и сопутствующих психоневрологических заболеваний.
Введение Современная молекулярная биология, одна из наиболее бурно развивающихся областей науки и основ высокотехнологичной индустрии, немыслима без широкого применения средств вычислительной техники. В ходе решения повседневных практических молекулярно-биологических задач перед исследователями постоянно встает необходимость проведения таких операций, как поиск определенных последовательностей в базах данных ДНК и белков, анализ гомологии этих последовательностей, их физико-химических свойств, планирование операций молекулярного клонирования, разработка и оптимизация процедур полимеразной цепной реакции, визуализация первичной и третичной структуры белков и т.п.
Поэтому одним из магистральных направлений развития современной инфраструктуры биологических исследований в последнее десятилетие стало создание многочисленных инструментов для биоинформатического анализа и платформ, объединяющих эти инструменты.
В целом все существующие биоинформатические платформы можно разделить на два класса: основанные на онлайн-технологиях и осуществляемые в основном на пользовательской стороне (standalone). В качестве примеров платформ, основанных на онлайн-технологиях, можно назвать биоинформатические порталы NCBI Национального центра биотехнологической информации США (http://www.ncbi.nlm.nih.gov), EMBL-EBI Европейского института биоинформатики (http://www.ebi.ac.uk) или ExPASy Швейцарского института биоинформатики (http://expasy.org). Все эти платформы исторически строились вокруг крупных баз данных последовательностей нуклеиновых кислот и белков, поэтому основной акцент в них сделан на поиск последовательностей в базах данных и анализ гомологии последовательностей. Несмотря на то, что каждый из этих порталов широко используется специалистами в области биоинформатики, следует отметить, что биоинформатические инструменты, наиболее полезные для повседневной работы в экспериментальной молекулярно-биологической лаборатории, зачастую разбросаны по разным интернет-ресурсам, что затрудняет их использование. В то же время подавляющее большинство standalone-программ предназначены для решения достаточно узкого круга задач; многие из них не способны к взаимодействию с онлайн-ресурсами, что затрудняет использование сторонних баз данных.
Одной из наиболее глубоко проработанных и интегрированных платформ, основанных на идеологии «пользовательской стороны», является программный пакет UGENE, разработанный и поддерживаемый Новосибирским центром информационных технологий «УниПро». Пакет сочетает разнообразные инструменты как рутинного, так и продвинутого биоинформатического анализа, обладает простым, но гибким пользовательским интерфейсом и обеспечивает поддержку современных высокопроизводительных вычислений, в том числе распределенных. Такие характеристики делают UGENE многообещающим средством, которое могут использовать в своей работе как молекулярные биологи-экспериментаторы, так и биоинформатики.
Данная поисковая научно-исследовательская работа была направлена на адаптацию пакета UGENE для решения ряда конкретных проблем, которые представляют собой примеры задач из разных областей молекулярной биологии. Эти задачи можно объединить в следующие группы: поиск последовательностей в базах данных на основании гомологии с заданной последовательностью, построение филогенетических деревьев, поиск паттернов в группах последовательностей, разработка схем молекулярного клонирования in silico, анализ пространственных структур белков и ДНК, анализ физико-химических свойств белков и ДНК. В ходе выполнения проекта все задачи были успешно решены. Также был получен ряд предложений по усовершенствованию платформы UGENE, которые либо уже имплементированы к настоящему времени, либо войдут в ближайшие релизы пакета.
Детальная информация о работе молодых ученых с платформой UGENE сгруппирована в приложениях А–В.
Заключение Результаты выполнения поисковой научно-исследовательской работы дают основания полагать, что программный пакет UGENE может стать инструментом, ежедневно используемым в молекулярно-биологических работах. С помощью средств, имплементированных в пакете, были решены задачи из таких разных областей, как молекулярная вирусология, молекулярная иммунология, генетическая инженерия, молекулярная паразитология, физика биополимеров, молекулярная эволюция, мутагенез, канцерогенез и репарация ДНК, структурная и функциональная геномика. Широкий спектр функций UGENE предоставляет возможность использования этого пакета и во многих других областях молекулярной биологии. Запланированные показатели выполнения проекта достигнуты в полном объеме.
В ходе работы над проектом были выявлены направления для дальнейшего усовершенствования платформы UGENE. Например, может быть значительно расширена часть пакета, предназначенная для визуализации пространственных структур биомакромолекул и их анализа. Активное развитие протеомики в последние годы делает актуальным реализацию алгоритмов поиска в базах данных не только последовательностей, гомологичных заданной последовательности, но также пептидов, соответствующих экспериментально определенным молекулярным массам. Также участниками работы были сделаны многочисленные предложения по улучшению отдельных функций UGENE и усовершенствованию пользовательского интерфейса.
Следует отметить, что неоценимый вклад в успех работы внесло то, что местом ее выполнения был Новосибирский государственный университет. Высокая квалификация сотрудников НГУ, принимавших участие в работе, позволила молодым ученым получить необходимые для своей работы консультации с привлечением новейшей научной информации. Организационные возможности НГУ помогли провести школу для молодых ученых с практическими занятиями по работе с платформой UGENE, лекциями по современным проблемам молекулярной биологии и вычислительным подходам к решению биологических проблем, и ознакомлением с институтами СО РАН. С другой стороны, успешное выполнение работы было бы невозможно без активного участия сотрудников Новосибирского центра информационных технологий «Унипро», которые тесно взаимодействовали с молодыми учеными по конкретным вопросам работы с UGENE.
Успешное сотрудничество между НГУ и «Унипро» в области биоинформатики, получившее новый импульс благодаря Федеральной целевой программе «Научные и научнопедагогические кадры инновационной России», планируется продолжить в будущем с целью изучения возможности разработки обучающих технологий на базе платформы UGENE..
Работа с вычислительными задачами молодых ученых по темам краткосрочных исследований А1 Анализ вычислительных задач Было проведено анкетирование молодых ученых по нескольким аспектам:
вычислительной части их ПНИР и научной работы в целом вычислительной биологии опыт работы с платформой UGENE, если таковой был ранее какое программное обеспечение используется постоянно в их научной работе опыт использования параллельных вычислительных алгоритмов Данные анкетирования представлены в приложении Б, а также доступны по ссылке https://ugene.unipro.ru/fcp/doku.php Из анализа ответов и интерактивного общения с пользователями стало понятно, что на данном этапе развития функциональных возможностей платформы UGENE для некоторых она может помочь пока лишь в небольшой части обработки данных, для других — стать полноценным инструментом в ряду других программ, для третьих — исполнить роль основного инструмента вычислительной обработки. Все участники проявили интерес к получению знаний по высокопроизводительным вычислениям в биологии.
А2 Школа-семинар «Вычислительные задачи молекулярной биологии и платформа UGENE»
С учетом анкетирования молодых ученых в процессе обсуждения с участниками проекта от НГУ было принято решение о проведении школы-семинара для близкого знакомства с платформой UGENE и ее возможностей для научно-исследовательских задач участников. Второй целью совместной работы явилось более детальное знакомство молодых ученых с принципами высокопроизводительных вычислений и их применением в вычислительной биологии, а также решение практических задач на вычислительном кластере НГУ. Ниже приведена программа школы-семинара.
«Вычислительные задачи молекулярной биологии и платформа UGENE»
29-30 мая – приезд и размещение иногородних участников 12. Вступительное слово о НГУ и биомедицинских образовательных Ауд. 257 главного корпуса НГУ 13.00 – 13. Лекция руководителя НОЦ НГУ «Молвир» чл.-корр РАН профессора Ауд. 257 главного корпуса НГУ 13.15 – 13.45 С.В. Нетесова («Молекулярно-эпидемиологические исследования Лекция руководителя проекта д.б.н., профессора Жаркова Д.О. Ауд. 257 главного корпуса НГУ "Вычислительные задачи в биохимических и молекулярнобиологических исследованиях: опыт комплексного изучения Ознакомительная презентация по UGENE, разбор практических Ауд. 257 главного корпуса НГУ 15.30-17.00 примеров, ответы на вопросы 17.15 – 18. Отнести ноутбуки через дорогу в Лабораторию НГУ-Интел Научное кафе «Эврика», тема "Оцениваем Science", вход бесплатный Арт-клуб НИИ КуДА (ул. Терешковой, 12А) http://www.niikuda.ru/niokr.php 19.00 -20. 9.00 – 9.30 Решение оргвопросов молодых ученых в НИЧ НГУ Встреча на 1-ом этаже главного корпуса 9.45 – 11.15 Семинар «Использование параллельных алгоритмов в биоинформатике и Ауд. 4 юридического корпуса НГУ оптимизированные вычисления в UGENE».
11.30 – 13.15 Практическое занятие по запуску расчетных задач на кластере НГУ Ауд. 4 юридического корпуса НГУ 14. 14.55 – 15. 15.00 – 16.00 Разбор вычислительных задач по темам краткосрочных ПНИР Ауд. 4 юридического корпуса НГУ 16.15 – 17.15 Разбор вычислительных задач по темам краткосрочных ПНИР Ауд. 4 юридического корпуса НГУ Сходить за ноутбуками в Лаб НГУ-Интел (через дорогу) 10.00 – 10.25 Презентация д.ф.-м.н. профессора Е.Е.Витяева «Реляционный подход к Ауд. 257 главного корпуса НГУ интеллектуальному анализу данных Discovery и его применение в 10.40 – 12.00 Семинар Ирины Хомичевой по обучению участников проекта основам Ауд. 257 главного корпуса НГУ реляционного метода извлечения знаний ExpertDiscovery.
13. 13.50 -13. Переход ногами или проезд на микроавтобусе до главного корпуса НГУ 15.00 -15. 15.15 – 16.45 Консультации по вычислительным задачам индивидуальных ПНИР Ауд. 4 юридического корпуса НГУ 17.00 – 18.30 Консультации по вычислительным задачам индивидуальных ПНИР Ауд. 4 юридическог корпуса НГУ 10.00 – 12.00 Консультации по вычислительным задачам индивидуальных ПНИР Ауд. 4 юридического корпуса НГУ Все участники прослушали лекции чл.-корр. С. В. Нетесова, д.б.н. Д. О. Жаркова, проф.
Е. Е. Витяева, М. Ю. Фурсова. Семинары и практические занятия проводились под руководством и при поддержке инженеров-программистов Унипро, при инфраструктурном и техническом обеспечении лаборатории НГУ-Интел.
За время практической работы с платформой UGENE было разобрано несколько типичных вычислительных задач, возникающих при обработке результатов экспериментов с нуклеотидными последовательностями.
Также инженеры Унипро осуществили интеграцию платформы с вычислительным кластером НГУ, что сделало возможным проведение практических занятий с помощью ресурсов этого кластера. Было разобрано несколько примеров с запуском расчетов на кластере НГУ.
Отдельный семинар был посвящен специализированной версии платформы ED-UGENE, которая была реализована в сотрудничестве с группой проф. Е. Е. Витяева для иерархического анализа биологических данных.
Все три типа практических задач собраны в методическом пособии, которое было подготовлено коллективом Унипро специально для Школы-семинара, которое приведено в приложении В и доступно по ссылке http://ugene.unipro.ru/rus/documentation.html.
По окончании школы участники — молодые ученые — получили сертификаты (см.
рисунок А2.1).
Рисунок А2.1 — Сертификат участника Школы-семинара.
Коллективами НГУ и лаборатории НГУ-Интел совместно были организованы экскурсии на вычислительные кластеры НГУ, ССКЦ СО РАН – Intel и Центра коллективного пользования «Биоинформатика», в ЦКП «Секвенирование», в Технопарк Академгородка, в НЦИТ «Унипро».
А3 Работа по вычислительным задачам с использованием Индивидуальная работа с каждым участником по интересующему его кругу вычислительных задач выявила: а) особенности применения различных функционалов платформы; б) необходимость корректировки некоторых модулей для большего удобства использования; в) возможности расширения применений платформы при наращивании прикладных модулей.
В течение школы-семинара каждый молодой ученый имел возможность длительной работы с программистами-консультантами Унипро. Очные консультации и в режиме онлайн были продолжены и далее в течение проекта Все технические пожелания молодых ученых были занесены в открытую онлайн систему трэкинга развития проекта https://ugene.unipro.ru/tracker/secure/Dashboard.jspa и могут быть просмотрены при задании в системе меток поиска fcp; и fcp.
Далее приводятся отзывы участников по участию в Школе-семинаре и результаты работы с их индивидуальными пожеланиями к системе.
А3.1 Поиск локальной гомологии между вирусными и человеческими А3.1.1 Отчет участницы о работе на Школе-семинаре Бакулина Анастасия Юрьевна, ФГУН ГНЦВБ «Вектор»: Я научилась работать с программой Ugene, узнала принципы ее разработки и перспективы развития. Разработчики программы консультировали меня по вопросам, не отраженным в документации, и помогали найти оптимальный способ решения моих практических задач. В частности, я научилась строить филогенетические деревья и искать сходство аминокислотных последовательностей с помощью HMMER. Сейчас Ugene имеет мало функций для работы с белковыми пространственными структурами, но я надеюсь на их скорое появление, и планирую всячески содействовать интеграции в Ugene таких программ.
Также хотелось бы отметить очень интересные экскурсии и эффективное неформальное общение. По итогам школы-семинара я нашла интересные варианты сотрудничества с другими участниками и уже сейчас начала работать над двумя новыми проектами, не упомянутыми в моей заявке.
А3.1.2 Результаты индивидуальной работы с участницей Поиск последовательностей всех человеческих мембранных белков проведен методом BLAST в программе UGENE. Пожелания участницы по работе с программой учтены и частично реализованы в ходе проекта.
а) Сделать поддержку внешних программных инструментов сторонних производителей для работы с конструктором вычислительных схем. — Реализовано и вошло в версию 1.9.4, выпущенную 12.07.2011 (https://ugene.unipro.ru/tracker/browse/UGENE-253).
б) Добавить большее количество опций для работы с функционалом BLAST. — Будет реализовано и войдет в версию 1.10 (https://ugene.unipro.ru/tracker/browse/UGENE-311).
в) Сделать новый элемент для констуктора вычислительных схем, возможно скриптовый, — фильтр по любым признакам. — Будет реализовано в версии 1. (https://ugene.unipro.ru/tracker/browse/UGENE-580).
А3.2 Создание рекомбинантных химерных антигенов B.burgdorferi s.l.
А3.2.1 Отчет участника о работе на Школе-семинаре Рябченко Александр Владимирович, НИИ биохимии СО РАМН: В ходе обучения на платформе UGENE были освоены методы выравнивания нуклеотидных и аминокислотных последовательностей; поиск гомологичных генов в известных базах данных (GeneBank);
создание вычислительных схем для решения биологических задач и их запуск на кластере НГУ. На семинаре я так же ознакомился с модулем Expert Discovery и возможностью его использования для решения практических задач по поиску комплексных сигналов на выровненной выборке.
На самостоятельных занятиях я освоил модуль программы UGENE позволяющий моделировать плазмидные ДНК — векторы для экспрессии генов. В ходе этих занятий были построены несколько гибридных молекул ДНК на основе вектора pET36b(+), содержащих в своей структуре под регуляторной областью промотора гены боррелий (OspA, OspC, p39 и p83). На этих моделях была показана возможность клонирования слитых генов боррелий, определены сайты рестрикции — разработана стратегия их клонирования. В целом в результате проделанной мною работы были выявлены некоторые сбои (баги) программы UGENE и составлен список пожеланий и рекомендаций направленный на улучшение пользовательских качеств платформы UGENE.
А3.2.2 Результаты индивидуальной работы с участником Моделирование конструкций плазмидных ДНК, химерных генов и белков произведено в программе UGENE. А. В. Рябченко показал себя самым активным участником при обучении работе на платформе UGENE. По результатам индивидуальной работы с участником в онлайн-трэкере заведено 17 новых пунктов (issues). Часть из них уже реализована в течение проекта, например, возможность убирать рамки трансляции в окне «Sequence view» (https://ugene.unipro.ru/tracker/browse/UGENE-366). Другие пожелания оставлены для реализации в следующих версиях программы, например, такие как встраивание некоторых параметров из программы AnnHyb (расчет температуры плавления праймеров, GC-контент и т.д., https://ugene.unipro.ru/tracker/browse/UGENE-374).
А3.3 Определение генотипических и фенотипических маркеров вирулентности и устойчивости к лимитирующим факторам А3.3.1 Отчет участника о работе на Школе-семинаре Крюков Вадим Юрьевич, ИСиЭЖ СО РАН: С помощью UGENE проведен BLASTанализ нуклеотидных последовательностей ITS региона штаммов энтомопатогенного гриба Metarhizium, различающихся по уровню вирулентности и формам трофической специализации. На основании полученных результатов культуры отнесены к патоварианту Metarhizium anisopliae var. anisopliae (в понимании ряда авторов – самостоятельному виду M.
anisopliae). Таким образом, мы предполагаем, что внутри одного патоварианта также могут существовать формы, проявляющие трофическую специализацию в паразитической или в некротрофной фазе жизненного цикла патогена.
А3.3.2 Результаты индивидуальной работы с участником Анализ нуклеотидных последовательностей методом BLAST сделан на платформе UGENE. Исследованы возможности построения филогенетических деревьев на базе платформы.
Работа с пожеланиями участника:
а) Скорректировать механизм скачивания последовательностей из удаленных баз данных. — Реализовано, войдет в версию 1.10 (https://ugene.unipro.ru/tracker/browse/UGENEб) Обсуждены с разработчиками перспективы работы с филогенетическими данными на базе платформы.
А3.4 Молекулярное моделирование белкового комплекса NS2B-NS протеазы вируса клещевого энцефалита Сибирского субтипа А3.4.1 Отчет участницы о работе на Школе-семинаре В работе школы принимала участие У. В. Потапова, соавтор Н. В. Кулаковой по заявленной теме ПНИР, которая представила следующий отчет.
Потапова У. В.: В рамках Школы-семинара выполнены следующие этапы работы.
1) Подробное ознакомление с программным пакетом UGENE 2) Освоение навыков использования различных биоинформатических инструментов, 3) Освоение методики работы с удаленными базами биологических данных, постановка вычислительных задач на удаленном кластере НГУ, извлечение необходимых нуклеотидных и аминокислотных последовательностей.
4) Обработка биологических последовательностей сериновой протеазы для семи различных флавивирусов (выравнивание, усечение, поиск паттернов) 5) Создание матрицы последовательностей флавивирусной протеазы для моделирования по гомологии трехмерной структуры комплекса NS2B-NS протеазы вируса клещевого энцефалита.
А3.4.2 Результаты индивидуальной работы с участницей В результате интерактивной работы с Н. В. Кулаковой и У. В. в онлайн-трэкере заведено 6 новых пунктов (issues) по работе с окном визуализации последовательностей Sequence View. Часть этих пожеланий уже реализована:
https://ugene.unipro.ru/tracker/browse/UGENE- https://ugene.unipro.ru/tracker/browse/UGENE- https://ugene.unipro.ru/tracker/browse/UGENE- Остальные буду реализованы позднее:
https://ugene.unipro.ru/tracker/browse/UGENE- https://ugene.unipro.ru/tracker/browse/UGENE- https://ugene.unipro.ru/tracker/browse/UGENE- А3.5 Анализ генетического разнообразия глубоководных губок озера А3.5.1 Отчет участницы о работе на Школе-семинаре Майкова Ольга Олеговна, ЛИН СО РАН: В рамках работы школы-семинара нас ознакомили со всеми возможностями при работе на вычислительной платформе UGENE. Я считаю, что наше общение с разработчиками этой программы было очень продуктивным и полезным для обеих сторон. Мне очень понравился индивидуальный подход к каждому из участников проекта при разборе практических задач по конкретным проблемам. Все было проведено на профессиональном уровне. Особенно приятна перспектива дальнейшего сотрудничества, когда общение биолога с программистом приносит практическую пользу при усовершенствовании программы UGENE и вместе с тем значительно облегчает работу биолога.
А3.5.2 Результаты индивидуальной работы с участницей последовательностей, поиск и сравнение инвертированных повторов в исследованных участках мтДНК. Участницей также были высказаны пожелания по улучшению некоторых функциональностей платформы:
а) Создать скриптовый сценарий для конструктора вычислительных схем (Workflow Designer) для численного сравнения наборов палиндромов для различных видов губок по заданным критериям (https://ugene.unipro.ru/tracker/browse/UGENE-516).
б) Улучшения в плагине поиска повторов (https://ugene.unipro.ru/tracker/browse/UGENEА3.6 Поиск последовательностей гомологичных пептидуиммуномиметику бензо[a]пирена в протеоме животных Mus.
Musculus и человека, и их функциональная аннотация А3.6.1 Отчет участницы о работе на Школе-семинаре Апалько Светлана Вячеславовна, ИЭЧ СО РАН: Были получены новые знания и консультационная и техническая поддержка по организации и проведению вычислений с помощью UGENE в локальном и сетевом режиме. Было проведено обучение по использованию параллельных алгоритмов и оптимизированных версий.
UGENE позволяет исследовать последовательность, проводя поиск гомологов с последующим множественным выравниванием последовательностей. Использование такого визуализацией, многоформатностью и многозадачностью, кажется наиболее подходящим для рутинного анализа данных.
А3.6.2 Результаты индивидуальной работы с участницей Для решения задач ПНИР с помощью UGENE был проведен поиск коротких аминокислотных последовательностей в протеоме животных Mus. Musculus и человека, гомологичных последовательности пептида-иммуномиметика бензо[a]пирена. Для получения корректных результатов по поиску гомологии коротких пептидов, в частности пептида-иммуномиметика бензо[a]пирена — LHLPHHDGVGWGGGGS, требуется определенная задача параметров поиска.
Было установлено, что программное обеспечение UGENE не оптимизировано для поиска гомологии коротких последовательностей. Устранение ряда выявленных недостатков и оптимизация UGENE даст новый импульс для дальнейшего совершенствования пакета и выполнения при помощи усовершенствованной версии поставленных задач.
Зафиксирован ряд пожеланий по улучшению функционала:
а) Добавить поиск BLAST с сайта expasy.org (https://ugene.unipro.ru/tracker/browse/UGENE-505).
б) Добавить большее количество опций для работы с функционалом BLAST (https://ugene.unipro.ru/tracker/browse/UGENE-311).
А3.7 Поиск флексибильных сайтов по всему геному человека, составление карты флексибильных сайтов генома человека, сопоставление их с Fra-сайтами и с сайтами частых хромосомных перестроек в опухолевых клетках человека А3.7.1 Отчет участницы о работе на Школе-семинаре Маценко Наталья Юрьевна, НИИМББ СО РАМН: Полезные практические навыки использования платформы UGENE применительно к поставленной в рамках проекта задаче были получены мной в процессе семинарских занятий с элементами инженерного тренинга при индивидуальных консультациях специалиста «Унипро».
В рамках школы была начата работа с сотрудником «Унипро» по созданию дополнительных опций UGENE для решения поставленной в рамках проекта задачи. Сейчас мы активно сотрудничаем по данному проекту.
конструктивный обмен мнениями, данными и знаниями аспирантов и молодых ученых о состоянии, тенденциях развития биоинформатического направления и его применения в своих сферах научной деятельности достигнута.
Я высоко оцениваю уровень подготовки и проведения Школы – семинара, как с образовательной, так и с культурно-познавательной стороны. Необходимо отметить высокий уровень докладов, представленных лекторами школы-семинара.
А3.7.2 Результаты индивидуальной работы с участницей а) Специально для целей данной ПНИР был создан новый плагин по поиску сайтов ломкости в ДНК (https://ugene.unipro.ru/tracker/browse/UGENE-421), который вошел в релиз 1.9.4 от 12.07.2011.
После этого поиск флексибильных районов ДНК в геноме человека и сопоставление их локализации с местоположением известных сайтов ломкости проводилось с помощью биоинформатической платформы UGENE. На данном этапе работы для более удобной работы с полученными данными разработчики UGENE адаптируют программу для графического отображения мест локализации сайтов флексибильности в геноме человека.
б) С помощью алгоритма Clustal W2, входящей в состав UGENE анализировали гомологию нуклеотидных последовательностей флексибильных районов в фрагменте хромосомы 17q12-q21 и сайтов флексибильности в известных сайтах ломкости.
в) Также было реализованы статистические опции для редактора выравниваний (https://ugene.unipro.ru/tracker/browse/UGENE-422).
А3.8 Создание функциональной генной сети с участием А3.8.1 Отчет участницы о работе на Школе-семинаре Головнина Ксения Александровна, ИЦиГ СО РАН: Организация школы проведена на высоком уровне. Эффективность школы для дальнейшего решения поставленных задач в рамках своей работы я оцениваю очень положительно. Наиболее полезными и интересными были лекции об общих принципах работы UGENE, обновлениях программы, возможности проводить расчеты на кластере. Практические занятия с индивидуальными проектами дали возможность более глубоко изучить конструктор вычислительных схем. Совместно с сотрудниками компании «Унипро», которые выступали консультантами на практических занятиях, удалось провести поиск сайтов связывания транскрипционных факторов в промоторе гена NF1, а также найти возможные гомологи, сделать выравнивание последовательностей и самое главное сориентироваться как автоматизировать процессы для высокопроизводительных задач. Данные задачи являются важными этапами для выполнения индивидуального проекта по созданию функциональной генной сети с участием нейрофибромина I и II типов (NF1 и NF2).
А3.8.2 Результаты индивидуальной работы с участницей Для достижения поставленной цели использованы новые биоинформационные подходы, успешно используемые ранее для подобных задач, реализованные в программах, разработанных в Институте Цитологии и Генетики СО РАН и совместно с компанией Унипро (ANDCell, UGENE), а также доступные онлайн ресурсы. В рамках проекта был проведен анализ регуляторных районов NF1, NF2 генов в 5’ не транслируемых областях на предмет сайтов связывания транскрипционных факторов (ТФ). Работа выполнена при помощи встроенного плагина SITECON на платформе UGENE.
Также учтены пожелания по улучшению возможностей платформы:
а) Добавлен функционал перемены мест последовательностей в редакторе выравниваний (https://ugene.unipro.ru/tracker/browse/UGENE-238).
б) Имя SITECON-модели удобно сделать ссылкой на какую-то страницу с описанием этой модели (https://ugene.unipro.ru/tracker/browse/UGENE-532).
А3.9 Исследования структуры ферментов репарации E.coli и человека методами молекулярной динамики А3.9.1 Отчет участника о работе на Школе-семинаре Попов Александр Викторович, ИХБиФМ СО РАН: В процессе проведения школысеминара изучены основные возможности интегрированного биоинформатического инструмента UGENE. Получены общие сведения об использовании высокопроизводительных вычислений в решении вычислительных задач (параллельные алгоритмы, SIMD) и об их применении в UGENE. Приобретены необходимые навыки работы с различными модулями платформы, включая работу с удалёнными базами данных и запуск ресурсоёмких вычислительных задач на суперкомпьютерах. Получена информация о доступности и способах использования суперкомпьютерных систем в решении вычислительных задач.
Приобретенные навыки и информация будут использованы в решении задач ПНИР. В рамках поставленных задач проведена подготовка компьютерных моделей ДНК-белковых комплексов для моделирования методом молекулярной динамики.
А3.9.2 Результаты индивидуальной работы с участником Визуализация ДНК-белковых комплексов проводилась на платформе UGENE.
Обсуждены возможные улучшения по 3D-визуализатору молекулярных структур и работе с белками. Некоторые возможно будут реализовано в будущих версиях платформы.
А3.10 Исследования процессивности урацил-ДНК-гликозилазы E. Coli А3.10.1 Отчет участника о работе на Школе-семинаре Мечетин Григорий Вениаминович, ИХБиФМ СО РАН: В результате проведенной школы были изучены основные возможности платформы UGENE. Приобретены практические навыки работы на платформе, получено представление об использовании параллельных алгоритмов вычислений в решении задач биоинформатики на платформе, а также навык использования UGENE на вычислительном кластере при решении задач, требующих высоких вычислительных мощностей. Полученные на семинаре навыки будут в дальнейшем использованы для решения задач ПНИР.
А3.10.2 Результаты индивидуальной работы с участником Для построения выравнивания аминокислотных последовательностей урацил-ДНКгликозилаз человека и E. Сoli и сравнения их трёхмерных структур использовалась платформа UGENE. Обсуждены и запланированы к реализации некоторые новые функции для будущих версий платформы UGENE:
а) В 3D-визуализаторе возможности выборочного просмотра (https://ugene.unipro.ru/tracker/browse/UGENE-416).
б) Автоматизация запросов к сервису GetArea, расчет энергии сольватации и визуализация уровней энергии сольватации (https://ugene.unipro.ru/tracker/browse/UGENEОт участника получено техническое описание для реализации приведенной выше функциональности.
А3.11 Иерархический анализ протяженных генетических последовательностей Хомичева Ирина Вадимовна, ИМ СО РАН, впервые познакомилась с платформой UGENE за два года до начала настоящего проекта и с января 2011 г. начала работать вместе с профессором Е. Е. Витяевым и инженером «Унипро» над интеграцией системы ExpertDiscovery c платформой UGENE.
А3.11.1 Отчет участницы о работе на Школе-семинаре Хомичева Ирина Вадимовна, ИМ СО РАН: При подготовке к Школе-семинару по проекту была проделана следующая работа:
1) Руководство интеграцией системы обработки протяженных последовательностей ExpertDiscovery (http://www.math.nsc.ru/AP/ScientificDiscovery) и UGENE.
функциональности системы ExpertDiscovery в составе UGENE. Поверка работы широкомасштабного использования: прояснение всех шагов применения системы, уменьшение количества незначимых параметров и др.
2) Подготовка методического пособия по практическим аспектам реляционного метода извлечения знаний ExpertDiscovery, предоставление исходных данных для демонстрации работы модуля ExpertDiscovery.
Во время Школы-семинара были выполнены следующие работы:
3) Обучение участников проекта теоретическим и практическим основам метода ExpertDiscovery. Разбор типовых задач, которые молодые ученые могут решить с помощью системы ExpertDiscovery.
4) Разбор вычислительных задач участников проекта, обсуждение необходимых модификаций системы ExpertDiscovery для решения этих задач.
А3.11.2 Результаты индивидуальной работы с участницей По результатам апробации интеграционного программного пакета ExpertDiscovery– UGENE на биологических данных молодых ученых — участников проекта — сформировано техническое задание для усовершенствования интеграционного пакета. Инженер «Унипро»
Ю. Васькин приступил к его реализации в августе 2011 г при консультационной поддержке И. В. Хомичевой.
А3.12 Поиск протеомных маркеров шизофрении и сопутствующих психоневрологических заболеваний А3.12.1 Отчет участницы о работе на Школе-семинаре Логинова Лариса Викторовна, НИИ ПЗ СО РАМН: На школе я получила ознакомительные сведения по UGENE, освоила работу с практическими примерами исследование неизвестного вируса, поиск генов в последовательности, работу с данными секвенирования, построение вычислительных схем.
Полезно также было узнать про реляционный подход к интеллектуальному анализу данных Discovery, поучиться искать комплексны сигналы. Семинар по использование параллельных алгоритмов в биоинформатике и оптимизированным вычислениям был интересным и полезным.
А3.12.2 Результаты индивидуальной работы с участницей последовательностях идентифицированных белков использовалась платформа UGENE.
Результаты анкетирования молодых ученых 1. Список предполагаемых вычислительных задач по Вашей теме краткосрочной научно-исследовательской работы «Поиск локальной гомологии между вирусными и человеческими белками»
Анастасия Поиск локальной гомологии между множеством последовательностей Бакулина вирусных белков и белками человека. Возможно, для этого будет
ФГУН ГНЦВБ
"Вектор" «Создание рекомбинантных химерных антигенов B.burgdorferi s.l. для Александр Рябченко Вычисляю только температуры плавления праймеров, делаю это с НИИ биохимии помощью простеньких специальных программ (в суть работы которыхСО РАМН
даже не вникаю), так что в целом эта процедура элементарная и не претендует на какую-то серьезную «вычислительную задачу».«Маркеры вирулентности штаммов энтомопатогенных аскомицетов – Вадим Крюков ИСиЭЖ СО РАН потенциальных продуцентов микоинсектицидных препаратов»
- кластерный анализ и дискриментный анализ продуктов ISSR PCR, - методы оценки полиморфизма по продуктам ISSR PCR, - методы сравнения последовательностей с информацией в Genbank.
«Молекулярное моделирование белкового комплекса протеазы вируса Нина Кулакова
ЛИН СО РАН
- анализ полногеномных последовательностей, - нахождение и обрезка белоккодирующей части генома, - нахождение мотивов и паттернов в разных гомологичных геномах Подготовка файлов для молекулярного моделирования белков Структурное выравнивание моделей, преобразование форматов визуализация моделей, построение графиков, работа с файлами «Изучение глубоководных байкальских губок»Ольга Майкова - Выравнивание полученных последовательностей.
ЛИН СО РАН
- Поиск прямых и инвертированных повторов и их сравнительный анализ у нескольких последовательностей.- Поиск открытых рамок считывания и их сравнительный анализ у - Построение матрицы данных по вставкам и делециям и проведение филогенетического анализа на основе этой матрицы методом максимальной экономии. Подсчет смещения нуклеотидов.
«Поиск последовательностей гомологичных пептиду-иммуномиметику Апалько бензо[a]пирена в протеоме человека и их функциональная аннотация»
Светлана Поиск гомологов белка в геномах человека, мыши, возможно еще и
ИЭЧ СО РАН
Маценко Наталья «Поиск флексибильных сайтов по всему геному человека, составление карты флексибильных сайтов генома человека, сопоставление их с Fra-сайтами и сНИИМББ СО
сайтами частых хромосомных перестроек в опухолевых клетках человека»РАМН Вычисление торсионной напряженности (флексибильности) «Создание функциональной генной сети с участием нейрофибромина I и II Ксения Головнина, 5’UTR Nf2/NF1 анализ промоторов, TF binding sites (хорошо, ИЦиГ СО РАН там коровая последовательность всего 3-8 нуклеотидов, может Alternative splicing (алтернативный сплайсинг). Идея такая, у генов у которых есть алтернативные транскрипты, просто гдето не сплайсируются интроны или наоборот выпадают вместе с последовательностями, с которыми связываются нужные белки.
Попов Александр «Исследования структуры ферментов репарации E. coli и человека методами ИХБиФМ СО Расчёт молекулярной динамики комплексов ДНК-белок и РАН последующий их анализ по различным структурным критериям «Исследования процессивности урацил-ДНК-гликозилазы E. coli»
Мечетин Расчет электростатических и гидрофобных поверхностей белков, Григорий визуализация и анализ третичных структур ферментов репарации ДНК ИХБиФМ СО РАН Хомичева Ирина «Иерархический анализ протяженных генетических последовательностей»
Ориентировочно (если не появится новых интересных задач от
ИМ СО РАН
молодых ученых) собираемся повторить имеющиеся, но пока не опубликованные результаты, на интегрированной версии систем Логинова Лариса «Поиск протеомных маркеров шизофрении»Поиск возможных сайтов модификации протеомных маркеров
НИИ ПЧ СО
шизофрении и сопутствующих психоневрологических заболеваний РАМН Методическое пособие по работе с платформой UGENE Пособие приложено отдельным файлом (перейти к пособию).Программа курсов повышения квалификации молодых ученых I. Очный раздел (курсы, проведенные в рамках Школы-семинара молодых ученых «Вычислительные задачи молекулярной биологии и платформа UGENE»
1. Общеобразовательная часть:
1) Лекция «Молекулярно-эпидемиологические исследования вирусов», 2) Лекция «Вычислительные задачи в биохимических и молекулярнобиологических исследованиях: опыт комплексного изучения ферментов репарации ДНК», профессор Д.О. Жарков (НГУ) 1,5 ч.
3) Лекция «Реляционный подход к интеллектуальному анализу данных Discovery и его применение в различных прикладных областях», 4) Семинар «Основы реляционного метода извлечения знаний ExpertDiscovery» преподаватель И.В. Хомичева, (ИМ СО РАН), 5) Знакомство с вычислительными ресурсами НГУ и Сибирского 7) Знакомство с Новосибирским Центром Информационных 2. Вычислительная платформа UGENE как инструмент поддержки исследований в области молекулярной биологии:
1) Лекция «Использование параллельных алгоритмов в биоинформатике и оптимизированные вычисления в UGENE»
3) Семинар «Разбор практических примеров, ответы на вопросы преподаватели К.В.Оконечников, Т.Б.Тлеукенов, Д.Ю.Кандров 4) Практика: запуску расчетных задач на кластере НГУ преподаватели 5) Практика: Решение вычислительных задач по темам краткосрочных консультанты: И.Е.Ефремов, О.И.Голосова, К.Е. Оконечников, Форма контроля — планы выполнения вычислительных задач II. Раздел дистанционного обучения 1. Курс «Горячие точки молекулярной биологии» (на базе одноименного 2. Курс «Основы технологий программирования для биологов» (на базе общеобразовательного курса «Технологии программирования» ММФ НГУ) 1) Дистанционное изучение разделов курса И.Н. Скопина «Основы менеджмента программных проектов» Интернет университета 2) Практика: подготовка рефератов по теме «Организация проектной III. Итоги выполнения программы Общее учебное время — 83 часа.
Из них – лекционные занятия — 6 часов;
– самостоятельное дистанционное обучение — 16 часов;
Государственный контракт № 14.740.12. «Научные и научно-педагогические кадры инновационной России Исследования в области молекулярной биологии, вирусологии, микробиологии и биотехнологии с использованием унифицированной биоинформатической платформы UGENE 12 молодых ученых из 10 институтов СО РАН и СО РАМН (Новосибирск, Иркутск, Томск, Кемерово), из них 7 кандидатов наук НГУ, Лаборатория НГУ-Интел, НЦИТ «Унипро»
команда - 15 человек Научный руководитель – д.б.н., доцент Д.О.Жарков.
Кураторы – чл.-корр. РАН С.В. Нетесов, к.х.н. Е.П. Яблокова, к.ф-м.н.
Ю.Э.Данилова Получение и применение новых знаний по информационным технологиям для конкретных исследовательских тематик в области молекулярной биологии, вирусологии, микробиологии и биотехнологии.
Генерация и анализ новых научных результатов.
Повышение уровня квалификации и мобильности научных Данная поисковая научно-исследовательская работа была направлена на адаптацию пакета UGENE для решения ряда конкретных проблем из областей биотехнологии, генетической инженерии, молекулярной вирусологии, молекулярной иммунологии, молекулярной паразитологии, молекулярной эволюции, мутагенеза, канцерогенеза и репарации ДНК, структурной и функциональной геномики, физики биополимеров.
Школа-семинар «Вычислительные задачи Лекции – 6 ч:
Чл.-корр РАН, профессор С.В.Нетесов, д.б.н., доцент Д.О.Жарков, Д.ф.-м.н. Е.Е.Витяев, лидеры проекта UGENE М.Ю.Фурсов, И.Е. Ефремов Семинары, практические занятия - 14 часов:
Команда UGENE – 9 человек, И.В. Хомичева – участница проекта Темы:
Биомедицинские исследования в НГУ, ИХБиФМ СО РАН и в мире.
Вычислительные аспекты современной мол.биологии Вычислительные возможности UGENE. Типичные задачи и составные вычислительные эксперименты.
Высокопроизводительные вычисления в биологии, расчет задач на кластере. Реляционный подход к интеллектуальному анализу данных Discovery.
Индивидуальные вычислительные задачи участников.
Инфраструктура: Аудитории и компьютеры - НГУ, Лаборатория НГУ-Интел, вычислит. кластер НГУ, обучающий пакет UGENE, метод. пособие Экскурсии: НГУ, ИХБиФМ, ИВМиМГ СО РАН, Технопарк, «Унипро»
Обучение биологов-исследователей новым вычислительным возможностям. Показана реальная альтернатива зарубежным коммерческим пакетам.
Новые прикладные аспекты развития UGENE.
Зафиксированы > 20 практических рекомендаций по улучшению интерфейса и развитию функционала пакета.
Развитие партнерства. Успешно опробованы возможности совместного проведения учебных программ с НГУ и Интеллаб. Налажены новые научные контакты с перспективой развития.
Из отзывов участников:
«Юджин, как мы сейчас понимаем, нужен почти всему нашему Институту, пусть люди пользуются, это такие огромные возможности»
«Данная программа уже сейчас может заменить все те программы, которые мне необходимы для работы, а также благодаря разработчикам выполнить потенциальные задачи в будущем»
ПНИР #1 - «Поиск локальной гомологии между вирусными и человеческими белками», Бакулина А.Ю., ФГУН ГНЦВБ "Вектор" Результаты:
Найдено детальное распределение по семействам для белков человека, имеющих гомологов среди вирусных белков. Суммарно методом BLAST были найдены гомологи для 1413 белков с описанными в UniProt семействами.
ПНИР #2 - «Создание рекомбинантных химерных антигенов B.burgdorferi s.l. для диагностики болезни Лайма»
Рябченко А.В., НИИ биохимии СО РАМН Трансляция регинов ДНК, работа с белками в UGENE ПНИР #2 - «Создание рекомбинантных химерных антигенов B.burgdorferi s.l. для диагностики болезни Лайма»
Рябченко А.В., НИИ биохимии СО РАМН (продолжение) Результаты:
Получены штаммы E.coli - продуценты рекомбинантных химерных белков OspC2 и OspC2P83, несущих эпитопы антигенов западносибирских изолятов B.garinii и B.afzeli. Получены препараты очищенных рекомбинантных химерных белков OspC2 и OspC2-P83.
Рекомбинантные белки были протестированы методом ИФА с сыворотками больных иксодовым клещевым боррелиозом и рекомендованы для диагностики иксодового клещевого боррелиоза методом ИФА.
ПНИР #3 - «Определение генотипических и фенотипических маркеров вирулентности и устойчивости к лимитирующим факторам среды у энтомопатогенных аскомицетов», Крюков В.Ю., ИСиЭЖ СО РАН Широкая специализация Специализация в паразитической через кутикулу фазе цикла (кроме Lepidoptera) Специализация Активное в некротрофной фазе цикла Идентификация патовариантов на основе сопоставления последовательностей ITS региона рДНК с помощью UGENE ПНИР #3 - «Определение генотипических и фенотипических маркеров вирулентности и устойчивости к лимитирующим факторам среды у энтомопатогенных аскомицетов», Крюков В.Ю., ИСиЭЖ СО РАН (продолжение) Результаты:
Проведена идентификация патовариантов энтомопатогенного гриба Metarhizium anisopliae, собранных на территории России.
Идентификация проводилась на основе сопоставления нуклеотидных последовательностей ITS региона рДНК и выравниванием с имеющимися в компьютерных базах данных GenBank.
Установлено, что внутри одного патоварианта существуют формы, характеризующиеся разной продукцией токсинов, разными типами патогенеза, вызывающими различные защитные реакции хозяев (экспрессия детоксицирующих ферментов или ее отсутствие) и проявляющие трофическую специализацию в паразитической или в некротрофной фазе жизненного цикла патогена.
Выявлены культуры обладающие высокой вирулентностью и эпизоотическим потенциалом, которые могут быть использованы в качестве основы высокоэффективных экологически безопасных препаратов для контроля численности насекомых.
ПНИР #4 - «Молекулярное моделирование белкового комплекса NS2B-NS3 протеазы вируса клещевого энцефалита Сибирского субтипа», Кулакова Н.В., ЛИН СО РАН Обработка геномов ВКЭ в UGENE Результаты:
Гомологичное моделирование пространственной структуры белкового комплекса NS2B-NS3 вирусной сериновой протеазы проведено для штамма ВКЭ сибирского субтипа Aina и штамма Dalnegorsk дальневосточного субтипа ВКЭ, взятого в качестве контрольной группы.
ПНИР #5 - «Анализ генетического разнообразия глубоководных губок озера Байкал», Майкова О.О., ЛИН СО РАН Множественное выравнивание и Поиск и сравнительный анализ редактирование мтДНК в UGENE инвертированных повторов в Результаты:
Молекулярно-генетический анализ глубоководных губок эндемичного байкальского семейства Lubomirskiidae показал внутривидовую и межвидовую вариабельность некодирующих последовательностей мтДНК, а образцы губок отнесены к видам B.
intermedia profundalis, B. martinsoni и B. bacillifera.
ПНИР #6 - «Поиск последовательностей гомологичных иммунометику бензо[a]пирена в протеоме животных Mus. Musculus и человека, и их функциональная аннотация», Апалько С.В., ИЭЧ СО РАН I. Теоретические прогнозы развития аутоиммунных реакций при введении в организм животных Mus. Musculus пептида-иммуномиметика бензо[a]пирена, как специфического компонента антиканцерогенной вакцины Поиск последовательностей гомологичных пептиду-иммуномиметику бензо[a]пирена проводился с помощью алгоритма BLAST, реализованного в программе UGENE.
Аминокислотных последовательностей, удовлетворяющих заданным параметрам поиска, ни в протеоме животных Mus.
Musculus, ни в протеоме человека найдено не было.
II. Подтверждение в in vivo эксперименте Иммунизация трехмесячных самцов мышей линии Balb/c рекомбинантным химерным белком, содержащим пептид-иммуномиметик.
При введении препарата подопытным животным была продемонстрирована их 100%-ная выживаемость. Также не было обнаружено увеличения массы внутренних органов (тимуса, легкого, сердца, печени, почек и селезенки).
Таким образом, результаты, полученные в ходе выполнения ПНИР по поиску последовательностей гомологичных пептиду-иммуномиметику бензо[a]пирена в протеоме животных Mus. Musculus и человека, могут быть использованы в прогнозировании развития аутоиммунных реакций для других пептидовиммуномиметиков, а также для модификации структуры известного пептидаиммуномиметика бензо[a]пирена.
ПНИР #7 - «Поиск флексибильных сайтов по всему геному человека, составление карты флексибильных сайтов,» Маценко Н.Ю., НИИМББ СО РАМН Поиск сайтов повышенной флексибильности в геноме человека с помощью платформы UGENE на примере анализа последовательности хромосомы По результатам анализа был создан прототип карты локализации флексибильных ПНИР #7 - «Поиск флексибильных сайтов по всему геному человека, составление карты флексибильных сайтов,» Маценко Н.Ю., НИИМББ СО РАМН (продолжение) Картирование сайтов флексибильности на хромосоме 7 относительно сайтов ломкости с известной локализацией с помощью платформы UGENE на примере ЧСЛ FRA7H Результат: Полное совпадение последовательности FRA7H и одного из районов флек-сибильности свидетельствует о том, что флексибильность ДНК лежит в основе сайтов ломкости ДНК ПНИР #8 - «Создание функциональной генной сети с участием нейрофибромина I и II типов (NF1 и NF2): поиск их взаимодействия»
Головнина К.А., ИЦиГ СО РАН Результат: построение генной сети, отражающей основные биохимические пути и ключевые домены, нарушения в которых приводят к нейрофиброматозу.
ПНИР #9 - «Исследования структуры ферментов репарации E. coli и человека методами молекулярной динамики», Попов А.В., ИХБиФМ СО РАН ПНИР #10 - «Исследования процессивности урацил-ДНК-гликозилазы E. Coli», Мечетин Г.В., ИХБиФМ СО РАН Выравнивание последовательностей урацил-ДНК-N-гликозилаз человека и E. coli Выравнивание последовательностей и визуализация третичных структур производились при помощи программного пакета UGENE v1.9. ПНИР #11 - «Иерархический анализ протяженных генетических последовательностей», Хомичева И.В., ИМ СО РАН Реляционный подход был применен для решения задачи анализа регуляторных районов генов. Информацией, извлекаемой из данных (ДНК) являлись комплексные сигналы.
ПНИР #12 - «Поиск протеомных маркеров шизофрении и сопутствующих психоневрологических заболеваний», Логинова Л.В., НИИ ПЗ СО РАМН Результаты:
1. При электрофоретическом анализе белкового спектра сыворотки крови больных шизофренией в сравнении с контрольной группой получены отличия в следующих областях молекулярных масс: 165 – 195 кДа, 70-110 кДа, 40 –