WWW.DISS.SELUK.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА
(Авторефераты, диссертации, методички, учебные программы, монографии)

 

РОССИЙСКАЯ АКАДЕМИЯ НАУК

Сибирское отделение

Федеральное государственное бюджетное учреждение наук

и

Институт цитологии и генетики

На правах рукописи

Медведева Ирина Вадимовна

КОМПЬЮТЕРНЫЙ АНАЛИЗ ЗАКОНОМЕРНОСТЕЙ КОДИРОВАНИЯ

ФУНКЦИОНАЛЬНЫХ САЙТОВ БЕЛКОВ В ГЕНАХ ПОЗВОНОЧНЫХ

(03.01.09) «математическая биология, биоинформатика»

Диссертация на соискание учёной степени кандидата биологических наук

Научный руководитель:

доцент, к.б.н. Иванисенко В.А.

Новосибирск – Содержание Содержание

Введение

Список сокращений

Глава 1. Обзор литературы

1.1 Пространственная структура белка

1.1.1 Физико-химические свойства аминокислот

1.1.2 Вторичная структура полипептидов

1.1.3 Классификация структур белков

1.1.4 Доменная структура белка

1.1.5 Существующие компьютерные ресурсы по пространственной структуре белков и анализу ее особенностей

1.2 Структурная организация функциональных сайтов белков

1.3. Влияние мутаций на структуру и функцию белка

1.4 Базы данных, посвященные функциональным сайтам белков............... 1.3 Эволюция структуры и функции белков

1.3.1 Пути эволюции генов эукариот

1.3.2 Частота использования кодонов в последовательностях ДНК........ 1.3.3 Эволюция пространственной структуры белка: конвергенция и дивергенция

1.4 Проекция пространственной структуры белка на структуру кодирующего гена

1.4.1 Соответствие доменной структуры белка и экзонной структуры кодирующего гена

1.4.2 Фазы экзонов и интронов и их роль в эволюции

1.4.3 Интегрированные базы данных

1.5 Заключение к литературному обзору

Глава 2. Компьютерная система SitEx

2.1 Описание использованных баз данных

2.1.1 Ensembl

2.1.2 Protein Data Bank (PDB)

2.1.3 SCOP

2.2 Описание программных средств

2.2.1 Формат данных FASTA

2.2.2 BLAST

2.2.3 ClustalW

2.2.4 3DPDBScan

2.3 Алгоритм создания БД SitEx

2.4 Показатели разрывности функциональных сайтов белков

2.5 Описание структуры базы данных SitEx

2.6 Описание веб-интерфейса

2.7 Применение системы SitEx для анализа особенностей кодирования функциональных сайтов белков

2.7.1 Сравнение особенностей кодирования сайтов связывания одинаковых лигандов в негомологичных белках человека на примере глицеральдегид-3-фосфатдегидрогеназы

2.7.2 Поиск сходства между фрагментами белков, кодируемых отдельными экзонами, и аминокислотными последовательностями прокариот на примере уропорфириногендекарбоксилазы Bacillus subtilis

2.7.3 Исследование разрывности сайтов в функционально близких доменах белков, кодируемых генами с различной экзонной структурой на примере домена карбоксилазы типа В

2.8 Заключение

Глава 3. Статистический анализ закономерностей кодирования функциональных сайтов белков в генах позвоночных

3.1 Исследование распределений длин экзонов, кодирующих и некодирующих функциональные сайты

3.2 Анализ консервативности экзонов, кодирующих функциональные сайты

3.3 Исследование разрывности функциональных сайтов

3.4 Анализ частот кодонов в фрагментах ДНК, кодирующих аминокислотные остатки функциональных сайтов белков

3.5 Частота фаз экзонов в функциональных сайтах на границе экзонов..... Обсуждение

Выводы

Список литературы

Приложения

Приложение 1

Приложение 2

Приложение 3

Приложение 4

Приложение 5

Введение Исследование механизмов, лежащих в основе эволюции структуры и функции белка, является одним из важнейших разделов современной биологии. В ходе дискуссии в 1978 году Уильям Гилберт выдвинул предположение, согласно которому один экзон кодирует один домен [1].

Однако дальнейшие исследования показали, что корреляция между границами доменной и экзонной структур наблюдается не всегда [2].

Непосредственно в функциональных взаимодействиях белка или его домена задействовано небольшое количество аминокислотных остатков, образующих функциональный сайт. Функция и структурная организация функциональных сайтов напрямую связаны с молекулярной эволюцией соответствующих генов и белков. Однако взаимосвязь между структурной организацией функциональных сайтов и особенностями молекулярной эволюции генома оставалась практически не изученной.

Исследование закономерностей и анализ структурно-функциональной организации генов с учетом информации о расположении границ экзонов, доменов и функциональных сайтов белков как на уровне аминокислотных последовательностей, так и нуклеотидных последовательностей ДНК невозможны без применения биоинформатических методов. До недавнего времени возможности применения этих методов были ограничены небольшим числом полностью секвенированных геномов секвенированных геномов и расшифрованных третичных структур белков. В настоящее время накоплены огромные массивы молекулярно-генетических данных, представленных в базах последовательностей генов (GeneBank, EMBL, Ensembl и др.), белковых последовательностей (SwissProt, Trembl и др.), пространственных структур белков (PDB) и их функциональных сайтов (PDBSite, SitesBase). Интеграция этих ресурсов позволяет получить новые знания о структурно-функциональной организации экзонов, доменов, функциональных сайтов, участков с повышенной консервативностью и последовательностях и их роли в эволюции молекулярно-генетических систем живых организмов.



Цели и задачи работы Цель работы состояла в выявлении закономерностей кодирования функциональных сайтов белков с использованием проекций границ экзонов на первичные и пространственные структуры белков. В связи с этим решались следующие задачи:

1. Разработка компьютерной системы, предназначенной для анализа проекций на аминокислотную последовательность белков экзонной функциональных сайтов. Создание базы данных, интегрирующей результаты проекции и существующие ресурсы по структурнофункциональной организации белков и генов.

2. Интеграция компьютерной системы с программой BLAST с целью поиска гомологичных экзонов и участков полипептидов, кодируемых одним экзоном, и программой 3DPDBScan для осуществления структурного выравнивания анализируемого белка с пространственными структурами фрагментов белков, кодируемых одним экзоном.

3. Анализ закономерностей распределения фрагментов ДНК, кодирующих функциональные сайты белков, в экзонной структуре гена 4. Исследование распределения кодонов в фрагментах ДНК, кодирующих функциональные сайты белков, на границах экзонов.

Научная новизна. Впервые установлено, что функциональные сайты белков преимущественно кодируются более длинными экзонами. При этом оказалось, что в случае разрывных функциональных сайтов, кодирующие их фрагменты ДНК преимущественно распределяются в пределах одного или нескольких сближенных в последовательности гена экзонов. Впервые выявлены статистически значимые отличия между частотами фаз кодонов, расположенных на 5`-конце экзонов, кодирующих и не кодирующих функциональные сайты белков. Согласно этим данным нулевая фаза кодонов встречается реже в случаях экзонов, кодирующих функциональные сайты.

Впервые выдвинута гипотеза о том, что экзоны, кодирующие только фрагменты функциональных сайтов белков, меньше подвержены перетасовкам по сравнению с другими экзонами. Таким образом, последовательностях белков может быть фактором, ограничивающим изменчивость экзонной структуры генов, в том числе в результате перетасовок экзонов.

Впервые создана программно-информационная система, интегрирующая различные структурные и функциональные данные о белках и кодирующих их генах, белковые и геномные последовательности, экзон-интронную структуру, домены и функциональные сайты. Система включает в себя базу данных SitEx, содержащую данные о функциональных сайтах белков, нуклеотидных и аминокислотных последовательностях экзонов и соответствующих им фрагментов пространственных структур полипептидной цепи белка, а также программы анализа. Новизной обладают предоставляемые в системе возможности поиска по базе данных ДНК последовательностей экзонов с помощью программы BLASTN, а также поиска по базе данных фрагментов белков, кодируемых отдельно взятыми экзонами, с помощью BLASTP и программы 3DPDBScan, осуществляющей структурное выравнивание 3D структур этих фрагментов.

Практическая ценность. Разработанная компьютерная система SitEx имеет свободный доступ через Интернет и может использоваться для решения широкого круга фундаментальных и прикладных задач, связанных с анализом соотношения экзон-интронной структуры генов и структурнофункциональной организации, кодируемых ими белков. SitEx позволяет проводить поиск гомологий между белковыми последовательностями, а также осуществлять структурное сравнение белков с учетом информации об экзон-интронной структуре, кодирующих их генов. Функциональные возможности созданной системы SitEx могут быть использованы при планировании генно-инженерных экспериментов.

Положения, выносимые на защиту.

- Функциональные сайты белков значимо чаще, чем ожидается по случайным причинам, кодируются одним или близко расположенными в последовательности гена экзонами;

аминокислотные остатки функциональных сайтов, в среднем значимо превышает длину остальных экзонов;

- Распределение частот представленности различных фаз кодонов в районах 5`-концов экзонов, статистически значимо отличается между кодонами, кодирующими и не кодирующими аминокислоты в позициях функционального сайта белка;

используются чаще во фрагментах ДНК длиной до 15 нуклеотидов на Апробация работы конференциях:

o Восьмая Международная конференция по биоинформатике регуляции и структуры генома (BGRS'2012). Россия, Новосибирск, июнь 25-29, 2012, устный доклад.

o 19th Annual International Conference on Intelligent Systems for Molecular Biology and 10th European Conference on Computational Biology. Австрия, Вена, июль 17-19, 2011, постер o 2011 International German/Russian Summer School on Integrative Biological Pathway Analysis and Simulation. Германия, Билефельд, июль 4-7, 2011, устный доклад.

o Седьмая Международная конференция по биоинформатике регуляции и структуры генома (BGRS'2010). Россия, Новосибирск, июнь 20-27, 2010, постер.

o Школа Молодых Ученых (YSS`2010). Россия, Новосибирск, июнь 28-29, 2010, устный доклад o International Autumn School for Young Scientists on Computational Systems Biology and Bioinformatics 2008. Россия, Новосибирск, сентябрь 24, 2008, устный доклад o Шестая Международная конференция по биоинформатике регуляции и структуры генома (BGRS'2008). Россия, Новосибирск, июнь 22-28, 2008, устный доклад.

o The 2007 International Conference on Bioinformatics & Computational Biology (BIOCOMP`07). США, Лас-Вегас, июнь 25-28, 2007, постер.

o Международная научная конференция студентов, аспирантов и молодых учёных "Ломоносов-2007". Москва, Россия, апрель 8-12, 2007, устный доклад.

Публикации В результате выполнения работы было опубликовано 3 статьи в рецензируемых журналах, рекомендованных ВАК, 6 тезисов к российским и государственной регистрации базы данных.

Статьи в рецензируемых журналах:

Орлов Ю.Л., Брагин А.О., Медведева И.В., Гунбин К.В., Деменков П.С., Вишневский О.В., Левицкий В.Г., Ощепков Д.Ю., Подколодный программный комплекс анализа символьных последовательностей геномики // Вавиловский журнал генетики и селекции. – 2012. – Том 16, 4/1. – c. 732-741.

Medvedeva I.V., Demenkov P.S., Kolchanov N.A., Ivanisenko V.A. SitEx:

a computer system for analysis of projections of protein functional sites on eukaryotic genes // Nucleic Acids Res. – 2012. – Vol. 40(D1) – p. D278-283.

распределения аденозин-фосфат связывающих сайтов белков на экзонной структуре гена // Информационный Вестник ВОГиС. – 2009. – Том 13, №1. – с. 122-127.

Свидетельства:

Свидетельство о государственной регистрации базы данных № 2013621254. Позиции аминокислот функциональных сайтов белков в экзонной структуре кодирующих генов (СайтЭкс)/Protein functional sites positions in exon structure of the coding genes (SitEx).

Тезисы конференций:

o Medvedeva I.V., Demenkov P.S., Ivanisenko V. A. Influences of protein functional site encoding features on protein evolution in Eukaryota. // Abstracts of the Eighth International Conference on Bioinformatics of Genome Regulation and Structure (BGRS'2012), Novosibirsk, Russia, June 25- 29, 2012, p.209.

o Medvedeva I.V., Demenkov P.S., Ivanisenko V. A. Computer system SitEx for analyzing protein functional sites in eukaryotic gene structure. // Abstracts of the Seventh International Conference on Bioinformatics of Genome Regulation and Structure (BGRS'2010), Novosibirsk, Russia, June 20- 27, 2010, p.182.

o Medvedeva I.V., Demenkov P.S., Ivanisenko V. A. Protein functional site projection on exon structure of gene. // Abstracts of the Sixth International Conference on Bioinformatics of Genome Regulation and Structure (BGRS'2008), Novosibirsk, Russia, June 22- 28, 2008, p.159.

o Medvedeva I. V., Demenkov P. S., Ivanisenko V. A. (2007) Analysis of protein functional site distribution on gene structure. Proceedings of the 2007 international conference on bioinformatics and computational biology (BIOCOMP’07). Vol. 2, pp. 452-455.

o Медведева И. В. Анализ картирования функциональных сайтов белков на экзонной структуре гена. Материалы докладов XIV Международной конференции студентов, аспирантов и молодых ученых «Ломоносов».

Москва. 2007. стр. 58.

o Медведева И. В. Анализ распределения просайтов функциональных сайтов в пространственных структурах белков. Материалы XLIV Международной студенческой конференции «Студент и научнотехнический прогресс». Биология. Новосибирск. 2006. стр. 146.

Личный вклад автора. Основные результаты работы были получены и проанализированы автором самостоятельно, а именно: (1) разработана структура и интерфейс базы данных SitEx; (2) разработаны алгоритмы и программы, с использованием которых проведен анализ геномных данных и данных по функциональным сайтам белков и заполнение на этой основе базы данных SitEx; (3) осуществлена интеграция доступных внешних программ BLAST и 3DPDBScan в систему SitEx; (4) проведен анализ данных из базы данных SitEx по установлению закономерностей кодирования функциональных сайтов белков в геномах позвоночных. Реализация вебверсии компьютерной системы была осуществлена совместно с Деменковым П. С.

Структура и объем работы.

Работа состоит из оглавления, списка сокращений, введения, трех глав, заключения, выводов, списка литературы и четырех приложений. Материал изложен на 108 страницах (101 страница текста и 7 страниц приложений), содержит 28 рисунков, 11 таблиц, формулы.

руководителю диссертации к.б.н. Иванисенко В.А., соавторам и коллегам по работе – академику РАН Колчанову Н.А., к.б.н. Деменкову П.С., к.б.н.

Орлову Ю.Л., д.б.н. Кочетову А.В. за консультации и плодотворные научные дискуссии. Автор особо благодарен к.б.н. Рогозину И.Б. за большой объём консультаций по биологическим вопросам и за помощь в биологической интерпретации результатов.

Автор участвовал в работах по грантам Министерства образования и науки (гранты 14.740.11.0001, 07.514.11.4003, 8740); междисциплинарных интеграционных проектах СО РАН (94, 111, 119); РФФИ (11-04-92712); FP7:

EU-FP7 SYSPATHO No. 260429; программ РАН (A.II.5, A.II.6, B.21, B.26) и гранте Леонарда Эйлера DAAD.

Список сокращений 3D – пространственная структура ФС – функциональный сайт белка ЭКФС – экзон, кодирующий хотя бы часть функционального сайта ЭНФС – экзон, не кодирующий функциональный сайт АФС – аминокислота функционального сайта Глава 1. Обзор литературы 1.1 Пространственная структура белка Благодаря своей сложной структуре и огромному разнообразию, белки участвуют во множестве процессов: инициации транскрипции, ферментативном катализе, передаче сигналов, распознавании чужеродных молекул, образовании мембранных каналов, сокращении мышечных клеток и пространственных структур белков. В свою очередь, пространственная структура белка, зависит от физико-химических свойств аминокислот, составляющих последовательность белка.

1.1.1 Физико-химические свойства аминокислот Последовательность белка кодируется 20 различными каноническими аминокислотами (обозначения представлены в таблице 1.1).

Таблица 1.1. Однобуквенные и трехбуквенные обозначения аминокислот Аминокислоты можно классифицировать на группы по их физикохимическим свойствам (Рисунок 1.1). По свойствам боковых радикалов аминокислоты разделяют на несколько классов: 1) неполярные (A, V, L, I, F, P, M, С); 2) положительно заряженные (K, R); 3) отрицательно заряженные (E, D); 4) полярные незаряженные (S, T, N, Q, Y, W, H); 5) G, имеющий в боковой цепи только один атом водорода, обладает отличными свойствами и его относят к отдельному классу или к первому из указанных [3]. В силу столь малого объема боковой цепи, которая практически не создает стерических трудностей при конформационных изменениях полипептидной цепи, глицин необходим для обеспечения гибкости белка. Минимальный объем глицина также накладывает сильные ограничения на возможность его замены на другие аминокислоты в случае, когда он располагается внутри белковой глобулы. Такие замены не могут проходить без подвижек внутри всей молекулы, в силу того, что заменяющие аминокислоты имеют больший объем по сравнению с глицином, что, как правило, ведет к нарушению пространственной структуры белка.

Рис. 1.1. Классификация аминокислот У. Тэйлора по их физико-химическим свойствам на основе метода кругов Эйлера (1986) [4,5].

взаимодействия, как: ионные, водородные, Ван-дер-ваальса [6]. Кроме того, на стабилизацию пространственной структуры влияют цистеиновые мостики (связи S-S). Водородные связи образуются между группами атомов положительный и отрицательный - формируют солевой мостик.

эффект в процессе сворачивания белка: чтобы избежать контакта с водой гидрофобные боковые цепи полипептида разворачиваются внутрь белка, формируя гидрофобную сердцевину. В гидрофобной среде атомы основной цепи образуют водородные связи и таким образом формируются, элементы вторичной структуры белка [3]. Кроме того, внутри структуры белка иногда растворителя, с молекулами воды которых полярные боковые цепи также могут взаимодействовать. Подобные полости также часто являются областями связывания различных лигандов (атом, ион или молекула, непосредственно связанные с боковыми группами аминокислот в составе поверхности следующий аминокислотный состав: 58% гидрофобных (неполярных) аминокислот, 29% полярных, 13% заряженных аминокислот;

внутри гидрофобного ядра состав аминокислот приблизительно следующий:

60% неполярных, 33% полярных, 7% заряженных аминокислот [7].

пространственную структуру полипептидов, различают несколько уровней организации структур белка:

1) Первичная структура – аминокислотная последовательность белка 2) Вторичная структура – единица пространственной организации 3) Третичная структура (3D-структура) – пространственная структура 4) Четвертичная структура – взаимная пространственная ориентация комплекса белков либо нескольких полипептидных цепей.

1.1.2 Вторичная структура полипептидов Важнейшей характеристикой структуры белка является его вторичная структура, образуемая за счет водородных связей между атомами основной цепи. Другой особенностью вторичной структуры является наличие фиксированных конформаций основной цепи, при которых конформации боковых цепей неважны. Наиболее широко распространены –спираль и лист.

Спирали могут различаться по направлению вращения (право- и левозакрученные), периоду (количеству аминокислотных остатков) и шагу (длине витка). Направление спираль считается от N-конца к С-концу аминокислотного остатка в последовательности соединяется водородной связью с группой H-N i+4 остатка. В белках в основном встречается правозакрученная (против часовой стрелки) –спираль как наиболее стабильная. Известны такие спирали: 27 (в белках не встречается), 310(связь i – i+3), 413(–спираль), 516 (-спираль, связь i – i+5, встречается в белках очень редко). Нижний индекс обозначает число атомов основной цепи между поддерживающую соответствующую вторичную структуру [3, 8]. Для разных типов вторичных структур существует предпочтительность аминокислот образовывать ту или иную структуру. Например, такие аминокислоты как аланин (A), глутамат (E), лейцин (L), метионин (M) встречаются чаще других в –спиралях. С другой стороны, пролина, глицин и тирозин встречаются редко в спиралях [3].

Регулярная структура, образованная водородными связями между удаленными участками белка, формирует -лист. -структура может быть параллельной, антипараллельной и смешанной. Поверхность -листа складчатая, а сам лист имеет небольшую скрученность вправо за счет стерически выгодных конформаций [8, 9, 10].

Помимо регулярных вторичных структур существуют и нерегулярные: изгибы и петли. -изгибы формируются между участками полипептида, задействованных в формировании антипараллельного -листа. Петли обычно располагаются на поверхности белка и могут участвовать в образовании функционального сайта белка. Большая часть петель обладает стабильной структурой, однако, есть и неупорядоченные петли [8, 9].

Статистические закономерности встречаемости определенных аминокислотных остатков в различных участках вторичной структуры белка:

в составе –спирали, -листа, нерегулярной структуры или гидрофобного ядра приведено в Приложении 1 [8].

Между вторичными струкутрами существуют взаимодействия, в частности, –спирали за счет амфипатичности могут взаимодействовать друг с другом гидрофобными фрагментами, образуя «пучок прутиков». Во взаимодействия между вторичными структурами могут быть вовлечены как ковалентные связи (S-S мостики), слабые взаимодействия, а также стекинг, или - взаимодействия между ароматическими аминокислотами. Около 60% всех ароматических аминокислот белка вовлечены в - взаимодействия, при этом их большая часть осуществляется со сдвигом в параллельной плоскости, а меньшая – перпендикулярно друг к другу. Они играют значительную роль при сворачивании белка [11].

1.1.3 Классификация структур белков Чем больше расшифровывалось пространственных структур белков, тем тем понятнее становилось, что белки, даже разные по функции и по последовательности, имеют общие элементы пространственной структуры.

Так было введено понятие мотива укладки - взаимная пространственная ориентация вторичных структур в составе пространственной структуры белка. Укладка белка – это структура, образованная атомами основной полипептидной пептидной цепи. Таким образом, в основу классификации структур белков легла классификация мотивов укладки. Всего насчитывается 1000-2000 мотивов укладки, хотя по некоторым оценкам их кличество может возрасти до 7000 [12,13,15,16]. На сегодняшний день выделеляют четыре основные группы структур, описывающие укладку большей части всех белков [10]:

1) только – вторичная структура включает –спирали, но не -листы 2) только – вторичная структура включает -листы, но не –спирали 3) ./ – чередование –спиралей и -листов, 4) + - –спирали и -листы присутсвуют в структуре, но не чередуются Наиболее известные классификации представлены в ресурсах SCOP[16] и CATH[17].

1.1.4 Доменная структура белка Доменная структура белка определяется взаимным расположением доменов в пространственной и первичной структурах одного белка. Ее исследование позволяет получить важную информацию о функции белка. В белках различают структурные, функциональные и эволюционные домены [18]. При этом разные типы доменов могут либо совпадать, либо не совпадать друг с другом.

Структурный домен определяют как обособленную в пространстве часть белка, способную к самосборке в нативную структуру, имеющую сравнительно мало контактов с другими частями белка и собственное гиброфобное ядро.

Функциональный домен - минимальная часть полипептидной цепи, способную к самосборке в нативную структуру и обладающую той же целевой функцией, что и в составе полноразмерного белка [18].

Эволюционный домен - непрерывный участок полипептидной цепи, эволюционирующий существенно медленнее других участков, является эволюционной единицей в перетасовке доменов.

В 1981 году Го также определил термин «модуль» [19, 20]. Это структурная единица, определяемая диаметром в пределах 15-35. Эта структура также рассматривалась как эволюционная единица (см. раздел 1.3.1). Кроме этого, существуют свидетельства того, что модули могут функционировать независимо, вследствие чего было предположено, что модуль – первоначальная функциональная единица белка [21].

Для проведения биоинформатических исследований наиболее часто используются домены из базы данных Pfam [22]. Понятие домена, используемое в Pfam, базируется на поиске консервативных участков гомологичных последовательностей белка из различных организмов. Ядро множественного выравнивания аминокислотных последовательностей для каждого из функциональных семейств, определенных в PFAM, задавалось путем ручного анализа экспертов, с учетом функциональной аннотации каждого из гомологов. Затем, каждое из таких ядер подвергалось автоматическому расширению путем добавления выравнивания новых пространственных структур белков [23].

1.1.5 Существующие компьютерные ресурсы по пространственной структуре белков и анализу ее особенностей Первые пространственные структуры белка (миоглобина и гемоглобина) были расшифрованы в конце 1950х годов Джоном Кендрю [24] и Максом Перуцем [25] с помощью рентгеноструктурного анализа. В 1980х годах Карлом Вютрихом и Ричардом Эрнстом были разработаны методы определения трехмерной структуры биологических молекул с помощью ядерно-магнитного резонанса [26, 27, 10]. Также разновидностью электронной микроскопии, проводимой при низких температурах, является криоэлектронная микроскопия, применяемая для распознавания структур крупных белковых комплексов с середины 1980х годов [10, 28].

Знание пространственной структуры помогает определить положение функциональных сайтов, элементов вторичной структуры и отдельных доменов. С 1990х годов расшифрованные пространственные структуры белков стали помещаться в единый банк структур – Protein Data Bank (PDB) – в специальном формате данных, включающим координаты атомов [29]. До февраля 2009 года не было единого формата данных. Помимо координат атомов и информации о структурных элементах, отмеченных выше, формат включает в себя информацию об авторе, организме, молекулах растворителя, подробностях эксперимента, последовательности, отсутствующих в структуре атомах, лигандах и идентификаторах в других базах данных.

На основе PDB было создано множество ресурсов, однако основные из них посвящены классификации пространственных структур. В частности, SCOP (поддерживается экспертным курированием базы)[16] и CATH (поддерживается автоматическим курированием)[17]. Среди баз данных, посвященных доменам белков, можно выделить PROSITE [30], BLOCKS [31], PRINTS [32], SUPERFAMILY [33], CDD [34], TIGRFAM [35], Panther [36], ProDom [37], EVEREST [38], Pfam [22] и SMART (Simple Modular Architecture Research Tool [39]. Большая их часть основывается на информации о консервативных участках последовательности различной протяженности, некоторые аннотируются экспертами, другие – автоматически.

1.2 Структурная организация функциональных сайтов белков Традиционно функции белков подразделяют на каталитическую, структурную, защитную, регуляторную, сигнальную, транспортную, рецепторную, моторную и запасающую. В пост-геномную эру, с развитием экспериментальных высокопроизводительных транскриптомных, протеомных и метаболомных технологий появилась возможность полногеномного профилирования молекулярно-генетических взаимодействий и экспрессии белков. Это позволило более полно описывать биохимическую и системную функцию белка, включая клеточный, тканевой и организменный уровень [40, 41]. Развитие методов кристаллизации белков в сочетании с методами рентгеноструктурного анализа обеспечили расшифровку десятков тысяч пространственных структур белков из различных организмов. Информации о пространственных структурах белков, в свою очередь, послужила основой для изучения структурной организации функционирования.

Функциональный сайт белка – группа аминокислотных остатков, лигандами/рецептором или биохимических реакциях, обеспечивающих выполнение его функции. Функциональные сайты обладают свойством компактности в пространственной структуре, т.е., их аминокислотные остатки сближены в пространстве между собой, но могут быть удаленно распределены по последовательности. Среди различных типов функциональных сайтов можно выделить следующие:

1) активные центры (посредством которых катализируются химические реакции, включают в себя каталитические сайты и сайты связывания субстрата). Существует классификация ферментов, разработанная совместно с IUPAC, отражающая также функциональное деление активных центров [42];

2) связывающие лиганды (могут связывать либо макромолекулы - белки, ДНК, РНК, - либо небольшие молекулы);

3) аллостерические (сайты, связывание лигандов с которыми может изменять конформацию белка и, таким образом, регуляторно воздействовать на функцию других удаленных в пространстве сайтов);

4) регуляторные (могут регулировать ферментативную активность белков с помощью активаторов и ингибиторов). Аллостерические сайты являются подгруппой регуляторных сайтов;

фосфорилирования, метилирования, ацетилирования, гликозилирования, присоединения жирной кислоты и др. Описано более 100 видов посттрансляционных модификаций белков [43].

Лиганд-связывающие сайты подразделяются на множество сайтов, в зависимости от типа лиганда (Таблица 1.2). Лигандами могут быть другие белки, ДНК, РНК, или ионы тяжелых металлов, аденин-содержащие кофакторы, органические кислоты и т. п. При классификации таких сайтов могут учитываться размер лиганда, характер химических групп, входящих в состав лиганда и т. д. [44].

Таблица 1.2. Классификация лиганд-связывающих сайтов, представленных в базе данных PDBSite [45].

связывающие неорганические вещества и неметаллосвязывающие Структурная организация сайтов во многом определяется той функцией, преимущественно располагаются во впадинах на молекулярной поверхности белка, что способствует увеличению площади контакта лиганда с белком и особенности расположения лиганд-связыващих сайтов [8]:

1. в воронке на торце -цилиндра. Такое углубление способствует окружению субстрата одновременно многими боковыми цепями белка;

2. в месте стыка доменов.

Активные центры, как правило, не доступны растворителю, они расположены в углублениях на поверхности белка и часто оказываются доступны для взаимодействия с субстратом и осуществления каталитической реакции только после конформационных изменений структуры активного сайта [46]. Каталитические сайты и субстрат-связывающие сайты могут пересекаться между собой в структуре активного центра, либо располагаться раздельно друг от друга, образуя распределенный активный центр.

Например, активный центр многих сериновых протеаз, липаз и сериновых карбоксипептидаз помимо каталитического сайта включает в себя расположенную по соседству впадину, роль которой заключается в образовании водородных связей с атомами-акцепторами и образовании комплекса с субстратом [47]. При наличии гидрофобных частей лиганда связывание, как правило, осуществляется гидрофобными аминокислотными остатками [48].

Активные центры ферментов и сайты связывания ДНК, РНК расположены на поверхности, имеющей высокий электростатический потенциал. То, насколько важен электростатический потенциал, показывает пример сериновых протеаз [48], чьи каталитические триады могут различаться по аминокислотному составу, положению в структуре различных укладок, но проявляют высокую консервативность по отношению к заряду, т.е. имеют одинаковый заряд каталитического кармана.

Лиганд-свзяывающие сайты при связывании с лигандом могут оказывать аллостерический эффект друг на друга. Примером может служить связывание гемоглобином кислорода. Молекулы кислорода выступают аллостерическими регуляторами при связывании с ионом железа гемма, входящего в состав гемоглобина. Связывание хотя бы одной молекулы кислорода приводит к конформационным изменениям белка и повышает его аффинность для последующего связывания других молекул кислорода.

Высокоафинная форма гемоглобина называется R-формой (англ. relaxed), а кислород является положительным гомотропным эффектором. Верно и обратное, частичная потеря молекул кислорода приводит к снижению уровня сродства гемоглобина к кислороду. СО2, Н+ и дифосфоглицерат (ДФГ) являются естественными гетеротропными эффекторами, стабилизирующими низкоафинную форму гемоглобина T (англ. tense). ДФГ также оказывает аллостерический эффект, который интерферирует с эффектом, вызываемым молекулами кислорода. При связывании гемоглобином молекул кислорода стерическое влияние связанного с гемоглобином ДФГ, расположенного в центральной полости тетрамера гемоглобина, ослабляется [10, 49].

Способность белка связывать лиганд зависит от физико-химических свойств аминокислот. Алифатические аминокислоты – аланин, валин, лейцин, изолейцин - обычно не вступают во взаимодействия, но могут осуществлять распознавание лиганда и обеспечивать его связывание. Такие аминокислоты как: лизин, аргинин, глутамин, глутаминовая кислота – являются дифильными, т.е. гидрофильными и гидрофобными одновременно.

Ароматические аминокислоты помимо свойства гидрофильности также обладают способностью образовывать стэкинг и Т-стэкинг взаимодействия.

В частности, они могут связывать, например, полипролиновые участки молекул (домен SH3) [50]. Случай Т-стэкинга можно рассмотреть на примере ингибитора тромбина: ароматическое кольцо ингибитора расположено под углом к плоскости ароматического кольца триптофана [51]. Кроме того, важную роль в этих взаимодействиях играет гистидин: часто встречается в случае обмена доменами, белок-ДНК взаимодействиях и каталитических остатках [52]. Одним из частных случаев химической связи рассматривается образование водородной связи перпендикулярно к ароматической молекуле.

Например, комплекс белка GGBP, связывающего глюкозу между фенилаланином и триптофаном [53]. Еще одним типом взаимодействий являются пи-катионные, т. е. образующиеся между ароматическим аминокислотным остатком и N-H связью лиганда [11].

Роль аминокислотных остатков в каталитических сайтах до сих пор активно изучается [54, 55]. В частности, в сериновых протеазах активный сайт, как правило, состоит из глутаминовой и аспартановой кислоты, гистидина и серина. Гистидин и кислота являются акцепторами атома водорода серина, серин же временно связывает N-конец новообразованного пептида.

В случае реакции образования тирозил-АМФ из тирозина и АТФ на ферменте тирозил-тРНК синтетазе за связывание в процессе переходного состояния отвечают гистидин и треонин за счет водородных связей.

1.3. Влияние мутаций на структуру и функцию белка Обычно рассматривают три основных воздействия мутаций на белок, это влияние мутаций на его функцию, термодинамическую стабильность и синтез [56]. Мутации в белке могут быть повреждающими (запрещенными), нейтральными, либо благоприятными [57]. При этом замечено, что чем более белок функционально нагружен (например, участвует в белок-белок взаимодействиях), тем больше мутаций оказываются запрещенными [56].

Аминокислотные остатки в различных позициях могут по-разному влиять на структуру и функцию конкретного белка. Некоторые аминокислотные остатки важны только для функции белка, другие необходимы для поддержания пространственной структуры. Третьи не так важны для структуры, но опосредованно влияют на внутри- или межмолекулярные взаимодействия. Про четвертые нельзя сказать ничего. Самые важные аминокислотные остатки являются консервативными, часто формируя консервативные паттерны. Мутации, приводящие к замене аминокислотных остатков в функциональном сайте, как правило, не фиксируются. В случае взаимодействия аминокислотных остатков на поверхности между белками наблюдается их коэволюция, т.е. если на поверхности одного белка произошла мутация, то на аминокислотный остаток другого белка будет действовать отбор, и может возникнуть компенсаторная мутация [58].

Мутации аминокислотных остатков вне функциональных сайтов также могут влиять на стабильность и афинность связывания через аллостерический эффект [59].

Остатки, погруженные внутрь гидрофобного ядра, как правило, сохраняют гидрофобные свойства. Аминокислотные остатки на поверхности белка наоборот могут свободно мутировать. Петли на поверхности белка также нечувствительны к вставкам и делециям. В то же время взаимодействия между аминокислотными остатками ограничивают возможности молекулярной изменчивости [10].

Очевидно, что одна и та же мутация может иметь множественный эффект на функцию и структуру белка. Мутации, нейтральные с точки зрения функции, могут быть благоприятны для повышения стабильности пространственной структуры белка, однако при этом могут исключаться последующие мутации, которые могли бы быть функционально выгодны, но запрещены с точки зрения стабильности структуры. В то же время такие мутации могут приводить к увеличению количества функциональных сайтов белка или расширению области его специфичности. До определенного момента такие мутации могут не подвергаться отбору, но впоследствии являться ключевыми при адаптивной эволюции новых функций данного белка [60]. Подобные мутации могут влиять не только на эволюцию этого белка, но и на эволюцию всего функционального процесса, в котором задействован белок [61].

Следует также выделить мутации, ведущие к образованию новых функциональных сайтов. Новообразованный функциональный сайт может существующего в белке функционального сайта. Как правило, устойчивое сосуществование этих двух функций наблюдается в случае, если лиганды этих сайтов различны по размеру или заряду. Обычно такая функциональная дивергенция основывается на предшествующей дупликации или различных компенсаторных механизмах, например, регуляции экспрессии белка. Если устойчивого существования не наблюдается, в большинстве случае такие мутации приводят к приобретению новой функции и утрате прежней. Также взаимодействий [61].

1.4 Базы данных, посвященные функциональным сайтам Описание функциональных сайтов в базах данных, как правило, содержит информацию о позициях аминокислотных остатков, входящих в его состав, и их взаимного пространственного расположения в структуре белка. Многие базы данных также содержат функциональные мотивы (как в первичной, так Экспериментальные данные о положении функциональных сайтов в пространственной структуре белков часто приводятся в базе данных PDB пространственных структур белков. На основе экспертного реферирования литературы создана Catalytic Site Atlas (CSA) – база данных каталитических сайтов белков с известной пространственной структурой [62, 63].

Существуют также вторичные базы данных, содержащие информацию о функциональных сайтах, полученную в результате компьютерного анализа экспериментальных данных. Наиболее известны среди них следующие:

SitesBase – база данных на основе информации из PDB, посвященная сайтам распознавания и связывания лигандов [64].

PDBSite – база данных функциональных сайтов различных типов (сайты посттрансляционной модификации, каталитические, сайты связывания органических и неорганических лигандов, сайты белок-белковых и белокДНК взаимодействий и т. д.) на основе информации о сайтах из PDB и о контактных сайтах на основе информации о структуре гетерокомплексов [45].

электростатическим свойствам молекулярной поверхности функционального сайта [65].

sc-PDB - база данных сайтов связывания лигандов, построенная на основе скрининга структур PDB на предмет поиска полостей на поверхности белка, которые могли бы связывать небольшие лиганды, в частности, с целью фармакологического применения [66].

функциональных сайтах как из PDB, так и из CSA [67].

LigASite – база данных таких функциональных сайтов белков, для которых известна как апо-структура (структур белка до связывания с лигандом), так и холо-структура (структура белка после связывания с лигандом) [68].

Эти базы данных содержат информацию об особенностях организации функциональных сайтов в структуре белка, которая может быть расширена информацией об экзон-интронной организации генов, кодирующих соответствующие белки. Однако ресурсов по функциональным сайтам, предоставляющих информацию о взаимоотношении функциональных сайтов с экзон-интронной структурой гена до сих пор не создано.

1.3 Эволюция структуры и функции белков Всестороннее изучение особенностей кодирования функциональных сайтов помимо анализа структурно-функциональной организации белков также требует исследования экзон-интронной структуры гена. Геномы позвоночных характеризуется большим объемом (обычно более 1Гб), при этом большая часть последовательности ДНК является некодирующей [69].

На рисунке 1.2 показана общая структура гена эукариот и его экзонинтронная структура.

Рис. 1.2. На рисунке представлена общая структура гена эукариот и его экзонинтронная организация. Овалами отмечены сайты связывания транскрипционных факторов. Поли(А) – поли(А)-тракт на 3’-конце молекулы РНК, 5’UTR – 5’ нетранслируемая лидерная область, 3’UTR – 3’ нетранслируемая трэйлерная область. В качестве примера промоторной области приведен ТАТА-бокс. Черным цветом показана кодирующая белок область, белым – некодирующая [70].

Кодирующая область ДНК представлена экзонами, которые имеют разные длины. Статистика распределений длин экзонов представлена в таблице 1.3.

При этом значения параметров распределения длин экзонов близки для человека, мыши и крысы. [71]. Число экзонов в структуре одного гена эукариот колеблются в количестве 2-3 у одноклеточных и в среднем до 6-9 у позвоночных [72,73].

Таблица 1.3. Распределение длин экзонов в генах различных организмов [71].

Homo sapiens Mus musculus Rattus norvegicus 1.3.1 Пути эволюции генов эукариот дупликация гена (или экзона) с последующей дивергенцией функции [57], горизонтальный перенос генов (между геномом эукариот и геномами внутриклеточных органелл (митохондрий, пластид), прокариот и эукариот [74]). Основным понятием в анализе последовательностей генов является понятие гомологии. Гомологичные гены различают двух типов: ортологи (гены разных видов, имеющие одного предка) и паралоги (гены, образованные путем дупликации внутри одного генома). При этом ортологи обычно обладают сходными функциями. В то же время паралоги в большинстве случаев представляют различные функции [75].

Под действием отбора происходит дивергенция функций белков, кодируемых как генами-ортологами, так и генами-паралогами. Как правило, большинство различий по последовательности ортологов не связаны с функциональности, различия могут быть также вызваны адаптацией к другим внутриклеточным компартментам, тканям или коадаптацией к измененным рецепторам или лигандам, с которыми белок взаимодействует [61].

Дупликация генов является частым событием. По некоторым оценкам в различных геномах от 1% до 10% генов сосуществуют со своими почти точными копиями [76], также присутствует вариация количества копий генов между отдельными особями [61]. Известно, что вследствие дупликации генов у эукариот наблюдается кластеризация паралогов в геноме [69]. В то же время тандемные дупликации приводят к увеличению частоты неравного кроссинговера [57].

Эволюция генов путем диверсификации функции кодируемых белков может происходить по одной из трех моделей (рис. 1.3) [61].

1) Модель Оно. Согласно этой модели дупликация гена является образовавшейся копии до тех пор, пока белок, кодируемый паралогом, не приобретет функцию, благоприятно сказывающуюся на каком-либо метаболическом пути. Это одна из первых моделей, позволившая в упрощенном виде объяснить возникновение генов с новыми функциями.

Однако ей присущ ряд недостатков. В частности, модель Оно опирается на представление о том, что один ген кодирует один белок с единственной функцией. Кроме того, согласно модели в силу нейтральной эволюции в гене накапливаются запрещенные мутации с такой же вероятностью, как и разрешенные, что противоречит наблюдаемым закономерностям. Существуют также и другие события, которые не укладываются в рамки модели. В частности, в работе [77] были рассмотрены возможные случаи, когда дупликация гена может подвергаться положительному отбору в условиях увеличенной потребности в продукте гена.

2) Дивергенция прежде дупликации. Эта модель основывается на том, что многие белки способны проявлять несколько функций в той или иной степени, даже если они нисколько не свойственны основной функции этого белка. В этом случае дупликация позволяет данному гену-паралогу специализировать одну из функций, которая в ходе отбора становится положительному отбору тогда, когда возрастает потребность во второстепенной функции белка, кодируемого данным геном.

3) Субфункционализация. Данная модель предполагает, что после дупликации запрещенные мутации могут накапливаться в обеих копиях паралогов, в этом случае оба гена подвергаются положительному отбору на функцию, представленную геном-предком. Чаще встречается у регуляторных элементов, но подходит и для белок-кодирующих последовательностей.

Рисунок 1.3. Основные модели дивергентной эволюции белков, в которую вовлечены дупликации кодирующего гена [61].

Перетасовка экзонов как еще один способ эволюции гена был предложен У. Гилбертом (Gilbert) в 1978. Под перетасовкой понимают слияние и разрыв экзонов, а также их дупликацию. Считается, что механизмом перетасовки экзонов является двойной неравный кроссинговер [56]. Частота кроссинговера обуславливается соотношением длины экзонов и интронов.

Так как экзоны занимают 1% длины генома человека, а интроны 24% [78], то рекомбинация с большей вероятностью осуществляется между экзонами и затрагивает некодирующую часть генома, а не в экзонах. Было высказано предположение, что интроны – горячие точки рекомбинации [59]. Вследствие этого можно считать экзонную перетасовку одним из главных факторов эволюции белков. При этом показано, что случаи перетасовки экзонов происходили только на поздних ступенях эволюции, и потому процесс перетасовки не мог значительно влиять на возникновение древних белков.

Считается, что процесс перетасовки экзонов возник после появления сплайсосомных интронов [79,80]. Помимо двойного неравного кроссинговера причиной перетасовки экзонов могут являться дупликации [61] и взаимодействия с мобильными элементами [60,61].

Чтобы можно было утверждать, что имел место случай перетасовки экзонов, необходимо, чтобы выполнялись два условия [80]:

1) два гомологичных участка последовательности присутствуют в окружении негомологичных участков;

2) перенос гомологичного участка осуществлялся с помощью рекомбинации между интронами.

Случаи перетасовки экзонов распространены среди многоклеточных организмов для генов, кодирующих внеклеточные белки и рецепторы. На основе этого факта была выдвинута гипотеза, что именно этот механизм эволюции способствовал развитию явления многоклеточности [74].

Вертикального переноса наследственного материала, то есть от предка, недостаточно для описания эволюции эукариот, в частности, одноклеточных микроорганизмов. Причина этого кроется в том, что эукариотические геномы химерны, так как возникли в результате как вертикального, так и горизонтального переносов [81]. Анализ доступных данных показал, что существует два типа горизонтального переноса: 1) горизонтальный перенос генетического материала из органелл в ядро, лишь некоторые события которого произошли на заре возникновения эукариотических геномов; 2) аномальные события горизонтального переноса, в которые вовлечены различные виды организмов как донора, так и реципиента.

Горизонтальный перенос между геномами прокариот и эукариот.

Примером может служить встройка в геном Drosophila melanogaster большей части генома облигатного внутриклеточного симбионта Wolbachia[82]. Как правило, такие случаи горизонтального переноса связаны с эндосимбиозом или способности простейших к фаготрофии. Однако также известно существование горизонтального переноса и в геномах животных [83].

Известны случаи переноса генов и от эукариотического генома к прокариотическому [84]. Однако эти случаи намного более редки.

Горизонтальный перенос между геномами эукариот. Засвидетельствованы несколько случаев горизонтального переноса генов отвечающих за патогенность или осмотрофный тип питания между различными видами грибов от патогенного к непатогенному. Это привело к конвергентной адаптации непатогенного вида гриба к патогенности [85].

1.3.2 Частота использования кодонов в последовательностях ДНК соответствуют наиболее распространенным тРНК и трансляция которых соответственно проходит быстрее. Среди кодонов выделяют часто встречающиеся и редко встречающиеся. На использование кодонов влияют такие факторы, как инициация трансляции, сайты сплайсинга, нуклеосомный контекст.

Известно, что использование кодонов вблизи границ экзонов и интронов отличается, так как кодоны в этих участках ДНК несут сигнал сплайсинга.

Посчитаны консенсусы для донорного и акцепторного сайтов сплайсинга (рис. 1.4) [86].

Рисунок 1.4. Консенсус последовательности для донорного и акцепторного сайтов сплайсинга отображен с помощью весовых матриц PSM.

Дальнейшие исследования показали, что хотя последовательность насыщена динуклеотидами AG в области донорного сайта сплайсинга, кодоны встречаются, как правило, AT-богатые [87].

Последние исследования на различных организмах показывают, что использование кодонов связано и со структурно-функциональными особенностями кодируемых белков. Так, можно выделить следующие факторы [88]:

располагающиеся в гидрофобном ядре пространственной структуры белка, более консервативны и чаще оптимальны, чем те, которые кодируют аминокислоты, расположенные на его поверхности;

2) использование оптимальных кодонов во фрагментах ДНК, кодирующих аминокислоты, расположенных внутри элемента вторичной структуры белка, не коррелирует со скоростью эволюции последовательности;

3) слабоструктурированные участки пространственной структуры менее консервативны, чем элементы вторичной структуры;

4) наблюдается корреляция между скоростью экспрессии гена, его скоростью эволюции и термостабильностью кодируемого белка;

5) участки белок-белковых взаимодействий подвергаются меньшей скорости эволюции, чем другие на поверхности пространственной структуры белка.

Оптимальные и часто встречающиеся кодоны могут отличаться у разных видов, при этом различается и интенсивность их использования [89].

1.3.3 Эволюция пространственной структуры белка: конвергенция и Пространственная укладка аминокислотной цепи белка подчиняется ряду закономерностей [23]:

1. белок сворачивается в уникальную трехмерную структуру;

пространственная укладка последовательности белка избирательна, т.е. произвольно выбранный полипептид не обязательно образует известную укладку;

3. белки, взятые из протеомов различных организмов и имеющие сходство последовательностей 25-30%, имеют одинаковую третичную структуру и принадлежат к одному семейству укладок 4. некоторые пары белков, имеющие одинаковую укладку, имеют такое же сходство последовательностей, какое могут иметь произвольные последовательности – 8-9% 5. внутри одного семейства укладок белковые последовательности имеют только 3-4% одинаковых аминокислот на совпадающих позициях.

На формирование и сохранение пространственной структуры белка влияет жесткий стабилизирующий отбор, так как белок стремиться приспособиться к наиболее стабильной и консервативной укладке. Последние же данные показывают, что белковая укладка не обязана быть ни физически, ни биологически инвариантной [90].

Небольшое количество аминокислот, одинаковых и располагающихся в сходных участках пространственной структуры белков с одинаковой укладкой, относится к числу наиболее функционально важных. Так, показано сходство между функциональными сайтами разных белков для укладки индолглицеролфосфат синтаза, рибулозо-бисфосфаткарбоксилаза и др. [3].

Было замечено, что существуют участки третичной структуры белка (петли и другие периферические структуры), являющиеся структурно подвижными. Такие белки были названы хамелеонами, а подвижные части вариабельными. Как правило, расположение этих участков в структуре изменяется при изменении функционального состояния белка (например, при связывании с лигандом) [90].

Белки сгруппированы в различные семейства, объединяемые общей укладкой, на основе гомологии и сходства пространственной структуры [91].

При определении белкового семейства используются различные пороги для подсчета. Широко применяется порог в 30%. В частности, при составлении базы данных SCOP (Structural Classification of Proteins) [16], используется два критерия кластеризации белков: 1) аминокислотные последовательности, имеющие сходство более 30%; 2) белки, обладающие низким уровнем сходства последовательности, но близкие по функциям и структуре (например, глобины с уровнем сходства 15%).

1.4 Проекция пространственной структуры белка на структуру кодирующего гена Экспериментальные методы позволили идентифицировать не только структуры белков, но структурные домены, входящие в их состав, т.е.

минимальные по длине фрагменты последовательности, обладающие способностью к самостоятельной сборке в глобулярную пространственную свидетельств того, что структурные домены также могут сохранять полноразмерных белков [2]. С появлением данных о пространственной структуре белков возникли вопросы о том, как же соотносятся между собой структурная организация беков и структура кодирующих их генов.

1.4.1 Соответствие доменной структуры белка и экзонной структуры кодирующего гена Соответствия между экзоном и доменом могут быть классифицированы следующим образом [2]:

1. один экзон – один домен 2. несколько экзонов – один домен 3. один экзон – несколько доменов 4. нет точного соответствия (например, домен составлен из частей экзонов).

Показано, что после перетасовки кодирующая экзонная структура домена белка может изменяться за счет вставок или делеций интронов [80].

Для мультидоменных белков была рассмотрена зависимость между сложностью организма и количеством комбинаций с доменами других суперсемейств. В этом случае суперсемейства были эквивалентны суперсемействам базы данных SCOP. Как видно из таблицы 1.4, количество таких суперсемейств увеличивается со сложностью организма, также увеличивается и количество белков, содержащих в своем составе различные комбинации доменов [92]. Существование комбинаций доменов может обуславливаться потребностью в многофункциональных белках. Одним из лидеров суперсемейств по количеству различных доменов является EGF.

Интересно отметить, что происхождение этого суперсемейства связывают с перетасовкой генов [93].

В литературе, наравне с доменом, также выделяют супра-домен, как эволюционную единицу, т.е. такую парную комбинацию доменов из различных суперсемейств, которая подвергалась дупликации в пределах некоего гена [94].

Таблица 1.4. Распределение комбинированных друг с другом суперсемейств по геномам [92].

Геномы Methanobacterium thermoautotrophicum Считается, что на перетасовку доменов оказывает влияние их размер.

Полагают, что более крупные домены являются менее мобильными по сравнению с меньшими по размеру [95]. В частности, это согласуется с гипотезой о том, что вставки дополнительных интронов в экзоны способствуют осуществлению негомологичной рекомбинации [95].

1.4.2 Фазы экзонов и интронов и их роль в эволюции Для анализа корреляции структур экзона и домена используется сопоставление границ экзона в гене и проекции домена кодируемого белка на различные комбинации по фазе интронов и экзонов, т.е. по номеру определяется по месту разрыва кодирующего кодона интроном: 0 – если разрыв находится на границе триплетов, 1 – если сдвиг на 1 позицию, 2 – если сдвиг на два нуклеотида (рис. 1.5). У одного экзона можно выделяют участвующими в разрыве на 5’-конце и 3’-конце.

Рисунок 1.5. Фазы интронов и экзонов соответственно границам вставки [78]. Красным показан кодон, по которому проходит вставка интрона между экзонами.

Частота статистически значимых совпадений границ проекции домена и экзона увеличивается в ходе эволюции от червей и насекомых к рыбам и млекопитающим, что отражает постепенно увеличивающуюся корреляцию экзон-домен. Огромное количество данных по этой корреляции дает повод для некоторых предположений и вопросов, увеличивающих интерес к экзонной теории перекомбинации. Например, способствует ли экзондоменная корреляция распространению доменов и облегчению распределения доменов внутри генома? Может ли эта мобильность домена быть движущей силой формирования мозаичных белков?

Рисунок 1.6. Эволюция прокариот и эукариот с точки зрения интрон-экзонных границ.

Интроны показаны черной соединительной линией. Экзоны с границами 0-0 – белыми квадратами, с границами 1-1 – черными [96].

Группой авторов [97] исследовался кластер доменов, чьи границы расположены очень близко к экзон-интронным границам. С использованием геномов девяти видов животных, было показано, что эти ограниченные одним экзоном домены демонстрируют высокую подвижность в пределах генома. Экзон-ограниченные домены в среднем более многочисленны и присутствуют в большем количестве генов, чем другие домены.

Например, у C. elegans 19% всех доменов совпадают с границами экзонов, тогда как у человека таких доменов 42% [97]. Если в мультидоменных белках имеются повторяющиеся домены, процент совпадения границ экзонов и доменов увеличивается до 50%. Эти и другие данные говорят о постепенном усложнении генома и об эволюционном прогрессе, связанном с перетасовкой и дупликациями [97].

Правило вырезания рамки для экзонной рекомбинации обуславливает участие в перетасовках доменов, ограниченных одной и той же фазой интронов. Это может быть одной из причин, по которой интрон-экзонные границы начала и конца экзона часто совпадают по нуклеотидной позиции в триплете. При этом у древних видов чаще встречается позиция 0-0, а у новых – 1-1 (рис. 1.6, 1.7) [2].

Рисунок 1.7. Распределение древних и новых доменов в зависимости от позиции в белке [91]. Гибридный белок содержит и древние, и новые домены. Простой белок содержит домены только одного типа. А. Новые домены в гибридных белках. B. Старые домены в гибридных белках. C. Новые домены в простых белках. D. Гибридные домены в простых белках.

Подобная корреляция является строгой для интрон-экзонной структуры некоторых генов позвоночных (протеазы коагуляции крови, фибринолиза, белки комплемента, различные селектины, белок соединения хряща, фактор Н, тенацины [78]). В то же время существуют группы генов, для которых корреляции границ экзонов и доменов не были выявлены. Например, у ламининов.

Авторами [96] проводился анализ корреляции границ проекции модуля белка на нуклеотидную последовательность гена и границ экзона. Оказалось, что границы интронов коррелируют именно с такими модулями, но только если оба находятся в фазе 0. На этом фоне было выдвинуто предположение, что перетасовка древних генов у прокариот осуществлялся по фазе 0, поэтому интроны ими были потеряны или их не было вовсе, но рекомбинация все же происходила.

1.4.3 Интегрированные базы данных За последние несколько лет были интегрированы многие базы данных, содержащие информацию по нуклеотидным, аминокислотным последовательностям, а также пространственным структурам белков. Так были созданы ресурсы XdomView [98], ExDom [99] и Structural Exon Database (SEDB) [100], осуществляющие разметку границ экзонов, а также доменов на пространственной структуре белка (Таб. 1.5).

XdomView – это веб-приложение для визуализации границ доменов белка на его третичной структуре. Для разметки доменной структуры извлекалась информация из баз данных SCOP, CATH, DALI [91], 3DEE [101], MMDB [102]. Для аминокислотной последовательности производилась разметка экзонной структуры кодирующего гена на основе БД ExInt [103]. Разметка экзонной структуры также производилась для гомологичных белков, поиск которых осуществлялся с помощью программы BLAST [104]. При этом информация не хранится в базе данных, а генерируется после запроса пользователя.

последовательностей по GeneBank [105] с помощью BLAST, осуществляя структурное выравнивание между найденными последовательностями и последовательностью PDB по методу CE [106] и экстрагируя информацию об экзонно-интронной структуре из базы данные EID [107]. Кроме этого, программа позволяет проводить множественное выравнивание белков по соответствующим им границам экзонов и визуализировать фазы экзонинтронных границ.

ExDom сопоставляет доменную структуру белка и экзон-интронную структуру кодирующего его гена. В случае если для белка известна пространственная структура, на нее проецируют границы экзонов.

Таблица 1.5. Сравнительные характеристики ресурсов, посвященных проекции структуры белка на структуру кодирующего его гена.

Проекция структуры PDB Проекция доменной структуры Взаимно-однозначное соответствие кодирующего гена и пространственной структуры 1.5 Заключение к литературному обзору В литературном обзоре рассмотрены основные принципы строения, функционирования и организации белков. Приведены физико-химические свойства аминокислот в составе функциональных сайтов, классификация функциональных сайтов белков, в том числе по типу связываемых лигандов.

Рассматривается эволюция структуры и функции белка в связи с эволюцией кодирующей структуры гена. Описываются причины наблюдаемой корреляции границ экзонной и доменной структур.

пространственной структуре белков и анализу ее особенностей, по методам и ресурсам, осуществляющим проекцию пространственной структуры белков на кодирующую структуру гена, а также баз данных, содержащих информацию по функциональным сайтам белков. По итогам такого обзора можно сделать вывод об отсутствии ресурса, который бы интегрировал различные и разрозненные данные о функциональных сайтах белка и их проекции на кодирующую структуру гена.

Глава 2. Компьютерная система SitEx Разработана компьютерная система SitEx, предназначенная для анализа соотношения между экзон-интронной структурой генов и особенностями структурно-функциональной организации белков, включая структуру и свойства их доменов и функциональных сайтов. Система состоит из трех интегрированных между собой компонентов:

аминокислотную последовательность белков экзонной структуры кодирующих их генов, границ функциональных и структурных доменов белков, а также позиций функциональных сайтов белков;

2) программных средств BLAST и 3DPDBScan, предназначенных для поиска по базе данных SitEx на основе анализа сходства нуклеотидных последовательностей генов, а также первичных и третичных структур белков;

3) веб-интерфейса, обеспечивающего доступ к базе данных и программным средствам, а также предоставлющего графическую визуализацию результатов.

2.1 Описание использованных баз данных При создании базы данных SitEx использовались данные из таких ресурсов как Ensembl (хранение полной информации о последовательности пространственной структуре белков), SCOP (структурная классификация белков). В разделе приводится описание форматов данных этих ресурсов.

2.1.1 Ensembl Ресурс Ensembl посвящен хранению организованной биологической информации о последовательностях генов организмов, геном которых секвенирован полностью или почти полностью [108, 109]. При этом Ensembl посвящен информации преимущественно о геномах эукариот, в частности, хордовых. Позднее в ресурс вошли еще 5 веб-сайтов, посвященных бактериальным геномам (Ensembl Bacteria), геномам простейших (Ensembl Protista), грибов (Ensembl Fungi), растений (Ensembl Plants) и животных (Ensembl Metazoa). В основе Ensembl лежит автоматическая аннотация известных генов и предсказание новых генов на основе функциональной аннотации InterPro [110], информации о болезнях, связанных с мутациями OMIM [111], данных по экспрессии белков на основе метода SAGE (Serial analysis of gene expression) [112] и информации о семействе генов. Ensembl также содержит информацию о генах, предсказанных по гомологии и по методу скрытых марковских моделей. Геномный браузер позволяет просматривать гены на протяжении всей длины хромосомы. Помимо этого, хранится информация о генетических маркерах, генах сцепленных с заболеваниями, об однонуклеотидных полиморфизмах, СрG-островах, повторах, сравнительном анализе генов. Транскрипты основываются на курируемых базах данных UniProt/Swiss-Prot и NCBI RefSeq, а также UniProt/TrEMBL [113]. Таким образом, транскрипты в базе данных Ensembl могут быть, известными (known), предсказанными (novel) и смешенного типа (merged).

Идентификаторы Ensembl организованы следующим образом:

ENSG### ген ENST### транскрипт ENSP### белок ENSE### экзон Для генов других организмов к идентификаторам добавляются первые буквы латинского алфавита: ENSDART### (Danio rerio).

В случае альтернативного сплайсинга для одного гена в Ensembl может содержаться информация о транслируемых и нетранслируемых транскриптах. Для каждого транскрипта имеется полная последовательность, включающая экзон-интронную разметку. Также для гена представлено попарное выравнивание с последовательностями известных ортологов и паралогов. Страница, описывающая белок, включает информацию о последовательности белка, о кодирующей экзон-интронной структуре и о доменной структуре на основе таких баз данных, как Pfam, Prosite, InterPro.

2.1.2 Protein Data Bank (PDB) Общая информация об этом банке данных описывалась выше (см. 1.1.3).

Поскольку это база данных трехмерных структур белков, то основную часть файла в формате PDB занимает описание пространственных координат атомов основной цепи и аминокислотных остатков. Помимо этого, файл содержит информацию о наименовании молекулы, первичной и вторичной структурах белка, о лигандах и комплексах, ссылки на другие базы данных, содержащие информацию о последовательности белка, библиографические ссылки и подробности проведения эксперимента.

Файл базы данных PDB – форматированный текстовый файл, в котором каждая строка начинается с названия поля. Название поля имеет длину до латинских символов. Есть поля, присутствующие в файле в обязательном порядке (таб. 2.1): краткий заголовок (HEADER), наименование (TITLE), характеристика молекул (COMPND), организм (SOURCE), ключевые слова (KEYWDS), информация о характере эксперимента при получении пространственной структуры (EXPDTA), авторы эксперимента(AUTHOR), изменения в файле с момента первого опубликования (REVDAT), публикации и разрешение структуры (REMARK 2 и 3 соответственно), первичная структура (SEQRES), конец файла (END). Остальные поля являются опциональными.

Данные, которые заносятся в каждое поле, строго регламентированы.

Информация о функциональном сайте белка хранится в полях:

REMARK 800, которое предоставляет информацию об идентификаторе сайта; способе распознавания сайта (экспертное или с помощью компьютерных программ); трехбуквенном идентификаторе лиганда HETNAM – содержит расшифровку трехбуквенного идентификатора последовательности белка, для которой известна пространственная структура Таблица 2.1. Группы данных, представленных в файле формата PDB

MDLTYP, AUTHOR, REVDAT, SPRSDE, JRNL

Последовательность DBREF, SEQADV, SEQRES MODRES Дополнительные молекулы HET, HETNAM, HETSYN, FORMUL Вторичная структура HELIX, SHEET Кристаллографические данные CRYST Система координат ORIGXn, SCALEn, MTRIXn Координаты атомов

ENDMDL

Координаты связанных атомов CONECT 2.1.3 SCOP Согласно SCOP, структуры белков объединены в семейства, структурные суперсемейства, укладки и классы [16].

Классы – самая старшая единица иерархии – представлены восемью группами структур: 1) состоящие только из альфа-спиралей, 2) только из бета-листов, 3) состоящие из чередующихся альфа и бета структур, 4) состоящие из разделенных альфа и бета структур, 5) мультидоменные белки, 6) мембранные белки и белки поверхности клетки, 7) малые белки, 8) суперзакрученные структуры (coil-coiled).

Структурная укладка объединяет домены, имеющие одинаковые элементы вторичной струкутры в одинаковой топологической ориентации.

Надсемейство объединяет домены, имеющие помимо структурного сходства общее эволюционное происхождение.

Структурное семейство – самая младшая единица иерархии - объединяет последовательности; 2) функциональное сходство (рис. 2.1).

Рисунок 2.1. Идентификатор структурного семейства в SCOP.

пространственных структурах, описанных в формате PDB, то координаты пространственная структура и структурная укладка, совпадают. Каждый структурный домен в БД SCOP имеет стандартный идентификатор:

d(идентификатор pdb)(цепь полипептида в pdb).

Структурный домен может полностью включать в себя одну цепь белка. В то же время на одной цепи белка может лежать несколько структурных доменов.

2.2 Описание программных средств При создании системы были использованы программные средства для сравнения последовательностей и пространственных структур.

2.2.1 Формат данных FASTA аминокислотной последовательности. Первая строка, начинаясь с «>», содержит описание последовательности, как правило, в следующем порядке:

наименование последовательности (обязательно) тип последовательности длина последовательности Во второй строке записана последовательность, как правило, разбитая на игнорироваться, так и считаться окончанием последовательности. Цифры, дефисы, пробелы и т.п. обычно игнорируются. Файл может содержать несколько последовательностей.

2.2.2 BLAST BLAST (Basic Local Alignment System Tool) – программа для сравнения последовательностей с помощью оптимизированного алгоритма локального выравнивания и матриц замен [114]. Она позволяет осуществлять поиск нуклеотидных и аминокислотных последовательностей, имеющих высокое семантическое сходство, по заданной базе последовательности. Результаты поиска упорядочены по очкам (Score) и статистической значимости результата (E-value). Значимым обычно считается результат со значением Evalue менее 0,05.

Программа позволяет использовать как стандартные БД (UniProt, PDB, GenBank, RefSeq etc.), так и базу собственных последовательностей в FASTA формате. В первом случае формат FASTA включает в начале строки “gi|”, вот втором идентификатор считается локальным и вначале строки используется “lcl|”. При этом заголовок последовательности должен быть уникальным, а через пробел может включаться любая информация в произвольном формате.

Программа находится в свободном доступе и может быть установлена на сервер (таблица 2.2).

Таблица 2.2. Программы, включенные в пакет BLAST Программа Анализируемая последовательность База последовательностей tblastx транслированная нуклеотидная транслированная нуклеотидная гомологичных последовательностей, которые зависят, например, от длины последовательности (таблица 2.3). При выравнивании аминокислотных последовательностей показателем количественной оценки качества выравнивания является его вес.

Таблица 2.3. Рекомендуемое использование в BLAST матриц аминокислотных замен при различной длине полипептида [116].

Для сравнительного анализа разрывности функциональных сайтов, входящих в состав домена карбоксилазы типа В был рассчитан коэффициент CoefE для всех рассматриваемых выше белков (Таб. 2.6).

Таблица 2.6. Сайты связывания лигандов в домене карбоксилазы типа В Проанализированы сайты связывания N-ацетил-D-глюкозамина (NAG), таурохолевой кислоты (TCH), кофактора А (COA), фукозы (FUC), бутановой кислоты (BUA), маннозы (MAN и BMA), лимонной кислоты (FLC). При этом только для NAG-связывающего сайта имелась информация по его расположению во всех рассматриваемых белках. Оказалось, что для NAGсвязывающего сайта значение CoefE равно 0 во всех белках за исключением специфической особенностью. В отличие от других рассмотренных белков, в нейролигине-2 он кодировался двумя экзонами, между которыми была вставка экзона, не кодирующего функциональный сайт. Следует также отметить особенность кодирования других лигандов, хотя они были представлены только одним из рассмотренных выше белков. TCH- и CоAсвязывающие сайты также оказались разрывными по экзонам. Эти сайты имеют относительно большой размер по сравнению с сайтами связывания FUC, BUA, MAN, FLC, которые кодировались одним или несколькими соседними экзонами.

Таким образом, на примере домена карбоксилазы типа В показано, что функциональные возможности системы SitEx позволяют проводить анализ разрывности сайтов в функциональных доменах белков, кодируемых генами с различной экзонной структурой.

2.8 Заключение В главе описаны этапы разработки компьютерной системы SitEx. Описано используемых в последующем для интеграции данных и во вспомогательных содержащая информацию о разметке функциональных сайтов в экзонной структуре генов, являющаяся частью системы SitEx. Система SitEx иммет гибкий интуитивно ясный для пользователя интерфейс, а также содержит программы Exon BLAST Search и 3D Exon Search, позволяющие решать задачи анализа соотношения между экзон-интронной структурой генов и особенностями структурно-функциональной организации белков.

Функциональные возможности системы SitEx были продемонстрированы на примерах решения следующих задач:

1) Сравнение особенностей кодирования сайтов связывания одинаковых лигандов в негомологичных белках человека на примере глицеральдегид-3фосфатдегидрогеназы. В результате анализа показано, что НАДсвязывающие сайты в глицеральдегид-3-фосфатдегидрогеназе и алкогольдегидрогеназе расположены в пространственно сходных участках, но не гомологичных по аминокислотной последовательности, что может быть следствием конвергентной эволюции этих сайтов;

2) Поиск сходства между фрагментами белков, кодируемых отдельными экзонами, и аминокислотными последовательностями прокариот. На примере белка уропорфириногендекарбоксилазы человека, имеющего общую функцию с белком Bacillus subtilis, с помощью SitEx выявлены экзоны, кодирующие наиболее консервативные и функционально значимые участки последовательности белка;

3) Исследование разрывности сайтов в функционально близких доменах белков, кодируемых генами с различной экзонной структурой. С использованием SitEx на примере домена карбоксилазы типа В, часто встречающегося в мозаичных белках, показано, что экзонная структура, кодирующая этот домен, вариабельна, однако, разрывность по экзонам NAGсвязывающего сайта проявляет консервативность.

Таким образом, компьютерная система SitEx обеспечивает возможность реализации сложных запросов, позволяющих формировать различные сценарии анализа функциональной организации генов, особенностей кодирования и эволюции функциональных сайтов с учетом экзонной структуры гена, а также задач выявления экзонов, задействованных в эволюционных перетасовках, вставках и делециях.

функциональных сайтов белков в генах позвоночных 3.1 Исследование распределений длин экзонов, кодирующих и некодирующих функциональные сайты Для сравнительного анализа распределений длин экзонов, кодирующих и некодирующих функциональные сайты, было создано две соответствующих выборки экзонов (ЭКФС и ЭНФС) на основе БД SitEx.

Выборка ЭКФС включала в себя 6444 экзона, а выборка ЭНФС - последовательностей генов. Распределения длин экзонов представлено на рисунке 3.1. Статистический анализ с помощью 2 двух распределений длин экзонов из выборок ЭКФС и ЭНФС показал их значимое различие (2=582.8,

Э КФС Э НФС

Рисунок 3.1. Распределения длин экзонов из выборок ЭНФС (I) и ЭКФС(II).





Похожие работы:

«КРАЕВ Андрей Николаевич ОБОСНОВАНИЕ ИСПОЛЬЗОВАНИЯ ПЕСЧАНОЙ АРМИРОВАННОЙ ПОДУШКИ В СЛАБЫХ ГЛИНИСТЫХ ГРУНТАХ ПОД ЛЕНТОЧНЫМИ ФУНДАМЕНТАМИ 05.23.02 - Основания и фундаменты, подземные сооружения ДИССЕРТАЦИЯ на соискание ученой степени кандидата технических наук...»

«Марочкин Алексей Геннадьевич ПОГРЕБАЛЬНАЯ ПРАКТИКА НАСЕЛЕНИЯ ВЕРХНЕГО ПРИОБЬЯ В ПЕРИОДЫ НЕОЛИТА И ЭНЕОЛИТА (история изучения, структурный анализ и типология, проблемы культурно-хронологической интерпретации) 07.00.06 – Археология ДИССЕРТАЦИЯ на соискание ученой степени кандидата исторических наук Научный руководитель : доктор исторических наук,...»

«Спирина Екатерина Александровна РАННЯЯ АКТИВИЗАЦИЯ ПОСЛЕ ОРТОТОПИЧЕСКОЙ ТРАНСПЛАНТАЦИИ СЕРДЦА 14.01.24 - Трансплантология и искусственные органы Научный руководитель : доктор медицинских наук, профессор В. Н. Попцов ДИССЕРТАЦИЯ на соискание ученой степени кандидата медицинских наук Москва - ОГЛАВЛЕНИЕ ВВЕДЕНИЕ ГЛАВА 1 ПРЕДПОСЫЛКИ ДЛЯ ВНЕДРЕНИЯ МЕТОДА РАННЕЙ...»

«КИРИЛЛОВА Альбина Александровна ОСНОВЫ КРИМИНАЛИСТИЧЕСКОЙ МЕТОДИКИ СУДЕБНОГО РАЗБИРАТЕЛЬСТВА ПО УГОЛОВНЫМ ДЕЛАМ ОБ УБИЙСТВАХ (ч. 1 ст. 105 УК РФ) Специальность 12.00.12 – криминалистика; судебно-экспертная деятельность; оперативно-розыскная деятельность ДИССЕРТАЦИЯ на соискание ученой степени кандидата юридических наук Научный руководитель : доктор юридических наук, профессор Ю.П. Гармаев Улан-Удэ – Оглавление Введение Глава 1....»

«Логинова Елена Анатольевна Повышение энергетической эффективности тепловых электрических станций с использованием низкокипящих рабочих тел в паротурбинных циклах Специальность 05.14.04 Промышленная теплоэнергетика Диссертация на соискание ученой степени кандидата технических наук Научный руководитель : к.т.н., доцент Коновалов...»

«ГАВРИЛОВ ИЛЬЯ ЮРЬЕВИЧ ОПРЕДЕЛЕНИЕ ВЛИЯНИЯ НАЧАЛЬНОГО СОСТОЯНИЯ ПАРА НА ВОЛНОВУЮ СТРУКТУРУ И ПАРАМЕТРЫ ДВУХФАЗНОГО ПОТОКА В СОПЛОВОЙ ТУРБИННОЙ РЕШЕТКЕ Специальность 05.04.12 – Турбомашины и комбинированные турбоустановки Диссертация на соискание ученой степени кандидата технических наук Научный руководитель : Доктор технических...»

«Пи Цзянькунь ОППОЗИЦИЯ ПРАВДА – ЛОЖЬ В ПАРЕМИОЛОГИЧЕСКОМ ПРОСТРАНСТВЕ РУССКОГО ЯЗЫКА (ЛИНГВОКУЛЬТУРОЛОГИЧЕСКИЙ АСПЕКТ) Специальность 10.02.01 – русский язык ДИССЕРТАЦИЯ на соискание ученой степени кандидата филологических наук Научный руководитель : д.ф.н., проф. Зиновьева Елена Иннокентьевна Санкт-Петербург 2014 2 ОГЛАВЛЕНИЕ ВВЕДЕНИЕ.. ГЛАВА ТЕОРЕТИЧЕСКИЕ ОСНОВЫ ИЗУЧЕНИЯ 1. ПАРЕМИОЛОГИЧЕСКОГО ПРОСТРАНСТВА РУССКОГО ЯЗЫКА 1.1....»

«УДК 511.3 Горяшин Дмитрий Викторович Об аддитивных свойствах арифметических функций 01.01.06 математическая логика, алгебра и теория чисел диссертация на соискание учной степени е кандидата физико-математических наук Научный руководитель : доктор физико-математических наук, профессор В. Н. Чубариков Москва 2013 Содержание Обозначения Введение 1 Точные квадраты вида [n]...»

«УДК 547.992.2 Гречищева Наталья Юрьевна Взаимодействие гумусовых кислот с полиядерными ароматическими углеводородами: химические и токсикологические аспекты 02.00.03 –Органическая химия 11.00.11 –Охрана окружающей среды и рациональное использование природных ресурсов Научные руководители: кандидат химических наук И. В. Перминова доктор химических наук, профессор В. С. Петросян Научный...»

«Тарасов Антон Юрьевич Факторы, детерминирующие процесс взаимодействия руководителей и персонала крупных промышленных предприятий Специальность 22.00.08 – Социология управления Диссертация на соискание ученой степени кандидата социологических наук Научный руководитель Потемкин Валерий Константинович доктор экономических наук,...»

«Кондаков Василий Гаврильевич Обобщение схемы КАБАРЕ на многомерные уравнения задач газовой динамики специальность: 05.13.18 – Математическое моделирование, численные методы и комплексы программ Диссертация на соискание ученой степени кандидата физико-математических наук Научный руководитель : д.ф.-м.н. С.А. Карабасов Москва - Содержание Введение Глава 1. Схема КАБАРЕ для уравнений...»

«НЕФЕДОВ ЮРИЙ ВИКТОРОВИЧ ЗАКОНОМЕРНОСТИ ПРОЯВЛЕНИЯ АЗОТНЫХ ДЕФЕКТОВ В КРИСТАЛЛАХ АЛМАЗА УРАЛЬСКОГО ТИПА Специальность 25.00.05 – Минералогия, кристаллография ДИССЕРТАЦИЯ на соискание степени кандидата геолого-минералогических наук Научный руководитель – доктор...»

«Неустроева Евдокия Анатольевна ОСОБЕННОСТИ РАЗВИТИЯ ТВОРЧЕСКИХ СПОСОБНОСТЕЙ В УСЛОВИЯХ ОСВОЕНИЯ ДЕТЬМИ СИМВОЛИЧЕСКИХ СРЕДСТВ ВЫРАЗИТЕЛЬНОЙ ПЛАСТИКИ (ДОШКОЛЬНЫЙ И МЛАДШИЙ ШКОЛЬНЫЙ ВОЗРАСТ) 19.00.07 – Педагогическая психология Диссертация на соискание ученой степени кандидата психологических наук Научный руководитель кандидат психологических наук, старший научный сотрудник, Брофман Вера Владимировна Москва – 2014 СОДЕРЖАНИЕ ВВЕДЕНИЕ ГЛАВА 1. Символ в пространстве творческой...»

«Кальной Павел Станиславович Клинико-экспериментальное обоснование реконструктивных операций на митральном клапане при дегенеративной патологии 14.01.26 Сердечно-сосудистая хирургия Диссертация на соискание учёной степени кандидата медицинских наук НАУЧНЫЙ РУКОВОДИТЕЛЬ: доктор медицинских наук профессор Идов Эдуард Михайлович Москва 2014 г. ОГЛАВЛЕНИЕ СПИСОК СОКРАЩЕНИЙ 3 ВВЕДЕНИЕ 4 Глава 1. РЕКОНСТРУКТИВНАЯ...»

«Бурвиков Никита Викторович Системные построения в судебной экспертизе 12.00.12 – Криминалистика; судебно-экспертная деятельность; оперативно-розыскная деятельность Диссертация на соискание учёной степени кандидата юридических наук Научный руководитель доктор юридических наук, профессор Толстухина Т.В. Тула – ОГЛАВЛЕНИЕ ВВЕДЕНИЕ.. ГЛАВА 1....»

«ВАСИЛЬЕВ Евсей Владимирович ЭВОЛЮЦИЯ ВНЕШНЕПОЛИТИЧЕСКОЙ СТРАТЕГИИ БЕЛОРУССИИ НА СОВРЕМЕННОМ ЭТАПЕ Специальность 23.00.04 – Политические проблемы международных отношений, глобального и регионального развития Диссертация на соискание ученой степени кандидата политических наук Научный руководитель д. ю. н., профессор ХРИСТОФОРОВ Василий Степанович Москва ОГЛАВЛЕНИЕ Введение...»

«ПОБЕЖИМОВ Андрей Иванович ЗАСЕЛЕНИЕ И ХОЗЯЙСТВЕННОЕ ОСВОЕНИЕ СЕВЕРНОГО ПООНЕЖЬЯ В СЕРЕДИНЕ XVI–НАЧАЛЕ XVIII В Специальность 07.00.02 – Отечественная история ДИССЕРТАЦИЯ на соискание ученой степени кандидата исторических наук Научный руководитель : доктор исторических наук, профессор Шумилов Михаил Ильич Петрозаводск, 2014 ОГЛАВЛЕНИЕ ВВЕДЕНИЕ Глава 1. ЗАСЕЛЕНИЕ И ХОЗЯЙСТВЕННОЕ ОСВОЕНИЕ СЕВЕРНОГО ПООНЕЖЬЯ К СЕРЕДИНЕ XVI В. 1.1....»

«АЛЕКСЕЕВ Михаил Николаевич ОСОБЕННОСТИ ЭКОНОМИЧЕСКОГО МЕХАНИЗМА КОНКУРЕНЦИИ НА РЕГИОНАЛЬНОМ РЫНКЕ МЯСОПРОДУКТОВ Специальность 08.00.05 – экономика и управление народным хозяйством (экономика, организация и управление предприятиями, отраслями, комплексами – АПК и сельское хозяйство; региональная экономика) ДИССЕРТАЦИЯ на соискание ученой степени кандидата экономических наук Научные руководители:...»

«Кидяева Наталья Петровна ПОВЫШЕНИЕ ЭФФЕКТИВНОСТИ ИСПОЛЬЗОВАНИЯ ЗЕРНОУБОРОЧНЫХ КОМБАЙНОВ ЗА СЧЕТ ОПТИМИЗАЦИИ ЭНЕРГОЗАТРАТ В УСЛОВИЯХ АМУРСКОЙ ОБЛАСТИ Специальность 05.20.01 – технологии и средства механизации сельского хозяйства Диссертация на соискание ученой степени кандидата технических наук Научный руководитель – доктор технических наук, профессор Щитов С.В....»

«ГУЩИНА Дарья Юрьевна МОДИФИКАЦИЯ ЭЛЬ-НИНЬО В УСЛОВИЯХ МЕНЯЮЩЕГОСЯ КЛИМАТА: МОНИТОРИНГ, ПРИЧИНЫ, УДАЛЕННЫЙ ОТКЛИК 25.00.30 – метеорология, климатология, агрометеорология диссертация на соискание ученой степени доктора географических наук Москва, 2014 2 Содержание ВВедение ГлаВа 1. Эль-ниньо – Южное колебание и Внутрисезонная тропическая изменчиВость: мониторинГ и механизмы формироВания 1.1....»






 
2014 www.av.disus.ru - «Бесплатная электронная библиотека - Авторефераты, Диссертации, Монографии, Программы»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.