WWW.DISS.SELUK.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА
(Авторефераты, диссертации, методички, учебные программы, монографии)

 

Министерство образования и науки Украины

Харьковский национальный университет им.В.Н.Каразина

В.В.ИВАНОВ, Л.А.СЛЕТА

РАСЧЕТНЫЕ МЕТОДЫ ПРОГНОЗА БИОЛОГИЧЕСКОЙ

АКТИВНОСТИ ОРГАНИЧЕСКИХ СОЕДИНЕНИЙ

Харьков - 2003

УДК 615.015.11

Иванов В.В, Слета Л.А.

РАСЧЕТНЫЕ МЕТОДЫ ПРОГНОЗА БИОЛОГИЧЕСКОЙ

АКТИВНОСТИ ОРГАНИЧЕСКИХ СОЕДИНЕНИЙ.

Харьков: ХНУ, 2003–71с.

Учебное пособие является систематическим изложением основ методологии прогноза биологической активности органических молекул.

Рассмотрены базовые параметры характеризующие молекулярную структуру, а также распространенные статистические методы обработки экспериментальных данных по биоактивности.

Для аспирантов и студентов старших курсов специальностей химия, биохимия, биофизика и медицинская физика.

Рис. 5. Библиография: 7 назв.

Рецензенты:

Доктор химических наук Дорошенко А.О.

Рекомендовано к печати методической комиссией химического факультета Харьковского национального университета им. В.Н.Каразина Протокол № 5 от 14 мая 2003 г.

© Иванов В.В., Слета Л.А.

©Харьковский национальный университет им.В.Каразина, 2003 г.

СОДЕРЖАНИЕ

Введение

1. Дескрипторный метод описания структуры молекул

1.1. Индексы электронной структуры

1.2.Задачи

1.3. Топологические и теоретико-информационные индексы............... 1.4.Задачи

2. Регрессионные модели биологической активности

2.1. Метод наименьших квадратов

2.2. Эмпирические константы заместителей. Уравнения Гаммета и Тафта...……………………………………………………….………........ 2.3. Аддитивная модель Фри-Вильсона

2.4. Метод Хэнча. Оценка липофильности......…

2.5. Задачи

3. Статистические методы классификации молекул по их биологической активности

3.1. Логико-комбинаторный подход........……

3.2. Кластерный анализ

3.3. Линейный дискриминационный анализ...........…

3.4. Задачи..…………………………..................………

4. Заключение

5. Список литературы

6. Приложение. Некоторые термины и параметры биологической активности........……………………………………………………………......

ВВЕДЕНИЕ

Современная технология ставит перед учеными задачу разработки методов надежного предсказания физико-химических и биологических видов активности различных классов химических соединений. Эта проблема имеет общее название количественное соотношения структура - активность (Quantitative Structure – Aсtivity Relationship, QSAR) и в настоящее время является многопрофильной задачей, включающей в себя различные подходы не только в рамках фармакологической химии, но и физики и математики.

Для того, чтобы найти соотношение между заданным видом активности органических соединений и их структурой, последнюю необходимо представить в численном виде. Численные характеристики, выражающие структурные особенности молекулы, получили общее наименование дескрипторов молекулярной структуры (или просто дескрипторы). В связи с этим главная проблема QSAR – выбор такого (желательно минимального) набора дескрипторов, который достаточен для описания заданного свойства. Хорошие перспективы при решении данной проблемы имеют методы квантовой химии, с помощью которых можно проводить расчеты электронной структуры и геометрии самых разнообразных химических систем вплоть до моделирования эффектов среды и взаимодействия молекулы с рецептором.

Особенностью проблематики QSAR является необходимость экспериментальных данных, позволяющих строить различные типы функциональных зависимостей. Здесь наряду с хорошо известным регрессионным анализом применяются факторные методы, позволяющие выделять наиболее существенные параметры, описывающие систему, а затем проводить классификацию химических соединений по типам биологической активности. В целом методология QSAR позволяет заменить поиск соотношений “структура – активность“ анализом исследований получать модельные функции вида:

где искомое свойство Y выражается через значения дескрипторов молекулярной структуры d i. Подобные уравнения фактически являются схемами для расчета самых различных свойств органических соединений.

Область применения построенных моделей зависит как от их качества с точки зрения статистики, так и от представительности базы данных, использованной для их построения.

В процессе моделирования важно контролировать прогностическую способность построенных моделей. Один из наиболее надежных подходов к решению этой задачи состоит в разделении исходной базы данных на обучающую выборку, использующуюся для построения моделей, и контрольную выборку. Последняя необходима для независимого контроля предсказательной способности моделей. Такой подход позволяет в большинстве случаев избежать случайных корреляций.

Целью настоящего пособия является краткое изложение основных понятий и методологии QSAR, а также описание различных систем параметров молекул и методов оценки биологической активности на основе статистического анализа эмпирических данных. Для каждого из таких подходов предлагается набор соответствующих задач. Все объекты, биологической активности взяты из оригинальных работ.



1. ДЕСКРИПТОРНЫЙ МЕТОД ОПИСАНИЯ СТРУКТУРЫ

МОЛЕКУЛ

В последние десятилетия для описания структуры молекул были предложены тысячи различных дескрипторов, которые включают индексы, характеризующие топологию, электронную структуру, энергию, форму молекул и т.д.

Строение молекулы может быть описано с разной степенью детализации. Так, брутто-формула показывает, сколько и какие атомы содержатся в молекуле. Структурная формула учитывает лишь типы атомов и характер их связывания, игнорируя при этом геометрические характеристики. Задание координат ядер атомов в пространстве позволяет строить трехмерные геометрические модели молекул. С помощью квантовохимических расчетов можно получить дополнительную информацию о распределении электронной плотности (электронная структура молекулы). В ряде случаев для характеристики молекул используют физико-химические параметры, отражающие молекулярное строение косвенным образом.

1.1. ИНДЕКСЫ ЭЛЕКТРОННОЙ СТРУКТУРЫ

На первом этапе исследования QSAR необходимо вычислить определенный набор дескрипторов для всех структур в имеющейся базе данных.

Электронные дескрипторы могут быть вычислены с использованием методов квантовой химии. В данном разделе мы рассмотрим возможности применения простейшего подхода - полуэмпирического метода молекулярных орбиталей Хюккеля (МОХ). Метод МОХ основан на предположении, что каждый атом углерода поставляет в общую систему один -электрон, а гетероатомы – один или два (так называемое электронное приближение).

В методе Хюккеля обычную структурную формулу органического вещества заменяют его молекулярным графом или хюккелевским графом.

Хюккелевский граф наряду с топологической матрицей передает информацию о молекулярной структуре сопряженных и ароматических соединений. Так, для молекулы фульвена граф имеет вид:

Топологическая матрица (или матрица смежности) графа G определяется следующим образом. Матричный элемент G rs равен 1, если вершины графа (атомы) связаны друг с другом, в противном случае матричный элемент G rs равен 0, т.е. топологическая матрица состоит из 1 и 0. Например, топологическая матрица графа фульвена имеет вид:

Хюккелевские молекулярные орбитали (МО) являются собственными обозначаемого h :

Величина орбитальной энергии i представляет собой собственное значение энергии, связанное с собственной функцией i. Каждая МО выражается в виде линейной комбинации атомных орбиталей:

где суммирование проводится по всем атомам r сопряженной молекулы, r – атомная 2p z – орбиталь атома с номером r, а c ir – вклад r-й атомной орбитали в i-ю МО (так называемый орбитальный коэффициент). При этом атомные орбитали r предполагаются ортонормированными:

Полная -электронная энергия E определяется выражением где ni - число заполнения орбитали i, принимающее значения 2, 1 или 0.

Минимизация E с помощью вариационного метода приводит к системе секулярных (или вековых) уравнений где h rs – матричные элементы гамильтониана в базисе атомных орбиталей:

Секулярные уравнения имеют нетривиальные решения только при условии обращения в нуль секулярного (векового) детерминанта где I – единичная матрица.

Упрощение секулярного детерминанта достигается путем введения следующих хюккелевских приближений:

где - кулоновский интеграл, который предполагается одинаковым для всех орбиталей, центрированных на идентичных атомах r, где называется резонансным интегралом, в простейшем варианте теории он предполагается одинаковым для всех связей между атомами одного типа. С учетом хюккелевских приближений матрица h приобретает вид где G – топологическая матрица молекулы.

Секулярный детерминант легко преобразовать к виду:

Численные величины x =, входящие в секулярный детерминант, определяют энергию -электронов на отдельных МО и образуют набор собственных значений рассматриваемого хюккелевского графа, т.е.

спектром графа.

Поскольку матрицы h и G коммутируют, они обладают общим набором собственных векторов. Собственные векторы топологической матрицы G идентичны хюккелевским молекулярным орбиталям.

На основе решений метода Хюккеля в рамках -электронного приближения разработана система дескрипторов молекулярной структуры (табл.1.1).

Таблица 1.1 Наиболее распространенные квантовохимические Электронная плотность характеризует вероятность пребывания электронов в данной области молекулы (у данного атома r) где ni – число электронов на i-той МО, c ir – орбитальный коэффициент разложения i-той молекулярной орбитали по r-той атомной орбитали (атом r). C этой величиной связан также заряд на атоме (qr):

где Zr – число –электронов атома, отданных в систему сопряжения.

-Порядок связи характеризует степень -электронного связывания.

Эту величину для связи r-s можно вычислить следующим образом:

Индекс свободной валентности Fr характеризует реакционную способность углеродного атома r и согласно определению вычисляется следующим образом:

характеризующая способность к образованию -связи, а Nr - сумма порядков всех связей атома r:

электрофильную – Se (r) и нуклеофильную – Sn (r) :

где ( HOMO ) – энергия высшей заполненной МО, ( LUMO) – энергия нижней характеризующие способность к делокализации (стабилизации) электронов в переходном комплексе при атаке электрофильным/нyклеофильным суперделокализуемость в связи с оценками канцерогенной активности молекул.

Важное значение имеют индексы, характеризующие поляризуемость электрическую дипольную поляризуемость и набор коулсоновских поляризуемостей.

Электрическая дипольная поляризуемость характеризует изменение распределения электронной плотности молекулы при помещении её в однородное электрическое поле. Эта величина может быть получена из эксперимента по молекулярной рефракции или вычислена как производная дипольного момента ( µ ) по напряженности электрического поля ( E ) из выражения Обычно эта величина используется в виде средней поляризуемости :

или (реже) анизотропии поляризуемости:

Здесь xx, yy, zz – компоненты тензора дипольной поляризуемости.

Молярная рефракция (MR) также широко используется в качестве дескриптора. В области оптических частот она выражается известной формулой Лорентца-Лоренца:

где n – показатель преломления вещества, MW – молекулярный вес, а d – плотность.

Известны следующие типы коулсоновских поляризуемостей.

электроотрицательности (кулоновского интеграла) того же атома:

Сумма самополяризуемостей по всем атомам также может служить хорошим дескриптором “подвижности” электронной оболочки • Атом-атомная поляризуемость ( rs ) характеризует изменение электроотрицательности (кулоновского интеграла) другого атома (s):

Кроме перечисленных известны также поляризуемости типа атом-связь ( r,st = ) и связь-связь ( rs,tu = rs ), которые, однако, менее популярны в проблеме QSAR.

Энергия разрыва химической связи:

где E – полная энергия молекулярной системы, а E – суммарная энергия составных частей, на которые система распадается.

Энергия электронного перехода в различных квантовохимических подходах оценивается по-разному. В простейшем методе Хюккеля её получают как разность энергий МО. Так, энергия длинноволнового перехода вычисляется по формуле:

характеристикой сопряженной системы:

где второй член соответствует энергии системы изолированных двойных связей данной молекулы.

Вышеперечисленные квантовохимические индексы нашли широкое распространение в проблеме QSAR. Известно множество корреляционных функций, которые связывают наблюдаемый био- или физико-химический эффект с параметрами электронной структуры молекулы. В качестве примера приведем два уравнения. Так, из данных о токсичности ( lg LD 50, см. приложение) серии из 20 нитрилов было получено следующее корреляционое уравнение (Chem.Rev., 1996, 96, 1027):

где – поляризуемость молекулы, а E – ее энергия протонизации, оцененная методами квантовой химии как разность энергии нейтральной и протонированной формы. Во втором уравнении описыается ингибирование ацетилхолинестеразы производными бензилпиперидина:

где µ – дипольный момент, С4 – орбитальный коэффициент в высшей заполненной молекулярной орбитали, а ( HOMO) – ее энергия (уравнение взято из работы J.Med.Chem., 1992, 35, 584).

Метод Хюккеля и другие полуэмпирические методики (CNDO, INDO, AM1, PM3), которые используются в расчетах QSAR, реализованы в HyperChem и т.д). Программа HyperChem позволяет оценить такие полезные величины как эффективная площадь поверхности молекулы, квантовохимических программ был разработан также и на кафедре технической химии Харьковского национального университета им.

В.Н.Каразина.

Задания 1-19 выполните, не используя квантовохимических вычислительных программ.

1. Изобразите молекулярные графы и запишите топологические матрицы для следующих молекул и радикалов: а) этилена, аллила и бутадиена; б) циклопропенила, циклобутадиена, пентадиенила и бензола;

в) нафталина и азулена; г) антрацена и фенантрена.

2. Запишите детерминант Хюккеля для следующих молекул и радикалов: а) этилена, аллила и бутадиена; б) циклопропенила, циклобутадиена, пентадиенила и бензола; в) нафталина и азулена;

г) антрацена и фенантрена.

3. Вычислите энергии МОХ для молекулы этилена. Постройте энергетическую диаграмму МО основного и возбужденного состояний этилена. Вычислите соответствующие им полные электронные энергии.

4. Вычислите энергии МОХ формальдегида. Полученные результаты сравните с соответствующими энергиями МОХ этилена. (При вычислениях используйте: 0 = + ; CO =, где и - параметры для атома углерода.) 5. Вычислите энергии МОХ для радикала аллила. Постройте энергетические диаграммы МО для радикала аллила, его катиона и аниона.

Вычислите соответствующие энергии связывания. Обсудите полученные результаты.

6. Постройте энергетическую диаграмму МО и вычислите энергию делокализации для молекулы бутадиена, если для связывающих МО значения x равны –1,618 и –0,618. Какой физичесий смысл имеет энергия делокализации?

7. Постройте энергетическую диаграмму МО и вычислите энергию делокализации для молекулы бензола, если для связывающих МО 8. Постройте энергетическую диаграмму МО и вычислите энергию делокализации для молекулы нафталина, если для связывающих МО x принимает значения:

9. Постройте энергетическую диаграмму МОХ для радикала бензила, если для занятых МО получены следующие значения х = -2,101; -1,259; Общее решение векового детерминанта в методе МОХ для циклического углеводорода c N атомами имеет вид: x k = 2 cos(2k ) / N, где k = 1, 2, … N. Используя этот результат, вычислите орбитальные энергии и энергии делокализации для а) радикала циклопропенила; б) молекулы циклобутадиена; в) радикала циклопентадиенила.

составьте хюккелевские уравнения для нахождения орбитальных коэффициентов молекулы этилена. Вычислите орбитальные коэффициенты для связывающей и разрыхляющей МО этилена. Запишите для них аналитические выражения, изобразите их графически.

12. В рамках метода МОХ вычислите электронные плотности на атомах, порядок связи и индексы свободной валентности для молекулы этилена. Результаты расчета представьте на молекулярной диаграмме.

13. В рамках метода МОХ вычислите электронные плотности на атомах, порядки связей и индексы свободной валентности для молекулы бутадиена. Постройте молекулярную диаграмму бутадиена. Используйте следующие выражения для занятых молекулярных орбиталей:

где численные коэффициенты имеют следующие значения:

14. Вычислите индексы свободной валентности на атомах углерода в молекуле пиридина, если порядки связей равны р12 = 0,654, р23 = 0,669 и р = 0,665.

15. Вычислите индексы свободной валентности на атомах углерода в радикале бензиле, если порядки связей равны р12 = 0,635, р23 = 0,523, р34 = 0,705, р45 = 0,635.

16. Вычислите индексы свободной валентности на атомах углерода в молекуле анилина, если порядки связей равны р12 = 0,291, р23 = 0,637, р34 = 0,673, р45 = 0,663.

17. Отличаются ли электронные плотности на атомах в молекулах: а) этилена и бутадиена; б) бензола и нафталина; в) нафталина и азулена; г) антрацена и фенантрена?

18. Постройте молекулярную диаграмму для молекулы бензола, если известно, что порядок углерод-углеродной связи равен 0,667. Вычислите атом-атомные поляризуемости в молекуле бензола.

19. В рамках метода МОХ обсудите электронную структуру: а) триметилен метила; б)метиленциклопропена; в) дициклобутадиена; г) пентадиенила.

При выполнении заданий №№ 20—34 проведите компьютерный 20. Сравните электронные структуры метиленциклопропена и циклопропенона (энергии МО, заряды, порядки связей).

HC CH CH

21. Вычислите энергии делокализации следующих небензоидных структур:

22. Покажите, что 1,4-дивинилбензол и 2-фенилбутадиен являются изоспектральными молекулами (им соответствуют одинаковый спектр энергий хюккелевских молекулярных орбиталей).

неальтернантного углеводородов. Вычислите заряды, индексы свободной валентности, самополяризуемости и суперделокализуемости углеродных атомов.

24. Вычислите энергию делокализации и предскажите устойчивость в ряду следующих углеводородов:

структурных формул наиболее адекватно передает его свойства?

27. Сравните распределение зарядов на атомах и орбитальные энергии следующих нуклеотидных оснований 28. Вычислите распределение зарядов на атомах и орбитальные энергии электрофильную суперделокализуемость атомов углерода для положения 1, 2, 3, 4 и 5.

30. Сравните заряды на однотипных атомах кислорода и оцените акцепторные свойства следующих соединений:

31. Укажите атомы углерода, для которых индексы свободной валентности и электрофильной суперделокализуемости имеют наибольшие значения в молекулах следующих соединений:

углеродных атомов бутадиена, если молекулярные орбитали (в порядке возрастания энергии) имеют вид:

a = 0,372, b = 0,602. Оцените изменение электронной плотности на первом углеродном атоме при увеличении его кулоновского интеграла на 0,1.

33. Оцените энергию нижайшего электронного возбуждения, первую энергию ионизации и сродство к электрону в ряду молекул: этилен, бутадиен, гексатриен, октатетраен.

1.3 ТОПОЛОГИЧЕСКИЕ И ТЕОРЕТИКОИНФОРМАЦИОННЫЕ ИНДЕКСЫ

Топологический подход к описанию молекулярной структуры основан на анализе структурной формулы молекулы и вычислении изменении нумерации атомов или связей (так называемые топологические инварианты). При этом обычно “легкие” водородные атомы в расчете не учитываются и рассматривается каркас молекулы, построенный из “тяжелых” атомов: С, N, O, S… Развитие топологического подхода тесно связано с применением теории графов. Кроме топологической матрицы (G) здесь часто используется матрица расстояний G D. Каждый элемент в матрице расстояний g D (ij) равен минимальному числу ребер, соединяющих одну вершину (i) с другой (j). В качестве примера приведем граф и соответствующие матрицы G и G D для молекулы 2,3-диметилбутана:

топологических дескрипторов.

• Число путей в молекулярном графе определенной длины.

Число путей между вершинами длины “1” (P1 ), т.е. число химически связанных пар атомов, число путей длины “2” или индекс ГордонаСкантлбери (P2), число путей длины “3” (P3) получают простым подсчетом количества единиц, двоек или троек в одном из треугольников симметричной матрицы GD.

• Индекс Винера W равен сумме связей, существующих между всеми парами “тяжелых” атомов в графе молекулы с n вершинами:

• Индекс Рандича (1) характеризует молекулярную связность:

где – i и j cтепени вершин графа, т.е. соответствующие количества связей вершин i и j. Суммирование проводят по всем парам связанных вершин. Известны также обобщенные индексы Рандича, где суммирование проводится по всем цепям маршрутов длины k между вершинами i и j:

• Индекс среднеквадратичных расстояний D где Pi – число пар вершин в матрице G D, расстояние между которыми (длина) равно i.

• Индексы загребской группы.

В первом выражении суммирование проводится по всем вершинам, а во втором – по всем парам связанных атомов.

• Наибольшее собственное значение max матрицы смежности (G) как топологический индекс был предложен в качестве меры количества разветвлений в структуре графа.

использовании известной универсальной формулы Шеннона для оценки неоднородности (информации) любой системы. Предположим, что структура молекулы определенным образом разбита на подмножества.

Тогда, вычислив вероятность попадания того или иного элемента в заданное подмножество, можно оценить информацию о распределении всех элементов по подмножествам (формула Шеннона):

где ni – количество элементов в подмножестве i, а n – суммарное количество всех элементов системы, равное В этом выражении логарифм берется по основанию 2, что соответствует информации выраженной в битах. На основе формулы Шеннона введены следующие теоретико-информационне индексы.

• Неоднородность распределения расстояний между вершинами в молекулярной структуры. Здесь степень неоднородности структуры, оценивается на основе анализа распределения расстояний между вершинами графа. Тогда ni =Рi – количество связей длины “i”, а n – общее количество кратчайших расстояний между всеми парами атомов структуры. Часто бывает удобно использовать общее количество информации в пересчете на граф – TI D :

• Информационное содержание графа относительно окрестностей kго порядка – ICk, представляет собой информационное содержание в расчете на одну вершину:

где pi - вероятность того, что выбранная случайным образом вершина графа (атом) попадет в i-тое подмножество, причем вычисляется она с учетом окружения.

• TIC k – полное информационное содержание – мера сложности в расчете на один граф.

• SIC k – структурное информационное содержание • BICk – информационное содержание связывания где Nb – полное число ребер (ковалентных связей) в молекулярном графе.

• CICk – комплементарное информационное содержание В качестве примера рассмотрим вычисление индексов I D и IC для молекулы 2,2-диметилбутана (остальные информационные индексы легко вычисляются из IC). Граф молекулы можно представить в виде:

Для вычисления индекса I D подсчитаем число путей между вершинами длины “1”, “2”, “3”и т.д. Р1=5, Р2=7, Р3=3. Путей длины более “3” в этом графе нет, поэтому И, следовательно, индекс I D равен В отличие от индекса I D индекс ICk вычисляется на основе анализа вершин (атомов). Для IC0 подсчитывается количество неэквивалентных атомов без учета ближайших соседей. Поскольку в этой молекуле все атомы одного сорта – атомы углерода, то все они эквивалентны и, следовательно, относятся к одной группе.

Индекс IC1 вычисляется с учетом ближайших соседей. Анализ графа показывает, что при таком рассмотрении можно выделить группы атомов (см. табл 1.2) Таблица 1.2 Группы атомов в молекуле 2,2-диметилбутан с учетом Следовательно, значение индекса IC1 равно Индекс IC 2 вычисляется с учетом ближайших и следующих за ними соседей. Четыре группы эквивалентности атомов с учетом соседей “второго порядка’’ приведены в табл. 1.3.

Таблица 1.3 Группы атомов в молекуле 2,2-диметилбутан с учетом В табл.1.4 приведены для сравнения некоторые топологические индексы двух изомеров гексана – н-гексана и 2,2-диметилбутана.

Таблица 1.4 Некоторые топологические индексы для двух изомеров Теперь рассмотрим более сложную систему – молекулу ментола, молекулярный граф которой имеет вид (как и в предыдущих случаях, атомы водорода не рассматриваем):

Нулевой порядок ( IC0 ).

С учетом окрестностей нулевого порядка все десять углеродных атомов эквивалентны. Следовательно, одиннадцать “тяжелых атомов” системы могут быть сгруппированы в две группы – все атомы углерода и кислород.

Информационное содержание в этом случае равно TIC 0 = 4,829, SIC 0 = 0,127, BIC0 = 0,127, CIC 0 = 3, (ближайшие соседи) для всех атомов Очевидно, что имеется 5 групп эквивалентности, а именно С1, С9, С10, – 3 атома;

С2, С5, С8, – 3 атома;

С3, С6, С7, – 3 атома;

С4 – 1 атом;

О – 1 атом.

Используя эти данные, можно вычислить IC1 :

TIC1 = 23,793, SIC1 = 0,625, BIC1 = 0,625, CIC1 = 1, Второй порядок ( IC 2 ). Окрестности второго порядка (учет соседей через один атом) для всех эквивалентных атомов в первом порядке выглядят следующим образом:

Итак, имеем следующие группы эквивалентности:

• С1, С9, С10 – 3 атома;

• С6, С7 – 2 атома;

• а также шесть групп по одному атому.

TIC 2 = 31,295, SIC 2 = 0,822, BIC2 = 0,822, CIC 2 = 0, Третий порядок ( IC3 ). Рассматриваем все эквивалентные атомы во втором порядке и выписываем окрестности через два соседних атома.

• Атомы С9 и С10 включаются в одну группу;

• остальные группы по одному атому.

TIC 3 = 36,058, SIC3 = 0,948, BIC3 = 0,948, CIC3 = 0, Очевидно, что дальнейшее расширение окрестностей не приведет к изменению информационного содержания, поскольку атомы 9 и топологически неразличимы по соображениям симметрии.

Перечисленные топологические и информационные индексы широко описывающих самые различные биологические и физико-химические свойства молекул. Ряд примеров использования этих индексов приведен в последующих разделах, а здесь, в качестве иллюстрации, мы запишем два простых корреляционных соотношения. Первое связывает температуру кипения алканов T( o C) с индексом Рандича (1) :

демонстрирует удовлетворительное согласие с экспериментальными величинами (табл. 1.5).

Таблица 1.5. Индекс Рандича и температура кипения изомеров Во втором уравнении (J.Pharm.Sci., 1975, 64, 1971) тот же индекс Рандича линейно связан с минимальной блокирующей концентрацией анестетиков (спирты, кетоны, эфиры, амины, фенолы) для мускульных или нервных волокон ( lg MBC ).

представляет собой относительно простую задачу ручного счета лишь для малых систем. В тех же случаях когда речь идет о крупных молекулах, содержащих десятки атомов, такой расчет может оказаться трудоемким. К сожалению, авторам известна только одна современная компьютерная программа DRAGON, которая позволяет вычислять более тысячи (!) всевозможных дескрипторов, включая топологические. Немаловажным ее (http://www.disat.unimib.it/chm).

34. Изобразите молекулярные графы изомеров бутана. Для каждого из них вычислите число связей длины “1”, “2” и “3”. По каким топологическим индексам можно различать изомеры бутана?

35. Изобразите молекулярные графы изомеров пентана. Для каждого из них вычислите число связей длины “1”, “2” и “3”. По каким топологическим индексам можно различать изомеры пентана?

36. Изобразите молекулярные графы и вычислите индексы Винера для всех изомеров гексана.

37. Изобразите молекулярные графы и вычислите индексы Винера для изомеров гептана.

38. Вычислите индексы Рандича для изомеров гексана.

39. Вычислите индексы Рандича для изомеров гептана 40. Вычислите информационные индексы ( I D, IC0, IC1, IC 2 ) для изомеров гексана.

41. Вычислите информационные индексы ( I D, IC0, IC1, IC 2 ) для двух любых изомеров гептана.

42. Составьте таблицу топологических и информационных индексов для орто-, мета- и пара- ксилола. По каким индексам эти изомеры можно различать?

43. Составьте таблицу топологических и информационных индексов для любых трех изомеров гептана. По каким индексам их можно различать?

44. Изобразите молекулярные графы любых двух изомеров октана.

Вычислите для них индекс Винера, индекс Рандича и информационный индекс (I).

бутадиена.

46. Вычислите индексы IC0, IC1, SIC1, BIC1, CIC1 для насыщенных одноатомных спиртов: бутанол-1, 2-метилпропанол, 3-метилбутанол, пентанол-1, 3-метилбутанол-2.

47. Вычислите индексы IC0, IC1, IC 2, IC3, для молекулы камфоры 48. Вычислите индексы I D и TI D для следующих молекул: н-бутан, изобутан, н-пентан, 2-метилбутан, 2,2-диметилпропан, 2-метилпентан, 3метилпентан, 2,3-диметилбутан, 2,2-диметилбутан.

49. Вычислите информационные индексы для молекул гексана, циклогексана.

50. Вычислите индексы IC0, IC1, IC 2 а также индексы Рандича ( (1), ( 2) ) и Винера (W) для дизамещенных барбитуровой кислоты:

а) барбитал (R1 = R2 = -C2H5), в) фенобарбитал (R1 = -C2H5, R2 = C6H5), с) барбамил (R1 = -C2H5, R2 = -C5H11(i) ).

2. РЕГРЕССИОННЫЕ МОДЕЛИ БИОЛОГИЧЕСКОЙ

АКТИВНОСТИ

Одним из наиболее популярных подходов к оценке биологической регрессионной модели. Эта модель связывает численное выражение биоактивности (обычно – логарифм количества препарата, приводящего к заданному биоэффекту) и набор выбранных дескрипторов. При этом предполагается, что введенное в биообъект вещество с некоторыми потерями проходит к так называемому целевому рецептору – участку организма, воздействие на который и определяет биоэффект. Сам вид функции, связывающей биоактивность или биоэффект с дескрипторами, может варьироваться от линейного до нелинейного типа. Подбираемые параметры, определяющие вклад дескрипторов, обычно находят с помощью метода наименьших квадратов (МНК).

Задача о множественной регрессии заключается в нахождении коэффициентов в уравнении зависимости биоэффекта (yi) для i-той молекулы от набора дескрипторов, описывающих молекулярную систему (d1i, d2i, d3i,...):

где k0, k1, k2... – искомые коэффициенты регрессии. На практике нахождение коэффициентов ki сводится к минимизации следующей величины (метод наименьших квадратов, МНК):

где yi(э).- экспериментальное значение биоэффекта i-той молекулы, а yi – его теоретическая оценка. Система линейных уравнений для нахождения коэффициентов регрессии в самом общем виде имеет следующий вид:

Качество аппроксимации может быть оценено при помощи дисперсии адекватности:

и коэффициента корреляции между у(э) и у:

где n – число молекул в выборке, m – количество искомых коэффициентов регрессии, а y и y( э) - средние величины (по обучающей выборке) теоретической и экспериментальной биоактивности. Коэффициент r выражает зависимость (корреляцию) экспериментальных данных и их аппроксимацию методом МНК. В литературе по статистике корреляции переменных, обычно, оценивают как “отличные” |r| > 0.99, “хорошие” 0.98 |r| 0.99, “удовлетворительные” 0.95 |r| < 0.98, “плохие” |r| < 0.9.

Следует отметить, что такие оценки являются довольно условными.

Для проверки значимости корреляции используют множество (предполагается, что задача соответствует нормальному распределению ошибок):

С помощью этой величины по специальным таблицам оценивается вероятность того, что между биоэффектом и дескрипторами имеется статистическая связь.

Особенность проблематики QSAR заключается в том, что заранее неизвестно сколько и какие именно дескрипторы необходимы для описания заданного свойства. Поэтому зачастую возникает “соблазн” выбрать очень широкий набор параметров, что приводит к возникновению случайных корреляций. Эта ситуация существенна и тогда, когда число дескрипторов. Одним из распространенных подходов в таких ситуациях является метод анализа главных компонент (principal components analysis, PCA). В этом методе анализируется структура матрицы корреляции между всеми параметрами задачи с целью идентификации новых переменных, которые суммируют информационное содержание широкого первичного дескрипторного набора. К сожалению, ограниченный объем пособия не позволяет уделить должного внимания этой важной группе статистических методов.

В данном разделе мы привели лишь наиболее общее описание МНК, поскольку оно имеется в ряде учебников и монографий по статистике, кроме того этот метод и соответствующие оценки значимости включают в персонального компьютера (EXEL, CurveExpert, STATISTICA, ORIGIN).

Харьковского национального университета им.В.Н.Каразина.

2.2. ЭМПИРИЧЕСКИЕ КОНСТАНТЫ ЗАМЕСТИТЕЛЕЙ.

УРАВНЕНИЯ ГАММЕТА И ТАФТА

При построении регрессионных зависимостей типа “биоактивность – структура” для рядов соединений, отличающихся только заместителями, удобно использовать подходы с эмпирически подобранными параметрами заместителей. Одним из таких подходов, который базируется на термодинамическом принципе линейности свободных энергий, является метод Гаммета. Он применяется для описания -электронных эффектов заместителей и основан на анализе констант ионизации мета- и паразамещенных бензойных кислот. Уравнение Гаммета связывает свободную энергию Гиббса для данной реакционной серии (G) с аналогичной величиной, полученной для другой (стандартной) реакционной серии (G0), с тем же самым набором варьируемых параметров (заместителей):

где k0 и k – константы скорости реакции соответственно для незамещенной и замещенной молекулы. Предполагая линейную связь между G G 0 и параметрами заместителей, получаем уравнение Гаммета:

В этом уравнении параметр - характеристика данной реакционной серии, а -величина, характеризующая заместитель. При этом обычно различают константы заместителей, введенных в пара – р и мета – m положения бензольного кольца. Известны также соответствующие величины для реакций в алифатическом ряду (индукционные постоянные – *).

Таблица 2.1 Эмпирические константы заместителей Однако, подчеркнем, что уравнение Гаммета описывает лишь электронные эффекты взаимодействия заместителя с реакционным центром. В тоже время известно много реакций, константы которых зависят также от пространственных (стерических) особенностей заместителей. В связи с этим при изучении кислотного гидролиза эфиров Тафтом было получено выражение, по форме аналогичное уравнению Гаммета:

в котором Еs – некоторая пространственная характеристика заместителя, а – мера чувствительности данной реакционной серии.

Параметры наиболее распространенных заместителей приведены в табл. 2.1. Эти параметры, как характеристики электронных и стерических эффектов заместителей, широко используются в качестве дескрипторов регрессионных моделей биологической активности.

рассматривается ряд соединений, у которых заместители находятся в различных положениях. Тогда, предполагая вклад от заместителей записать следующим образом:

где a ip – вклад в общую активность i-того заместителя, находящегося в pтом положении, n ip – количество заместителей типа i в положении р (обычно 0 или 1, редко – 2), а y 0 – биоактивность незамещенной молекулы.

Численные значения коэффициентов a ip и y 0 находят с помощью МНК.

заместителей в определенных положениях удобно построить матрицу феноксипропанолов, обладающей фунгистатическими свойствами1 (QSAR, Фунгистат – химическое соединение, ингибирующее рост и размножение грибков.

2002, 20, 422) возможны замещенные (-СН3, -Сl) в орто-, мета-, и параположениях:

Соответствующая матрица Фри-Вильсона приведена в табл.2.2.

Таблица 2.2 Матрица Фри-Вильсона для производных Обработка этого массива данных методом наименьших квадратов позволяет получить искомую функциональную зависимость активности от параметров структуры (см. задачу 58).

2.4. МЕТОД ХЭНЧА. ОЦЕНКА ЛИПОФИЛЬНОСТИ В методе Хэнча рассматривается фармакокинетическая модель, согласно которой биологически активное вещество (C), взаимодействуя с целевым рецептором биообъекта (S), порождает соответствующий комплекс (C:S). В результате устанавливается следующее равновесие:

В соответствии с законами химической кинетики константа равновесия K выражается через отношение концентраций:

Очевидно, что концентрация вещества С (см. Приложение) вблизи рецептора пропорциональна его количеству, введенному в биообъект C 0 :

Поэтому концентрация C 0 (обычно рассматривается логарифм обратной величины – lg 1 C 0 ) может служить мерой биологической активности препарата. Так, если заданный или стандартный биоэффект (например, на 50% замедляется рост опухоли) наступает при очень малых значениях C 0, то препарат высокоактивен, и наоборот, – большие значения C свидетельствуют о его малой активности. Очевидно, что коэффициент пропорциональности А определенным образом должен быть связан с параметрами, характеризующими транспортировку препарата через клеточные мембраны к целевому рецептору. При этом, поскольку препарату на своем пути приходится преодолевать ряд водно-липидных слоев, в качестве такого параметра можно использовать величину, которая характеризует распределение вещества в различных фазах. В настоящее время для этой цели принято использовать липофильность – логарифм коэффициента распределения вещества в смеси октанол-вода lg P (см.

концентрации вещества в н-октаноле ( C октанол ) и воде ( C вода ):

Для оценки lg P существует множество теоретических подходов.

Среди них особо популярным является аддитивный метод, в котором предполагается, что общая липофильность молекулы может быть разложена на структурные составляющие. Одна из первых таких схем, позволяющая оценивать липофильность заместителей, была предложена самим Хэнчем. Она основывалась на следующем соображении: если липофильность соединения R-X равна lg PRX, а незамещенной молекулы RH – lg PRH, то липофильность заместителя X равна Следуя аддитивной модели, общая величина lg P должна выражаться через липофильности составляющих где ni – число структурных фрагментов типа i для которых известна липофильность i.

Рассмотрим, каким образом lg P связан с биоактивностью в рамках фармакокинетической модели. Ответ на этот вопрос дает компьютерное моделирование прохождения вещества через множество водно-липидных описывающих такие процессы приводит к так называемому Таблица 2.3 Константы липофильности распространенных заместителей (по Хэнчу) в ароматическом и алифатическом радикалах Типичный график такой зависимости показан на Рис. Рис. 1 Параболический тип зависимости активности lg(1/C) обстоятельство широко используется при разработке новых биоактивных препаратов. Так, например, анализ экспериментальных данных говорит о том, что соотношение lg P ~ 2 является оптимальным для того, чтобы лекарство легко достигало головного мозга. Иными словами, при данной величине липофильности концентрация препарата в головном мозге биообъекта максимальна. Соответствующие оптимальные величины lg P известны и для достижения других органов – печени, почек и т.д.

единственной. Большое распространение в последнее время получила также билинейная модель:

в которой числа a, b, и - подгоночные параметры (Рис. 2).

Рис. 2 Билинейная модель связи биоактивности и Из рис.2 следует, что особенностью билинейной модели является наличие двух линейных участков вдали от максимума, что хорошо согласуется с множеством экспериментальными данных.

Кроме собственно липофильности ( lg P ) в расчетах QSAR часто используются соответствующие (подкорректированные) величины для катионной, анионной и цвиттерионной структур ( lg P +, lg P, lg P ± ). Если для препарата (XH) предполагается ионное равновесие в растворе:

то, очевидно, что его распределение между несмешивающимися фазами, зависит от pK соединения и pH среды. В этом случае, вместо lg P целесообразно использовать величину Cоответствующие выражения получены и для других типов ионных равновесий.

Однако, не только величина липофильности оказывает влияние на эффективность воздействия вещества на организм. Очевидно, что взаимодействие молекулы с рецептором должно быть связано с параметрами электронной структуры молекулы (электронная плотность, дипольный момент, сверхделокализуемость и т.д.). Если речь идет о ряде биологическое действие может быть выражено (в стиле уравнения Гаммета) через эмпирические константы заместителей, описанные в разделе 2.2.

Таким образом, учитывая перечисленные выше факторы, можно записать общее уравнение Хэнча (с параболической зависимостью от lg P ), описывающее биоактивность препарата:

где варьируемые параметры (а, b, c, d,…,const) могут быть найдены с помощью МНК-процедуры. Если вместо общей липофильности системы уравнение приобретает вид:

Отметим также, что теоретическая оценка lg P для молекулярной системы может быть получена с использованием ряда пакетов прикладных программ, среди которых HyperChem, ACDLabs, DRAGON и т.д.

51. Постройте регрессионную зависимость токсичности вещества (LD50) от топологических параметров заместителя по данным табл. 2.4.

Таблица 2.4 Зависимость токсичности (LD50) некоего вещества от Используя коэффициент корреляции и дисперсию, оцените качество следующих наборов параметров: а) NC,W, I D ; б) IC0, IC1, IC2; в) P1, P2, P3.

52. Известно, что аккумуляцию биологически активных веществ можно прогнозировать на основании данных об их растворимости в воде.

Используя данные табл. 2.5 для ряда насыщенных спиртов, постройте функцию растворимости lgX от молекулярных параметров (NC, IC1, I D ).

Oцените lgX и сравните расчетные данные с экспериментом для 3метилбутанола-2 (-lgX= 1,926) и пентанола (-lgX=2,332).

Таблица 2.5. Растворимость в воде насыщенных спиртов 53. Производные барбитуровой кислоты обладают снотворным действием различной продолжительности (данные приведены в табл.2.6).

Вычислите функцию, описывающую длительность действия барбитуратов в зависимости от параметров заместителя. Используйте cледующие наборы топологических индексов (для каждого оцените качество аппроксимации):

a) P1,P2,P3; б) NC, (1), I D ; в) P1, P2, P3, I D.

Таблица 2.6 Длительность cнотворного действия барбитуратов 54. Алифатические спирты ингибируют микросомальное парагидроксилирование анилина цитохромом. Вычислите линейную зависимость ингибиторной способности спирта pIC502 от различных наборов теоретико-информационных индексов, если известны следующие данные для различных одноатомных спиртов (табл.2.7).

Таблица 2.7 Ингибиторная способность спиртов при парагидроксилировании анилина В качестве дескрипторов используйте следующие наборы:

а) IC0, IC1, IC2, б) IC0, SIC1, CIC2, в) TIC0, TIC1, TIC Какой из этих наборов удачнее описывает активность?

заместителя представлена в табл. 2.8. Предполагая, что функция, описывающая токсичность LD50 (мк/кг), в зависимости от структуры молекулы имеет вид:

pIC50 – отрицательный логарифм концентрации спирта (в миллимолях) приводящий к 50% ингибированию гидроксилирования анилина.

равен: а) IC0, б) IC1, в) SIC1, г) SIC2, д) CIC2, е) индекс Рандича, ж) индекс Винера. Сравните качество описания токсичности LD50 с помощью этих дескрипторов.

Таблица 2.8. Токсичность производных барбитуратов 56. Синтетические аналоги капсаицина Природный алкалоид капсаицин (амид дециленовой кислоты) - выделяют из перца.

обладают анальгетическим действием (J.Med.Chem., 1993, 36, 2381). В табл. 2.9 приведено численное выражение биоактивности lgEC50 совместно с некоторыми параметрами заместителей ( p – константа Гаммета, MR R – молекулярная рефракция, R – липофильность). Постройте линейнорегрессионную модель зависимости биоактивности от параметра заместителя. Какой из параметров лучше описывает активность? Сделайте прогноз биологической активности соединения с R = —СOCH3. Для параболической и билинейной модели Хэнча найдите коэффициенты регрессии. Какая из этих моделей лучше описывает биологический отклик?

Используя p константы заместителя (табл. 2.1) сделайте прогноз биоактивности для соединений с R= — SCH3, — C6H5, — F.

Таблица 2.9 Биологическая активность аналогов капсаицина и 57. Постройте матрицу Фри-Вильсона для набора заместителей R 1 и R 2, приведенных в табл. 2.10 (QSAR, 2002, 20, 422). Вычислите коэффициенты a ip и линейной регрессии. Какова биоактивность дифторпроизводного? Постройте линейную и параболическую зависимости lgC от парциальных липофильностей ( R1, R 2 ) и электронных констант заместителей.

Таблица 2.10 Адреноблокирующие свойства в ряду замещенных 58. Для матрицы Фри-Вильсона, приведенной в разделе 2.2 (табл.2.2) незамещенной молекулы ?

59. Активность производных нитрозомочевины:

X CH N C NH R

против L-1210 лейкемии мышей выражается следующей формулой:

биологической активности? Постройте график зависимости теоретического значения lg 1 C 0 от липофильности.

3. СТАТИСТИЧЕСКИЕ МЕТОДЫ КЛАССИФИКАЦИИ

МОЛЕКУЛ ПО ИХ БИОЛОГИЧЕСКОЙ АКТИВНОСТИ

В связи с успехами органического (комбинаторного) синтеза, позволяющего получать огромное количество новых структур, возрастает потребность проведения систематического скрининга (просеивания) соединений c целью отбора наиболее перспективных в плане их активности, дальнейшего исследования и, затем, применения. Это приводит к использованию статистических методов классификации структур по признакам активные - неактивные (слабоактивные). В наиболее распространенных методах классификации предполагается проводится “настройка” математической модели с целью явного или не явного выявления структурных параметров (или их совокупности), важных в контексте заданного типа активности. Популярными в связи с этим представляет также так называемый логико-комбинаторный подход, позволяющий в конкретных структурно-химических терминах описать и прогнозировать биоактивность молекул.

3.1. ЛОГИКО-КОМБИНАТОРНЫЙ ПОДХОД Логико-комбинаторный подход (Розенблит, Голиндер, 1984) базируется на некоторых результатах формальной логики и статистики.

Рассмотрим наиболее важные в контексте этой проблемы логические понятия.

1. Сходство. Если два или больше исследуемых случаев имеют общим одно обстоятельство, то это обстоятельство, с которым согласуются все явления, есть причина (или следствие) данного феномена.

Схематически это можно выразить следующим образом. Некоторая ABCD X. Другая структура имеет компоненты AKLM и обладает тем же свойством Х: AKLM X. Отсюда следует, что данное свойство 2. Различие. Если случай, при котором данный феномен проявляется, и случай когда он не проявляется, схожы во всех обстоятельствах кроме одного, появляющегося только в первом случае, то это обстоятельство (которым только и различаются оба случая) и есть причина (или следствие) феномена.

Эти два утверждения и являются основой для логико-комбинаторного метода анализа биоактивности. Перечислим его основные моменты:

1. Структура каждой молекулы µ описывается с помощью специального вектора-описателя Sµ.

2. Соединения обучающей выборки классифицируются по типам активности на Nk классов A k, k = 1 N k. В самом простом случае предусматривается разбиение выборки на два класса неактивные (или слабоактивные) – активные.

3. Признаки активности f r (S) (или неактивности) определяются как некоторые фрагменты структуры, выраженные с помощью вектораописателя Sµ, присутствие которых в молекуле с высокой вероятностью указывает на то, что соединение проявляет (или не проявляет) данную активность. Такие потенциальные признаки находят путем сравнения пар молекул внутри каждого класса с последующим выделением общего фрагмента:

4. Подсчитывается число появлений этого признака L kr в каждом из классов Nk, а также суммарное количество проявлений этого признака во всех классах – L r.

5. Проводится статистическая оценка проявления этих признаков для каждого класса. Поскольку точные значения вероятностей того, что соединение, обладающее данным признаком f r (S) относится к классу Ak неизвестны, для их оценки можно воспользоваться методом Байеса. В этом методе вероятности вычисляются так, что возможный ущерб от неверной оценки минимизируется. В случае разбиения массива объектов на два класса (активные — неактивные) формула для вероятности отнесения к классу Ak записывается очень просто:

При этом прогностическая ценность признака определяется как Прогностическая ценность ( U kr ) показывает, во сколько раз увеличиваются шансы нахождения соединения с заданным свойством в сравнении с методом простого перебора.

Проиллюстрируем этот метод следующим примером. Предположим, что структура соединений различается только заместителями R1, R2, R3 и R4. При этом соединения имеют различную активность I (табл. 3.1).

Таблица 3.1 Терапевтический эффект (I) в различных замещенных Здесь указан I = – так называемый терапевтичний эффект – величина, которая характеризует эффективность данного препарата. Основным структурным признаком в этой задаче для молекулы µ можно считать вектор Sµ:

Так, для молекулы № 1 вектором-определителем является а для молекулы № 2 – Разделим весь набор по признаку I на два класса – активные молекулы (№ 1- №4, 11,67 I 18,0 ) и неактивные (№ 5- № 8, 1,75 I 2,86 ).

Далее проводим отбор признаков специфичных для данного класса.

Например, векторы S1 и S3 характеризуют структуры активных молекул, а их пересечение может служить ключевым признаком для классификации молекул:

Здесь – символ пустого множества. Признак S1 S3 соответствует условию (R1=H)&(R3=Br), где & – логическое “И”. Последовательное попарное сравнение структурных векторов S дает следующий набор признаков.

В табл. 3.2 кроме признаков приведены также числа их появлений в классе активных молекул L1r и неактивных молекул L2r. Соответствующие вероятности P(A1 | f r ) и P(A 2 | f r ) дают оценку успешности классификации.

Так, согласно этим данным, наличие признаков 1 или 3 с вероятностью 0,75 позволяют отнести неизвестную молекулу к классу активных систем.

Признаки 4 и 5 с той же вероятностью позволяют отнести систему к неактивным молекулам.

Используя таблицу признаков, можно оценить активности новых соединений, которые не вошли в исходный набор, описывающий терапевтический эффект (табл. 3.3).

Таблица 3.3 Оценка активности новых соединений Очевидно, что соединения № 9 и № 10 уверенно классифицируются как соответственно активное и неактивное. Соединение № 11 на основании пяти перечисленных признаков не может быть надежно классифицировано.

Соединение № 12 (с вероятностью 0,60) также может быть отнесено к активным.

Кластерный анализ связи биоактивности и структуры основывается на геометрическом представлении молекул в многомерном пространстве дескрипторов. Иными словами, набор из N дескрипторов ( d i, i = 1, K, N ), которые однозначно характеризуют молекулу, можно интерпретировать как совокупность координат некой условной точки. Таким образом, молекула – это точка в пространстве N измерений. В качестве меры сходства (или близости) между разными молекулами можно принять расстояние R между соответствующими точками. Однако, поскольку это пространство не является реальным, физическим, то таковой метрикой могут служить самые разные функции, удовлетворяющие аксиомам расстояния. Эти аксиомы для любых трех объектов (молекул) Xi, Xj, Xk формулируются следующим образом:

идет об одной и той-же молекуле (неразличимость идентичных Несколько наиболее популярных типов расстояний приведены в табл. 3.4.

Естественно предположить, что ряд молекул-точек, обладающих близкими характеристиками (например, активные в отношении данного свойства) будут находится на достаточно близком друг от друга расстоянии.

Неактивные же молекулы будут образовывать отдельную группу. Такие группы принято называть кластерами, а соответствующий анализ данных, позволяющий разбивать совокупность объектов на отдельные кластеры, кластерным анализом.

Таблица 3.4. Метрические характеристики близости объектов Таким образом главная цель кластерного анализа – нахождение групп (кластеров) схожих объектов. Распространенным способом представления результатов кластерных методов является дендрограмма (древовидная диаграмма), которая графически изображает иерархическую структуру, порожденную объединением объектов в кластеры. На рис. 3 показан пример дендрограммы отображающей разбиение трех объектов (молекул) на два кластера. Структуры А и B относятся к одному кластеру, тогда как структура С к другому.

W – внутригрупповая ковариационная матрица. См раздел 3.3, + – операция транспонирования Рис. 3 Пример иерархической дендрограммы Различные варианты кластерного анализа программно реализованы в STATISTICA).

3.3. ЛИНЕЙНЫЙ ДИСКРИМИНАЦИОННЫЙ АНАЛИЗ

Целью линейного дискриминационного анализа является вычисление функции, позволяющей классифицировать системы по заранее заданным группам. Чаще всего встречается необходимость классификации молекул на две группы (активные – неактивные). При этом функция D выбирается так, чтобы ее значения максимально различались для типичных представителей разных групп (активных – неактивных молекул). Наиболее распространенный, линейный вариант дискриминационной функции, строится как суперпозиция молекулярных дескрипторов (d1, d2, d3,…), и значение D-функции для i-той молекулы выглядит следующим образом:

Искомые коэффициенты разложения D: k0, k1, k2,… (не путайте их с коэффициентами линейного регрессионного анализа !) можно вычислить, максимизировав отношение где числитель характеризует межгрупповой разброс молекулярных параметров (дескрипторов), а знаменатель – разброс параметров внутри групп. Эти величины построены с помощью ковариационных матриц (Т и W), описывающих соответствующие дисперсии:

При этом матрица C отвечает общей дисперсии дескрипторов. В этих выражениях предполагается, что di – усредненная по всем (двум) группам величина дескриптора d i, di – средняя величина дескриптора d i по группе. Величина d im – i-тый дескриптор молекулы m, которая относится к группе, а n – количество молекул в группе. Таким образом, основная задача дискриминационного анализа состоит в нахождении наилучшего разделения молекул на группы в том смысле, что межгрупповая дисперсия должна быть максимальной, а внутригрупповая – минимальной.

С геометрической точки зрения дискриминационный метод близок к основам кластерного анализа. Каждая молекула представляется в виде точки в условном пространстве дескрипторов d. Тогда, при удачном выборе дескрипторного набора, молекулы, относящиеся к данной группе (кластеризоваться). Вычислив значение D-функции для молекулы с неизвестной активностью (х), можно выяснить, к какому кластеру она относится и, следовательно, оценить ее активность. Схематически группы активных и неактивных молекул можно представить в виде рисунка (Рис.4).

Рис. 4 Разделение молекул на активные и неактивные в пространстве дескрипторов (d). Крестиком помечена молекула с неизвестной активностью, жирная точка – Линия, разделяющая кластеры, соответствует значению функции D = 0. Из рис.4 следует, что молекула, помеченная крестиком, ближе к группе активных.

Важным понятием дискриминационного анализа является понятие центроида. Под центроидом понимают систему, имеющую значения дескрипторов, которые вычисляются как средние по группе. Таким образом, центроид можно воспринимать как наиболее типичную (чаще всего гипотетическую) молекулу из заданной группы молекул. Значение дискриминационной функции для центроида, в свою очередь, может служить опорным при интерпретации расчетов D-функций реальных систем. На Рис. 4 центроид схематически показан в виде жирной точки.

Качество дискриминации по группе обычно оценивается по отношению где n - число молекул верно отнесенных с помощью D-функции к заданной группе.

59. Согласно концепции Пульмана канцерогенная активность конденсированных углеводородов связывается с электронными свойствами так называемых K - и L - областей молекулы (Рис. 5).

В табл. 3.5 приведены максимальные значения электрофильных сверхделокализуемостей K- и L- областей некоторых углеводородов вместе с экспериментальными данными о наличии (+) или отсутствии (–) значительной канцерогенной активности.

На основе этих данных постройте дискриминационную функцию для распознавания канцерогенной активности углеводородов. Сделайте прогноз активности для трех последних в табл. 3.5 молекул (фенантрена, бенз(а)пентацена и дибенз(b,k)перилена). Каковы “координаты” центроида? Вычислите матрицу “расстояний” между объектами.

Постройте дендрограмму описывающую “близость” различных молекул.

Таблица 3.5 Суперделокализуемости K- и L- областей и канцерогенная активность конденсированных углеводородов углеводородов. Постройте дискриминационную функцию, с помощью которой можно было бы отделить соединения с высокой (lgP>3,5) липофильностью. В качестве дескрипторов выберите число углеродных атомов и какой-либо из параметров, характеризующих разветвленность углеродного каркаса молекулы. Оцените эффективность дискриминации с помощью параметра.

Таблица 3.6 Липофильности некоторых насыщенных углеводородов (структура А и структура В):

проведите разбиение на кластеры (табл. 3.7).

Таблица 3.7 Заместители фосфорильных производных В качестве параметров структур можно выбрать различные характеристики заместителей (липофильности, -константы, электронные плотности на заместителях, дипольные моменты, энергии ВЗМО и НВМО и т.д., см. раздел 1,2). На сколько кластеров можно разбить всю совокупность молекул? Постройте дендрограмму, описывающую “близость” различных замещенных. Какой способ вычисления расстояний Вы используете? Зависит ли результат (кластеризация) от способа вычисления расстояний? Если зависит, то как?

62. Замещенные эстрадиолов относятся к классу стероидных гормонов:

В табл. 3.8 приведены данные, характеризующие относительное сродство замещенного ( lgBA ) с соответствующим биологическим рецептором описывающую активность замещенных эстрадиолов. Методом МНК найдите уравнение для биоактивности. Вычислите набор электронных дескрипторов описывающих эстрадиол (дип. момент, поляризуемость, энергии высшей занятой и нижайшей вакантной МО).

дискриминационную функцию описывающую активность приведенных молекул в терминах электронных дескрипторов. Каково качество Вашего прогноза по дискриминационной функции?

Таблица 3.8 Относительное сродство замещенных эстрадиолов В заключении авторам хотелось бы подчеркнуть несколько моментов. Прежде всего отметим, что описанные выше подходы и соответствующие им задачи призваны продемонстрировать лишь основы методологии QSAR. Исследование биологической активности молекул, как и любая другая нетривиальная задача, требует творческого понимания проблемы. В особенности это касается отбора дескрипторов, способных универсального набора дескрипторов для любых систем и любых типов активности не существует. Уместно также вспомнить принцип Оккама:

“Не приумножай сущностей более чем необходимо”, поскольку чрезмерно “раздутый” дескрипторный набор увеличивает риск случайных корреляций. В целом QSAR методология не предполагает глубокого понимания сущности конкретных биохимических процессов в организме, однако, имея какую-либо модель этих процессов, можно существенно облегчить формулировку самого вида количественного соотношения структура-активность.

статистические подходы, поскольку их изложение требует специальных знаний. Среди них факторный анализ (один из его вариантов известен как метод главных компонент) – статистический метод, позволяющий проанализировать структуру взаимосвязей элементов дескрипторного набора и, что очень существенно, сжать его. Своеобразным гибридом МНК и метода главных компонент является частичный метод наименьших квадратов (partial least squares, PLS), использующийся в расчетах систем с большим количеством дескрипторов.

Необходимо отметить также, что QSAR – это бурно развивающаяся область хемометрии. За последнее десятилетие появилось множество новых подходов. Среди них так называемый трехмерный QSAR (3DQSAR) – мощный метод, предполагающий зависимость биоактивности от стерических свойств молекул и их электростатических полей. Набирает популярность метод искусственных нейронных сетей – алгоритм, симулирующий функционирование нейронов. Он используется в проблеме молекулярного распознавания и классификации. Генетические алгоритмы – новый подход, позволяющий корректно обрабатывать данные, которые содержат больше переменных (дескрипторов), чем объектов (молекул).

Все эти методы наряду с проверенными известными подходами составляют теоретическую базу для целенаправленного поиска новых лекарственных препаратов. Авторы надеются, что данное пособие облегчит понимание студентами этой не простой и практически важной задачи.

5. СПИСОК ЛИТЕРАТУРЫ

1. Станкевич М.И., Станкевич И.В., Зефиров Н.С. Топологические индексы в органической химии // Успехи химии.- 1988.-T.57, № 3.C.337-365.

2. Раевский О.А. Дескрипторы молекулярной структуры в компьютерном дизайне биологически активных веществ // Успехи химии.- 1999.-T.68, № 6.-C.555-575.

3. Лоусон Ч., Хенсон Р. Численное решение задач метода наименьших квадратов.–М.:Наука, 1986.- 230с.

4. Факторный, дискриминантный и кластерный анализ. – М.: Финансы и статистика, 1989.- 213с.

5. Розенблит А.Б, Голиндер В.Е. Логико-комбинаторные методы в конструировании лекарств. – Рига:Зинатне, 1984.- 351с.

6. Стьюпер Э., Брюггер У., Джурс П. Машинный анализ связи химической структуры и биологической активности. – М.:Мир, 1982.- 235с.

7. Коваленко С.Н., Друшляк А.Г., Черных В.П. Основы комбинаторной органической химии. – Харьков, из-во НфаУ “Золотые страницы”, 2003.- 106с.

НЕКОТОРЫЕ ТЕРМИНЫ И ПАРАМЕТРЫ

БИОЛОГИЧЕСКОЙ АКТИВНОСТИ

В качестве меры биологической активности обычно используют количество вещества на единицу биомассы (или его логарифм), необходимое для достижения заданного уровня биологического действия.

LD50 – доза поражающая 50% экспериментальных организмов.

ED50 – доза антагониста, снижающая на 50% действие стандартной дозы агониста.

MIC – концентрация ингибитора, подавляющая рост исследуемого биологического объекта до минимального уровня.

IC50 – концентрации вещества, приводящая к 50%-ному ингибированию протекания ферментативной реакции.

Агонист – чужеродное организму вещество активизирующее рецепторы и вызывающее в биообъекте те же изменения, что и естественные (эндогенные) вещества. т.е. обладающее биоактивностью Антагонист – вещество блокирующее рецепторы и тем самым ослабляющее или полностью предотвращающее действие другого вещества.

Липофильность (гидрофобность) – параметр, характеризующий распределение вещества между водно-липидной фазой. Ранее, для этой цели, использовался логарифм коэффициента распределения в системе оливковое масло – вода. В настоящее время общепринятой системой является н-октанол-вода.

Рецептор – активный фрагмент макромолекулы (белка) с которым взаимодействуют агонисты и антагонисты.





Похожие работы:

«Учебно-тематическое планирование по географии Класс 6 А Учитель Григорьева О. Г. Количество часов Всего 70 час; в неделю 2 час. Плановых контрольных уроков 11, тестов 11 ч.; Планирование составлено на основе: 1. Стандарта основного общего образования по географии (базовый уровень, приказ Минобразования россии №1089 от 05.03. 2004 г.) 2. Примерной программы для основного общего образования по географии (базовый уровень, Сборник нормативных документов. География: М., Дрофа, 2004 г.); 3....»

«Назначение ООП ВПО ООП ВПО представляет собой совокупность учебно-методической документации, разработанную и утвержденную высшим учебным заведением с учетом потребностей регионального рынка труда, требований федеральных органов исполнительной власти и соответствующих отраслевых требований на основе федерального государственного образовательного стандарта высшего профессионального образования по направлению подготовки 034700.62 Документоведение и архивоведение (бакалавр), а также с учетом...»

«Учреждение образования БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНОЛОГИЧЕСКИЙ УНИВЕРСИТЕТ ЭКОНОМИЧЕСКОЕ ОБОСНОВАНИЕ ДИПЛОМНЫХ ПРОЕКТОВ Методические указания для студентов специализации 1-36 05 01 03 Машины и механизмы деревообрабатывающей промышленности Минск 2006 УДК: 658.5:674.05 ББК 65.053 Э 40 Рассмотрены и рекомендованы к изданию редакционноиздательским советом университета Составители: И. И. Пищ, А. Н. Кривоблоцкий Рецензент зав. кафедрой д/о станков и инструментов канд. техн. наук А. А. Гришкевич...»

«Государственное образовательное учреждение Высшего профессионального образования Иркутский государственный медицинский университет Министерства здравоохранения и социального развития Охремчук Л.В., Николаева Л.А. ВИТАМИНЫ. ПОЛИВИТАМИНЫ. МИКРОЭЛЕМЕНТЫ. Учебное пособие для самостоятельной внеаудиторной работы студентов Иркутск - 2009 г. Печатается по решению ЦК МС Иркутского государственного медицинского университета Протокол N 4 от 19 мая 2009 года Данное учебное пособие, подготовлено...»

«3040 МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ ЛИПЕЦКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ Кафедра транспортных средств и техносферной безопасности МЕТОДИЧЕСКИЕ УКАЗАНИЯ И РАБОЧАЯ ПРОГРАММА первой производственной практики для студентов направления 190109 Наземные транспортно-технологические средства специализации Подъемно-транспортные, строительные, дорожные средства и...»

«Лекторы Фестиваля популярной науки Николай Николаевич Андреев Кандидат физико-математических наук, заведующий лабораторией популяризации и пропаганды математики Математического института им. В.А. Стеклова РАН, автор проектов Математические этюды (http://etudes.ru), Механизмы П.Л. Чебышева (http://tcheb.ru), Архив издательства Mathesis (http://mathesis.ru) и совместного с Фондом Династия проекта Увлекательная математика. Лауреат Премии Президента Российской Федерации в области науки и инноваций...»

«БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ФАКУЛЬТЕТ ПРИКЛАДНОЙ МАТЕМАТИКИ И ИНФОРМАТИКИ МЕТОДИЧЕСКИЕ УКАЗАНИЯ ПО ОФОРМЛЕНИЮ И ЗАЩИТЕ КУРСОВЫХ, ДИПЛОМНЫХ РАБОТ И ДРУГИХ ОТЧЕТНЫХ ДОКУМЕНТОВ СТУДЕНТОВ УНИВЕРСИТЕТА МИНСК 2005 УДК 378.147.88 (072) ББК 74.582я73 М 54 Авторы-составители: В. В. Горячкин, Н. Н. Демеш, Н. А. Коротаев Рекомендовано Ученым советом факультета прикладной математики и информатики 24 мая 2005 г., протокол № Рецензент доктор физико–математических наук, профессор В. В. Попечиц...»

«Александр Элдер ОСНОВЫ БИРЖЕВОЙ ТОРГОВЛИ Учебное пособие для участников торгов на мировых биржах Содержание 7 ВВЕДЕНИЕ 1. Психология - ключевой момент 9 2. Факторы, действующие против вас 12 17 I. ПСИХОЛОГИЯ ЛИЧНОСТИ 1.1. Зачем играть? 1.2. Фантазии и реальность 1.3. Рыночные гуру 1.4. Саморазрушение 1.5. Психология игры 1.6. Биржевые уроки Анонимных Алкоголиков 1.8. Победители и проигравшие II. МАССОВАЯ ПСИХОЛОГИЯ 2.1. Понятие цены 2.2. Понятие рынка 2.3. Площадка для игры 2.4. Рыночная толпа...»

«1 2 3 1. Цели освоения дисциплины Целями освоения дисциплины Избранные главы неорганической химии являются: - освоение студентами теоретических основ химии, химии элементов и их соединений; - понимание роли химии и химической технологии в охране окружающей среды; - формирование естественнонаучного мировоззрения и представлений о дальнейшем развитии химической науки; - способность и готовность использовать основные законы химии в профессиональной деятельности. 2. Место дисциплины в структуре ООП...»

«Федеральное агентство по образованию Дальневосточный государственный технический университет (ДВПИ им. В.В. Куйбышева) Инженерно-экономический институт Н.Е. Марфенко БУХГАЛТЕРСКИЙ УЧЕТ, АНАЛИЗ И АУДИТ: ВВЕДЕНИЕ В СПЕЦИАЛЬНОСТЬ Учебное пособие Рекомендовано Дальневосточным региональным учебнометодическим центром в качестве учебного пособия для студентов специальности 080109 Бухгалтерский учет, анализ и аудит вузов региона Владивосток • 2008 УДК 657 ББК 65.052 М 30 Рецензенты: В.А. Останин, д-р....»

«ЛИПЕЦКАЯ ОБЛАСТНАЯ УНИВЕРСАЛЬНАЯ НАУЧНАЯ БИБЛИОТЕКА НАУЧНО-МЕТОДИЧЕСКИЙ ОТДЕЛ Право быть гражданином Итоги конкурса Библиотеки Липецкой области и правовое просвещение избирателей ЛИПЕЦК, 2012 Право быть гражданином : итоги конкурса Библиотеки Липецкой области и правовое просвещение избирателей / ЛОУНБ; науч.-метод. отдел; сост. Л.В. Селиванова; ред. и отв. за вып. Л.Т. Самойлова. – Липецк, 2012. – 80 с. 2 Ни один человек не рождается хорошим гражданином, ни одна страна не рождается...»

«МИНИСТЕРСТВО КУЛЬТУРЫ НОВОСИБИРСКОЙ ОБЛАСТИ НОВОСИБИРСКОЕ ГОСУДАРСТВЕННОЕ ХУДОЖЕСТВЕННОЕ УЧИЛИЩЕ (ТЕХНИКУМ) Вопросы теории и методики художественного образования Методический сборник работ преподавателей Новосибирского государственного художественного училища Выпуск № 1 Новосибирск 2013 ББК 74.266.4 Материалы рекомендованы Методическим советом НовоВ 74 сибирского государственного художественного училища (техникума) Вопросы теории и методики художественного образования: методический сборник...»

«БИБЛИОГРАФИЧЕСКИЙ УКАЗАТЕЛЬ КНИГ, ПОСТУПИВШИХ В БИБЛИОТЕКУ (июнь-август) АВТОМАТИКА (681.5) 1. 681.5 П 78 Проблемы автоматизации и управления в технических системах : сборник статей Международной научно-технической конференции (Пенза, 23-25 апреля 2013 г.) / Пенз. гос. ун-т ; под ред. д.т.н., проф. М. А. Щер бакова. – Пенза : Изд-во Пенз. гос. ун-та, 2013. – 514 с. : ил. Экземпляры: всего:2 - хр1(2) БИБЛИОГРАФИЯ (01) 2. 016:9 П 91 А.С. Пушкин и декабристы : библиографический указатель / Научная...»

«МИНИСТЕРСТВО СЕЛЬСКОГО ХОЗЯЙСТВА РОССИЙСКОЙ ФЕДЕРАЦИИ ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ АЛТАЙСКИЙ ГОСУДАРСТВЕННЫЙ АГРАРНЫЙ УНИВЕРСИТЕТ Т.В. Жарикова, Е.В. Краснов ЦЕНООБРАЗОВАНИЕ Учебно-практическое пособие Барнаул Издательство АГАУ 2006 УДК 338.5(072) Жарикова Т.В. Ценообразование: учебно-практическое пособие / Т.В. Жарикова, Е.В. Краснов. Барнаул: Изд-во АГАУ, 2006. 119 с. Учебное издание разработано в соответствии с программой курса...»

«72 Г 75 Градостроительство и планировка населенных мест: учебник для студ. вузов по напр. 120300 Землеустройство и кадастры и спец. 120301 Землеустройство, 120302 Земельный кадастр, 120303 Городской кадастр; доп. МСХ РФ / Ассоциация Агрообразование; ред.: А. В. Севостьянов, Н. Г. Конокотин. - М.: КолосС, 2012. - 398 с.: ил. - ISBN 978-5-9532-0810-9 УДК 72 Аннотация: Учебник подготовлен в соответствии с Государственным образовательным стандартом высшего профессионального образования по...»

«Федеральное агентство по образованию Государственное образовательное учреждение высшего профессионального образования Казанский государственный технологический университет Галимов Равкат Абдулахатович Гайфуллин Руслан Анварович ВЫДЕЛЕНИЕ ПАРАФИНОВЫХ УГЛЕВОДОРОДОВ ИЗ НЕФТЯНОГО СЫРЬЯ И ИХ ПРИМЕНЕНИЕ Казань 2006 УДК 665.7.033:661 Выделение парафиновых углеводородов из нефтяного сырья и их применение: Учебное пособие /Р.А.Галимов, Р.А.Гайфуллин; Казан. гос. технол. ун-т. Казань, 2006. 82 с. ISBN...»

«М И НИ СТЕРСТВ О СЕЛЬ СКО Г О ХО ЗЯЙ СТВА РО ССИ Й СКО Й Ф ЕДЕРАЦ ИИ РОССИЙСКИЙ ГОСУДАРСТВЕННЫЙ АГРАРНЫЙ УНИВЕРСИТЕТ – МСХА имени К.А. ТИМИРЯЗЕВА Факультет садоводства и ландшафтной архитектуры Кафедра ландшафтной архитектуры Производственная практика по ландшафтному проектированию Москва 2012 УДК 635.9:712.3(083.131) ББК 42.373:85.118.72я81 П80 Производственная практика по ландшафтному проектированию: Методические указания / А.Г. Скакова, А.И. Довганюк М.: изд-во РГАУМСХА, 2012. 36 с. В...»

«Б А К А Л А В Р И А Т Т.С. БРОННИКОВА ТЕОРИЯ, МЕТОДИКА, пРАКТИКА Допущено Советом Учебнометодического объединения вузов России по образованию в области менеджмента в качестве учебного пособия по специальности Менеджмент организации Четвертое издание, стереотипное КНОРУС • МОСКВА • 2013 УДК 339.13(075.8) ББК 65.2902я73 Б88 Рецензенты: К.Ф. Пузыня, заведующий кафедрой Экономика и менеджмент в науке и социальной сфере СанктПетербургского государственного инженерноэкономического университета,...»

«Государственное образовательное учреждение высшего профессионального образования Челябинский государственный педагогический университет Профессионально – педагогический институт Кафедра педагогики и психологии профессионального образования С. Г. Литке ОБЩАЯ ПСИХОЛОГИЯ Методические рекомендации Серия: УЧЕБНО-МЕТОДИЧЕСКОЕ ПОСОБИЕ по выполнению самостоятельной работы по специальности 050501 - Профессиональное обучение (очная и заочная формы обучения) Челябинск Государственное образовательное...»

«ГОУ ВПО БАШКИРСКАЯ АКАДЕМИЯ ГОСУДАРСТВЕННОЙ СЛУЖБЫ И УПРАВЛЕНИЯ ПРИ ПРЕЗИДЕНТЕ РЕСПУБЛИКИ БАШКОРТОСТАН Юридический факультет Кафедра гражданского права Р. Р. Салахутдинова ТРУДОВОЕ ПРАВО Учебно-методический комплекс для студентов специальностей 080504 Государственное и муниципальное управление, 030201 Делопроизводство и документационное обеспечение управления, 080507 Менеджмент организаций УФА-2008 УДК 349.2 ББК 67.405 С 16 Рецензент: Арутюнян М.С., канд. юрид. наук С 16. Салахутдинова Р. Р....»






 
2014 www.av.disus.ru - «Бесплатная электронная библиотека - Авторефераты, Диссертации, Монографии, Программы»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.