«Вестник Академии ДНК-генеалогии Proceedings of the Academy of DNA Genealogy Boston-Moscow-Tsukuba Volume 5, No. 7 July 2012 Академия ДНК-генеалогии Boston-Moscow-Tsukuba ISSN 1942-7484 Вестник Академии ДНК-генеалогии. ...»
И здесь вас подводит непонимание расчета погрешностей. В первом случае получается 4360±450 лет, во втором 5270±1050 лет, потому что 2712 мутаций на 67 маркерах дает в среднем по 40 мутаций на маркер, и средняя погрешность при этом получается почти 20%, то есть примерно те самые 5270±1050 лет. Как видно, обе цифры одинаковы в пределах погрешности.
Это уже не говоря о том, что для тех же 107 гаплотипов у вас получается то 2244 мутации, то 2712 мутаций, хотя гаплотипы одни и те же, и их число то же самое. То ли счет неверный, то ли выборка кривая. Откуда лишних мутаций взялись-то для одной и той же серии гаплотипов?
Наконец, среди этих 67 маркеров есть медленные, у которых всего не более 5 мутаций на все 107 гаплотипов, и тогда по таким погрешность составляет ±40-50%. Давно всем, кто хоть малое понятие имеет о мутациям в маркерах, ясно, что нельзя считать мутации по отдельным маркерам и из них что-то рассчитывать. Одному вам это, видимо, неизвестно.
Мутации по отдельному маркеру, особенно медленному, часто не статистические, не неупорядоченные, а отражают историю данной линии.
Эти мутации просто-напросто наследуются на протяжении тысячелетий, а вовсе не происходят (неупорядоченно) у потомков. Только если считать мутации "на круг", по всем 67 маркерам, их "нестатистичность" компенсируется другими мутациями по другим маркерам.
>Цитата(Ostan @ 3.6.2012, 11:12) Рассмотрим тот же расчет квадратичным методом.... В частности с базовым субкладом Z280+Z92+ его отделяют только 12 мутаций, что относит точку разделения субкладов к тем же 5500 лет.
Повторяю, что линейный метод дал 5700 лет. Ну, и в чем "преимущество" квадратичного метода? Он всегда должен давать те же самые результаты, что и линейный метод, если счет правильный. Опять же это вам много раз говорили.
>Цитата(Ostan @ 3.6.2012, 11:12) В частности, для этой задачи был получен следующий базовый гаплотип 13-25-16-11-11-14-12-12-10-13-11-30 -- 15-9-10-11-11-24-14-20 32-12-15-15-16 -- 11Z-93) Базовый гаплотип неверный. Это - суперпозиция базовых гаплотипов упомянутых выше нескольких ветвей. Например, DYS390 у вас 25, а он на самом деле 24 и 25 у разных ветвей. Например, у башкир он 24, у евреев 25, но поскольку евреев в вашем списке больше, они "перетянули одеяло на себя", и у вас получилось 25. Но каждый башкир давал вам лишнюю мутацию в DYS390. Толку-то было по отдельным маркерам считать... В L657+, который входит в Z93, и который вы, конечно, не отделяли, DYS19 = 15, а у вас в суммарном - 16. Опять лишняя мутация на многие гаплотипы L657+. DYS385b у башкир 15, как и у многих южан (Армения, Ближний Восток), а у вас он 14, евреи опять перетянули.
И так далее, я ведь только по пяти маркерам прошелся из 67. Неужели так и не понятно, что субклад часто состоит из нескольких ветвей? Как же можно "субклад" брать как якобы за критерий одной ветви?
>Цитата(Ostan @ 3.6.2012, 11:12) Ранее, обычно ямную культуру мы приписывали R1b. Такого же мнения придерживался и я. Но последние открытия субклада R1b1a2a в Армении и Башкирии позволили предположить, что субклад R1b появился в регионе ямной культуры из майкопской культуры. Майкопская северная ветвь безусловно оказала влияние на ямную культуру, но основным субкладом ямной культуры следует считать R1a Z93. Этот субклад ямной культуры можно считать наследием хвалынской культуры. Сейчас датировки хвалынской культуры весьма приблизительны. но они колеблятся в интервале 6000-5000 лет тому назад. Из этих датировок наиболее вероятна датировка 5600 лет тому назад. А это практически совпадает с временем разделения субкладов R1a.
Принадлежность ямников субкладу Z93 является довольно неожиданным результатом.
Неожиданным, потому что неверным. Вы здесь все на свете перепутали.
Майкопская культура - и R1b, и R1a, просто в разные времена. У нее корни уходят в разные стороны, на что историк Л.С. Клейн уже давно обратил внимание. Хвалынская культура - наследница самарской, это комплекс древних средневолжских культур, когда R1a просто и не могло быть на Русской равнине. Более того, они связаны с ботайской, а там намного больше вероятность R1b, R1a просто быть там не могло в те времена.
Но вы не просто перепутали, вы искусственно подтягиваете датировки и гаплотипы, на что вам не раз указывали.
Почитайте хотя бы Википедию:
Хвалынская культура (называемая также протокурганной) — энеолитическая археологическая культура Северного Кавказа и Среднего Поволжья V-IV тыс. до н.
э. Название получила по месту первых находок — близ города Хвалынск Саратовской области. Сложилась на основе самарской культуры, но в значительно более широком ареале — от Саратова на севере до Азовского моря на юго-западе и реки Урал на юго-востоке. Близка среднестоговской культуре и иногда выделяется вместе с ней в единую общность. В дальнейшем эволюционировала в ямную культуру и оказала влияние на ботайскую культуру Казахстана.
Цитата:
>Но, с другой стороны, какая из известных культур могла так разнести субклад?
От Англии и Шотландии до Хакасии и Киргизии. И от Индии до Башкирии.
А кто вам сказал, что это могла быть одна археологическая культура? R1a вообще и R1a-Z93 в частности прошли через много культур на протяжении многих тысячелетий.
Цитата:
>Я еще ни разу не видел расчета линейным методом на 111-маркерных гаплотипах. В квадратичном методе 100% соответствие с расчетами на 67маркерах. А вот в линейном разница составит не 10-15%, а уже 20-30%. Опять будем скорости корректировать?
Вы много чего не видели, потому что не читаете статьи. Расчеты линейным методом на 111-маркерных гаплотипах давно проводятся в наших работах, больше года назад об этом была статья в Вестнике, а осенью прошлого года – статья в Advances in Anthropology. Во всех случаях получается полное совпадение с результатами на 67-маркерных гаплотипах.
И. Рожанский:
>Цитата(aklyosov @ 4.6.2012, 7:17) В цитированной выше статье построено дерево из 203 67-маркерных гаплотипов субклада Z93, то есть выборка вдвое больше вашей, и показано, что она состоит из пяти ветвей - евреи, башкиры, киргизы, и две разных ветви L657+.
В последней версии IRAKAZ имеется несколько десятков гаплотипов родительской ветви Z93+ L342.2-, которые, строго говоря, следует считать отдельно от юго-восточной ветви. Их предок жил раньше, чем предок ветвей с L342.2+.
Если исключить родительские гаплотипы и ашкеназийскую ветвь, то для оставшегося списка счет как скопом, так и по ветвям дает примерно один и тот же базовый гаплотип и совпадающие датировки. То есть, относительно небольшие дочерние подветви не нарушают однородность выборки, что подтверждается также анализом на сходимость. Кроме башкирской и киргизской, там еще несколько компактных арабских линий, так что они компенсируют друг друга.
Почему надо исключать Z93+ L342.2- и ашкеназийскую линию? Потому что первых относительно немного, и по внешнему виду они неотличимы от L342.2+, но, поскольку у них предок попадает на более раннее время, они внесут те мутации, что набежали ДО ТОГО, как появился предок ныне живущих L342.2+. То есть, они искусственно "состарят" дочернюю ветвь, хотя многое тут зависит от конкретного вида дерева. При отпределенном раскладе могут и омолодить. В любом варианте, предок такой разношерстной компании будет фантомным.
С ашкенази все очевиднее - их много (почти половина от всего списка Z93), ветвь компактная, и при расчете базового гаплотипа "в лоб" они будут перетягивать его на себя. Счет мутаций в разнородной выборке идет не от собственно базового, а от не имеющего физического смысла модального гаплотипа (в этом смысле такой термин уместен). Предок однозначно будет фантомным, даже если время до него случайным образом совпадет с реальным.
Вспомните о часах, что 2 раза в день показывают точное время. Это полная аналогия подхода, с помощью которого уважаемый Ostan пытается "компенсировать" неучет конкретного вида дерева. Способ расчета здесь вообще ни при чем. Если выборка "кривая", то и результат будет "кривым", в какие ученые слова его не облачай.
Ostan:
Анатолий Алексеевич, для меня ваше утверждение, что формулу КлесоваАдамова нельзя использовать для отдельных маркеров оказалось сюрпризом. И это утверждение исходит от одного из авторов этой формулы! А в каком случае ее можно использовать, и в каком случае ее нельзя использовать? Я эту формулу досконально проверил и считаю, что ее как раз можно и нужно использовать для отдельных маркеров.
Например, в приведенном мною расчете совпадение квадратичного метода расчета и результатов использования формулы практически идеальное. В 35-CDYb линейный метод дает 136 мутаций. С учетом компенсации по формуле 310 мутаций. А квадратичный метод дает 324 мутации.
Совпадение идеальное, да и величина погрешности в норме. И так для всех маркеров. Другое дело, что если использовать формулу для каждого маркера, то сразу видно, что вся компенсация для всех 67 маркеров наберется только при расчете компенсации для трех-четырех быстрых маркеров. Впрочем, все расчеты я уже приводил ранее, и эти расчеты вами не опровергнуты. Посмотрите сами, как это выглядит. С одной стороны расчеты, а с другой стороны общие рассуждения о том, что и как следует делать, чтобы получить тот или иной результат.
Игорь Львович, веткообразование существует в каждой выборке, какой бы малой мы ее не сделали. Другое дело, что в квадратичном методе вес ветки (количество гаплотипов) влияет на конечный результат меньше чем в линейном, поскольку плечо момента берется в квадрате. В итоге перетягивание одеяла (базового гаплотипа) в квадратичном методе менее заметно, чем в линейном. Но оно существует. Поскольку ветки существуют в любой выборке, то и найденные базовые гаплотипы всегда фантомны. Но это не повод менять терминологию. Анатолий Алексеевич за это меня бьет.
Если Вам не понравился найденный мной базовый гаплотип, то предложите свой. Или у Z93 не было единого предка?
А. Клёсов >Цитата(Ostan @ 4.6.2012, 5:09)... для меня ваше утверждение, что формулу Клесова-Адамова нельзя использовать для отдельных маркеров оказалось сюрпризом. И это утверждение исходит от одного из авторов этой формулы! А в каком случае ее можно использовать, и в каком случае ее нельзя использовать?
Вы или ерничаете, или действительно не понимаете, о чем речь.
Вам говорят, что если монету подбросить всего три раза, то из этого не рассчитать вероятность выпадения орла или решки. А вы делаете круглые глаза и говорите, что никогда не слышали, чтобы методы матстатистики были неприменимы к бросанию монеты.
Узнаете свой стиль?
Повторяю для новичков, которые это могут читать. Чтобы методы статистических расчетов были применимы к гаплотипам или отдельным маркерам, нужно, чтобы было статистически значимое количество мутаций, и чтобы было показано, что мутации удовлетворяют критерию неупорядоченности (или критерию кинетики первого порядка, что в принципе одно и то же).
Значительная часть маркеров - медленные, и в них всего несколько мутаций, причем часто в одну сторону. Это - наследственные мутации, а не статистически-неупорядоченные. В таких случаях по отдельным маркерам считать нельзя. Именно поэтому мы строим деревья гаплотипов, и/или применяем логарифмический метод для проверки соответствия критерию кинетики первого порядка. Вы не делаете ни того, ни другого.
Иногда, когда ветви уравновешивают друг друга, может получиться случайная компенсация, а в других случаях этого не будет. То есть ситуация непредсказуема. Это - не наука.
>Цитата(Ostan @ 4.6.2012, 5:09) Я эту формулу досконально проверил и считаю, что ее как раз можно и нужно использовать для отдельных маркеров.
Значит, так ничего не не поняли. Читайте, что выше.
>Цитата(Ostan @ 4.6.2012, 5:09) Например, в приведенном мною расчете совпадение квадратичного метода расчета и результатов использования формулы практически идеальное. В 35CDYb линейный метод дает 136 мутаций. С учетом компенсации по формуле 310 мутаций. А квадратичный метод дает 324 мутации. Совпадение идеальное Ничего удивительного, выбрали самый быстрый маркер, в котором мутаций. А в медленных маркерах 1-2-3-4 мутации. Ну и как считать будете, когда там ошибка расчетов будет 50-100%?
Это называется подтасовкой в дискуссии.
>Цитата(Ostan @ 4.6.2012, 5:09) Или у Z93 не было единого предка?
Опять передергиваете. Вы не словом не упомянули о том, что в Z93 есть разные ветви, что вы в расчетах не учитываете. А мутационную разницу между ними возводите в квадрат. За счет этого и получаете более высокие значения лет до общего предка, кроме тех случаев, где случайно скомпенсировалось.
Был, был общий предок в Z93 (по крайней мере в рамках понятий ДНКгенеалогии), только вы неверно анализируете систему, опять изобретаете велосипед. Сообщите нам здесь, сколько из ваших 107 гаплотипов было гаплотипов евреев. Подсказываю – не менее половины. А ведь они совсем недавние. А теперь догадайтесь, почему вы получили большую величину до общего предка.
Ostan:
Анатолий Алексеевич, а что мне остается, кроме как ёрничать. Вот уже более года Вы мне так и не ответили на вопрос в каком случае можно использовать формулу Клесова-Адамова, а в каком случае нельзя.
Приведу пример с квадратичным методом. Если все мутации представить в виде таблицы, в которой строки соответствуют гаплотипам, а столбцы отдельным маркерам, то в квадратичном методе сумма мутаций по столбцам будет соответствовать дисперсии нормального распределения. А суммы мутаций по гаплотипам будут подчиняться закону Пуассона. Все прозрачно. А в линейном методе, если мы найдем сумму мутаций по столбцам, то можем ли мы использовать формулу Клесова-Адамова? Я считаю, что можно. Вы теперь пишете, что нельзя. Еще запутаннее вопрос о сумме мутаций по строкам. Если считать по усредненным скоростям мутаций в маркерах, то, как Вы утверждаете, можно, но баланса мутаций мы и в этом случае не получаем. Эту проблему я решил в примере расчета ранее в теме «Калибровка скоростей мутаций». Вы согласились с этим расчетом, назвав полученную ошибку в 17% нормальным явлением. Так почему теперь удивляетесь той же самой ошибке в 17%, но только в этом конкретном случае?
Еще интереснее получается если использовать при расчете 111-маркерные гаплотипы. Предсказанная ошибка линейного метода для этого примера составит около 26%. Проведем расчет для этого же субклада. Еврейскую ветвь как и в предыдущем случае опускаем, чтобы не было лишних вопросов. Хотя в квадратичном расчете и с еврейской ветвью получается тот же результат, если ее объём не превышает 20% гаплотипов. Но и без еврейской ветви на 111-маркерах достаточно своих ветвей. Выборка составила 27 гаплотипов. Линейный метод дал 744 мутации. После компенсационного расчета получаем 853 мутации. Итого 853/27*126 = лет. Еще полтысячи лет в лакуну опустили. Расчет квадратичным методом дает 1039/26*126 = 5040±350 лет. Вполне нормальная оценка для гаплотипов. Разница в методах составляет 26%. Точно рассчитанная величина. Ну, так это вполне нормальное явление.
А. Клёсов:
>Цитата(Ostan @ 5.6.2012, 11:11)...а что мне остается, кроме как ёрничать. Вот уже более года Вы мне так и не ответили на вопрос в каком случае можно использовать формулу КлесоваАдамова, а в каком случае нельзя.
Похоже, что вы на самом деле вы не ерничаете. Вы, судя по рассуждениям, просто не знаете. Но не слушаете, когда Вам объясняют.
Любую формулу можно применять тогда, когда выполняются условия для ее применения. Когда условия не выполняются, идут отклонения, и чем они больше не выполняются, тем больше отклонения, вплоть до полностью неверного результата. Определение "полностью неверного" дайте сами.
Поэтому сама постановка вопроса "в каком случае можно, а в каком нельзя" показывает удручающее непонимание того, что написано в предыдущем абзаце. Как Вам уже много раз объясняли, нельзя применять тогда, когда ветви не разделены. Когда понятие "субклад" заменяет предварительное рассмотрение серии гаплотипов на их сходимость к общему предку. Когда мутаций очень мало, и нет статистики. Когда анализ идет по одному маркеру, и распределение мутаций в нем отражает не неупорядоченность, а историю предков, особенно это касается медленных маркеров. То есть нельзя тогда, когда не знаете и не понимаете особенности системы. Это же касается любой области науки и техники. Нельзя применять кувалду при ремонте телевизора. Или это Вам тоже нужно объяснять, почему? Но если на ней раскладывать детали, то применять можно.
Вот и ответьте на общий вопрос, когда можно применять таблетки для лечения больного, а когда нельзя. Сможете ответить? Вот примерно так и смотрится ваш вопрос выше. Просто тот, кто ЗНАЕТ суть подхода, тот знает, что и когда можно, а что и когда нельзя.
>Цитата(Ostan @ 5.6.2012, 11:11) А в линейном методе, если мы найдем сумму мутаций по столбцам, то можем ли мы использовать формулу Клесова-Адамова? Я считаю, что можно. Вы теперь пишете, что нельзя.
Что нельзя? Где нельзя? В каких случаях нельзя? Вы что, прикидываетсь, или в самом деле ситуация настолько плоха?
>Цитата(Ostan @ 5.6.2012, 11:11) Вы согласились с этим расчетом, назвав полученную ошибку в 17% нормальным явлением. Так почему теперь удивляетесь той же самой ошибке в 17%, но только в этом конкретном случае?
Ошибка в 17% - нормальное явления при числе мутаций в серии гаплотипов, примерно равном 50 (мутаций), и то при наличии одного общего предка, подтвержденном известными критериями. Если в системе менее 50 мутаций, то ошибка больше, чем 17%. Если в системе тысячи мутаций, то погрешность в 17% показывает, что там что-то не так.
Например, больше одного предка, есть разные ветви, не учтены мультикопийные маркеры, и так далее.
Далее, если мы сравниваем двух общих предков, до одного 10 тысяч лет, до другого 500 лет, то ошибка в 17% - нормальное явление, она никак не меняет принципиальный результат. Если мы строим какие-то исторические конструкции при сравнении двух величин, отличающихся друг от друга на 5% при погрешности в 17%, то это глупость, а не нормальное явление.
Неужели так трудно сообразить, что каждый раз проводится конкретный анализ в конкретной ситуации, и в одной 17% - это замечательно, в другой это рушит все выводы.
Ostan:
Ясно, что линейная модель где-то может быть использована, а где-то ее необходимо заменить на более продвинутую нелинейную.
Для людей, знающих химическую кинетику, также ясно, что задачи нестационарной диффузии в многокомпонентных системах в разбавленных растворах, где процессы диффузии компонент не влияют друг на друга, решаются раздельно для каждого компонента. А общее решение является суперпозицией (сложением) частных решений. И для получения общего решения вовсе не требуется вводить средний коэффициент диффузии. Для простейших задач такой метод еще проходит, но когда коэффициенты диффузии компонент отличаются в более чем 500 раз, а число компонент составляет 67, такой метод уже не применим. Это все равно, что запрячь в одну телегу коня и трепетную лань.
Телега все равно быстрее не поедет.
А вот предки субклада Z93 это прекрасно знали. Именно они придумали запрячь лошадь в телегу, и уже 5000 лет тому назад имели поселения и на Алтае, и на Дунае в центре Европы недалеко от Гальштата, и в Иране. Такая великая культура, как ямная, просто по определению не могла иметь никаких бутылочных горлышек, также как я их не обнаружил у культуры колоколовидных кубков. Ямная культура сама могла сделать бутылочное горлышко кому захотела бы. И такую культуру древних индоариев Вы предлагаете опять скинуть в искусственную лакуну? Не получится. Своих не выдаем.
И. Рожанский:
Уважаемый Ostan, Вам не кажется, что все написанное в 3-ем абзаце чистейшей воды демагогия? Что это за лакуны и бутылочные горлышки, которые кто-то кому-то устраивает по причине многомерной диффузии или чего-то там из области гамма-распределения? Вы уж или о математике или о реконструкциях, но в разделе "Гаплофантазии". Я уж устал обсчитывать модели, которыми, как теперь понимаю, тщетно пытаюсь показать, что и как работает.
Попробуйте хоть раз самостоятельно построить дерево гаплотипов и оценить его устойчивость, и тогда сразу станет ясно, что все эти рассуждения о тонкостях распределений - это ловля блох на фоне куда более существенных факторов.
Вот ссылки:
http://evolution.genetics.washington.edu/phylip.html http://www.megasoftware.net/ http://www.fluxus-engineering.com/sharenet.htm Весь софт бесплатный и не слишком сложный в обращении.
Ostan:
Пока нет времени заняться моделированием. Давайте сначала закончим с Z93. Тем более, что эта ветвь очень показательная, поскольку уже хорошо отснипована и снипы в ней идут один за другим практически без значительного интервала времени. Это позволяет легко выделить наиболее древние ветви Z93, и оценить время возникновения снипов.
Если выделить 67-маркерные гаплотипы Z93+Z94- и Z93+Z94+, то это будет самый низ дерева и ветви исходящие с этими снипами будут самыми древними. Их у меня нашлось 14 с самой обширной географией. Подсчет возраста по этим гаплотипам квадратичным методом дает 348/13*203 = 5430±560 лет, что стопроцентно совпадает с возрастом, рассчитанным по гаплотипам со всеми молодыми ветвями. Теперь выделим гаплотипы с L342+, включая и гаплотипы с L657+. Таких под руками оказалось 66.
Возраст этой ветви составит 1690/65*203 = 5280±250 лет. Сразу видно небольшое понижение возраста. Как видно из этого эксперимента, снипы действительно идут один за другим с небольшим интервалом не более 200лет. Это и определило практически одинаковую географию их распространения.
Таким образом, самые древние ветви субклада Z93 попадают в интервал 5430-5280 лет. Ну и о каком бутылочном горлышке может идти речь? Ведь согласно линейному расчету в это время не было никаких ветвей, а общий предок субклада появился почти на 800 лет позже. Заметьте, что молодые ветви практически не оказали влияния на расчет возраста. Ну и зачем их выделять? Это связано с тем, что квадратичный метод всегда ориентирован на самые старые ветви, которые ушли на наибольшее расстояние от базового гаплотипа. Если обратиться к аналогии с брошенным камнем, то квадратичный метод измеряет наибольший диаметр распространения волны, а на суперпозицию отраженных, стоячих волн внутри этого круга не обращает внимание. Но именно наибольший диаметр и есть тот показатель, который и позволяет наиболее точно измерить время, прошедшее от момента бросания камня.
Мы привыкли просто работать с линейным методом и считаем, что чем более древние ветви мы выделим, тем точнее получим возраст субклада. Но в квадратичном методе это не так. Он сам выделяет наиболее древние ветви и ориентируется только на них. Для понимания этого результата надо чаще обращаться к квадратичному методу.
Это вовсе не означает, что ветвеобразование не оказывает влияние на результат расчета. Оказывает и довольно часто. Например, в расчете возраста субклада Z93 на 111 маркерных гаплотипах, который я уже приводил, расчет возраста на 27 гаплотипах дал 1039/26*126 = 5040±310 лет.
А расчет этих же гаплотипов, но только с учетом 67-маркерной части дает 744/26*203 = 5800±420. В среднем все равно получается 5400, но разброс резко возрос. Это и есть результат влияния веткообразования. Молодая ветвь случайным образом может попасть или ближе к базовому гаплотипу или дальше. Причем обе вероятности равны. Это мы уже обсуждали в теме калибровки скоростей мутации. Именно этот фактор и заставляет при калибровке скоростей мутации обращаться к как можно большему количеству ветвей, чтобы нивелировать этот разброс. Но результаты расчетов в среднем все равно попадают туда куда нужно. Если бы этого не происходило, то тогда мы не смогли бы откалибровать скорости мутаций.
Ну а к моделированию случайных марковских процессов мы еще вернемся.
И. Рожанский:
>Цитата(Ostan @ 8.6.2012, 1:41) Мы привыкли просто работать с линейным методом и считаем, что чем более древние ветви мы выделим, тем точнее получим возраст субклада. Но в квадратичном методе это не так. Он сам выделяет наиболее древние ветви и ориентируется только на них. Для понимания этого результата надо чаще обращаться к квадратичному методу.
http://www.rodstvo.ru/forum/index.php?show...amp;#entry Линейный метод, 67-маркерная панель:
0,00184±0,0001 мутаций на маркер на 25 лет.
ASD с фиксированным базовым гаплотипом, 67-маркерная панель:
0,00217±0,00015 мутаций на маркер на 25 лет.
А ларчик просто открывался © Ostan:
Игорь Львович, я все ждал от Вас базового гаплотипа для субклада Z93, но, видимо, уже не дождусь. Тот базовый гаплотип, который я показал является одновременно и модальным для квадратичного метода. Он выбран единственным способом, обеспечивающим минимальную дисперсию, а следовательно, и минимально возможный возраст этого субклада. Если мы в качестве базового возьмем другой гаплотип, то подсчет возраста субклада даст большие значения. Тем самым мы сможем закрыть остатки лакуны и доказать, что у этого субклада не было никаких бутылочных горлышек.
Квадратичный метод расчета возраста субклада, так же как и линейный, не идеальный. Он также продуцирует свою лакуну, размер которой тем не менее в несколько раз меньше, чем в линейном. Если мы смогли бы с помощью других способов, которыми Вы владеете ( построением конкретного дерева, выделением отдельных ветвей и т.д.), приблизиться еще ближе к предковому гаплотипу, то подсчет возраста субклада дал бы наконец тот возраст разделения отдельных субкладов, который по предварительным оценкам находится в диапазоне 5500-5700 лет. Возраст субклада Z93 непосредственно упирается в эту цифру.
Cейчас уже набрана достаточная статистика по древним линиям R1a в Европе. Я, например, нашел 11 гаплотипов Z283+, остальные снипы минус, 10 гаплотипов M458+,остальные снипы минус и 18 гаплотипов Z284+, остальные снипы минус. Все три линии дают возраст около 6000 лет тому назад, но точность вычисления возраста пока еще невелика. А вот, объединение этих трех линий дает уже достаточно хорошую статистику.
Для 39 гаплотипов возраст составляет 1265/38*203 = 6700±375 лет. Т.е. снип Z283 появился свыше 6500 лет тому назад. M458 и Z284 появились около 6000 лет тому назад. По сравнению с этими цифрами возраст Z93 выглядит достаточно молодым. Его оценки пока не превышают 5500 лет. Даже если этот возраст будет в дальнейшем откорректирован в большую сторону, все равно в миграции R1a через Русскую равнину и Казахстан могли участвовать и представители M458, и представители пока еще не известных субкладов. Предпосылки для этого есть. Так в индийском проекте, в котором только еще часть отснипована как Z93, возраст до общего предка уже сейчас приближается к 6000 лет. А в арабском проекте уже сейчас обнаружены Z280, и даже Z92. Вполне возможно, что это более поздние миграции, но и наличие этих европейских субкладов в первоначальной миграции, отрицать также пока невозможно.
По современным представлениям долихокранные европейцы появились на Русской равнине и на Волге около 6000 лет тому назад. Это Средний стог на втором этапе и Хвалынская культура. Сейчас уже достаточно ясно, что их происхождение связано с распространением долихокранных средиземноморцев из балканских и дунайских культур. Предположение о приходе их из Индии пока не подтверждается. Также не подтверждается гипотеза М.
Гимбутас о местном их происхождении из Самарской культуры. Ни одна из имеющихся на настоящий момент краниологических серий это не подтвердила. Поэтому, появление долихокранных европейцев на Волге, Южном Урале и, даже на полуострове Мангышлак, следует связывать с распространением R1a из Европы.
A. Kлёсов:
Ну что же, проведем очередной разбор полетов. Каждый раз про одно и то же.
Итак, Ваши общие ошибки:
1. Вы не читаете литературу, потому каждый раз изобретаете велосипед.
2. Вы не делите на ветви, даже когда знаете, что у Вас - серия субкладов, причем один вышестоящий и два "дочерних", к тому и еще разного числа гаплотипов. То есть Вы не учитываете и "веса", в итоге весь расчет искажен.
3. Вы продолжаете завышать времена до "общих предков", используя квадратичный метод без поправок. А то, что в серии разные веса (и соответственно завышение числа мутаций), то квадратичный метод задирает времена еще больше.
4. Вы не рассматриваете очевидных альтернатив при "анализе" археологии.
Задрав время R1a до предка, Вы так и лупите - "хвалынская культура", даже не принимая во внимание, что это значительно более вероятнее R1b, по всему комплексу показателей. Вы выхватываете один вариант краниологии, не принимая во внимание, что там целый массив данных "по всему полю".
5. Наконец, что мелочь, но показательная - Вы сознательно встаете в позицию изгоя, не желая применять отработанные и опубликованные значения констант скоростей мутаций 67-маркерных гаплотипов. Вместо величины 0.12 мутаций на гаплотип на 25 лет ("208" в Ваших терминах обратных величин), Вы настойчиво применяете "213", то есть константу 0.117. Понятно, что это никакой роли не играет, разница примерно 2%, но здесь важна суть: Вы хотите быть изгоем. 0.12 давно опубликована, принята всеми, но Вы демонстративно не хотите в этом участвовать.
Если бы Вы честно написали, что это Вы так, балуетесь, и к этому не надо относиться серьезно, то и вопроса бы не было. Но Вы пишете в разделе «Центрально-евразийская ветвь», как якобы Вы взаправду.
Перейдем к вопросу более конкретно. Z283 (евразийская ветвь), M (европейская ветвь) и Z284 (скандинавская ветвь) соотносятся так:
Z284 Z283 M То есть левая и правая - дочерние ветви. Еще одна дочерняя от Z283 Z (центрально-евразийская ветвь).
Возраст Z283 - не 6500 лет, как Вы написали, да еще указав малую погрешность, а на 800 лет моложе, примерно 5700 лет.
Возраст М458 не 6000 лет, как Вы написали, а 4200 лет.
Возраст Z284 не 6000 лет, как Вы написали, а 4300 лет.
Погрешности я здесь опускаю, все это опубликовано в Вестнике, и на днях выйдет суммарная статья в Advances in Anthropology, там все эти данные.
Далее, при чем здесь хвалынская культура, когда Z284 - это в основном Скандинавия, а М458 - это в основном Центральная Европа? Вы на географию-то смотрите?
Прямо реинкарнация Гимбутас.
Наконец, кто по Вашим понятиям "долихокранные европейцы" на Русской равнине с давностью 6000 лет назад? Вы знаете, что R1a и R1b краниометрически практически неразличимы, и обе дают широкие вариации от долихокрании до брахицефалии?
>Цитата(Ostan @ 27.6.2012, 3:20) Поэтому, появление долихокранных европейцев на Волге, Южном Урале и, даже на полуострове Мангышлак, следует связывать с распространением R1a из Европы.
Угу. Прямо-таки "следует". Почитайте Вестник за август 2010 года, там много про краниологию древних и современных людей.
В этом-то и Ваша системная проблема, что Вы берете один вариант, и его выставляете. А это один вариант из многих, которые Вы или не знаете, или игнорируете.
И. Рожанский:
И еще раз о калибровках линейного и квадратичного методов, раз уж эта тема приобрела какой-то нездоровый характер. Вернулся к фамильным проектам с документированными предками. За прошедшие 1,5 - 2 года добавились новые гаплотипы, а также для некоторых линий удалось уточнить документальные данные. Для каждой из полученных 17-ти эталонных выборок сделал расчет мутаций в 3-х вариантах, тех же самых, что и в предыдущем сообщении.
Результаты представлены в виде графиков, на которых по осям отложено документированных предков в условных поколениях (т.е. 25 лет) до настоящего времени (2010 г.). Ниже - данные для 67-маркерной панели. Для остальных пока не делал, но вряд ли там будет качественно другая картина.
Красным отмечены точки в линейном методе с поправкой на возвратные мутации, синим - в квадратичном с фиксированным базовым гаплотипом.
Нетрудно убедиться, что скорости мутаций для этих двух методов получаются РАЗНЫЕ. Более того, между линейным и обеими разновидностями квадратичного метода существует строгая линейная зависимость, в чем можно убедиться из графиков. Нет ни малейшего намека на загиб во всем исследованном диапазоне, от 0,02 до 0,2 мутаций на маркер. То же самое линейное расхождение я уже наблюдал в позапрошлом году в масштабе до 0,5 мутаций на маркер, но тогда объяснения ему еще не нашли. Теперь мы знаем из модельных расчетов, что так проявляется эффект разных скоростей в отдельных маркерах.
Какой второй, и самый важный для практики вывод? Это то, что линейный и квадратичный методы, особенно в варианте с базовым гаплотипом (см.
графики), полностью эквивалентны. Вся разница лишь в коэффициенте пересчета приведенных мутаций в года. Они выписаны выше. Отсюда же следует, что все те расхождения в датировках линейного и квадратичного методов, вокруг которых постоянно кипят страсти, процентов на обязаны линейке с другими делениями. Как говорил один персонаж: "В попугаях я гораздо длиннее." Следовательно, все эти игры с распределениями и якобы лакунами - это в буквальном смысле ловля блох.
Неоднородности выборки и их ограниченный размер сказываются на точности куда больше.
Ostan:
Игорь Львович, Вы вот уже около двух лет приводите этот график в качестве доказательства, что скорости для квадратичного метода нужно изменить. При этом утверждаете, что графики абсолютно линейные. А как же формула Клесова-Адамова? Она то утверждает, что графики нелинейные. Зачем останавливаться на половине пути? Вы то уже освоили моделирование процесса. Так смоделируйте процесс и рассчитайте полученный результат различными методами. Только не на 12-ти и 25-ти маркерных гаплотипах, а на нормальных 67-ми и 111-ти маркерных. И не на интервале в 2000 лет, а на интервале в 5000-6000 лет. Т.е. именно там, где у нас имеются различия. Сколько можно обсуждать проблему? Лучше один раз увидеть, чем сто раз услышать.
В отличие от Вас, я использовал для калибровки не известные генеалогии, а известный факт - появление Культуры колоколовидных кубков в Европе.
При этом первоначально брал в качестве даты пересечения Гибралтара 4800 лет тому назад, но потом подкорректировал дату в соответствии с данными археологов до 5000 лет тому назад. При этом я получил на ветвях R1b точно такие же значения скоростей мутаций, что и у Вас. А именно года на мутацию при подсчете дисперсий с учетом степеней свободы, и лет на мутацию при подсчете по распределению Пуассона. А именно второй способ в точности соответствует линейному. Ну и хорошо, что скорости мутации при определении по известным генеалогиям и по археологическим данным совпадают. Не совпадают методы расчета линейный и квадратичный. Один показывает "бутылочное горлышко", а другой не показывает. Но это проблема у нас в головах. Если убрать бутылочное горлышко из наших голов, то и проблема отпадет.
Анатолий Алексеевич, почему Вы решили, что я не выделяю отдельные ветви. Очень точно выделил, и не две-три, а целых 39. И все они существовали еще в Старой Европе согласно Ваших же данных. Ну и что, что они прошли бутылочные горлышки около 5000 лет тому назад. Линии то остались. И все они имели общего предка - первого носителя снипа Z293.
Вы не привели доверительный интервал Ваших вычислений, и правильно сделали. Какая точность может быть при объединении двух -трех веток? А вот при объединении 39 точность уже более менее. Вы не правы, что я использую другие скорости мутации. Скорости мутаций те же самые.
Небольшая разница возникает только от метода расчета. Для примера приведу оба расчета 1265/38* 203 = 6760±375 лет, и 1285/39*208 = 6850± лет. Как видно обе оценки совпадают.
Другое дело, что при определении возраста до общего предка линейным методом эти оценки будут намного меньше, не более 4000 лет. Но это мы уже проходили. Еще некоторое время тому назад Игорь Львович посылал всех башкиров искать их предка в Западную Европу. Действительно, по его данным снип M269 для R1b1b2a появился около 6000 лет тому назад, но единственный выживший предок. согласно линейному расчету, проживал около 4000 лет тому назад в Западной Европе. Зачем такие сложности?
Квадратичный метод дает для армянских R1b1b2a около 5500 лет тому назад. И не надо искать предков в Европе, они преспокойно жили в Азии.
Такой же расчет и для башкиров немного погодя даст тот же самый возраст.
Также можно отметить, что антропологи достаточно хорошо выявляют особенности строения черепов. Антропология достаточно точная наука. И R1a от R1b они давно отличали, только не знали где какие. Так с самого открытия ямной культуры антропологам известно, что эта культура имела две компоненты. Одна долихокранные европейцы, а другая мезо- и брахикранные. Аналог второй компоненты не обнаруживался в местных культурах. Краниологические серии совпадали только с древними армянскими захоронениями и с некоторыми захоронениями Майкопской культуры. А вот с чего Вы решили, что на Урале и в Казахстане во времена свыше 5500 лет тому назад проживали R1b мне не ясно. У меня таких данных нет. Двухкомпонентность сохранилась и у современных башкир. И R1a и R1b у них со времен ямной культуры.
Впрочем, если подсчитать их возраст линейным методом, то и те и другие не должны существовать. Их предки давно должны числиться вымершими и не давшими потомства. Не должны существовать и индусы. И многие другие народы.
А. Клёсов:
>Цитата(Ostan @ 28.6.2012, 4:35)... почему Вы решили, что я не выделяю отдельные ветви. Очень точно выделил, и не две-три, а целых 39. И все они существовали еще в Старой Европе согласно Ваших же данных.
Вы не выделяете отдельные ветвь. И 39 - это у Вас число гаплотипов. И не гаплотипы существовали в Европе, а их общие предки. Остальное, как в том анекдоте, всё правильно.
Так вот, эти 39 гаплотипов разделяются на три субклада - Z283, и его дочерние М458 и Z284. При этом число гаплотипов во всех разное (в одном вдвое больше, чем в остальных), поэтому "веса" у них разные (11, 10 и 18, соответственно). Я об этом уже Вам растолковывал.
Когда веса разные, то та ветвь, которая больше по численности, при расчетах выступает в качестве "базовой", то есть якобы "предковой". У Вас это Z284, которая вообще дочерняя. Она "перетягивает одеяло" на себя.
Поэтому число мутаций получается в принципе неверное, а именно завышенное. А завышенное потому, что минимальное число мутаций должно быть от настоящего базового гаплотипа.
Вы это завышенное число мутаций возводите в квадрат, то есть получаете, как гласит американская поговорка, add insult to injury. По-русски переводится примерно как сделать плохую ситуацию еще хуже ("к ранению добавить еще оскорбление"). Вот так и получается у Вас из 4000 лет целых 6000 лет. А Вы начитаете забалтывать, наводить тень на плетень, петлять как заяц во хмелю, и так далее.
Но там у Вас ситуация еще хуже, потому что субклады в свою очередь состоят из ветвей. Например, в M458 есть несколько ветвей, из которых две наиболее различаются - это центрально-европейская и западно-славянская.
Она на дереве гаплотипов занимают совершенно разные места. А Вы опять набираете мутации МЕЖДУ ними, а не от общих предков. В итоге у Вас полная каша, и результат совершенно неверен.
>Цитата(Ostan @ 28.6.2012, 4:35) Вы не правы, что я использую другие скорости мутации. Скорости мутаций те же самые. Небольшая разница возникает только от метода расчета. Для примера приведу оба расчета 1265/38* 203 = 6760±375 лет, и 1285/39*208 = 6850±375 лет.
Как видно обе оценки совпадают.
Я же написал выше, в предыдущем сообщении:
5. Наконец, что мелочь, но показательная - Вы сознательно встаете в позицию изгоя, не желая применять отработанные и опубликованные значения констант скоростей мутаций 67-маркерных гаплотипов.
И дальше:
Понятно, что это никакой роли не играет, разница примерно 2%, но здесь важна суть: Вы хотите быть изгоем. 0.12 давно опубликована, принята всеми, но Вы демонстративно не хотите в этом участвовать.
Дело вовсе не в том, что это примерно то же самое. Если Вы в качестве величины "пи" используете не 3.14, а 3.15, то результат тоже будет примерно тот же самый, но люди будут хихикать в кулачок. Что я и делаю, глядя на Вашу акробатику.
>Цитата(Ostan @ 28.6.2012, 4:35) Еще некоторое время тому назад Игорь Львович посылал всех башкиров искать их предка в Западную Европу. Действительно, по его данным снип M269 для R1b1b2a появился около 6000 лет тому назад, но единственный выживший предок. согласно линейному расчету, проживал около 4000 лет тому назад в Западной Европе.
Зачем такие сложности?
Пошло, как обычно, ерничание и клоунада. Здесь все не только неверно, но извращено. Датировка М269 - примерно 7000 лет, и не в Европе, а в Азии.
6200 лет назад - это датировка дочернего субклада L23, тоже в Азии. Все это давно опубликовано. Но Вы же литературу не читаете, оставаясь в блаженном неведении.
>Цитата(Ostan @ 28.6.2012, 4:35) Также можно отметить, что антропологи достаточно хорошо выявляют особенности строения черепов. Антропология достаточно точная наука. И R1a от R1b они давно отличали, только не знали где какие.
Первая фраза - совершенно верная. Естественно, хорошо выявляют. И вторая фраза верная, наука достаточно точная. Поэтому антропологи давно установили, что краниометрия у населения динамичная, она плывет во времени, и зависит от многих факторов. Я же Вам советовал прочитать мою статью о краниометрии и сопоставлении с гаплогруппами. Так вот, нет там определенной корреляции. Сейчас, например, русские в основном склонны к брахицефалам, и это было отмечено более ста лет назад. Вот цитата из моей статьи, которую Вы читать не соизволили:
"40. «Из немногочисленных еще наблюдений, произведенных, главным образом, над фабричными Московской и Рязанской губ., оказывается, что...ширина головы, напр., в ее отношении к наибольшей длине головы представляет колебания показателя от 71 до 93, переходя, следовательно, от типичной долихоцефалии (не уступающей курганной) до крайних степеней брахицефалии. Но долихоцефальные формы составляют теперь исключения; преобладают формы более широкие...
средняя величина головного показателя, 81,5—82,5 (Воробьев, Зограф, Анучин) (там же)".
Оттуда же:
39. «У чехов теперь также господствует брахицефальная форма черепа (еще в большей степени, чем у русских), но древние могилы их страны, по всем признакам славянские, характеризуются долихоцефалией находимых в них черепов» (там же).
"Там же" - это Д. Анучин. Россия в антропологическом отношении.
Брокгауз и Ефрон. Энцикл. словарь.
>Цитата(Ostan @ 28.6.2012, 4:35) И R1a от R1b они давно отличали, только не знали где какие.
Вот это и есть клоунада.
На самом деле никто не знает, по какой причине краниометрия плывет - то ли ранее среди славян гаплогруппа I преобладала со своей долихокранностью, а R1a всегда были в основном брахицефальны, то ли в самом деле она меняется со временем. То же самое и в отношении R1b. А ранее в Европе и гаплогруппы G было много, и тоже неизвестно, какая была. Антропологи только череп видят, и их умеют измерять. А уж какая гаплогруппа - они и понятия не имеют.
>Цитата(Ostan @ 28.6.2012, 4:35) А вот с чего Вы решили, что на Урале и в Казахстане во времена свыше 5500 лет тому назад проживали R1b мне не ясно. У меня таких данных нет.
Данных нет, потому что не читаете, а если и читаете, то не понимаете.
Почитайте хотя бы последнюю статью в Advances in Anthropology.
>Цитата(Ostan @ 28.6.2012, 4:35) Двухкомпонентность сохранилась и у современных башкир. И R1a и R1b у них со времен ямной культуры.
Это они Вам сами рассказали, в отношении R1a?
Большинство (если не все) современных башкир гаплогруппы R1a имеют субклад L342.2, с общим предком 1125±190 лет назад. Но поскольку Вы в бутылочные горлышки не верите, то при чем здесь ямная культура? Это примерно 9-й век нашей эры. А если наконец поверите в бутылочные горлышки популяции, то их общий предок с ближневосточными L342. жил 4800±500 лет назад. Это как раз времена миграций ариев из Европы по Русской равнине. На это же указывает и время жизни общего предка башкир и евреев L342.2 - 4400±500 лет назад. Или евреи тоже к ямной культуре относились? Если нет, то чем они хуже башкир? Или наоборот, чем башкиры хуже евреев?
>Цитата(Ostan @ 28.6.2012, 4:32)... я использовал для калибровки не известные генеалогии, а известный факт появление Культуры колоколовидных кубков в Европе. При этом первоначально брал в качестве даты пересечения Гибралтара 4800 лет тому назад, но потом подкорректировал дату в соответствии с данными археологов до 5000 лет тому назад.
Это занятно. Вас не затруднит дать КОНКРЕТНЫЕ данные археологов о пересечении Гибралтара 5000 лет тому назад теми, кто образовал культуру колоколовидных кубков?
(ПРИМЕЧАНИЕ: Прошло более двух недель, данные не приведены. Ответа нет. - АК) И. Рожанский:
Уважаемый Ostan, ну как можно вести дискуссию с оппонентом, который не то сознательно передергивает аргументы, не то слышит и видит не обращенную к нему речь, а только то, что он сам ХОЧЕТ слышать и видеть?
>Цитата(Ostan @ 28.6.2012, 18:32) Так смоделируйте процесс и рассчитайте полученный результат различными методами. Только не на 12-ти и 25-ти маркерных гаплотипах. а на нормальных 67-ми и 111-ти маркерных. И не на интервале в 2000 лет, а на интервале в 5000лет. Т.е. именно там, где у нас имеются различия. Сколько можно обсуждать проблему? Лучше один раз увидеть, чем сто раз услышать.
"Жалко, что нам так и не удалось услышать начальника транспортного цеха"© Вы что, издеваетесь или взаправду не поняли, что изображено на графике полугодовой давности, приведенном выше? (источник – http://www.rodstvo.ru/forum/index.php?act=...post&id= http://www.rodstvo.ru/forum/index.php?show...amp;#entry87030) Цитирую:
>Для этого сделал в MS Excel генератор случайных шагов на +/-1 с заданной вероятностью для 1000 маркеров, и сделал по 10 прогонов на 200 поколений для 67маркерной панели (15 гаплотипов) и для набора из быстрых 16-ти маркеров ( гаплотипа). Индивидуальные скорости взял из сообщения Ostan'а, пронормировав при этом длину поколения так, чтобы общее число наблюдаемых мутаций в 200-м поколении соответствовало датировке, используемой в текущих расчетах.
Получилось 28 лет на поколение и 5600 лет для модельных испытаний. Вполне разумные величины для численных оценок.
Модельный расчет дал отклонение от линейности не более 3% во всем исследуемом интервале. Экспериментальные данные - и того меньше. Или коэффициент корреляции 0,99 и хи-квадрат 0,04 для Вас - пустой звук?
Да, по законам мат. статистики суммарное число мутаций при расчетах двумя методами связано нелинейным соотношением. В общем случае, прошу заметить. В частном же примере конкретного набора маркеров вклад нелинейности пренебрежимо мал, и поправка на нее проскакивает в коридор погрешностей, как теннисный мячик в баскетбольную корзину.
Весь эффект разной скорости мутаций в разных маркеров описывается линейным соотношением с хорошей статистической значимостью. Всё, вопрос закрыт!
Или вы всерьез полагаете, что следующие 56 экспериментальных ОДНОРОДНО СХОДЯЩИХСЯ генеалогических линий дадут совсем другую зависимость? Если да, то советую обратить внимание на вопиющее пренебрежение законами релятивистской механики специалистами в Центре Управления Полетами. Может быть, спутники падают из-за этого?
>Цитата(Ostan @ 28.6.2012, 18:32) В отличие от Вас, я использовал для калибровки не известные генеалогии, а известный факт - появление Культуры колоколовидных кубков в Европе.
"Я каждый день смотрю телевизор и знаю, чем живет современная молодежь" (К. Шахназаров. "Курьер") Неужели Вы в самом деле настолько погружены в собственный мир иллюзий, что не замечаете, как то и дело прибегаете к циклическим аргументам? Датировка R1b-M51, которая, очевидно, имеется в виду, была получена на основе калибровки по документальным генеалогиям, на ее основе, и с учетом еще целого набора фактов, она была сопоставлена с датировкой ККК, и далее послужила основой для гипотезы. Получается, Вы своим заявлением вышибаете фундамент, на котором выстроена вся конструкция, а взамен предлагаете начинать все с крыши.
Гаплогруппы африканских бушменов А. А. Клёсов:
Бушмены, они же племя Сан, наряду с другими койсанскими племенами бушменов с другими названиями (Шо, Барва, Канг, Кхве и т.д.), и обитающие в Южной Африке, имеют, по данным популяционных генетиков, один из самых высоких в Африке «коэффициентов разнообразия» (genetic diversity). Поскольку попгенетики истинно верят, что «высокое разнообразие» - это чистый параметр, имеющий абсолютное значение, то, естественно, на этом основании бушменов считают одними из родоначальников современного человечества. Вот как об этом пишет Википедия, которая, конечно, отражает представления тех, кто в нее пишут – хотя это же означает, что особых претензий у специалистов нет, или последним просто лень вносить изменения: « Various Y-chromosome studies demonstrated that the San carry some of the most divergent (oldest) Ychromosome haplogroups. These haplogroups are specific sub-groups of haplogroups A and B, the two earliest branches on the human Y-chromosome tree». Смысловой перевод: «Изучения Y-хромосомы показали, что бушмены (племени Сан) имеют наиболее разнообразные (то есть наиболее древние) гаплогруппы. Эти гаплогруппы являются субкладами гаплогрупп А и В, самыми древними ветвями на дереве Y-хромосомы человека.» Даются три ссылки.
Авторы первых двух ссылок – все те же Андерхилл, Животовский, Карафет, Хаммер, и ссылки старые – 2001 и 2003 год. Они допускают обычную и банальную ошибку попгенетиков, поскольку разнообразие вовсе не означает древность. Разнообразие часто означает просто смешивание разных компонент. Разнообразие означает древность только в случае замкнутых систем, не допускающих смешивание «снаружи». Здесь на старые статьи кивать нельзя – это системная ошибка попгенетиков. Вторая ошибка здесь – то, что гаплогруппа В якобы одна из «самых древних ветвей на дереве Y-хромосомы». Гаплогруппа В – часть блока гаплогрупп ВТ, и все они образовались примерно в интервале 50-20 тысяч лет назад. Третья ссылка – уже относительно новая, 2010 год:
Naidoo, Schlebusch, Makkan, Patel, Mahabeer, Erasmus, Soodyall (2010).
"Development of a single base extension method to resolve Y chromosome haplogroups in sub-Saharan African populations". Investigative Genetics 1 (1): 6.
В итоге авторы статьи в Википедии приходят к выводу, точнее, повторяют вывод попгенетиков: «This high degree of genetic diversity indicates that Southern Africa is the origin of anatomically modern humans.» «Эта высокая степень генетического разнообразия показывает, что Южная Африка – родина анатомически современных людей».
Вот так одна системная ошибка тащит за собой другие системные ошибки.
Другие авторы утверждают, что бушмены имеют черты, роднящие их с европеоидами: «Ashley Montagu noted that Bushmen have the following neotenous traits relative to Caucasoids: large brain, light skin pigment, less hairy, round-headed, bulging forehead, small cranial sinuses, flat roof of the nose, small face, small mastoid processes, wide eye separation, median eye fold, short stature and horizontal penis». То есть опять противоречие, которое, впрочем, может разрешаться тем, что бушмены – результат смешивания относительно недавних европеоидных линий с древними африканскими.
Тогда объясняется и разнообразие, и частичная европеоидность.
Еще деталь – в книге Стива Олсона “Mapping Human History – Genes, Race, and Our Common Origins” (2002) сообщается – «под микроскопом, клетки верхнего слоя кожи у бушменов не отличаются от таковых в других местах мира. Но глубже в коже есть клетки меланоцитов, которые придают коже цвет. У бушменов меланоциты более темные, чем у европейцев и азиатов, но менее темные, чем у чернокожих африканцев.
Последний список ISOGG-2012 (июль 2012) в разделе «Гаплогруппа В»
сообщает: Sub-group B2b is seen among Central African Pygmies and South African Khoisan... B2a1a (B-M109) is the most commonly seen sub-group of B2a.
About 2.3% of African-Americans belong to haplogroup B - with 1.5% of them belonging to the sub-group B2a1a.
Как мы видим, только 2.3% афро-американцев в США имеют гаплогруппу В, иначе говоря, 97.7% их имеют другие гаплогруппы.
И.Л. Рожанский Как раз среди бушменов гаплогруппа В встречается относительно редко. В последней по времени статье T. Naidoo et al. Development of a single base extension method to resolve Y chromosome haplogroups in sub-Saharan African populations Investig Genet. 2010; 1: 6 (линк на нее дан выше) есть статистика по 183 бушменам Южной Африки. Детали сбора образцов и племенная принадлежность их носителей не уточняются, но, исходя из современной численности этого народа (около 100 тыс. человек), такая выборка соответствует примерно одному образцу на 275 человек. То есть, покрытие очень плотное.
Из этих 183 человек 52 (28,4 %) дали положительный тест на снип М51. Это A1b1b2a в текущей версии ISOGG. К ним можно добавить носителей снипов М14 (A1b1a1a) - 5 чел., M114 (A1b1a1a1a) - 8 чел., и P28 (A1b1a1a1b) - 16 чел.
Итого, представители гаплогрупп, объединенных под A1b1, собирают 44.3% бушменов из выборки. У их ближайших соседей - банту Южной Африки, в этом же исследовании нашли 5 % (17 из 343) представителей гаплогруппы A1b1b2a. Очевидно, следствие метисации и ассимиляции, что, несомненно, имела место за долгое время соседства. Достаточно взглянуть на портрет Н. Манделы, коса (xhosa, первый звук - щелчок) по национальности.
На втором месте идут различные субклады, нисходящие к E1b1a: М2 (E1b1a) - 24 чел., M58 (E1b1a1a1a) - 2 чел., M154 (E1b1a1a1g1c) - 2 чел., М (E1b1a1a1f1a) - 14 чел. Все вместе они набирают 23,0 % от выборки. С большой долей уверенности происхождение этих линий можно связать с метисацией бушменов окружавшими их, и намного более превосходящими по численности банту. Среди них этот же набор снипов дал 66%.
На третьем - 29 человек (15,8 %) со снипом M35. Это гаплогруппа E1b1b1, характерная для жителей Средиземноморья и Африканского Рога, но весьма редкая в субсахарской Африке (1,5 % у банту Южной Африки в том же исследовании).
Лишь затем следуют 13 человек (7,1 %) со снипом Р6 (B2b1), к которым примыкают обладатели снипов M112 (B2b*) - 2 чел., и Р8 (B2b4a) - 5 чел.
Итого получается 10,9 % представителей гаплогруппы B2b, практически отсутствующей в выборке южноафриканских банту (1 из 343). Среди последних с частотой 16% встречается другой субклад - B2a1a (M152).
Из оставшиеся 10-ти человек 6 или 7 - явные потомки европейских поселенцев из гаплогрупп I (M170) - 1, R1a1a (M198) - 2, и R1b (M343) - 3.
Триста лет совместного проживания и распространенная практика бурских фермеров брать себе наложниц из местного населения не могли не сказаться. Один носитель снипа M34 (E1b1b1b2a1) может, в принципе, оказаться как потомком белого иммигранта, так и одним из членов ветви, маркированной М35.
Наконец, трое - представители гаплогруппы Е2, встречающейс с несколько большей частотой у южноафриканских банту.
Итого, специфичечески койсанскими линиями в этой выборке можно назвать A1b1, B2b и E1b1b1, которые вместе собирают 71% выборки южноафриканских бушменов. Последняя группа дала отрицательные результаты по нисходящим снипам M78 (E1b1b1a1), M148 (E1b1b1a1c1), M (E1b1b1b1a), M107 (E1b1b1b1a1 - private), M165 (E1b1b1b1a2a - private), M (E1b1b1b2a), M34 (E1b1b1b2a1), M136 (E1b1b1b2a1a1) и M281 (E1b1b2), что уводит ее общего предка с европейскими и ближневосточными ветвями того же субклада, как минимум, на 12 тысяч лет назад.
В этой весьма репрезентативной выборке (см. выше) не были обнаружены гаплотипы А0, что ставит под сомнение популярное утверждение, что бушмены - потомки самых ранних людей. Их необычайно большая вариативность - следствие наложения нескольких далеко разошедшихся линий, производных от альфа-гаплогруппы, а вовсе не знак того, что эта этническая группа какая-то особенно древняя.
Где и когда они перемешались, дав в итоге современную популяцию койсанских народов, мы не знаем. Если исходить из того, что гаплоруппы A1b1 и E1b1b1 весьма характерны для юга Аравийского п-ва и Африканского Рога, то по имеющимся данным можно предположить, что предки бушменов сформировались где-то в этом районе между 15 и 12 тыс.
лет назад, и лишь затем мигрировали на юг Африки. Встретили ли они там других людей и смешались с ними, или те уже вымерли к тому времени, мы не знаем. Бесспорно лишь, что за этой миграцией последовал долгий период изоляции (вплоть до появления скотоводов банту в начале нашей эры), в течение которого "вымылись" другие генеалогические линии. В свою очередь, сохранились те, что оказались минорными во времена неолитической революции на Ближнем Востоке, и исчезли там.
Так что имеющиеся данные по Y хромосоме койсанских народов не дают никакой дополнительной поддержки гипотезе Out-of-Africa. Все логично объясняется без привлечения ее постулатов.
Обращения читателей и персональные случаи LETTER I am sending you several haplotypes which are close to mine. I am wondering if having the same SNP's (J2a4) with a Palestinese Christian, a Samaritan and (almost) with a Jew can be meant as a clue for an ancestral origin in that area, Palestine/ Israel I mean, and in case if it has any sense to calculate a TMRCA with them.
Sorry but I have not knowledge on the matter so likely also my questions could be wrong, I know.
Frankly speaking even on the meaning of SNP's I have found some conflicting opinions in the Internet so for me it's a "mess", the same about the mutation rates and so on with the TMRCA etc. The only clear points I got in these years came with you. Do you have any opinion/suggestion to clarify my doubts?
Thanks /regards, MY RESPONSE:
Yes, indeed, you do have the same SNPs with a Palestinese Christian, a Samaritan and with a Jew, and there is nothing astonishing in it. All of those (incliding you) have positive J2-L26, L27 and negative M47. This places all of them (you including) to the subclade J2a3 (not J2a4, it is an obsolete nomenclature). You can see the subclade tree of haplogroup J, with its downstream J1 and J2 (they can be called "haplogroups" or "subclades" depending on the context; the same with a man can be called a "son" or the "father" or a "brother", etc., depending on the context.
http://www.isogg.org/tree/ISOGG_HapgrpJ.html who do not understand a good logic of it in the tree structure, and do not follow the (often) changing nomenclature. Granted, ISOGG folks who often change the nomenclature indeed create a mess in eyes of those people.
Those L26+ and L27+ people who have also L47+, are from a different subclade, namely J2a3a (take a look at the subclade tree).
Now, why people from such different regions mentioned above share the same subclade with you? One reason is that people move around, from one region to another. Second, some new subclades can be identified tomorrow, or next month, or next year, let's call it J2a3x, with SNP X25, and you will have it but the Jew with the same L26 would not have it. It would mean that you and the Jew have a common ancestor of L26, but then, later, your common ancestors (within L26) split, and you have X25+, but the Jew has X25-. If L26 arose, say, 10,000 years ago and X25 arose 5,000 ago, it would be quite understandable.
In other words, to know personal SNPs is not enough for a more or less adequate picture of DNA genealogy. One should also know WHEN each SNP arose, timewise. We are not there yet, though a few people in the world work on the problem, and I am among them.
I would suggest you to collect as many haplotypes with L26+, L27+, M47- as possible, preferably 67 marker haplotypes (you can add marker haplotypes as well), send them to me (as an Excel file), and I will calculate where a common ancestor of J2a3 lived.
Regarding mutation rates, there is no mess as well. If it looks as a mess, it is created by ignorant people. If you take a look at my paper in "Advances in Anthropology", 2011, vol. 1, No. 2, 26-34, you will see those mutation rate constants which are needed for calculations, and their verification using "classical genealogy" data. People are ignorant because either they do not read, or they cannot see what they read.
CONTINUATION:
Yes, indeed, you were clear and direct, thank you very much. I misunderstood the meaning of SNP's. If I see different SNP's in two different profiles of the same haplogroup, it just means that only those have been tested, and anyway all correspond to the same cluster. I think it's clear. If I knew before I would not have asked the question, in few words I started from a wrong assumption: that having same SNPs list means something in particular inside the same cluster...completely wrong!Thank you for all the other information and suggestions.
Is there any software I can use to calculate the TRMCA?
I think I'll get your book, I got the
Abstract
here:
http://archiver.rootsweb.ancestry.com/th/read/GENEALOGY-DNA/2011Thanks again and best regards, LETTER I have recently compared my DNA results with two other individuals with the same surname as mine. Out of 43 markers I have 36 and 37 the same respectively as the other two. But the other two have 40 common markers out of the 43 so clearly they are more closely related.
Can you kindly tell me how the time to the most recent common ancestor (TMRCA) is calculated for the differences indicated above, please? I am R-M207, subgroup R1b1b2*-M269.
Dr. John Chandler sent me his opinion, as follows:
>It would be more accurate to say "probably" instead of "clearly". Also, you didn't say how big the differences are on the markers that don't match. Are they all of just one step, or are there some differences of two or more steps each? For example, if the other two differ by just one step at each of the three discrepant markers, the 95% confidence interval for their TMRCA would extend to about generations, but if two of the discrepancies are two-steppers, the range would go to about 50 generations.
Note, in particular, that you can't *calculate* the TMRCA, but you can estimate it and place bounds on what values are plausible. In this case, where the (uncommon) surname matches, and the DNA differences are relatively few, you can probably figure the TMRCA to be no more than the age of the surname itself.
MY RESPONSE:
Welcome to DNA genealogy. The question which you have addressed is not simple, and even a scientist of such a great caliber as John Chandler came to a non-adequate estimate.
What makes your question not simple is that you "presented" (actually, vaguely described) only three haplotypes, none of them can be considered as a base (ancestral in this context) haplotype. Furthermore, you did not indicate WHICH 39 markers you consider, therefore, it is not clear which average mutation rate constant for the 39 marker panel to employ for calculations. Also, as John has mentioned, you did not indicate whether the mutations are one-step mutations (I assumed so in the estimate given below).
In that situation the most applicable is the "permutation method", which is practically not known among folks in the field, though I have published it first in 2009, and repeated from time to time, the most recent in the "Advances in Anthropology" in 2011 (vol 1 No. 2) and 2012 (vol. 2 No. 2).
Let's consider your three haplotypes in a "model" situation (since you did not show actual haplotypes:
10-11-12-13-14-15-16-17- 10-11-13-14-15-16-17-18- 11-11-13-14-14-16-17-18- Indeed, the last two haplotypes differ between them by 3 mutations, the first haplotype differs from the last two by 7 and 6 mutations, respectively.
In the permutation method one calculates squares of differences between each allele and all others for the same marker. For example, in the first column the difference is 0+1+0+1+ 1+1 = 4. In the second column the difference is zero. In the third column the difference is again 4. Since the differences are maximum 1, the squares are 1 in all the cases. Totally, squares of all the differences equal to (eight times by 4).
One divides that 32 by 43 (number of markers in a haplotype), by 9 (square of the number of haplotypes), by 2 (because in those permutations we counted each difference twice) and by the mutation rate constant, which is 0.00175 mutations per marker per a conditional generation of 25 years. Therefore, we have 32/43/9/2/0.00175 = 24 generations, or approximately 600 years to a common ancestor of those three haplotypes. Such a relatively short timespan explains why all three of them have the same surname.
John's calculation of 45 generations is not only incorrect, but hardly explains the same surnames after more than a thousand years from a "phantom" common ancestor. In fact, he gave an estimate not 45 generations to a common ancestor, but “the 95% confidence interval for their TMRCA would extend to about generations”. This manner of estimation, such as “would extend to…” is not an adequate presentation. If he would give, say, the 99% confidence interval, it might well move to, say, 400 generations dep in time, that is to 10,000 years before present. What practical sense does it have if you are told that a common ancestor of your three haplotypes lived within 10,000 years ago, when he in fact lived around 600 years ago? Notice, that Dr. Chandler did not give you his estimate, he gave you some abstract figure with an arbitrary “95% confidence”.
Very convenient.
Regards, LETTER In your study on the Milligan/Milliken/Amuligan lineages (with their origins in Scotland) and O’Dochartaigh/O’Dogherty/O’Doherty lineages (line in NW Ireland), published in the Proceedings, 2012, vol. 5, No. 1 (Letter 119), and Donnachaidh, the Scottish Highland Clan, published in vol. 5, No. 2 (Letter 120), with all the three lineages belong to R1b-M222, you came to a timespan to the common ancestors of the M-lineages of 1025±205 and 550±130 ybp, and the O’D lineage of 800±180 and 825±190 ybp. According to your calculations, a common ancestor of all the four lineages lived 1825 ybp, or around 190 AD, the beginning of the Common Era.
Similar calculations for the Donnachaidh branches results in three sub-lineages, with their common ancestors who lived 325±130, 375±120, and 875±170 ybp, and THEIR common ancestor lived 1625±200 ybp.
Since all of them belong to the same subclade. M222, I wonder when a common ancestor of all of those three M222 families (Scot and Irish) lived.
MY RESPONSE:
The way to answer your question is to compare all the seven base haplotypes of the branches mentioned above. The are all published as referenced in your letter, as follows:
13 25 14 11 11 13 12 12 12 13 14 29 – 18 9 10 11 11 25 15 18 30 15 16 17 17 – 11 13 25 14 11 11 13 12 12 12 13 14 30 – 18 9 10 11 11 25 15 18 30 15 16 16 17 – 11 13 25 14 11 11 13 12 12 12 13 14 29 – 18 9 10 11 11 25 15 18 30 15 16 16 17 – 11 13 25 14 11 11 13 12 12 12 13 14 29 – 18 9 10 11 11 24 15 18 30/31 15 16 16 17 – 13 25 14 11 11 13 12 12 11 13 14 29 – 18 9 10 11 11 25 15 18 29 15 16 16 17 – 12 13 25 14 11 11 12 12 12 11 12 14 28 – 17 9 11 11 11 25 15 18 30 15 15 16 17 – 11 13 25 14 11 11 13 12 12 12 13 14 29 – 17 9 10 11 11 25 15 18 30 15 16 16 17 – 11 All the seven haplotypes differ summarily by 29 mutations from the base haplotype:
13 25 14 11 11 13 12 12 12 13 14 29 – 18 9 10 11 11 25 15 18 30 15 16 16 17 – 11 It places a common ancestor by 29/7/0.09 = 46 48 generations, or 1200 years, plus the average 680 years of all the sub-base haplotypes, that is 1880 years before the present, or around 130 AD. As you see, it is close to 190 AD calculated earlier for a common ancestor of the first two families. It means that with a good probability it is the common ancestor of all the three families.