5.2. Систематическое рассмотрение основ и принципов ДНК-генеалогии
Как сказано выше, род в контексте ДНК-генеалогии, да, пожалуй, и вообще – это группа людей, в которой каждый человек связан с общим предком прямой наследственной линией. Этот род может быть очень древним и или относительно, или совсем недавним, а также может относиться к любому прямому предку. В этом смысле как вы, так и брат вашего отца, то есть ваш дядя, ведёте род от вашего дедушки. Как правило, «ведёте род» – это понятие коллективное и объединяет вас, как уже было сказано, с определённым кругом родственников, связанных прямыми наследственными линиями с одним общим предком. Чем предок глубже по времени, тем шире круг этих современных родственников. Все они принадлежат одному роду, более того, все несут в своих ДНК мутацию их БЛИЖАЙШЕГО общего предка.
Итак, в ДНК-генеалогии эта принадлежность к одному роду идентифицируется по наличию у каждого члена рода характерного признака – определённой «метки» в ДНК. Причем не просто в ДНК, а в нерекомбинируемой части ДНК, которая не перетасовывается с материнской ДНК, но передается по наследству как есть. Это делает её исключительно ценной для ДНК-генеалогии, потому что нерекомбируемая часть ДНК – единственная, которая не смешивается с материнскими хромосомами. Эта нерекомбинируемая часть ДНК находится в Y-хромосоме, мужской половой хромосоме. Потому и не рекомбинируется с женской половой хромосомой, а передаётся мужчинам целиком и полностью от отца.
Таким образом, если говорить о любой относительно стабильной и многочисленной общности людей, которые идентифицируют себя как относящиеся к этой общности, то они подразделяются на несколько доминирующих родовых групп. Однородными в этом смысле были бы только те общности, которые в течение тысяч и десятков тысяч лет жили бы в полной изоляции в пределах своего рода. Но так обычно не бывает.
В соответствии с этими понятиями любое вторжение – речь, естественно, о половых вторжениях – представителя другого рода, которое приводит к рождению мальчика, в свою очередь дающего мужское потомство, означает, что это потомство ведёт наследственные нити уже к тому, другому роду. У этого потомства уже другой характерный рисунок в мужской хромосоме, другие молекулярные метки. Естественно, при таком вторжении приобретаются и гены отца, а с ними и масса других наследственных признаков. Но гены по ходу поколений постепенно разбавляются другими, опять своего рода, «вымывая» генетику «чужака». А вот Y-хромосома не вымывается, остаётся той же. Точнее, почти той же, за исключением накопленных мутаций. Об этом речь будет идти ниже.
В итоге потомки часто и понятия не имеют, что они – прямые потомки другого рода. Язык, образ жизни, традиции, религия, даже характерные черты внешности, «возвращенные» генетическим вымыванием – всё говорит о том, что никаких вторжений не было. Собственно, даже и мысли об этом обычно нет. И – самоидентификация со своим родом на месте, что обычно самое главное для сознания человека в этом отношении.
И только данные по «меткам» в Y-хромосоме могут показывать, что на самом деле прямые потомки в отдалении – близком или далеком – принадлежали вовсе другому роду.
Важно это знать или нет? Кому как. Многим совершенно не важно, и они по-своему правы. В конце концов, в жизни масса других приоритетов, чем интересоваться предками. Другим важно, иначе не было бы огромного количества людей, интересующихся генеалогией своих предков. А это фактически то же самое, только методология другая и другие диапазоны времени.
Видимо, важно это и третьим, которые применяют генеалогию как аргумент в политических спорах или даже физических действиях. И вот здесь сходятся непримиримые позиции, когда на кону или выживание и расцвет нации, или её притеснение, вплоть до физического истребления, геноцида. И аргументы здесь тоже по сути дела генеалогические, в какой бы форме они ни выражались.
Как вынесено в заголовок, мы будем оперировать понятиями ДНК-генеалогии. Напомним основные положения этой новой дисциплины, поскольку материал нуждается в изложении понятийного аппарата.
При изложении материала в настоящей книге мы даём, на первый взгляд, избыточную информацию, приводя число гаплотипов в каждой выборке, число мутаций в каждой ветви гаплотипов и в каждой выборке, вместо того, чтобы просто сообщать окончательные результаты. Однако авторы рассматривают эту информацию как весьма важную, и из неё можно получить немало дополнительных сведений, о которых мы сейчас и не догадываемся. Наконец, авторы не просто изрекают результаты, которым можно доверять или нет, но пытаются вести читателя по логике расчётов, давая возможность читателю самому проверить результаты или разработать свои подходы.
5.2.1. Основные положения ДНК-генеалогии
Первое – к генетике наше повествование отношения не имеет (хотя в определённой части ДНК-генеалогии рассматривают и гены, но здесь этого не будет). ДНК – это не только гены. Гены вообще занимают только 1,9% последовательности ДНК. Остальные 98,1% – длинные участки, так называемые «никчёмные». Генов там нет. Есть протяжённые последовательности нуклеотидов, которые детально копируются при передаче наследственной информации от отца к сыну. Мы специально пишем «от отца к сыну», потому что в данной книге речь идёт только о «мужской» наследственной информации, передаваемой с мужской половой Y-хромосомой. У женщин её, этой хромосомы, нет.
«Никчёмными» эти негенные последовательности ДНК назвали по незнанию, и это название уже уходит в прошлое. По мере исследований, оказалось, что эти последовательности хранят массу информации и не только «генеалогического» характера. Более того, оказалось, что они, эти «никчёмные» участки, содержат сотни, если не тысячи крошечных генов РНК, кодирующих так называемые микро-РНК, длиной всего пару десятков нуклеотидов каждый, и которые регулируют синтез белков. Но это – предмет другого повествования.
Эти негенные участки ДНК в мужской Y-хромосоме, одной из 23 хромосом, которые доставляются сперматозоидом в организм будущей матери, копируются от отца к сыну, поколение за поколением. Поскольку у матери такой хромосомы нет, то сын наследует её только от отца. Остальные хромосомы сплетаются с материнской и образуют новую комбинированную молекулу ДНК, в которой хромосомы отца и матери перетасовываются. Перетасовываются все, кроме мужской Y-хромосомы.
Так и получается, что отец передаёт сыну эту Y-хромосому интактной, строго скопированной со своей. А свою Y-хромосому он получил от своего отца. Тот – от своего. И так далее, на тысячи и десятки тысяч лет вглубь, назад, к далёким предкам современных людей и к предкам тех далёких предков.
Здесь – важное примечание. В антропологии принято считать, в соответствии с базовыми понятиями, парадигмой антропологии, что сотни тысяч лет назад людей не было, во всяком случае на бОльшей части земной территории. Были палеонтропы, архантропы, неандертальцы, эректусы, другие гоминиды. Однако наши предки были, как их ни называть. Они были и десятки, и сотни тысяч лет назад, и миллионы лет назад. Он них, «приматов», мы и наследуем гаплотипы и гаплогруппы, пусть в значительной степени изменённые, мутированные.
Таким образом, аргументы, что тогда-то давно не было предков современного человека, в принципе неверны. Они были, но просто или не обнаружены антропологами (что вполне возможно), хотя и были на рассматриваемой территории, или они были представлены минорной долей гоминидов и прочих «приматов», и при изучении последних просто не встречались, проскочили сито антропологов, весьма крупноячеистое. Или определение, используемое антропологами, слишком жёсткое и не отражает значительно более сложной истории происхождения человечества. Это же относится в полной мере и к Африке, поэтому аргумент, что там 200 – 40 тысяч лет назад были только палеоантропы и архантропы, не есть на самом деле значимый аргумент.
Если бы Y-хромосома так и передавалась из поколения в поколение действительно неизменной, толку для генеалогии от неё было бы мало. Но неизменного ничего в мире нет, особенно когда речь о копировании. Копирования без ошибок не бывает. В том числе и копирование Y-хромосомы.
Отсюда второе положение – время от времени при копировании Y-хромосомы в копии проскакивают ошибки. Фермент под названием ДНК-полимераза (на самом деле вместе с целым набором молекулярных инструментов) или просто ошибается и делает некоторые участки ДНК короче или длиннее, удлиняя или сокращая повторы нуклеотидов, или «ремонтирует» повреждённые участки и в ходе «ремонта» удаляет повреждение (эта операция называется «делеция») или «вшивает» новый нуклеотид (называется «вставка», или «инсерт»).
Поэтому мутации, которые интересуют ДНК-генеалогию, бывают двух типов – или изменение числа повторов, тандемов, или «точечные», однонуклеотидные.
Оказалось, что многие повторы нуклеотидов находятся у разных людей в одних и тех же участках Y-хромосомы. Эти участки уже биохимиками пронумерованы, классифицированы, сведены в списки. Они получили название «маркеры». Набор маркеров, точнее, повторов в них, называется «гаплотип». Уже известных маркеров – многие сотни. И они, как правило, одни и те же у всех людей на Земле. Они отличаются только числом повторов, что вызвано теми самыми ошибками ферментов при копировании из поколения в поколение. Внимательное рассмотрение маркеров и гаплотипов позволило сделать вывод, что все люди на Земле произошли от одного предка. Иначе говоря, все люди – родственники.
Пока не удалось найти ни одного человека, у которого маркеры и гаплотипы были бы принципиально другие, которые не удалось бы вывести (по мутациям на временной шкале) из других жителей Земли в пределах последней сотни тысяч лет. И это – серьёзный (если не последний) аргумент против «теории мультирегиональности», согласно которой люди произошли от разных племянников современного человека, включая неандертальцев, синантропов и прочих гоминидов. То, что эти кузены человека существовали, сомнению не подвергается, но то, что выжившего потомства они не оставили – это, так сказать, экспериментальный факт. Пока не опровергнутый, но с каждым новым определением гаплотипа всё более подтверждаемый.
Строго говоря, приведённое выше рассуждение не отвергает теорию мультирегиональности в отношении жизни на Земле в ПРОШЛОМ потомков различных родов и видов, но отвергает наличие нескольких разных предков у СОВРЕМЕННЫХ людей. Иначе говоря, если даже разнообразные люди были, в полном соответствии с теорией мультирегиональности, они не прошли «бутылочные горлышки» популяций, не выжили. Выжила всего одна генеалогическая линия, а от неё и произошло современное человечество.
К настоящему времени образцы ДНК взяты у представителей практически всех популяций, и все сводятся к одному общему предку. Время жизни этого предка определяется разными исследователями в интервале между 100 и 200 тысяч лет. Порой и глубже во времени, вплоть до 800 тысяч лет назад (хотя это – верхняя грань большой погрешности расчётов) – поскольку разные исследователи используют разные значения скоростей мутаций, и эти данные пока в должной мере не упорядочены. Тем не менее, между ведущими исследователями имеется консенсус, что этот предок жил в Африке.
Итак, положение третье – все люди происходят от одного предка, который жил – по разным расчётам – от 100 до 200 тысяч лет назад. Примерно такое время понадобилось, чтобы получить то расхождение гаплотипов по мутациям, какое наблюдается у всех живущих ныне людей.
Положение четвёртое – гаплотипы изображают в виде числа тандемов, или повторов, по каждому маркеру, выбранному из десятков и сотен. В англоязычной литературе их называют STR, или Short Tandem Repeats. Самый простой и короткий гаплотип из тех, которые рассматривает ДНК-генеалогия, состоит из пяти или шести маркеров. Например, у восточных славян, к которым относится от 50% до 80% жителей старинных русских городов, городков и селений, базовый (или предковый) 6-маркерный гаплотип, в той записи, в которой обычно приводят в научных публикациях, такой
16-12-25-11-11-13
Он показывает число повторов нуклеотидных участков в маркерах, которые обозначают соответствующими индексами 19, 388, 390, 391, 392 и 393. В первом маркере (номер 19) было найдено 16 повторов определённой последовательности нуклеотидов. Во втором – 12 повторов уже другой последовательности и так далее. При передаче этого гаплотипа от отца сыну с вероятностью примерно одна сотая (то есть в среднем у одного на сто рождений) может произойти мутация, например, такая:
16-12-24-11-11-13
(в третьем маркере, выделена). Именно такая мутация есть у одного из авторов настоящей книги, поскольку она произошла у его предка. Остаётся неизвестным, когда она произошла – может, тысячелетия назад, может – автор такой в его генеалогической линии первый. И узнать это можно только изучая ДНК прямых предков или самых ближайших родственников. Например, если у родного брата такая же мутация – тогда автор точно не первый. Надо смотреть ДНК у дедушки или у брата дедушки, и так далее по генеалогической цепочке. Но это не имеет большого практического значения. Что есть, то есть. Хотя любознательность порой наказуема, и у родного (по документам) брата может оказаться вообще другой гаплотип, да и другой род.
Такое в ДНК-генеалогии бывает и чаще, чем хотелось бы. Например, это случилось с Рюриковичами, которые принадлежат как к славянскому, так и норманскому родам, в лингвистических категориях – угро-финскому. Афронт случился несколько сот лет назад, на уровне Владимира Мономаха, плюс-минус одно поколение.
Возвращаясь к нашему примеру, мутация могла произойти и в первом маркере:
15-12-25-11-11-13
или могла произойти любая другая мутация (как правило, одношаговая) в этих или любом другом маркере этого гаплотипа.
Например, еврейский ближневосточный гаплотип («гаплотип двенадцати колен израилевых», «гаплотип коэнов» – оба названия условные, а во втором случае и просто неверное, но принятое в литературе, о чём речь пойдет ниже), записанный в таком же 6-маркерном виде, такой:
14-16-23-10-11-12
Между восточно-славянским и ближневосточным еврейским гаплотипами – 9 одношаговых мутаций или в среднем 1.5 мутации на маркер. Это отражает долгий путь, который славяне и евреи эволюционно (в отношении гаплотипов) прошли, отделившись от общего предка. 9 мутаций на 6-маркерном гаплотипе означают, дистанция между двумя гаплотипами равна 86 тысяч лет или, что общий для славян и евреев общий предок жил огромное время назад, не менее 40 тысяч лет тому (точнее, 43 тысячи лет назад). Как эти дистанции считать – об этом позже.
Часто рассматривают 12-маркерные гаплотипы. Например, у восточных славян, базовый гаплотип такой (здесь запись уже по стандартам наиболее известных баз данных, и самая известная – FTDNA):
13-25-16-11-11-14-12-12-10-13-11-30
Здесь маркеры по порядку следующие: 393, 390, 19, 391, 385a, 385b, 426, 388, 439, 389-1, 392, 389-2.
В 25-маркерном варианте восточно-славянский гаплотип записывается так:
13-25-16-11-11-14-12-12-10-13-11-30-15-9-10-11-11-24-14-20-32-12-15-15-16
У ближневосточных евреев часто встречается такой 12-маркерный гаплотип («недавний гаплотип коэнов»):
12-23-14-10-13-15-11-16-12-13-11-30
У него с восточно-славянским уже 16 мутаций-расхождений, то есть в среднем 1.33 мутаций на маркер. Чем длиннее гаплотип, тем лучше статистика, тем точнее расчёты.
У ближневосточных евреев часто наблюдается следующий 25-маркерный гаплотип:
12-23-14-10-13-15-11-16-12-13-11-30-17-8-9-11-11-26-14-21-27-12-14-16-17
Это даёт 31 мутацию на 25-маркерном гаплотипе или в среднем 1.24 мутации на маркер. По скоростям мутаций это примерно соответствует 1.35 мутации на маркер для 12-маркерного гаплотипа. Так что статистика работает, и данные в целом вполне соответствуют друг другу на гаплотипах разной длины. Опять же, чем длиннее, тем точнее.
А вот пример 37-маркерного гаплотипа, который в данном случае принадлежит потомку человека по фамилии Коэн, который жил полтораста лет назад в Санкт-Петербурге:
12-23-14-10-13-15-11-16-12-13-11-30-17-8-9-11-11-26-14-21-27-12-14-16-17-11-10-22-22-15-14-21-18-31-35-13-10
Естественно, чем длиннее гаплотип, тем больше вероятность найти своего близкого предка в наше время. Заметьте, кстати, что на первых 25 маркерах этот гаплотип в точности совпадает с базовым, предковым, приведенным выше. А ведь предок жил 1350 лет назад, в 7-м веке нашей эры. Вот насколько стабильными могут быть гаплотипы и их маркеры.
Ещё пример, не столько стабильного гаплотипа. Статистика есть статистика.
12-23-14-10-13-15-11-16-11-13-11-30
Выделена одна мутация в 12-маркерном гаплотипе по сравнению с базовым «гаплотипом коэнов», приведённым выше. Этот гаплотип принадлежит еврею, живущему сейчас в Англии и предок которого родился много поколений назад, в 1799 году, там же, в Англии. А обладатель 37-маркерного гаплотипа, приведённого выше, как уже упомянуто, родился на 50 лет позже в России. Различаются всего на одну мутацию на 12 маркерах.
А на 37 маркерах? Приведём гаплотип еврея-англичанина более детально:
12-23-14-10-13-15-11-16-11-13-11-30-17-8-9-11-11-26-14-21-27-12-14-16-16-11-10-22-22-15-14-17-17-31-35-14-10
По сравнению с петербуржским Коэном добавились ещё семь мутаций, всего восемь: 12→11, 17→16, 21→17, 18→17, 13→14. Восемь, потому что одна мутация четырёхшаговая, она могла проходить шаг за шагом на протяжении длительного времени.
То, что данные примеры относятся к евреям, объясняется двумя причинами. Одна – потому что один из авторов данной книги много занимался ДНК-генеалогией евреев. За три с лишним тысячи лет относительной изоляции (по религиозным и прочим причинам) евреев от «гоев» у евреев выработались характерные ДНК-генеалогические линии, порой чётко отличающие евреев от неевреев. Поэтому наблюдается парадокс – сами евреи порой не могут дать чёткого определения евреев, которого и в самом деле нет. Но ДНК-генеалогические линии выявляют определённые ДНК-популяции евреев и почти безошибочно идентифицируют их носителей как евреев, независимо от их религиозной принадлежности, гражданства, или места жительства.
Вторая причина – потому, что евреи более других (и это «экспериментальный факт») интересуются своей ДНК-генеалогией, своими корнями. Это, в свою очередь, объясняется трагичной историей еврейского народа, постоянным передвижением по миру, часто вынужденным, часто – бегством, отсюда – потерей родовых, предковых связей. Сейчас, с помощью ДНК-генеалогии, эти связи восстанавливаются. И вовсе не нужно расматривать интерес к ДНК-генеалогии евреев как вторжение в их приватность, как попытки их «выявить и обмерить». Доказательством тому – многочисленные перепечатки работ одного из авторов книги в еврейских изданиях и награды и дипломы автору от еврейских коллективов, в том числе и золотая медаль от Международного общества коэнов (коханим) за вклад в изучение истории евреев.
Это – к тому, что по мнению немалого количества малообразованных и негативно настроенных людей, ДНК-генеалогия, да и антропология – это попытки разделить людей на «высших и низших». Нет ничего более далёкого от истины. Это – попытки понять наше прошлое, а значит – и будущее. Как раз единство общих предков показывает, что все люди – в буквальном смысле родственники.
Возвращаясь к последнему примеру выше, сообщим, что восемь мутаций у пары 37-маркерных гаплотипов соответствуют дистанции примерно в 98 поколений между ними, или примерно 2450 лет разницы во времени. То есть их условный общий предок жил на половине этого временного срока, или примерно 1225 лет назад. Кстати, одна мутация на 12 маркерах соответствует примерно 1200 лет, как будет показано чуть ниже. Так что здесь неплохое сходство во времени.
Но здесь это совпадение просто случайное. Потому что надо привести положение пятое: нельзя сравнивать мутации в парах гаплотипов. Мутации – дело статистическое, и их можно количественно (и часто полуколичественно) рассчитывать только на больших выборках. Чем выборка меньше – тем результат расчёта менее точный. А на двух гаплотипах мутация-другая могла добавиться буквально в предыдущем или нынешнем поколении. Это может сразу привести к прибавлению-отнятию тысячи лет «в одном поколении». А в большой выборке разница относительно нивелируется статистикой.
Подходы теории вероятности могут оценить погрешности расчётов в парах гаплотипах (или в любом их количестве), принадлежащих одному роду (одной гаплогруппе). Если два гаплотипа различаются на одну мутацию, то в 6-маркерных гаплотипах их общий предок жил 1600±1600 лет назад с надёжностью 95%. Как видно, информативность такой информации близка к нулю. Если два 67-маркерных гаплотипа различаются на одну мутацию, то их общий предок жил 75±75 лет назад, с той же 95%-ной надежностью. Иначе говоря, общий предок этих двух человек с 95%-ной вероятностью попадает в интервал времени от 150 лет назад до настоящего времени. В общем случае, одна мутация – это ±100%-й интервал погрешности для любого гаплотипа.
Число мутаций в |
Интервал погрешности |
1 |
100% |
2 |
±71% |
5 |
±46% |
10 |
±33% |
100 |
±14% |
1000 |
±10,5 |
Таблица 5.2.1.1. Интервалы погрешности при некоторых значениях числа мутации в сериях гаплотипов.
При показателе ±10,5% мы вплотную приблизились к предельной, минимальной погрешности, когда уже лимитирует точность константы скорости мутаций в гаплотипах. Точнее уже не будет, если не доказать, что константа определяется с погрешностью меньше, чем 5%. Естественно, 1000 мутаций могут быть только в больших сериях гаплотипов, причем не происходящих от недавнего предка. В тех мутаций мало. В любом случае, чем больше гаплотипов в выборке, тем больше в них мутаций, тем точнее расчёт времен жизни общего предка.
А как часто происходят мутации в гаплотипах? Для ответа на этот вопрос надо вернуться к тому, что мутации бывают двух разных типов – тандемные и точечные. Для тандемных мутаций средняя скорость мутации в 6-маркерном гаплотипе равна 0.0088 мутаций на гаплотип в поколение, то есть одна мутация в гаплотипе происходит в среднем примерно за 114 поколений, или за 2850 лет, если считать поколение за 25 лет (а именно это часто заложено в ДНК-генеалогические расчёты). На самом деле, это будет не 114 поколений, а 129, то есть 3225 лет, если принять в расчёт возвратные мутации, как будет пояснено ниже.
В 12-маркерном гаплотипе средняя скорость тандемных мутаций равна 0.022 на гаплотип в поколение, то есть одна мутация в 12-маркерном гаплотипе происходит в среднем примерно за 45 поколений, или примерно раз в 1125 лет. Опять, если принять в расчёт возвратные мутации, то будет раз в 47 поколений, или примерно 1175 лет. А точечные мутации происходят раз и практически навсегда. Они и являются метками гаплогрупп.
Гаплотип |
Скорость мутации |
17-маркерный |
1 мутация в 740 лет |
19-маркерный |
1 мутация в 880 лет |
25-маркерный |
1 мутация в 540 лет |
37-маркерный |
1 мутация в 280 лет |
67-маркерный |
1 мутация в 170 лет |
Таблица 5.2.1.2. Скорости мутаций.
Таблица 5.2.1.2. даёт общее представление, как часто происходят мутации в гаплотипах.
То есть имеем положение шестое – по числу тандемных мутаций в гаплотипах можно определять возраст гаплотипа.
А от чего или от кого считать? От того предка, кто имел такой гаплотип. Поскольку его сыновья сохраняют гаплотип отца, переданный по наследству, и мутации в этом гаплотипе проскакивают в среднем только раз примерно в 3225 лет (6-маркерный гаплотип) или раз в 1175 лет (12-маркерный гаплотип), то даже через 5000 лет у потомков сохранится 23% исходного 6-маркерного гаплотипа, без изменений. То есть в списке из 100 гаплотипов потомков – 23 гаплотипа будут такими же, какой был у предка 5000 лет назад. Это если рассматривать 6-маркерные гаплотипы. При рассмотрении 12-маркерных гаплотипов те же 23% гаплотипов предка сохранятся через 72 поколения, или 1800 лет.
Так что и через тысячелетия можно определить гаплотип предка. И по его виду можно узнать, из каких краёв предок пришёл.
К этому ведёт положение седьмое – гаплотипы в немалой степени (но не всегда) связаны с определёнными территориями.
Но как такое может быть? А вот как. В древности большинство людей передвигались племенами, родами. Род, по определению, это группа людей, связанных родством. То есть гаплотипы у них одинаковые или близкие. Помните – одна мутация в среднем происходит за тысячелетия? Проходили тысячелетия, численность родов порой сокращалась до минимума («бутылочное горлышко» популяции), и если выживший имел некоторую мутацию в гаплотипе, то его потомки уже «стартовали» с этой новой мутацией. Некоторые люди покидали род по своей или чужой воле – плен, бегство, путешествия, военные походы, и выжившие начинали новый род на новом месте. В итоге карта мира с точки зрения ДНК-генеалогии получилась пятнистой, и каждое пятно порой имеет свой превалируюший гаплотип, гаплотип рода. Такой наиболее популярный гаплотип на определенной территории называют «модальным». Часто он и есть гаплотип предка, начавшего род на данной территории.
Но есть ещё один тип мутации – точечные мутации, однонуклеотидные. Они – практически вечные. Раз появившись, они уже не исчезают. Теоретически, в том же нуклеотиде может произойти другая мутация, изменив первую. Но нуклеотидов – миллионы, и вероятность такого события крайне мала. Всего в хромосомах насчитали более трёх миллионов точечных мутаций [The International HapMap Consortium, 2007], и ДНК-генеалоги нашли применение нескольким сотням, которые, как уже было пояснено, называют «снипы», что и расшифровывается (в переводе с английского языка) примерно как «единичная нуклеотидная мутация».
Так вот, те, кто в древности покинул свой род по своей или чужой воле, всегда имели в своей Y-хромосоме эти самые снипы, причём во множестве. Все они передавались сыновьям, в результате того самого копирования ДНК от отца к сыну. Так что все мы имеем и тандемные мутации, и снипы. Из нескольких сотен снипов, которым ДНК-генеалоги нашли применение, около двухсот оказались удачными метками определённых популяций на Земле. Эти популяции и есть те самые рода, о чём речь шла выше, в самом начале. Их, эти рода, потомки которых несут соответствующие метки в ДНК, назвали «гаплогруппы», и присвоили им буквенные обозначения от А до Т, в хронологическом порядке появления соответствующего рода на планете. Или, по крайней мере, в том порядке, как учёные полагают эти рода появились. Хотя ревизий на этот счёт предстоит ещё много.
Итак, положение восьмое – людей можно классифицировать по древним родам не только (и не столько) по виду гаплотипов, но и по наличию определённых снипов. Например, гаплогруппы А и В – исконно африканские и самые древние; гаплогруппа С – монголоидная (и значительной части американских индейцев, потомков монголоидов), а также австралоидная; гаплогруппа J – исходно Ближний Восток, причем J1 – в основном евреи и арабы, гаплогруппа J2 – в основном жители Средиземноморья (хотя и часть евреев тоже); гаплогруппа N – многие жители Китая, Сибири, севера России и части Скандинавии (на территорию последней и прибыли носители гаплогруппы N тысячелетия назад).
Гаплогруппы I и R – видимо, гаплогруппы Русской равнины, причём R имеет подгруппы R1b (преобладающая подгруппа Западной Европы, доля которой превышает 90% в некоторых регионах Испании и Ирландии) и R1a – преобладающая в Восточной Европе, России, Украине, а также имеющая значительное представительство в Индии (более 100 млн человек, не менее 16% от мужской популяции, но по некоторым данным и 30%), куда эта гаплогруппа (R1a1) была принесена из Восточной Европы и Русской равнины предположительно 3500 лет назад ариями.
Гаплогруппой R1a1 отмечены и довольно резко очерчены территории Средней Азии (в Киргизии и Таджикистане), куда снип, образующий R1a1, был принесён его обладателями – ариями – по дороге в Индию и Китай. Интересно, что эти довольно резкие очертания границ гаплогруппы R1a1 в Средней Азии в ряде случаев, возможно, воспроизводят маршрут похода обладателей R1a1.
А на переходе из горной долины Памира в Индостан, в самой теснине перехода, по которому шли предки, целая малая народность так и донесла до современности этот европейский снип, образующий R1a1, в 80 процентов состава этой народности, под названием ишкашим. Гаплогруппа R1a1 представлена и в Восточном Иране, что, видимо, отражает арийский период этого региона во второй половине второго тысячелетия – первом тысячелетии до нашей эры. Но по Ирану пока мало данных, и открытия в этом отношении там ещё предстоят. Пока ясно, что гаплогруппа R1a1 появилась в Индии и Иране практически в одно и то же время.
Итак, данное положение сводится к тому, что у каждого мужчины есть снип из определённого набора, по которому можно сразу отнести носителя к определённому древнему роду. Времена появления снипов, обычно применяемых в ДНК-генеалогии, относятся к диапазону от 25 – 40 тысяч лет для «старых» снипов до 10 – 15 тысяч лет для «молодых». Снип гаплогруппы R1a1, преобладающей в России, образовался примерно 20 тысяч лет назад, как будет изложено ниже.
Положение девятое – гаплогруппы не просто соответствуют определённым родам, но образуют определённую последовательность, лестницу гаплогрупп, показывающих их иерархию, последовательный, ступенчатый переход от древнейшей гаплогруппы А до самой недавней гаплогруппы R (технически самыми последними гаплогруппами являются недавно введённые в номенклатуру гаплогруппы S и Т, но они ведут своё начало от промежуточной по положению гаплогруппы К). Эта последовательность называется «филогенетическое дерево гаплогрупп Y-хромосомы». Для его построения необходимо выполнение двух основных критериев:
1. снип, образующий гаплогруппу, должен происходить со скоростью, не превышающей 5×10-7/поколение,
2. снип должен происходить не более двух раз за всю историю человечества.
Чтобы пояснить эти два положения, напомним, что снип – это определённая мутация в определённом нуклеотиде (или в нескольких нуклеотидах одновременно). Например, гаплогруппа R1a1 определяется как имеющая мутацию М17 с идентификационным индексом rs3908, которая превратила четырёхнуклеотидный прогон в трёхнуклеотидный – GGGG→GGG – в Y- хромосомном участке под номером 68 и в позиции под номером 20192556.
Носители той же гаплогруппы имеют также мутацию М198 с идентификационным индексом rs2020857, которая превратила цитозин в тимин (С→T) в Y- хромосомном участке под номером 45 и в позиции под номером 13540146.
Вышестоящей гаплогруппой является R1a, c определяющей мутацией SRY10831.2 с идентификационным индексом rs2534636, которая превратила гуанин в аденин (G→A) в Y-хромосомном участке под номером 135 и в позиции под номером 2717176. Это – необычная мутация, поскольку ровно обратная ей есть у всех людей, потомков вышедших из Африки (по представлениям современной ДНК-генеалогии), и именно – у сводной гаплогруппы BR (то есть включающей в древние времена все гаплогруппы от B до R, поскольку их снипы тогда ещё не образовались).
Так вот, переход от древнейшей гаплогруппы A в ту сводную BR произошёл посредством мутации SRY10831.1 с тем же идентификационным индексом rs2534636, только там, наоборот, аденин превратился в гуанин (А→G) в том же самом Y-хромосомном участке под номером 135 и в позиции под номером 2717176. Другими словами, гаплогруппа R1a вернулась к гаплогруппе А, но с новыми дополнительными мутациями, которые набежали за десятки тысяч лет. Но вот той самой мутации, которая есть у всех неафриканцев на планете, в нас, восточных славянах, нет. Она вроде как заросла. Такие возвратные мутации называются у генетиков реккурентными. Они редко, но бывают.
Конечно, соблазнительно было бы объявить, что мы, восточные славяне, и есть самые первые люди на Земле, поскольку только у двух гаплогрупп, африканской А и восточнославянской R1a, нет этой самой мутации, как нет её и у приматов, а у других она появилась позже, начиная со сводной гаплогруппы BR – но к этому у нас нет оснований. Потому что в братской гаплогруппе R1b, которая составляет большинство западноевропейцев, эта мутация есть. Как и другие мутации, роднящие нас с «вышестоящими» гаплогруппами R1 и R. Так что получается, что в гаплогруппе R1a, «восточнославянской» (на территории России), эта мутация просто «закрылась», гуанин вернулся в аденин. Бывает.
Возвращаемся к двум основным критериям вхождения в дерево гаплогрупп отдельной самостоятельной гаплогруппой. Максимально допустимая скорость «сниповой» мутации 5×10-7 на поколение означает, что мутация в любой генеалогической линии должна происходить реже, чем раз в два миллиона поколений, то есть раз примерно за 50 миллионов лет. То есть она действительно должна быть практически необратимой. Это и делает человеческие рода, основанные на классификации по снипам, совершенно стабильными.
Потому они и не ассоциируются за практически бесконечное время, не говоря от каких-то десятках тысяч лет. Но мутации – дело статистическое, и всё может случиться и за более короткое время. Поэтому – второй критерий: если сниповая мутация и случится чаще, чем ожидается, то уж во всяком случае не чаще, чем два раза за историю человечества. Если случилась три раза – она из списка снипов вычеркивается как ненадёжная, способная «взбрыкивать». Вот в R1a она произошла уже два раза, ситуация на пределе. Если в ближайшие пару миллионов лет произойдет ещё раз, придется её вычеркнуть.
Есть ещё важный критерий – все гаплогруппы должны включать снипы «вышестоящих» гаплогрупп. То есть принцип «лесенки» должен выполняться. Преемственность узловых родов человечества должны соблюдаться.
Всё это делает филогенетическое дерево гаплотипов достаточно прочной и обоснованной структурой. У него есть только одно слабое место – само дерево: филогения не показывает, на каком континенте зародилось человечество, откуда пошли гаплогруппы, начиная с первой, гаплогруппы А. Говоря языком филогении, дерево гаплогрупп не «укоренено». Укоренение дерева – результат интерпретаций наблюдений и доступных экспериментальных данных. К этому мы ещё вернемся, а пока – как же представляется укоренение и последующее развитие дерева гаплотипов в пространстве и во времени? Как, откуда и куда шли миграции родов человечества? Ответ на этот вопрос с точки зрения антропологии дан в первой части этой книги. Ниже – результат консенсуса специалистов в том виде, как он изложен в программном документе Международного общества генетической генеалогии (ISOGG) за 2009 год.
В целом у специалистов-генетиков и биологов за последние 15 лет сложилось убеждение, что человечество вышло из Африки. На этом основании было построено филогенетическое дерево гаплогрупп, начинающееся от африканской гаплогруппы A и продолжающееся до самой молодой, заключительной гаплогруппы R (недавно, как уже упоминалось, были добавлены ещё две гаплогруппы, S и Т, но они ведут своё начало от более ранней гаплогруппы К). По этим представлениям, гаплогруппа А образовалась примерно 60 – 80 тысяч лет назад. До этого рода человечества как рода (гаплогруппы) не рассматриваются. Здесь не нужно путать понятие «рода» (tribe – англ.) в ДНК-генеалогии с понятием «рода» (genus – лат.) в биологии.
Возможно, это найдёт полное понимание у антропологов, поскольку до этого, то есть до образования гаплогруппы А (60 – 80 тысяч лет назад) и до образования анатомически современного человека, Homo sapiens, 100 – 200 тысяч лет назад, понятие «человечества» стоит на шаткой базе. Предки определённо были, но не от «человечества». Это могли быть «продвинутые» неандертальцы, гейдельберги, архантропы, палеоантропы, эректусы и прочие гоминиды (здесь мы умышленно смешиваем разные номенклатуры рода Homo семейства гоминид).
Относительно немного представителей гаплогруппы А осталось в Африке, в частности, в Эфиопии и Судане, и среди популяций с щёлкающими языками. Популяции с этой гаплогруппой разбросаны по всему континенту «пятнами». Похоже, что это всё, что осталось от самой древней гаплогруппы. Расчёты времён жизни общего предка с помощью реальных гаплотипов гаплогруппы А будут проведены ниже. У этой гаплогруппы есть свои подгруппы с более недавними снипами, такие, как подгруппы A2, A3b1, A3b2 (снипы М6, М51 и М13, соответственно). А2 и А3b1 живут преимущественно в южной Африке, причём A3b1 – почти исключительно койзанская популяция. 1,1% чернокожих африканского происхождения в США имеют гаплогруппу A3b2.
Cводная (в те времена) гаплогрупппа ВТ образовалась из гаплогруппы А 55 тысяч лет назад, в северо-восточной Африке, и гаплогруппа В оформилась примерно 50 тысяч лет назад. Территория и частота встречаемости примерно та же, что и гаплогруппы А, но добавляются центральноафриканские пигмеи и южно-африканские койзаны (гаплогруппа B2b). Язык банту распространён во многом среди носителей гаплогруппы B2a. К гаплогруппе В относятся 2,3% американских чернокожих (афроамериканцев).
От гаплогруппы В отделилась сводная гаплогруппа СF, которая и мигрировала из Африки. Это произошло в интервале 31 – 55 тысяч лет назад. От этой сводной гаплогруппы 50 тысяч лет назад образовалась гаплогруппа С, её носители мигрировали на восток, и часть её шлейфа осталась на юге Аравийского полуострова, остальные через Пакистан и Индию, Шри Ланку и через Юго-Восточную Азию ушли в Австралию. Подгруппы этой гаплогруппы наблюдаются в Японии (С1), в Полинезии, Меланезии и в Папуа-Новая Гвинея (С2), в Юго-Восточной и Центральной Азии (С3), среди аборигенов Австралии (почти исключительно С4).
От сводной гаплогруппы CF 50 тысяч лет назад образовалась сводная гаплогруппа DE, которая в свою очередь образовала гаплогруппу Е, которая разошлась по Северной Африке и Европе, и D, которая мигрировала в Индию и далее по Азии. Носители D1 живут в Тибете, Монголии, Центральной Азии, Юго-Восточной Азии, D2 – почти исключительно в Японии. Тот факт, что в Тибете примерно 50% гаплогруппы D, в Японии – 35%, может указывать на миграционные связи древних обитателей Азии. Высокое содержание гаплогруппы D2 наблюдается среди популяции айну. Гаплогруппа Е появилась, видимо, в Северо-Восточной Африке, но не исключён ближневосточный регион, откуда она могла попасть в Африку. Основания для этого предположения – что гаплогруппы E и D были в прошлом тесно связаны, но D в Африке не наблюдается. Гаплогруппа Е1b1a распространилась на огромные территории в Африке и Европе. Большинство афро-американцев имеют именно эту гаплогруппу.
Тот факт, что гаплогруппы F в Африке практически нет, но более 90% людей Земли имеют гаплогруппы, нисходящие от F, может означать, что она образовалась уже за пределами континента, или вышла из Африки в составе небольшой группы людей.
Гаплогруппа G, которая предположительно образовалась 30 тысяч лет назад в Северной Месопотамии, наблюдается в основном на Кавказе, в Иране, на Ближнем Востоке, и в Средиземноморье, но её почти нет на севере Европы – менее 2% популяции. На юге Европы она достигает 8 – 10% от общего состава Испании, Италии, Греции, Турции. Значительная доля гаплогруппы G наблюдается в Северной Осетии (до 50%), в Грузии и в Азербайджане. Гаплогруппу G имел И. Сталин (тест проведен по ДНК его внука), причём гаплотип практически в точности соответствует гаплотипам осетинского района, где и предполагалась родина его предков. В Европе наблюдается преимущественно G2а, в Иране – G1.
Гаплогруппа Н образовалась из F примерно 30 – 40 тысяч лет назад, предположительно в Индии, там в основном и осталась. Эта гаплогруппа пришла в Европу с цыганами в виде подгруппы Н1.
Сводная гаплогруппа IJK, образовавшаяся из F на Ближнем Востоке 45 тысяч лет назад, сначала отделила сводную гаплогруппу IJ и отдельную гаплогруппу K, затем разделилась на I и J и разошлась по Ближнему Востоку, Средиземноморью и далее по Европе. Причём в Европу сначала прибыла гаплогруппа I, по всей видимости, с Русской равнины, куда мигрировала из Месопотамии через Кавказские горы или в обход их. Об этом уже говорилось в первой части книги, и будет продолжено ниже.
Сейчас гаплогруппа I (в составе двух основных подгрупп – I2 [«балканской», которую стоило бы назвать «гаплотипом Русской равнины»] и I1 [«балтийской» или «скандинавской»]) охватывает примерно 20% европейцев, будучи второй по численности после гаплогруппы R1b1. Названия этих гаплогрупп опять условные, и даются здесь просто для ориентации, потому что указанные территории содержат наибольшие доли этих гаплогрупп.
За пределами Европы гаплогрупп I1 и I2 практически нет. I2 – старейшая гаплогруппа в Европе. Расчёты времени жизни этой гаплогруппы будут проведены ниже.
Гаплогруппа J1 наблюдается преимущественно у арабов и евреев, генеалогические линии которых разошлись примерно 4000 лет назад, в любопытном соответствии с тем, что изложено в Библии и её трактовках. Так, исход из Египта трактуется, как имевший место в ходе извержения вулкана Санторин примерно 3600 лет назад, а библейский Авраам жил за 400 лет до того. В Египет, как излагает Библия, пришёл внук Авраама Иаков с детьми и семейством. По иронии судьбы, евреи и арабы, включая палестинских арабов, в значительной степени делят не только гаплогруппу J, но и её подгруппу J1. Они – близкие ДНК-генеалогические родственники. Гаплогруппа J2 наблюдается среди жителей Средиземноморья – греков, итальянцев, а также многих евреев, выходцев с Ближнего Востока. Немало её в Индии, и расчёты времён жизни их индийских общих предков будут даны ниже.
Сводная гаплогруппа NOР (rs2033003) образовалась из гаплогруппы К примерно 40 – 35 тысяч лет назад к востоку от Аральского моря (это – одна из трёх основных версий), потом разделилась на N, заселившую Сибирь и территории южнее и севернее, О, мигрировавшую через Индию в Южную Азию, и Р, ушедшую в южную Сибирь, и разделившуюся на Q и R. Та же гаплогруппа К дала гаплогруппы L и M. Первая наблюдается в основном в Индии и Шри-Ланке (как субклад L1) и Пакистане (L3). Гаплогруппа M в основном находится в Папуа – Новой Гвинее, где её насчитывается от трети до двух третей всей гаплогруппы М всей планеты.
Другой вариант – что сводная гаплогруппа NOP ушла из Месопотамии на восток по Иранскому нагорью и перед неприступными горами Памира, Гималаев, Тянь-Шаня, Гиндукуша повернула на юг и прошла вдоль Индийского океана в Юго-Восточную Азию. Никаких данных в пользу той или иной гипотезы нет.
В Части 1 книги было высказано обоснованное предположение, что гаплогруппы NО и R мигрировали раздельно, вторая – на Русскую равнину из Месопотамии вместе с гаплогруппой I, и только этим можно, видимо, объяснить европеоидность гаплогрупп I и R, в отличие от не-европеоидных N и O (например, якутской и китайской-корейской-японской, соответственно).
Гаплогруппа Q наблюдается в значительной степени среди сибирских народов, а также у американских индейцев, включая потомков племен майя. Немало этой гаплогруппы у евреев-ашкенази, что относят к хазарским временам, поскольку общему предку этой гаплогруппы среди евреев не более тысячи лет.
Более детально относительно второй из приведённых версий маршрута миграции сводной гаплогруппы NO – они мигрировали из Северной Месопотамии 40 – 35 тысяч лет назад, на восток до Памирского узла, и далее по южной дуге до Индостана и Китая с последующей миграцией на север до Южной Сибири, Алтая и далее по северной дуге до Урала, Белого моря и Балтийского моря, куда носители гаплогруппы N прибыли только несколько тысяч лет назад, и образовали группы уральских и угро-финских языков.
Там они встретились с носителями гаплогруппы R1a1, группы арийских языков, или, как их сейчас называют лингвисты, «индоевропейских», и, в значительной части, «иранских» и «славянских» языков, и с носителями гаплогруппы R1b1, тогда носителями, возможно, вариантов древних тюркских языков, и с носителями гаплогруппы I, древний язык которых, скорее всего, тот же, что и у носителей R1a1, то есть пра-индоевропейский.
Гаплогруппа R дала три наиболее известные гаплогруппы – R1a1, R1b1 и R2. Все три будут рассмотрены довольно подробно ниже, в соответствующих разделах. Коротко – R1a1 наиболее представлена в России (в среднем 48%, и в южных районах – Белгородская, Орловская области и прилегающие регионы – 62% от всего населения) и в Восточной Европе (Польша, Украина, Белоруссия, примерно такие же доли в популяциях и до 57%); в Центральной Европе и в Скандинавии её примерно 15 – 20%. В Атлантических регионах её почти нет, порой на уровне единиц процентов. Гаплогруппа R1a1 предположительно прибыла с Русской равнины в составе предковой гаплогруппы R или R1 и образовалась примерно 20 тысяч лет назад, предположительно в Южной Сибири, и разошлась на европейскую и азиатскую ветви. Первая мигрировала в Европу, где зафиксирована 8 – 12 тысяч лет назад, вторая – через Китай мигрировала в Индию и Пакистан, со временем общего предка там 8 – 12 тысяч лет назад.
Европейские R1a1 – это гаплогруппа древних «прото-индоевропейцев», они же арии, прибывших в Индию примерно 3500 лет назад и замкнувших языковую связь между Европой и Индией (и тогда же с Ираном). Примерно тогда же они прибыли в Анатолию, предположительно через Кавказские горы. В высших кастах Индии и сейчас до 72% носителей гаплогруппы R1a1. R1b1 – это, вероятно, носители «курганной культуры» 5 – 7 тысяч лет назад в южных степях России и Украины, на своём пути из Центральной Азии до Ближнего Востока, Северной Африки (включая Египет и Алжир) и через Пиренейский полуостров – в Европу, где они сейчас наиболее широко представлены. Гаплогруппа R2 – относительно недавняя, преимущественно локализована в Индии, её возраст там около 7 тысяч лет.
Положение десятое – в ДНК-генеалогии обычно оперируют поколениями. Поколение в контексте ДНК-генеалогии – это событие, которое происходит четыре раза в столетие. Численно и по времени оно близко к продолжительности поколения в житейском смысле этого слова, но не обязательно равно ему. Хотя бы потому, что продолжительность поколения не может быть точно или хотя бы в среднем определена и «плавает» в реальной жизни в зависимости от многих факторов, включая культурные, религиозные и бытовые традиции, примерно и в среднем от 18 до 36 лет.
В древности этот диапазон был, видимо, заметно смещён к первой величине. Поэтому использовать столь «плавающую» величину для расчётов в широких временных диапазонах и для разных народов не представляется возможным или разумным. Скорости мутаций в настоящей книге откалиброваны под условно взятое поколение продолжительностью 25 лет. Если кому-то больше нравится 30 лет на поколение или любое другое количество лет, скорости придётся перекалибровать, и в итоге окажутся ровно те же величины в годах. Так что сколько лет приходится на поколение – в данном случае не имеет значения, потому что при расчётах меньшему числу лет на поколение будет просто соответствовать пропорционально большее число поколений, и итоговая величина в годах не изменится.
Положение одиннадцатое – только те мутации в гаплотипах имеет смысл рассчитывать, экстраполируя ко времени общего предка, которые подчиняются определённым количественным закономерностям. Другими словами, ДНК-генеалогия оперирует тремя экспериментальными факторами:
- наличием снипов, относящих человека к определённому роду,
- наличием мутаций, позволяющих оценивать время, прошедшее от общего предка совокупности гаплотипов и – при больших выборках – от начала самого рода, от самого далёкого из предков ныне живущих потомков данного рода,
- закономерности переходов гаплотипов в их мутированные формы, без численного учёта самих мутаций.
Это позволяет оценить, насколько достоверны расчёты предка по мутациям, и даёт ещё один, независимый способ расчетов.
Только если число поколений до общего предка совпадет по пп. 2) и 3), естественно, в пределах разумной ошибки, то эту временнУю оценку можно считать числом поколений до общего предка. То есть, это совпадение показывает, что общий предок был один (в рамках ДНК-генеалогии; например, это могли быть и родные братья, и даже группа близких родственников с одинаковыми или близкими гаплотипами). Если же число поколений, полученное по числу мутаций и по доле сохранившихся немутированными гаплотипов, заметно различается (порой в 2 – 3 раза), то данная выборка гаплотипов не может численно обрабатываться в предположении, что предок был один. Такую выборку надо делить по разным общим предкам, и для этого могут использоваться деревья гаплотипов или медианные сети. Тогда разные ветви дерева часто (не не всегда) соответствуют разным общим предкам.
Приведём пример подобного подхода. Рассмотрим два набора по 10 гаплотипов в каждом.
14-16-24-10-11-12 14-16-24-10-11-12
14-16-24-10-11-12 14-16-24-10-11-12
14-16-24-10-11-12 14-16-24-10-11-12
14-16-24-10-11-12 14-16-24-10-11-12
14-16-24-10-11-12 14-16-24-10-11-12
14-16-24-10-11-12 14-16-24-10-11-12
14-17-24-10-11-12 14-16-25-9 -11-13
15-16-24-10-11-12 14-16-25-10-12-13
14-15-24-10-11-12 14-17-23-10-10-13
15-17-24-10-11-12 16-16-24-10-11-12
Первые шесть гаплотипов в каждом наборе – базовые (предковые) гаплотипы. Остальные четыре – мутированные, в первом наборе 5 мутаций, во втором – 12. Если обращать внимание только на мутации, то среднее количество мутаций в наборах равно 5/10/6 = 0.083 и 12/10/6 = 0.200 мутаций на маркер. Ясно, что второй набор «древнее» в том смысле, что происходит от более древнего общего предка (если он один для всего набора), поскольку со времени его жизни в гаплотипах его потомков накопилось больше мутаций.
Чтобы определить соответствующее количество поколений, отделяющих современных гаплотипы от их общего предка, надо полученные средние величины мутаций разделить на константу скорости мутаций. Для 6-маркерных гаплотипов (в стандартном формате) она равна 0.00088 мутаций на гаплотип, или 0.00147 мутаций на маркер. Таким образом, количество поколений до общего предка будет равно 57 и 136 поколений, соответственно (с поправками на возвратные мутации разница будет ещё больше, а именно 61 и 158 поколений, соответственно).
Однако в обоих случаях число поколений, рассчитанное по доле базовых гаплотипов, равно ln(10/6)/0.0088 = 58 (с поправкой – 62 поколения; принципы расчётов описаны ниже). Как видно, только первый набор дал примерно такое же число поколений (61 и 62) и, таким образом, представляет «чистую выборку», имеющую одного общего предка. Второй набор искажён и соответствует более, чем одному общему предку. Поэтому он не может быть использован для прямых расчётов временной дистанции до общего предка.
Более корректно будет привести эти величины с расчётами соответствующих погрешностей для 95%-ного доверительного интервала. В этих случаях погрешность складывается из погрешности средней величины мутаций на маркер (пропорциональна обратному квадратному корню из числа мутаций и в простейшем случае равна этой величине, то есть 0.083±44.7%, или 0.083±0.037 мутаций на маркер для первой серии гаплотипов, и 0.200±28.9%, то есть 0.200±0.058 мутаций на маркер для второй серии гаплотипов) и погрешности в константах скоростей мутаций, которые принимаются равными 10% с 95%-ной степенью достоверности (на основании рассмотрения большого числа расчётов). Тогда погрешность для числа поколений до общего предка первой серии гаплотипов равна √44.72+102= 45.8%, и второй серии – √28.92+102= 30.6%, то есть 61±28 поколений, или 1525±700 лет до общего предка в первой серии гаплотипов. В такой серии гаплотипов общий предок всей серии жил в указанном интервале лет с 95%-ной достоверностью.
Если же рассчитывать число поколений и погрешности по числу базовых гаплотипов, то при оставшихся шести базовых гаплотипов погрешность в их числе равна в простейшем случае обратному квадратному корню из числа базовых гаплотипов, то есть 6±40.8%, или 6±2 базовых гаплотипов, и погрешность для числа поколений до общего предка первой серии гаплотипов равна √40.82+102= 42.0%, то есть 62±26 поколений, или 1550±650 лет до общего предка. Как видно, обе величины, рассчитанные по мутациям и по базовым гаплотипам практически одинаковы, но ошибка определения оказалась даже несколько меньше для расчётов по базовым гаплотипам. Это – следствие того, что число базовых гаплотипов оказалось больше, чем число мутаций в данной серии.
Вторая серия является смесью ДНК-генеалогических линий, и её суммарный расчёт был бы некорректным.
Многочисленные примеры расчётов по реальным выборкам гаплотипам даны ниже.
4. Определения.
5. Общие принципы ДНК-генеалогии.
5.1. Введение.
5.2. Систематическое рассмотрение основ и принципов ДНК-генеалогии.
5.2.1. Основные положения ДНК-генеалогии.
5.2.2. «Научные» и «коммерческие» выборки гаплотипов.
5.2.3.1. Семейство Мак-Доналдов, таблица Чандлера и деревья гаплотипов.