Общие принципы ДНК-генеалогии

5. Общие принципы ДНК-генеалогии

5.1. Введение

В данном разделе речь пойдет о роли, которую ДНК-генеалогия может играть в понимании происхождения, динамики и миграции человеческих родов, племён, генеалогических линий, а также языков человечества – в пространстве и во времени. В отличие от антропологии, истории, археологии, которые оперируют памятниками прошлого, ДНК-генеалогия имеет дело с молекулами, извлекаемыми из нашего организма. Путём серии отработанных физико-химических операций, доступных грамотному технику-лаборанту и почти полностью автоматизированных, исследователь получает сведения о мутациях, накопившихся в определённых участках ДНК и может сравнивать характер (рисунок) этих мутаций у конкретных людей или их коллективов, популяций, этнических групп, народов. Это позволяет получать сведения о передвижениях предков современных (и ископаемых) носителей анализируемых молекул ДНК, опять же в пространстве и во времени, вплоть до времён 50 – 80 тысяч лет назад и на любой территории. На самом деле, вплоть до любых времён жизни предков человека, до сотен тысяч и миллионов лет назад, но наука на таких временах пока имеет слишком малую базу.

Помимо того, любая человеческая популяция в определённые моменты времени проходила то, что генетики называют «бутылочным горлышком» популяции. Это означает, что популяция, будь то род, племя, или просто группа родственников, сокращается в размере настолько, что или прекращает свое существование, генеалогическая линия прерывается (не прошли «бутылочное горлышко»), или сокращается до нескольких, или буквально до одного человека, потомство которого в итоге выживает и увеличивается в числе. В таких случаях этот человек и оказывается «общим предком» выжившей популяции. Методы расчёта времени жизни общего предка данной, выжившей популяции ведут именно к тому человеку, картина мутаций в ДНК его потомков сводится именно к нему, потому что «разбег» мутаций в ДНК потомков отсчитывается именно от этого, выжившего предка. Он становится, в рамках понятий ДНК-генеалогии, общим предком данной популяции.

«Буквально до одного человека» здесь – это в понятия ДНК-генеалогии, то есть скорее «до одного гаплотипа». Людей, оставшихся в данной популяции, могло быть несколько, это могли быть отец и сын, или братья, группа родственников, у которых и гаплотип мог и не различаться, или различаться несколькими мутациями, но в итоге выжил только один гаплотип, и именно от него пошёл «разбег мутаций» у потомков.

Методы ДНК-генеалогии позволяют узнать, когда жил общий предок, и, значит, – когда имело место «бутылочное горлышко» популяции на абсолютной шкале времени. При этом при наличии умеренной статистики, а именно при рассмотрении всего нескольких десятков или (лучше) сотен образцов ДНК потомков, можно идентифицировать времена жизни общих предков с точностью, близкой к 10% при 95%-ной достоверности полученных абсолютных значений времени. Так, если общий предок данной популяции жил 5000 лет назад, то при наличии (путём тестирования) сотни «гаплотипов» (так называемых «25-маркерных гаплотипов»), то есть определённых фрагментов Y-хромосомы современников, потомков данного общего предка, время жизни общего предка определится с точностью 5000±530 лет до настоящего премени. Это означает, что время жизни общего предка данной популяции попадает в указанный интервал времени, между 4470 и 5530 лет назад, с надёжностью 95%.

Такая точность вызвана тем, что в сотне 25-маркерных гаплотипов (то есть когда в каждом гаплотипе имеется по 25 нуклеотидных маркеров, и каждый мутирует с определённой средней скоростью на протяжении этих тысяч лет) в распоряжении исследователя есть 2500 «экспериментальных точек», в которых на протяжении 5000±530 лет произойдёт, как исследователь знает, примерно 770 мутаций. Эта величина жестко завязана на среднюю скорость мутаций, установленную и калиброванную. Если мутаций меньше, то общий предок жил более недавно, и опять можно вполне надежно установить, когда он жил. Например, при рассмотрении 750 19-маркерных гаплотипов басков (Пиренеи), род (гаплогруппа) R1b1b2, оказалось, что все они содержат 2796 мутаций от гаплотипа, равноудалённого от всех (это и есть предковый гаплотип, так как мутации происходят в подавляющем большинстве совершенно неупорядоченно, со степенью симметрии 0.5 в любую сторону, «вверх» или «вниз» по значению аллелей). Это означает, что общий предок всех 750 басков жил 3625±370 лет назад.

Можно вообще не обращать внимание на число мутаций и просто посчитать, сколько среди этих 750 гаплотипов есть «равноудалённых», причём идентичных друг другу. Это и есть предковые гаплотипы, и их число задаётся законами химической кинетики, то есть физической химии. Примерно такими же законами задаётся скорость радиоактивного распада, хотя после превращения стабильный изотоп не может стать обратно радиоактивным нуклидом, эти процессы необратимы.

Мутация же может вернуться обратно, потому что мутации, как мы отмечали, полностью неупорядочены. Иначе говоря, мутированному гаплотипу всё равно, в какую сторону мутировать в следующий раз, мутации обратимы. Это вносит усложнения в расчёты по сравнению с простыми процессами радиоактивного распада, но проблема с успехом решаема.

Среди отмеченных 750 гаплотипов басков 16 оказались предковыми. То есть за прошедшие 3625±370 лет в полном соответствии с теорией вероятности 16 гаплотипов из 750 так и остались предковыми. Они не успели мутировать, они – «на хвосте» кривой вероятностного распределения мутаций. Если бы считать по законам радиоактивного распада (физико-химики говорят – по законам кинетики первого порядка), то из 750 гаплотипов 16 останутся неизменными за ln(750/16)/0.0285 = 135 поколений, прошедших со времени жизни общего предка, то есть за 3375 лет (продолжительность поколения в 25 лет заложена в константу скорости мутации 0.0285 мутаций на гаплотип на поколение).

Но при этом расчёте не учитывается обратимость мутаций. Учёт этой обратимости, опять в строгом соответствии с теорией вероятности, сдвигает число поколений со 135 до 156, то есть до 3900 лет до общего предка. Для введения подобных поправок есть детальные таблицы расчётов [Клёсов, 2008с; Klyosov, 2009a; Табл. 5.2.3.1.2 ниже]. Как мы видим, эта величина, 3900 лет, попадает в интервал 95%-ной надежности расчётов 3625±370 лет до общего предка.

Очевидно, что считать мутации, или считать предковые гаплотипы (если от времени жизни общего предка прошло не так много лет) – не имеет большого значения или большой разницы. Величины получаются примерно те же самые, если расчёт ведётся правильно, и используются надежные константы скоростей мутации, подтвержденные экспериментально, то есть с учётом известных генеалогий или известных исторических событий. Эта работа проведена, и в недавней работе [Klyosov, 2009a] приведены значения констант скоростей мутаций для 22 типичных гаплотипов, применяемых в ДНК-генеалогии, от 5-маркерного до 67-маркерного. В этой книге таблица расширена уже до 28 типичных гаплотипов (Табл. 5.2.3.1.2).

Чтобы показать, насколько массивными бывают расчёты, и насколько точными получаются данные, приведём ещё один пример – выборку из 857 25-маркерных гаплотипов Англии, род I1 (определения родов будут даны ниже), то есть 21425 «экспериментальных точек» [Klyosov, 2009a]. Эти гаплотипы содержали 4868 мутаций от предкового гаплотипа, который в ДНК-генеалогии часто называют «базовым». Такое название принято потому, что во многих случаях нет полной уверенности, особенно с очень древними гаплотипами, что «равноудалённый» – это непременно предковый гаплотип. Это может быть хорошее приближение, но не более того. Назвать его «предковым» было бы натяжкой. Потому – «базовый».

Такое число мутаций позволяет определять среднее число мутаций на маркер (а именно это среднее число фактически используется для расчёта времени жизни общего предка) с точностью до 1 – 2% с 95%-ной надёжностью. Это потому, что для несимметричных мутаций точность расчётов (среднеквадратичное отклонение) средней величины мутаций на маркер задаётся обратной величиной квадратного корня из числа мутаций, а для симметричных отличается лишь немногим [Klyosov, 2009a]. Для 4868 мутаций это отклонение – с 95%-ной надёжностью – составляет 1.43%. Но поскольку точность средних скоростей мутаций в гаплотипах принимается за 5%, то для 95%-ной надёжности расчётов времени жизни общего предка предельной точностью может быть только плюс-минус 5%, то есть 10%-ный интервал.

Поэтому для английских гаплотипов определено, что общий предок всех 857 человек в данной выборке жил 3425±350 лет назад. Это – относительно недавнее время, относительно молодые европейские популяции. Хотя для некоторых европейских родов общие предки – по данным ДНК-генеалогии – жили 16 – 18 тысяч лет назад. Как будет показано ниже, для ряда азиатских родов общий предок рода жил 16 – 20 тысяч лет назад, для африканских родов – 28 – 37 тысяч лет назад.

Эти примеры здесь даются для того, чтобы читатель осознал, что ДНК-генеалогия – это не просто нарождающаяся наука с зыбким фундаментом (что характерно для новых областей наук). За последние несколько лет ДНК-генеалогия практически закончила формировать расчётный базис, платформу, и временные расчёты проводятся теперь с достаточной надёжностью. Было экспериментально показано, с использованием геномов многих популяций людей, а также геномов шимпанзе, что мутации представляют собой действительно «молекулярные часы», скорость которых в ДНК неизменна на протяжении по меньшей мере последних двух миллионов лет [Sun et al, 2009].

Было экспериментально показано на тысячах пар «отец-сын», что мутации в гаплотипах действительно равновероятны по «направлению», и тандемные, повторяющиеся блоки нуклеотидов, называющиеся в ДНК-генеалогии маркерами, могут укорачиваться или удлиняться на блок (то есть менять чисто аллелей) с одинаковой вероятностью. На этих системах было показано что «двойные» или более мутации в гаплотипах (маркерах) происходят редко, на уровне единиц процентов, и практически не влияют на получаемые расчёты времён до общих предков популяций или серий гаплотипов.

Сложнее с географической привязкой, с выявлением того, где именно жил общий предок, так как время его жизни (то есть сколько поколений или лет назад он жил) о географии не говорит. Для выявления того, где, на каких территориях жили общие предки популяции, приходится привлекать независимые данные археологии, антропологии, лингвистики, понимая частую условность их сведений, поскольку о том, что те ископаемые предки действительно дожили в потомках до наших дней, приходится только гадать.

Именно потому союз антропологии, археологии, лингвистики с ДНК-генеалогией так важен. ДНК-генеалогия предоставляет в их распоряжение жёсткую привязку в виде «метки» рода, определённую и однозначно определяемую мутацию в Y-хромосоме ДНК, мутацию под названием «снип» (SNP = Single Nucleotide Polymorphism), которая всегда сопровождает каждого члена рода. Эта мутация не ассимилируется в популяциях, как ассимилируются языки, культуры, религии, физические черты, антропологические показатели.

Эта мутация, снип, одна и та же в смешанных популяциях, она позволяет отличить члена рода через тысячи и десятки тысяч лет. Она позволяет проследить миграции родов и отдельных представителей рода. Она позволяет понять, останки представителей каких родов находятся в археологических раскопах, и как археологические культуры связаны друг с другом – не только через материальные, культурообразующие носители, но и через людей, через конкретные рода, понять генезис, динамику археологических культур, добавить важнейшую компоненту к динамике человеческих популяций и их материальных носителей.

Так, определение снипа, то есть конкретной родовой принадлежности останков в Костёнках и Сунгире немедленно и надёжно позволило бы определить, есть ли их потомки среди нас, среди современного человечества. Если же снип окажется совершенно незнакомым, каких среди современных людей нет, то потомки этих культур, увы, не выжили. По крайней мере в мужском населении планеты. Но поскольку женщины имеют свои гаплогруппы и гаплотипы, в митохондриальных ДНК, то аналогичные тесты позволили бы однозначно установить, есть ли потомки женщин древних Костёнок и Сунгиря среди женщин Земли в настоящее время.

В этой книге выдвинута и частично обоснована гипотеза, что потомки обитателей тех древних стоянок 50 – 45 тысяч лет назад действительно дожили до настоящего времени. Но она, гипотеза, может быть верифицирована только путём анализа ДНК ископаемых останков. Технически это возможно – секвенированием, то есть определением нуклеотидной последовательности фрагментов костной ДНК, глубоко упрятанной в костях и частично пережившей тысячелетия. (Немногочисленные) примеры таких исследований и их результаты также приводятся в данной книге, а также поясняется, почему эти исследования немногочисленны, фактически единичны, насколько трудна эта работа и насколько дорогостояща.

Следует ещё раз подчеркнуть – ДНК-генеалогия наших современников «докапывается» только до «бутылочных горлышек» популяций, родов, племён, генеалогических линий, связывающих современников с их предками. «Бутылочное горлышко» – это далеко не обязательно результат мора, эпидемий, войн, природных катаклизмов в прошлом. Хотя все эти факторы непременно имели место и оказали влияние на состав современных популяций. Трудно представить, насколько чума середины 14-го века, которая выкосила четверть европейцев, терминировала генеалогические линии, гаплотипы и, возможно, целые гаплогруппы, рода. Много генеалогических линий начинаются именно в середине 14-го века. Это – выжившие люди, поведшие линию популяции опять сначала, ставшие «общими предками» многочисленных групп наших современников.

Геноцид – худший враг ДНК-генеалогии, не говоря обо всём человечестве. Сколько генеалогических линий прервала резня в Армении второго десятилетия прошлого века – об этом можно только догадываться. Да и любая война вносит необратимый вклад в уничтожение генетического «материала». Галльские войны Юлия Цезаря, по данным Плутарха, привели к гибели более миллиона жителей Центральной Европы, и ещё миллион был угнан в рабство. Опять, можно только гадать, как это изменило ландшафт гаплотипов и гаплогрупп в Европе.

Но не только войны и эпидемии создают «бутылочные горлышки», но и переезд, переход, миграция носителя гаплогруппы и гаплотипа на новое место. Если миграция массовая или даже нескольких человек, то эти люди «переносят» мутации своего общего предка на новое место, и, с точки зрения ДНК-генеалогии, общий предок мигрантов как был тысячелетия назад, так и остался. Так, например, общий предок англичан в Англии и в США – один и тот же. Как и русских, восточных славян, например. Это вовсе не означает, что восточные славяне жили также и в Северной Америке 4800 лет назад, как на территории современной России. Тем не менее, подобные заключения – типичная ошибка ДНК-генеалогии. Так, Исландия была заселена только в 9-м веке нашей эры, а общий предок исландцев практически по всем родам – тысячелетия назад, как и в континентальной Европе.

С другой стороны – общий предок гаплогруппы R1b1 по расчётам ДНК-генеалогии (по мутациям в гаплотипах) жил в Центральной (Средней) Азии 16 тысяч лет назад; на территории современной России, среди этнических русских – 6775 лет назад; на Ближнем Востоке (в частности, среди евреев, а также в Ливане) 5500 – 5200 лет назад, в Северной Африке – 3875 лет назад, на Пиренеях – 3625 лет назад, в Ирландии – 3800 – 3400 лет назад. Вот такой шлейф даёт обоснованное представление о временах и направлении миграций рода R1b1, более того – даёт основания связать этот род с курганной культурой (точнее, серией культур, горизонтом, культурно-исторической общностью).

Более того, он показывает истоки этой культуры в Евразии, даёт материал для интерпретаций в области языкознания. Показывает, что вряд ли гаплогруппа, род R1b1 может рассматриваться в качество «прото-индоевропейского» в отношении языка, и отдаёт это место роду R1a1, который мигрировал на Русскую равнину из Европы и имеет общего предка на Русской равнине 4800 лет назад, то есть намного позже, чем «курганники» (R1b1).

Носители гаплогруппы R1a1 продвинулись на восток, основали, среди прочих, андроновскую культуру (с ископаемыми R1a1 с датировкой 3800 – 3400 лет назад), с последующими тагарской и таштыкской культурами (ископаемые гаплогруппы практически исключительно R1a1), и примерно 3500 лет назад продвинулись в Индию, вся северная часть которой в настоящее время преимущественно R1a1.

Это и есть и корни индоевропейской семьи языков, корни санскрита, свидетельства прибытия в Индию носителей гаплогруппы R1a1, преобладающей по доле гаплогруппы в современной России (48% среди этнических русских, при второй по численности гаплогруппы только 15%, тоже, кстати, европейской гаплогруппы I2, которой много у сербов и болгар).

Кстати, «курганная» гаплогруппа (хотя курганная археологическая культура – всего эпизод в истории гаплогруппы) сейчас является наиболее распространённой в Центральной и Западной Европе и на Британских островах, достигая до 95% у ирландцев и до 93% у жителей Пиренейского полуострова.

Отсюда и новый термин – молекулярная история, то есть создание исторических реконструкций, исходя из молекулярных характеристик ДНК потомков, а порой и (ископаемых) предков. Поскольку далёкие предки, передвигаясь, несли в новые края языки, то, прослеживая миграции предков, происходившие сотни, тысячи и десятки тысяч лет назад, можно получать сведения о миграции языков во времена столь глубокой древности. Сопоставление этих реконструкций с данными лингвистики, полученными принципиально другими методами, может позволить получать более обоснованные сведения в области языкознания, проверять существующие концепции и приходить к новым, совершенно неожиданным концепциям и идеям. Примеры будут даны ниже.

Теперь дадим несколько определений и уточним некоторые данные выше положения. Потом перейдём к систематическому рассмотрению принципов и методов ДНК-генеалогии, и далее – к интерпретациям некоторых данных и положений антропологии и археологии (местами и лингвистики) с точки зрения ДНК-генеалогии. Это – не в ущерб концепциям антропологии и археологии, а в их поддержку, но на несколько другом уровне рассмотрения.

Мы будем здесь рассматривать ту область ДНК-генеалогии, которая оперирует картиной мутаций в Y-хромосоме, то есть мужской половой хромосоме. Женскую ДНК-генеалогию, основанную на мутациях в митохондриальной ДНК, мы здесь рассматривать не будем. Совокупность картин мутаций прилагается к популяциям, выбранным для рассмотрения.

Здесь термин «популяция» относится к любой группе мужчин, ДНК которых была извлечена (из слюны или крови) и тестирована по определенной методике, результатом чего явился набор цифр, характерных для каждого субъекта данной популяции. Эти цифры можно сопоставить по аналогии с серией и номером паспорта человека. «Серия паспорта» – это род, к которому относится данный человек.

Род – это совокупность людей, имеющих общего (для всех) прямого предка (рода). Все члены рода имеют характерную метку, то есть мутацию в ДНК, которую не имеют представители других родов. Эта мутация, как уже было отмечено, называется в ДНК-генеалогии «снип». Выше была дана расшифровка этого понятия. Эта мутация в каждом роду необратима, и передаётся из поколения в поколение, начиная со времени возникновения данной мутации, обычно тысячи или десятки тысяч лет назад. Таким образом, возраст родов исчисляется в тысячах, а то и в десятках тысячах лет. Возраст ДНК-генеалогических линий, ветвей рода, исчисляется порой всего в сотнях лет, опять же исходя из картины мутаций в ДНК тестируемых людей [Клёсов, 2008d; Klyosov, 2009a, b].

В задачи данного рассмотрения не входит давать исчерпывающий обзор истории создания и развития ДНК-генеалогии, хотя для справедливости следует отметить, что ДНК-генеалогия вырастает из дисциплины под названием популяционная генетика, которая была заложена трудами многих специалистов. Приложение популяционной генетики к ДНК человека в 1990-х годах – заслуга в первую очередь таких имён (хотя в данном списке, безусловно, отражаются личные предпочтения авторов), как Cavalli-Sforza L.L., Feldman M.W., Goldstein D.B., Hammer M.F., Jobling M.A., Kayser M., de Knijff P., Nebel A., Nei M., Oppenheim A., Semino O, Stoneking M., Thomas M., Underhill P., Walsh B., Wells R.S., Л.А. Животовский, Т.М. Карафет и многих других, которые здесь поместить просто невозможно (см., например, [Cordaux et al, 2004; Goldstein et al., 1995; Hammer et al., 2000; Heyer et al., 1997; Jobling & Tyler-Smith, 1995; Karafet et al., 1999; Kayser et al., 2000; Nebel et al., 2000, 2001; Nei, 1995; Semino et al., 2000; Takezaki & Nei, 1996; Underhill et al., 2000; Walsh, 2001; Wells, 2001; Zhivotovsky & Feldman, 1995]).

Трудами этих и десятков других исследователей были проведены тщательные отнесения снипов к принципиальным родам человечества и их подчинённым родам и отдельным генеалогическим линиям рода, имеющим свои мутационные метки в ДНК, называемым субкладами. Снипы тщательно идентифицируют и выбирают для классификации, так, чтобы рода (в терминах ДНК-генеалогии) были максимально чётко дифференцированы.

Всего на Земле насчитывают 20 родов (их именуют по буквам латинского алфавита, от А до Т), хотя снипов, применяемых в ДНК-генеалогии, известно уже несколько сотен. Они в большинстве своём и относятся к подчинённым родам, субкладам. Наиболее изучен так называемый «западноевропейский» род R1b1b2, в котором, в свою очередь, выделяют 35 субкладов, и число их с каждым годом растёт (в 2008 году в нем насчитывали 22 субклада). Для сравнения, в «восточноевропейском» роде R1a1, к которому принадлежит 48% этнических русских, насчитывают всего семь субкладов, из которых два пусты, то есть имеют скорее теоретический характер, в трёх насчитывают всего 15 человек из более чем тысячи тестированных, шестой (М434) тоже крайне редкий субклад, в котором насчитывают всего 14 человек из Пакистана и Омана, и только седьмой, М458), открытый совсем недавно, в 2009 году, включает несколько десятков (на самом деле значительно больше) человек. Носителей одного и того же снипа относят к одной и той же гаплогруппе. То есть, гаплогруппа – это и есть род в понятиях ДНК-генеалогии.

Следует сказать, что есть, по меньшей мере, две причины, по которым в гаплогруппе R1a1 субкладов так мало. Первая – то, что примерно 4500 лет назад что-то произошло с гаплогруппой R1a1 в Европе, она практически «обнулилась», не прошла «бутылочное горлышко» популяции. Это мог быть некий грандиозный природный катаклизм, мор, эпидемии, или что-то, почти уничтожившее носителей гаплогруппы R1a1 в Европе, и, похоже, не только их. Выжили только перешедшие к тому времени на Русскую равнину, они и возродили популяцию R1a1, которая частью вернулась в Европу. На возможные причины исчезновения гаплогруппы R1a1 в Европе наводит и то, что в то же время практически исчезла и гаплогруппа I1, и что в это же время, примерно 4500 – 4000 лет назад, произошло заселение Европы гаплогруппой R1b1b2. Грубо говоря, в одно и то же время в Европе появились кельты и исчезли «пра-индоевропейцы» и «скандинавы», кроме тех, кто уже переселились на Русскую равнину незадолго до того.

Возможно, поэтому расселение гаплогруппы R1a1 резко падает от Восточной Европы к центральной Европе и далее к Атлантике. На большей части Британских островов доля R1a1 составляет 2 – 5%, а в Польше, Украине, России – до 65 – 70%, порой и 80% по территориям. В среднем по Европейской части России доля R1a1 составляет 48%, падая от 70 – 80% за счёт заметной доли N1c в северных районах. То, что R1a1 в Европе значительно более древняя, по оценкам не менее 10 – 12 тысяч лет, выявляется по одиночным современным гаплотипам случайно выживших древних ДНК-генеалогических линий. Подробнее об этом – ниже, в настоящей части книги.

Вторая причина, по которой в гаплогруппе R1a1 практически отсутствуют субклады – весьма прозаична. Основные центры исследований ДНК-генеалогии – на Западе, где значительно преобладают гаплогруппы R1b1 и I1 – I2 и где крайне мало R1a1. На первые и направлены усилия исследователей и финансирование. Выше уже было упомянуто, что в гаплогруппе R1b1b2 идентифицировано 35 субкладов, добавим, что в гаплогруппе I – 34 субклада. В гаплогруппе R1a1 – практически один, сама гаплогруппа. Но в этой книге мы покажем наличие четырнадцати ДНК-генеалогических ветвей в гаплогруппе R1a1, выявленных в работе [Рожанский и Клёсов, 2009].

Число и расположение мутаций в выбранных для анализа участках ДНК, так называемых гаплотипах, можно сопоставить с «номером паспорта». Это – индивидуальная характеристика человека. Гаплотипы можно определять на коротких участках ДНК, можно на более протяжённых участках, что увеличивает разрешение, информативность исследования. Длину участка ДНК, то есть протяжённость гаплотипов, измеряют в числе маркеров. Маркер – это участок ДНК, специально охарактеризованный и «откалиброванный» числом нуклеотидов, которые образуют повторяющиеся, или «тандемные» последовательности.

Наиболее распространёнными при исследованиях являются гаплотипы в 12, 17, 25, 37 или 67 маркеров. Чем протяжённее гаплотип, чем больше в нём маркеров, тем он более уникален, тем более точно он описывает «паспорт» человека. Вот как выглядят 12-маркерные гаплотипы всех четырёх человек в редкой гаплогруппе R1a1b, упомянутой выше, как один из пяти субкладов в «восточноевропейском» роде R1a1:

13-23-14-11-11-14-12-14-12-13-13-16
13-24-14-10-11-15-12-12-12-14-13-16
13-24-14-10-11-14-12-12-11-13-13-17
13-24-14-11-11-15-12-12-12-13-13-16

Этот род иногда называют «восточноевропейским», так как гаплогруппа R1a1, как отмечалось выше, наиболее распространена в Восточной Европе. Но в данном случае носители гаплогруппы R1a1b указали на своих наиболее ранних им известных предков (как правило, живших не ранее 19-го века) в Канаде, Шотландии, Ирландии, Испании. Вполне возможно, что их более далёкие предки действительно были восточноевропейцами, например, обитателями Балкан. Может быть, жили и в других регионах Европы, мы этого пока не знаем. Приведённые выше четыре гаплотипа различаются между собой на 10 мутаций (считая только отклонения от преобладающих, «базовых», или «предковых» значений маркеров). Чем больше число отклонений (мутаций), тем раньше жил общий предок рассматриваемой группы людей.

Одна мутация в 12-маркерных гаплотипах происходит в среднем примерно в тысячу лет, точнее, раз в 1140 лет [Klyosov, 2009a], с точностью определения, зависящей от числа мутаций в гаплотипе. Чем больше мутаций, тем точнее определение средней частоты мутаций. 10 мутаций на четыре 12-маркерных гаплотипа, то есть на 48 маркеров – это в среднем 0.208 мутаций на маркер, что при расчётах даёт 3200±1100 лет до общего предка всех четырёх человек данного рода R1a1b. Расчеты обычно проводятся по формулам или по таблицам [Klyosov, 2009a; Клёсов, 2008c].

Более точно расчёты проводятся по 25-маркерным гаплотипам. Они определены всего для трёх человек данной группы R1a1b [YSearch, май 2009]:

13-23-14-11-11-14-12-14-12-13-13-16-18-9-10-11-11-24-15-19-29-15-16-16-19
13-24-14-10-11-15-12-12-12-14-13-16-16-9-9  -11-11-25-15-18-30-15-15-17-17
13-24-14-10-11-14-12-12-11-13-13-17-18-9-9-  11-11-25-15-19-31-15-15-17-18

Между всеми тремя гаплотипами – 19 мутаций. На все 75 маркеров это даёт в среднем 0.253±0.058 мутации на маркер, что приводит к времени жизни общего предка для всех трёх человек 4000±1000 лет назад. В пределах ошибки эти величины перекрываются для 25- и 12-маркерных гаплотипов, и видно, что величины, в принципе, довольно близкие, причём вторая величина, рассчитанная для почти вдвое большего количества маркеров, должна быть точнее.

Для 37-маркерных гаплотипов имеем:

13-23-14-11-11-14-12-14-12-13-13-16-18-9-10-11-11-24-15-19-29-15-16-16-19-11-11-19-23-16-15-17-17-36-38-13-12
13-24-14-10-11-15-12-12-12-14-13-16-16-9-9-11-11-25-15-18-30-15-15-17-17-11-10-19-23-16-15-17-18-39-40-11-12
13-24-14-10-11-14-12-12-11-13-13-17-18-9-9-11-11-25-15-19-31-15-15-17-18-11-12-19-24-15-15-18-17-36-36-12-12

Это добавило еще 15 мутаций, доведя общее число до 34 мутаций на 111 маркеров, или в среднем 0.306±0.052 мутаций на маркер. Скорости мутаций для 37-маркерных гаплотипов на треть выше, чем для 12- и 25-маркерных гаплотипов, поэтому и мутаций больше. Расчёты дают, что общий предок трёх человек данной гаплогруппы жил 3600±700 лет назад. Как видно, 12-, 25- и 37-маркерные гаплотипы дают примерно один и тот же возраст общего предка, в пределах ошибки расчётов.

Естественно, для такого малого числа гаплотипов подобные расчёты обычно не делают, и здесь они приведены просто для иллюстрации принципа расчётов. Именно из-за малого числа гаплотипов и мутаций в них ошибка расчётов составила от 30 до 20%. Обычно для больших серий, порой в сотни, а то и тысячи гаплотипов [Klyosov, 2009a; 2009b; Адамов и Клёсов, 2009d], ошибки расчётов уменьшаются, приближаясь к 10%, как было описано выше, при 95%-ном доверительном интервале, и к 5% при 68%-ном доверительном интервале. Большей точности обычно не бывает, поскольку лимитирует уже точность определения скоростей мутаций.

 

4. Определения.

5. Общие принципы ДНК-генеалогии.

5.1. Введение.

5.2. Систематическое рассмотрение основ и принципов ДНК-генеалогии.

5.2.1. Основные положения ДНК-генеалогии.

5.2.2. «Научные» и «коммерческие» выборки гаплотипов.

5.2.3. Кинетика мутаций гаплотипов, их калибровка и проверка. Принципы датировки. Основа исторических реконструкций.

5.2.3.1. Семейство Мак-Доналдов, таблица Чандлера и деревья гаплотипов.