Кинетика мутаций гаплотипов, их калибровка и проверка. Принципы датировки. Основа исторических реконструкций

5.2.3. Кинетика мутаций гаплотипов, их калибровка и проверка. Принципы датировки. Основа исторических реконструкций

Если принять, что генеалогическое дерево действительно симметричное, то переход базового гаплотипа в мутированные должен проходить в соответствии с уравнением кинетики первого порядка

ln (B/A) = kt,

где:

В – это общее количество гаплотипов в списке,

А – число сохранившихся базовых гаплотипов,

k – средняя скорость (частота) мутации (0.0088 на гаплотип на поколение для шестимаркерного гаплотипа),

t – число поколений до общего предка,

ln – натуральный логарифм.

Профессиональные кинетики эту формулу знают (cм, например, Березин и Клёсов, Практический курс химической и ферментативной кинетики, М., 1976), только её в ДНК-генеалогии до недавнего времени никто не применял. Мы покажем, что можно. Для этого нужно взять гаплотипы, для которых время обшего предка известно, и проверить формулу на практике.

 

5.2.3.1. Семейство Мак-Доналдов, таблица Чандлера и деревья гаплотипов

Есть такие гаплотипы, для которых время общего предка известно. Это, например, обширное семейство Мак-Доналдов, предок которых, Джон Лорд Островов (John Lord of the Isles) умер в 1386 году, и для которых на сегодняшний день известны 102 гаплотипов семейства, а именно мужчин. Принимая те же 25 лет на поколение, получим, что Джон жил 26 поколений назад. Посмотрим, что нам дадут гаплотипы.

Этот вопрос рассматривать тем более полезно, что один из авторов настоящей книги повторял эти расчёты несколько раз за последние два года, в ходе расширения списка гаплотипов Мак-Доналдов от 69 до 102. Можно проследить, насколько размер выборки и принципы её формирования вляют на конечный результат, на датировку общего предка.

В качестве «точки опоры» возьмём известную таблицу скоростей мутаций для 37 маркеров, которые используются в ДНК-генеалогии. Сейчас уже в ходу 67-маркерные гаплотипы, так что таблица неполная. Тем не менее, это лучшее, что продолжает оставаться в профессиональной научной литературе и принято научной общественностью в виде хотя и не конечной истины, но хорошего приближения. Автор таблицы – Джон Чандлер [Chandler, 2006] – проанализировал тысячи гаплотипов и сопоставил частоту мутаций каждого из внесённых в таблицу 37 маркеров. Здесь первая колонка – первые 12 маркеров, вторая – последующие 13 маркеров, третья – последующие 12 маркеров, чтобы завершить 37-маркерные гаплотипы. Все цифры – это скорости мутаций на маркер на поколение. Выделенные цифры – номера маркеров:

 

Маркер

Скорость мутации

Маркер

Скорость мутации

Маркер

Скорость мутации

393

0.00076

458

0.00814

460

0.00402

390

0.00311

459a

0.00132

GATA

0.00208

19

0.00151

459b

0.00132

YCAa

0.00123

391

0.00265

455

0.00016

YCAb

0.00123

385a

0.00226

454

0.00016

456

0.00735

385b

0.00226

447

0.00264

607

0.00411

426

0.00009

437

0.00099

576

0.01022

388

0.00022

448

0.00135

570

0.00790

439

0.00477

449

0.00838

CDYa

0.03531

389i

0.00186

464a

0.00566

CDYb

0.03531

392

0.00052

464b

0.00566

442

0.00324

389ii

0.00242

464c

0.00566

438

0.00055

 

 

464d

0.00566

 

 

Таблица 5.2.3.1.0. Таблица скоростей мутаций для 37 маркеров [Chandler, 2006].

 

Поскольку скорости отдельных маркеров складываются (мутации принимаются независимыми, и в целом так оно и есть, за несколькими исключениями), то для первых 6 маркеров средняя скорость мутации получится 0.00880±0.00015, для первых 12 маркеров средняя скорость мутации получится 0.022±0.004, для первых 25 маркеров – 0.070±0.011, и для всех 37 маркеров – 0.18±0.03 мутаций на гаплотип на поколение. Погрешности взяты из работы, в которой были опубликованы значения маркеров [Сhandler, 2006].

Если эти величины перевести в значения скоростей мутаций (или констант скоростей мутаций, они же частоты мутаций), то для 6- и 12-маркерных гаплотипов получим таблицу:

 

Гаплотип в формате FthNA

Средняя величина константы скорости мутации на поколение (25 лет по условиям калибровки)

Примечания

На гаплотип

На маркер

393-390-19-391-X-X-X-388-X-X-392-X

0.0088

0.00147

6-маркерный гаплотип в «старом научном» формате: 19-388-390-391-392-393

393-390-19-391-385a-385b-426-388-439-3891-392-3892

0.022

0.00183

12-маркерный гаплотип в формате FTDNA

 Таблица 5.2.3.1.1. Скорости мутаций.

 

Это – лишь частный вариант общей таблицы скоростей мутаций, в которой приведены данные для 23 вариантов гаплотипов в различных форматах, и которую мы приведём позже. Причина в том, что только две первые строки, составленные из данных Чандлера – для так называемой первой панели маркеров (от 1-го до 12-го) разумно описывают реальные системы. Во второй и третьей панели (12 – 25 и 26 – 37 маркерных фрагментах гаплотипов) мутации в ряде локусов или сайтов (тандемов, повторяющихся прогонов ДНК) происходят сложным образом. Некоторые сайты оказываются как бы сцепленными друг с другом, и мутации в них не являются независимыми (нумерацию этих сайтов обычно сопровождают буквами, как показано в таблице скоростей мутаций отдельных маркеров выше). В итоге количество мутаций, рассчитанное по этим сайтам в отдельности, оказывается порой сильно завышенным.

Это фактически парализовало работу по использованию мутаций в гаплотипах для проведения временных оценок в масштабах исторических событий. Дискуссии, какие скорости мутаций использовать и как их адаптировать к расчётам в режимах реального времени продолжаются до сих пор, и проблема казалось нерешаемой. Для «академических учёных» проблема до сих пор не решена. Нет даже минимального консенсуса. Поэтому редкие расчёты в академической науке ведутся на страх и риск авторов, а ещё чаще вообще не проводятся, в ожидании того, что проблема как-то рассосется.

Несмотря на это, проблема была в значительной степени решена, когда к скоростям мутации гаплотипов были применены (одним из авторов настоящей книги) подходы физической химии (химической кинетики) и соответствующих принципов математической статистики, и полученные данные выверены на известных генеалогиях (с соответствующим определением гаплотипов) и известных исторических событиях. Были сопоставлены скорости мутаций по их накоплению, и по одновременному уменьшению числа немутированных гаплотипов, были применены графические деревья гаплотипов с соответствующим разделением генеалогических ветвей, в каждой из которых была своя картина мутаций, были введены принципы симметрии мутаций и количественный учёт симметрии, количественный учёт возвратных мутаций, а также – что немаловажно – количественный расчёт доверительных интервалов получаемых времён жизни общего предка, что позволило давать реалистическую картину получаемых датировок. Эти принципы изложены в двух объёмных статьях [Klyosov, 2009a, 2009b], в серии статей в Вестнике Российской Академии ДНК-генеалогии (2008, 2009, в соавторстве с Д. Адамовым) и лишь в сокращённом виде изложены здесь на конкретных примерах, избегая сложных математических рассмотрений. Полностью эти выкладки приведены в работах [Адамов и Клёсов, 2008а, b; 2009a, b, c, d].

Первый наглядный пример и есть серия гаплотипов семейства Мак-Доналдов. Полтора года назад их было в списке 68 человек и, соответственно, 68 гаплотипов. Из них 53 шестимаркерных базовых, то есть идентичных друг другу:

15-12-25-11-11-13

и на остальные 6-маркерные приходилось 17 одношаговых мутаций. Посмотрим, сколько поколений от общего предка должно было пройти, чтобы из 68 гаплотипов осталось «нетронутыми», то есть немутированными 53, и чтобы во всех 68 набежало 17 мутаций. Применим средние скорости мутаций для 6-маркерных гаплотипов, рассчитанных по таблице Чандлера:

ln(68/53)/0.0088 = 28±5 поколений

17/68/0.0088 = 28±7 поколений

Как мы помним, генеалогическое дерево Мак-Доналдов уходит вглубь на 26 поколений (650 лет), точнее, на 623 года назад до смерти отца-основателя. Видно, что лучшего совпадения, учитывая погрешность расчётов, желать трудно. Погрешности здесь рассчитывались, исходя из числа немутированных гаплотипов (53) в первой формуле и из числа мутаций (17) во второй, как обратный квадратный корень из их величин, как было объяснено выше [Адамов и Клёсов, 2009с; Klyosov, 2009a].

Дерево 6-маркерных гаплотипов Мак-Доналдов показано на рис. 5.2.3.1.1. В нём, как и во всех деревьях гаплотипов, по кругу расположены базовые гаплотипы рассматриваемой серии, то есть идентичные друг другу, и, как правило, соответствующие предковому гаплотипу, общему для всей серии гаплотипов. Это в том случае, если предок действительно был один для всей серии. Как мы позже увидим, нередко базовый гаплотип относится всего лишь к части серии гаплотипов, а остальные сильно мутированы. Вот тогда и наблюдается дисбаланс между числом базовых гаплотипов и числом мутаций в серии. Этот дисбаланс выявляется сопоставлением числа базовых гаплотипов и числа мутаций в серии, с использованием логарифмического и «линейного» подхода, как обсуждалось выше.

Чем больше мутаций в гаплотипе, тем дальше он удален от «ствола» дерева, то есть от базовых гаплотипов. Мутации графически располагаются по уровням. Каждый уровень – одна дополнительная мутация. Из рис. 5.2.3.1.1 видно, как на дереве формируются ветви, хотя все они в данном случае происходят от одного общего предка, жившего 26 поколений назад.

Рис. 5.2.3.1.1. Дерево 6-маркерных гаплотипов семейства Мак-Доналдов гаплогруппы R1a1
(по данным Мак-Доналдов, 2007). В выборке – 68 гаплотипов.

 

При рассмотрении 68 12-маркерных гаплотипов оказалось, что среди них 42 базовых гаплотипа

13 25 15 11 11 14 12 12 10 14 11 31

и 44 мутации

Это даёт ln(68/42)/0.022 = 22±4 поколения до общего предка, если считать по базовым гаплотипам, и 44/68/0.022 = 29±5 поколений, если считать по мутациям.

Как видно, совпадение опять вполне приемлемое при расчёте обоими способами.

Рис. 5.2.3.1.2. Дерево 12-маркерных гаплотипов семейства Мак-Доналдов гаплогруппы R1a1
(по данным Мак-Доналдов, 2007). В выборке – 68 гаплотипов.

 

На самом деле точность и воспроизводимость расчётов в ДНК-генеалогии зачастую поражает, принимая во внимание неупорядоченную природу мутаций и их чистую случайность. Более того, расчёты довольно чувствительны к числу мутаций и числу немутированных гаплотипов в серии. Ведь если в рассмотренном примере в серии оказалось бы не 42, а 41 базовых гаплотипов, что более чем вероятно – проскочила одна лишняя мутация – и одним базовым гаплотипом меньше, то ln(68/41)/0.022 = 23, то есть одним поколением больше. Этот пример показывает, что мутации в гаплотипах довольно точно придерживаются системы.

Дерево 12-маркерных гаплотипов показано на рис. 5.2.3.1.2 видно, что оно начинает усложняться по сравнению с 6-маркерным. Число немутированных (базовых) гаплотипов по понятным причинам начинает уменьшаться, число мутаций расти.

А вот с 25-маркерными и 37-маркерными гаплотипами Мак-Доналдов таблица Чандлера дала сбой. Оказалось, что она включает на второй и третьей панели «сцепленные» маркеры, как DYS464a, b, c, d, и быстрые (см. таблицу Чандлера выше), которые «тянут одеяло» на себя, сводя к минимуму вклад большинства других маркеров.

Оказалось, что кажущиеся константы скоростей для 25-маркерных и 37-маркерных гаплотипов, полученные из таблицы Чандлера и приведенные выше, занижают времена жизни общих предков в полтора и два раза, соответственно, причем не только Мак-Доналдов, но и по любым сериям гаплотипов. В результате, после многих расчётов по многим сериям гаплотипов были приняты величины констант скоростей мутаций, приведенные в Таблице 5.2.3.1.2 для гаплотипов в 31 форматах, используемых в литературе.

 

Гаплотип в формате FthNA

Средняя величина константы скорости мутации на поколение (25 лет по условиям калибровки)

Примечания. Ссылки даны на работы, в которых рассматривались указанные гаплотипы

На гаплотип

На маркер

393-390-X-391-X-X-X-X-X-3891-X-3892

0.0108

0.00216

5-маркерный гаплотип [Cordaux et al, 2004]

393-X-19-X-X-X-X-388-X-3891-X-3892

0.0068

0.00135

5-маркерный гаплотип [Bittles et al, 2007]

393-390-19-391-X-X-X-388-X-X-392-X

0.0088

0.00147

6-маркерный гаплотип в «старом научном» формате: 19-388-390-391-392-393

393-390-19-391-X-X-X-X-X-3891-X-3892

0.0123

0.00205

6-маркерный гаплотип [Thanseem et al, 2006]

393-390-19-391-X-X-X-X-X-3891-392-3892

0.013

0.00186

7-маркерный гаплотип с пропущенными маркерами 385a, 385b, 426, 388, 439

393-390-19-391-X-X-X-388-X-3891-392-3892

0.013

0.00163

8-маркерный гаплотип с пропущенными маркерами 385a, 385b, 426, 439 [Zhivotovsky et al, 2004]

393-390-19-391-385a-385b-X-X-X-3891-X-3892

0.0168

0.00210

8-маркерный гаплотип с пропущенными маркерами 426, 439, 388, 392 [Contu et al, 2008]

393-390-19-391-385a-385b-X-Y-Z-3891-392-3892

0.017

0.00189

9-маркерный гаплотип с пропущенными маркерами 426, 388, 439

393-390-19-391-X-Y-Z-388-439-3891-392-3892

0.018

0.00198

9-маркерный гаплотип с пропущенными маркерами 385a, 385b, 426

393-390-19-391-385a-385b-X-388-Y-3891-392-3892

0.018

0.00180

10-маркерный гаплотип с пропущенными маркерами 426, 439

393-390-19-391-385a-385b-X-Y-439-3891-392-3892

0.022

0.00220

10-маркерный гаплотип с пропущенными маркерами 426, 388

393-390-19-391-X-Y-426-388-439-3891-392-3892

0.018

0.00180

10-маркерный гаплотип с пропущенными маркерами 385a, 385b

393-390-19-391-Х-Х-Х-388-439-3891-392-3892-(…)- 461

0.018

0.00180

10-маркерный гаплотип [Cinnioglu et al, 2004; Zhivotovsky et al, 2004; Sengupta et al, 2006]

393-Х-19-391-Х-Х-Х-Х-439-Х-Х-Х-(…)- 413a-413b-460-461-GATAA10-YCAIIa-YCAIIb

0.020

0.00182

11-маркерный гаплотип [Cruciani et al, 2007]

393-390-19-391-Х-Х-Х-388-439-3891-392-3892-(…)- 437-438

0.019

0.00176

11-маркерный гаплотип [Zalloua et al, 2008]

393-390-19-391-385a-385b-426-388-439-3891-392-3892

0.022

0.00183

12-маркерный гаплотип в формате FTDNA

393-390-19-391-385a-385b-X-Y-439-3891-392-3892-(…)-437-438

0.024

0.00200

12-маркерный гаплотип [Mertens, 2007]

393-390-19-391-X-X-X-388-439-3891-392-3892-(…)-YCAIIa-YCAIIb-460

0.024

0.00200

12-маркерный гаплотип [Fornarino et al, 2009; Battaglia et al, 2008]

393-390-19-391-X-X-X-388-439-3891-392-3892-(…)-YCAIIa-YCAIIb-461

0.021

0.00178

12-маркерный гаплотип [Chiaroni et al, 2009]

393-390-19-391-385a-385b-X-X-439-3891-392-3892-458-(…)-437-448-GATAH4-456-438-635

0.034

0.00200

17-маркерный гаплотип [Yfiler, FBI/National Standards) (Mulero et al., 2006]

393-390-19-391-Х-Х-Х-388-439-3891-392-3892-(…)-434-435-436-437-438-460-451-462

0.024

0.00141

17-маркерный гаплотип [King et al, 2007]

393-390-19-391-426-388-439-3891-392-3892-458-455-454-447-437-448-438

0.032

0.00188

17-маркерный гаплотип [Hammer et al, 2009]

393-390-19-391-385a-385b-X-388-439-3891-392-3892-(…)-434-435-436-437-438-460-461-462

0.0285

0.00150

19-маркерный гаплотип [Adams et al, 2008]

393-390-19-391-385a-385b-388-439-3891-392-3892-458-(…)-437-448-GATAH4-YCAIIa-YCAIIb-456-438-635

0.050

0.00250

20-маркерный гаплотип [Tofanelli et al, 2009]

393-390-19-391-385a-385b-426-388-439-3891-392-3892-458-459a-459b-455-454-447-437-448-449

0.038

0.00183

21- маркерный гаплотип c пропущенными маркерами DYS464a-d [Underhill et al, 2009]

393-390-19-391-385a-385b-426-388-439-3891-392-3892-458- 459a-459b-455-454- 447-437-448-449-438

0.047

0.00214

22-маркерный гаплотип [Hammer et al, 2009]

393-390-19-391-385a-385b-426-388-439-3891-392-3892-458-459a-459b-455-454-447-437-448-449-464a-464b-464c-464d

0.046

0.00184

25- маркерный гаплотип

393-390-19-391-385a-385b-426-388-439-3891-392-3892-458-459a-459b-455-454-447-437-448-449-464a-464b-464c-464d-460- GATAH4-YCAIIa-YCAIIb

0.055

0.00188

29-маркерный гаплотип

Стандартный 37-маркерный гаплотип

0.090

0.00243

37- маркерный гаплотип

393-390-19-391-385a-385b-426-388-439-3891-392-3892-458-459a-459b-455-454-447-437-448-449-(…)-460-YCAIIa-YCAIIb-456-442-438-444-446-461-441-445-452-462-469-T1B07-A10-C4-H4.1

0.071

0.00183

39-маркерный гаплотип [Underhill et al, 2009]

Стандартный 67-маркерный гаплотип

0.145

0.00216

67- маркерный гаплотип

Таблица 5.2.3.1.2. Средние значения констант скоростей мутаций на гаплотип и на маркер на поколение (25 лет по условиям калибровки) для 31 гаплотипа в разных вариантах формата, использующихся в литературе по ДНК-генеалогии и популяционной генетике. Величины рассчитаны по данным таблицы Чандлера (для гаплотипов с числом маркеров от 5 до 12), и калиброваны для более протяженных гаплотипов по серии гаплотипов семейства Мак-Доналдов, с некоторыми корректировками [Klyosov, 2009а, Клёсов, 2008d].

 

25-маркерных гаплотипов в списке Мак-Доналдов было 60 и дерево их гаплотипов приведено на рис. 5.2.3.1.3. Дело в том, что восемь человек ограничились при тестировании 12-маркерными гаплотипами. Видно, что дерево продолжает усложняться, и в нём осталось только 18 базовых и имеется 69 мутаций. Это даёт ln(60/18)/0.046 = 26±4 поколений до общего предка по числу базовых гаплотипов, и 69/60/0.046 = 25±4 поколений по числу мутаций.

Совпадение почти идеальное – и логарифмического метода с линейным, и с ожидаемым числом поколений до общего предка Мак-Доналдов. Базовый (предковый) 25-маркерный гаплотип Мак-Доналдов имеет вид:

13 25 15 11 11 14 12 12 10 14 11 31 16 8 10 11 11 23 14 20 31 12 15 15 16

Рис. 5.2.3.1.3. Дерево 25-маркерных гаплотипов семейства Мак-Доналдов гаплогруппы R1a1
(по данным Мак-Доналдов, 2007). В выборке – 60 гаплотипов.

 

Дерево 37-маркерных гаплотипов Мак-Доналдов приведено на рис. 5.2.3.1.4. Совершенно наглядная картина усложнения дерева при переходе к столь протяженным гаплотипам. Базовых гаплотипов не осталось, слишком высока вероятность, что они не выживут без мутаций на протяжении 26-ти поколений от общего предка. Точнее, остался один базовый гаплотип (номер 001 на дереве), но от него для расчетов пользы мало. Поэтому в данном случае базовый гаплотип определяется как тот, от которого ко всем остальным имеется наименьшее количество мутаций. Иначе говоря, он центровой, эквидистанционный в серии гаплотипов. Это понятно, поскольку от него и шли все мутации в гаплотипах потомков. Базовый 37-маркерный гаплотип выглядит так:

13 25 15 11 11 14 12 12 10 14 11 31 – 16 8 10 11 11 23 14 20 31 12 15 15 16 – 11 12 19 21 17 16 17 18 34 38 12 11

Здесь пунктирными линиями отделены панели гаплотипов – первая (1 – 12 маркеры), вторая (13 – 25 маркеры) и третья (26 – 37 маркеры). «Сцепленные» аллели 19 – 21 выделены (они имеют порядковые номера 28 и 29, если считать слева направо), это – характерные аллели для семейства Доналдов, отличающие их от гаплотипов практически всего мира. Речь об этом пойдёт ниже, а сейчас заметим, что аллели – это повторяющиеся нуклеотидные прогоны в соответствующих участках ДНК, называемых «маркерами», или «локусами». У Доналдов это прогоны повторены подряд 19 и 21 раз, соответственно. У восточных славян, например (той же гаплогруппы R1a1), они обычно повторяются 19 и 23 раза, соответственно. К этому мы ещё вернёмся.

Рис. 5.2.3.1.4. Дерево 37-маркерных гаплотипов семейства Мак-Доналдов гаплогруппы R1a1
(по данным Мак-Доналдов, 2007). В выборке – 59 гаплотипов.

 

На все 59 гаплотипов имеются 178 мутаций. Это дает 178/59/0.09 = 34 поколения до общего предка. Иначе говоря, с мутациями на этом дереве перебор. Рассмотрение мутаций сразу выявляет причину этого перебора. Всего один маркер из 37 дал пятую часть всех мутаций, а именно 36. Это – маркер CDYb, который в таблице Чандлера выше действительно зашкаливает по мутациям наряду с его близнецом CDYa, с которым они ещё и сцеплены. Если его снять, то получится 142/59/0.09 = 27±3 поколения до общего предка, что вполне приемлемо.

Этот пример показывает, что 37-маркерные гаплотипы могут давать сбои (но не всегда, хотя никогда заранее неизвестно, будет перебор с мутациями или нет), поэтому в равных ситуациях для расчётов предпочтительны 25-маркерные гаплотипы. Хотя часто 25-маркерные и 37-маркерные гаплотипы в сериях дают практически идентичные результаты. Это, конечно, наилучшее доказательство, что расчёт верный.

Рис. 5.2.3.1.5. Дерево 67-маркерных гаплотипов семейства Мак-Доналдов гаплогруппы R1a1
(по данным Мак-Доналдов, 2007). В выборке – 26 гаплотипов.

 

Наконец, на рис. 5.2.3.1.5 приведено дерево 67-маркерных гаплотипов Мак-Доналдов. В нём – 98 мутаций на все 26 гаплотипов, что дает 98/26/0.145 = 26±4 поколений до общего предка. Опять замечательная сходимость с результатами других расчётов и с данными «классической» генеалогии.

Эти примеры показывают, что расчёты как по базовым гаплотипам, так и по мутациям дают воспроизводимые данные, и это показано уже на десятках серий гаплотипов самых разных гаплогрупп. Прежние сомнения, что скорость мутации может на самом деле меняться при переходе к древним сериям гаплотипов (то есть происходящих от древних предков, тысячи и десятки тысяч лет назад) были развеяны недавней работой [Sun et al, 2009], выполненной совместным коллективом Гарвардского университета и Массачуссетского технологического института, согласно которой маркеры в гаплотипах представляют собой точные «молекулярные часы» с постоянной средней скоростью мутаций на протяжении как минимум 2 миллиона лет.

Это было показано сопоставлением почти тысячи маркеров в человеческих популяциях по всему миру и сотен маркеров в шимпанзе, наряду с анализом нуклеотидных последовательной всего генома. В этой же работе было показано, что наиболее древние популяции человечества – это популяции африканских племен Сан, пигмеев Биака и пигмеев Мбути, и что африканские популяции отделены генным «разрывом» от неафриканских популяций человека. Это, пожалуй, наиболее убедительная работа, свидетельствующая об Африке как прародине современного человека, наших современников.

Возвращаемся к семейству Мак-Доналдов.

К концу прошлого, 2008 года, в списке Мак-Доналдов было уже 84 человека (25-маркерное дерево гаплотипов приведено на рис. 5.2.3.1.6):

 

Рис. 5.2.3.1.6. Дерево 25-маркерных гаплотипов семейства Мак-Доналдов гаплогруппы R1a1
(по данным Мак-Доналдов, 2008). В выборке – 84 гаплотипов.

 

В этой, новой серии гаплотипов –

12-маркерные гаплотипы – 52 базовых (из 84), 44 мутации

25-маркерные гаплотипы – 21 базовый (из 84), 109 мутаций

Базовые гаплотипы были, естественно, теми же. Это дало:

12 – маркерные гаплотипы:

ln(84/52)/0.022 = 22±4 поколений до общего предка, и

44/84/0.022 = 24±4поколения,

25 – маркерные гаплотипы:

ln(84/21)/0.046 = 30±7 поколений до общего предка, и

109/84/0.046 = 28±4 поколений

В среднем эти средние значения дают 26±4 поколения до общего предка Мак-Доналдов. Как видно, увеличение выборки от 68 до 84 приводит к тому же результату.

В середине 2009 года число гаплотипов в серии возросло до 102, но при этом был расширен круг членов «семейства». Были введены те, кто ведёт свой род не от Джона Лорда островов, а от его предка, Сомерледа, который по легендам жил в 12-м веке. Число мутаций в гаплотипах серии сразу резко увеличилось.

102 гаплотипа Мак-Доналдов в 25-маркерном формате содержат 156 мутаций, что дает 156/102/0/046 = 33 поколения, то есть 825±110 лет до общего предка. Это – граничный период времени, когда надо вводить поправку на возвратные мутации, что увеличивает полученную величину до 34 поколений до общего предка, то есть 850±110 лет назад. Это – 12-й век (плюс-минус столетие) до нашей эры. Действительно, времена Сомерледа. Иначе говоря, введенные в список гаплотипы вели свою линию действительно от Сомерледа (или от его современника), что и привело к уходу времени жизни общего предка всех 102 гаплотипов в более древние времена, в 12-й век. Как видно, результаты расчётов весьма чувствительны к времени жизни общих предков.

Собственно, показать это – и была цель данного раздела. Читателю теперь должно быть ясно, что расчёты времён жизни общего предка – это не какая-то забава, это – операция, которая основана на прочном фундаменте, и которая позволяет достаточно надёжно рассчитывать абсолютные времена начала генеалогических линий. А это, в свою очередь, связано с определёнными историческими событиями – миграциями народов, войнами, природными катаклизмами, переселениями предков на новые места.

Это – порой бесценная информация для археологии, антропологии, истории, лингвистики.

Мы рассмотрим это ниже на десятках конкретных примерах. Но чтобы поместить данные о семействе Мас-Доналдов в определённый, более широкий исторический контекст и проиллюстрировать ещё одну особенность ДНК-генеалогии в этой, постановочной главе, рассмотрим, с какой популяцией сопряжены Мак-Доналды на общем дереве гаплотипов гаплогруппы R1a1 (рис. 5.2.3.1.7). На нём – около девятисот 25-маркерных гаплотипов Европы и Азии (на дереве есть немало гаплотипов США и Канады; в тех случаях, когда в базе данных были приведены места жительства наиболее удалённых предков «классической генеалогии), известных носителю гаплотипа; во всех случаях это была Европа или Азия).

Рис. 5.2.3.1.7. Дерево 25-маркерных гаплотипов европейского и азиатского происхождения гаплогруппы R1a1
(по данным базы YSearch, 2009). В выборке – 890 гаплотипов [Рожанский и Клёсов, 2009].

 

На этом дереве можно выявить 14 отдельных ветвей гаплотипов, каждая со своим общим предком. Одна из этих ветвей имеет сочетание аллелей (то есть числа повторов нуклеотидных прогонов в маркерах, как отмечалось выше), характерное для семейства Мак-Доналдов. «Сцепленные» маркеры под номерами 28 и 29, если считать слева направо в базовых гаплотипах ветвей гаплогруппы R1a1, обычно имеют аллели 19 – 23 (эти маркеры имеют индексы YCAII a и b), а у всех до одного членов семейства Доналдов, для которых был проведён анализ ДНК, там 19 – 21.

Поэтому на дереве гаплотипов образовалась отдельная ветвь для всех 19 – 21, и тех, кто от них немного мутировал, но сохранил общую структуру гаплотипа. Таких оказалось 105 67-маркерных гаплотипов, то есть в формате гаплотипов наивысшего разрешения. 65 из них представлены семейством Мак-Доналдов (помечены буквами mc на дереве гаплотипов на рис. 5.2.3.1.8), остальные обычными номерами. На дерево 25-маркерных гаплотипов (рис. 5.2.3.1.7) они не нанесены, чтобы не усложнять его ещё больше.

Рис. 5.2.3.1.8. Дерево из 40 67-маркерных гаплотипов ветви YCAII=19,21 и ближайших мутаций и
65 67-маркерных гаплотипов «клана Доналдов» с YCAII=19,21 (http://dna-project.clan-donald-usa.org/tables.htm). Последние помечены индексом mc.

 

Видно, что дерево состоит из двух частей – слева более старые гаплотипы, числом 36; справа и в верхней части – более молодые, числом 69, почти исключительно гаплотипы «клана Доналда». Среди них – только четыре гаплотипа, которые не занесены в таблицу «клана». Гаплотипы «клана Доналда» в левой широкой ветви полностью отсутствуют.

Все 36 гаплотипов старой, левой ветви содержат 152 мутации от следующего базового гаплотипа

13 25 15 11 11 14 12 12 10 13 11 30 – 15 9 10 11 11 23 14 20 32 12 15 15 16

что даёт 2550±330 лет до общего предка ветви. Это – середина первого тысячелетия до н.э. Как показало более детальное исследование [Рожанский и Клёсов, 2009], этот предок жил на Русской равнине, если следовать данным археологии и древним скандинавским сказаниям. В свою очередь, этот предок на Русской равнине продолжил род более древнего общего предка, который жил примерно 4400 лет назад, и который имел почти исключительно пару 19,23 в маркерах YCAII. Где жил этот древний предок – пока неизвестно, но предположительно он принадлежал археологической культуре шнуровой керамики в Центральной Европе. Там были обнаружены останки носителей R1a1 давности 4600 лет назад (Eulau в Германии, см. [Haak et al, 2009]), и оттуда предположительно было направление миграции R1a1 примерно 6 – 5 тысяч лет назад, которое заложило ямную, срубную и андроновскую культуру при движении на восток.

В середине 1-го тысячелетия н.э., в ходе Великого переселения народов, было обратное движение R1a1 на запад, в Центральную Европу и в Скандинавию. Вполне вероятно, что пара 19,21 в маркерах YCAII образовалась на Русской равнине и принесена в Скандинавию, оттуда – на Британские острова. Среди современных носителей R1a1 на Русской равнине этой пары 19,21 пока не обнаружено. Возможно, в те времена её имели единичные носители, которые и перешли в Скандинавию. Или остальные носители и/или их потомки не выжили.

Вторая, более «молодая» половина дерева гаплотипов на рис. 5.2.3.1.8, включающая почти исключительно «клан Доналда», имеет 100 мутаций на 69 гаплотипов, что даёт 825±120 лет до общего предка с гаплотипом

13 25 15 11 11 14 12 12 10 14 11 31 – 16 8 10 11 11 23 14 20 31 12 15 15 16

Это – практически абсолютное совпадение со временем жизни общего предка 850±110 лет назад, но рассчитанное по 102 25-маркерным гаплотипам. Этот гаплотип происходит непосредственно от скандинавской популяции возрастом 1700±220 лет, предположительно пришедший в Скандинавию в ходе Великого переселения народов, в середине первого тысячеления нашей эры:

13 25 15 11 11 14 12 12 10 14 11 31 – 15 9 10 11 11 23 14 20 32 12 15 15 16

Первые 12 маркеров у них вообще идентичны (отмечены мутации во второй панели маркеров). На самом деле там не три мутации, а 2.2 (0.70+0.76+0.78), что и даёт указанную разницу в «возрасте» общих предков.

Итак, выстраивается следующая картина. Исходный общий предок рассматриваемой серии скандинавских гаплотипов жил примерно 4400 лет назад, предположительно в Европе, в регионе культуры шнуровой керамики. Его прямые потомки продвинулись на восток, на Русскую равнину («Великий Свитьод» в скандинавских легендах и сагах), и 2550±330 лет назад, в середине первого тысячелетия до н.э. у его потомков на Русской равнине, или в ходе миграции на запад появилась мутация в YCAII c переходом от 19,23 в 19,21, возможно, через промежуточную форму 19,22, которая не получила развития. В середине 1-го тысячелетия н.э., в ходе Великого переселения народов, мигрантами R1a1 в Скандинавию было дано начало ДНК-генеалогической линии, продолжающей мутацию 19,21. Потомками этой линии были Сомерлед и Джон, Лорд Островов, которые дали начало знаменитому «клану Доналда» с его боевой историей, описанной во многих книгах и исторических документах.

Этот довольно подробный пример, как и весь раздел, даётся с единственной целью – показать, что расчеты по гаплотипам имеют надёжную основу, и позволяют проводить исторические реконструкции, как правило, не сами по себе, а в совокупности с независимыми данными. При этом независимые данные (история, археология, лингвистика) или подтверждаются, что придаёт им дополнительное обоснование и весомость, или не подтверждаются, что делает рассмотрение ещё более интересным и важным. Вот именно там, в узлах противоречий, и ожидают нас интересные открытия.

 

4. Определения.

5. Общие принципы ДНК-генеалогии.

5.1. Введение.

5.2. Систематическое рассмотрение основ и принципов ДНК-генеалогии.

5.2.1. Основные положения ДНК-генеалогии.

5.2.2. «Научные» и «коммерческие» выборки гаплотипов.

5.2.3. Кинетика мутаций гаплотипов, их калибровка и проверка. Принципы датировки. Основа исторических реконструкций.

5.2.3.1. Семейство Мак-Доналдов, таблица Чандлера и деревья гаплотипов.