Анатолий А. Клёсов
ОГЛАВЛЕНИЕ
1. Откуда появились славяне и «индоевропейцы» и где их прародина?
2. Гаплотипы восточных славян — девять племён?
3. Гаплотипы угро-финских русских северных славян: семь племен?.
4. Еще о финно-угорских гаплотипах: история о «Великом Князе Всея Руси», современном «предводителе дворянства».
5. Гаплотипы южных и балтийских русских славян: четверо племён?
6. ДНК-генеалогия против «норманнской теории»
7. Хинди-руси бхай-бхай с точки зрения ДНК генеалогии, или откуда есть пошли славяне
8. «Служба кровию и смертию». Дворяне и дети боярские
9. Сe – человек. Часть первая – о мужчинах
10. Сe – человек. Часть вторая – о женщинах
11. Умереть за княжну
12. Древние арии: кто они были, и откуда?
13. Основные положения ДНК-генеалогии (хромосома Y), скорости мутаций, их калибровка и примеры расчетов
14. Ответы на вопросы радиослушателей передачи агентства русской информации (АРИ)
15. Обращения читателей и персональные случаи ДНК — генеалогии.
16. Приложение к очерку «Откуда появились славяне и индоевропейцы» . Деревья гаплотипов и расчеты
17. Приложение: руководство к расчету времен до общего предка гаплотипов Y-хромосомы
Приложение
РУКОВОДСТВО К РАСЧЕТУ ВРЕМЕН ДО ОБЩЕГО ПРЕДКА ГАПЛОТИПОВ Y-ХРОМОСОМЫ
Практика настоятельно требует создания набора простых приемов, которые позволят максимально упростить расчет времен до общего предка. Эти приемы должны включать пять стадий.
Первое – убедиться, что для рассматриваемой выборки гаплотипов есть всего один предок, или соответствующий ему эквивалент. Эквивалентом могут быть братья или другие близкие родственники (что уже находится вне предела разрешения методами ДНК-генеалогии). Суть в том, что определенное количество поколений или лет назад существовал определенный базовый, или предковый гаплотип, от которого началась разветвленная последовательность мутаций, которая и привела к рассматриваемой выборке гаплотипов потомков предка, общего для данной выборки. Для того, чтобы убедиться, что выборка «однородная», то есть происходит от одного общего предка, есть несколько приемов.
Один – это построение дерева гаплотипов, которое должно сходиться к одному гаплотипу. Это и есть базовый, или предковый гаплотип. Иначе говоря, при наличии одного предка для всей выборки – в дереве гаплотипов не должно быть выраженных ветвей, идущих от основания дерева. Базовый гаплотип может быть равен предковому, и присутствовать в выборке, причем порой во множественных копиях, а может быть получен минимизацией мутаций в гаплотипах выборки. В таком случае полученный базовый гаплотип не обязательно идентичен предковому, и может быть всего некоторым приближением. Для другого приема необходимо сравнить времена для общего предка, рассчитанные с применением линейной и логарифмической модели. Здесь линейной моделью называется вариант применения формулы n/N/μ = t, где t – время до общего предка в поколениях, n – количество мутаций во всех N гаплотипах выборки, μ – средняя скорость (частота) мутаций, выраженная в числе мутаций на гаплотип на поколение. Логарифмическая модель рассматривает не число мутаций, а число базовых гаплотипов в выборке, то есть основывается на принципиально другом рассмотрении выборки гаплотипов. В этом случае необходимо сосчитать число базовых, идентичных гаплотипов в выборке, оценить число поколений до общего предка по формуле ln(N/m)/μ = tln, где m – количество базовых (идентичных) гаплотипов в выборке, tln – время до общего предка в поколениях, остальные обозначения приведены выше. Если t = tln (в разумных пределах, например, в пределах 10%), то общий предок один. Если эти две величины значительно различаются (например, в 1.5-2 раза и более) – выборка определенно гетерогенна в отношении общих предков, и таблица ниже, как и формулы выше, неприменимы для расчетов времен до общего предка. В таких случаях выборки необходимо разделять, используя дерево гаплотипов, как описано выше.
Другими словами, для однородной выборки, имеющей одного общего предка, число мутаций в гаплотипах должно согласовываться с числом базовых гаплотипов в выборке.
Очень важно, что если критерий наличия одного общего предка для выборки гаплотипов не соблюдается, или просто не рассматривался, то таблицы, данные ниже, применять некорректно. Полученный результат с большой вероятностью будет относиться к некоему фантомному общему предку, который на самом деле может оказаться суперпозицией времен до разных предков, порой разделенных тысячелетиями.
Второе – это сосчитать число мутаций в данной выборке гаплотипов. Число мутаций следует считать по отношению к базовому гаплотипу, выявленному на первой стадии расчетов (см. выше).
Третье – это рассчитать среднее число мутаций на маркер для всех гаплотипов выборки, имеющей общего предка. Например, если на двадцать 7-маркерных гаплотипов приходится 65 мутаций, то среднее числе мутаций на маркер равно 65/20/7 = 0.464.
Четвертое – это пересчитать среднее число мутаций на условную скорость мутаций, равную 0.00200 мутациям на маркер на поколение. Дело в том, что каждый маркер имеет свою скорость мутаций, и в зависимости от набора маркеров в гаплотипе их средняя скорость мутаций разная. Эти скорости мутаций даны выше в таблице в очерке 13 (стр. 271) для наиболее часто рассматриваемых гаплотипов. Например, для 7- маркерных гаплотипов (продолжая пример выше) средняя скорость мутаций равна не 0.00200, а 0.00186 мутаций на гаплотип на поколение. Поэтому в пересчете на такую среднюю скорость 65 мутаций в двадцати 7- маркерных гаплотипах даст не 0.464 мутаций на маркер, а 0.464х2/1.86 (это – упрощенное 0.464×0.002/0.00186) = 0.499. Это – для условного гаплотипа, имеющего скорость мутаций 0.002 на маркер на поколение.
Пятое – применить таблицу (см. ниже), которая дает поправку на возвратные мутации. Например, среднему числу мутаций 0.499 на маркер (при скорости мутаций 0.002 на маркер на поколение) соответствует 331 поколение в таблице ниже, то есть 8275 лет до общего предка для 20 носителей данных гаплотипов.
Без такого пересчета нам пришлось бы давать 11 таблиц по типу приведенной здесь таблицы, по одной на каждый формат гаплотипа (а их двадцать в таблице в очерке 13 на стр. 271).
Если ограничиться только линейной моделью, без учета возвратных мутаций, то 65 мутаций в двадцати 7-маркерных гаплотипах дадут всего 65/20/0.013 = 250 поколений до общего предка, вместо 331 поколений (с учетом возвратных мутаций). Вместо 8275 лет до общего предка получится 6250 лет, на две с лишним тысячи лет меньше. Если применить скорости мутаций не на гаплотип, а на маркер, которые тоже даны в таблице в очерке 13 (стр. 271), то получится 65/140/0.00186 = 250 поколений, то есть то же самое, с той же большой ошибкой (без учета возвратных мутаций), что и при применении скоростей на маркер.
Таблица, приведенная ниже, позволяет вносить вклад возвратных мутаций и в число поколений до общего предка, рассчитанное с помощью простой линейной модели, или с помощью логарифмической модели, в которой тоже не учтены возвратные мутации. Например, находим 250 поколений до общего предка, рассчитанные выше для 65 мутаций в двадцати 7- маркерных гаплотипов (линейная модель, без учета возвратных мутаций), во второй колонке таблицы ниже, и читаем – 331 поколение, или 8275 лет с учетом возвратных мутаций.
Таблица.
Число поколений (25 лет на условное поколение по калиброванным данным) и лет, рассчитанные для средних значений мутаций на маркер для скорости мутаций 0.002 мутаций на маркер на поколение.
Для гаплотипов, для которых средняя скорость мутаций отличается от 0.002 (см. табл. в разделе 13, стр. 271, третья колонка) среднее число мутаций на маркер должно быть соответственно пересчитано.
Если число поколений до общего предка рассчитано по линейной модели, без учета возвратных мутаций, и для приведенного выше примера равно 65/(20×0.013) = 250 поколений до общего предка, то по таблице ниже находится, что это число, приведенное во второй колонке, соответствует 331 поколению с учетов возвратных мутаций.
За основу данной таблицы взята сокращенная таблица, опубликованная в работе (Адамов и Клёсов, 2008).
Среднее число мутаций на маркер
|
Число поколений до общего предка выборки |
Число лет до общего предка выборки с учетом возвратных мутаций |
|
для линейной модели |
с учетом возвратных мутаций |
||
0.002 |
1 |
1 |
25 |
0.004 |
2 |
2 |
50 |
0.006 |
3 |
3 |
75 |
0.008 |
4 |
4 |
100 |
0.010 |
5 |
5 |
125 |
0.012 |
6 |
6 |
150 |
0.014 |
7 |
7 |
175 |
0.016 |
8 |
8 |
200 |
0.018 |
9 |
9 |
225 |
0.020 |
10 |
10 |
250 |
0.022 |
11 |
11 |
275 |
0.024 |
12 |
12 |
300 |
0.026 |
13 |
13 |
325 |
0.028 |
14 |
14 |
350 |
0.030 |
15 |
15 |
375 |
0.032 |
16 |
16 |
400 |
0.034 |
17 |
17 |
425 |
0.036 |
18 |
18 |
450 |
0.038 |
19 |
19 |
475 |
0.040 |
20 |
20 |
500 |
0.042 |
21 |
21 |
525 |
0.044 |
22 |
22 |
550 |
0.046 |
23 |
23 |
575 |
0.048 |
24 |
25 |
625 |
0.050 |
25 |
26 |
650 |
0.052 |
26 |
27 |
675 |
0.054 |
27 |
28 |
700 |
0.056 |
28 |
29 |
725 |
0.058 |
29 |
30 |
750 |
0.060 |
30 |
31 |
775 |
0.062 |
31 |
32 |
800 |
0.064 |
32 |
33 |
825 |
0.066 |
33 |
34 |
850 |
0.068 |
34 |
35 |
875 |
0.070 |
35 |
36 |
900 |
0.072 |
36 |
37 |
925
|
0.074 |
37 |
38 |
950
|
0.076 |
38 |
40 |
1000
|
(В таблице, приведенной в книге, есть расчетные данные до 180000 лет)
Литература
Клёсов, А.А. (2008) Основные положения ДНК-генеалогии (хромосома Y), скорости мутаций, их калибровка и примеры расчетов. Вестник Российской Академии ДНК-генеалогии, т. 1, вып. 2 (июль), стр. 252-348.
Адамов, Д.С. и Клёсов, А.А. (2008) Теоретическая и практическая оценка возвратных мутаций в гаплотипах Y-хромосомы. Вестник Российской Академии ДНК-генеалогии, т. 1, вып. 4 (октябрь), стр. 631-645.
Chandler, J.F. (2006) Estimating per-locus mutation rates. J. Genetic Genealogy 2, 27-33.
Полный текст«Происхождение славян и других народов. Очерки ДНК-генеалогии» в формате pdf, 645 стр., (9649 Кб)