«Научные» и «коммерческие» выборки гаплотипов

5.2.2. «Научные» и «коммерческие» выборки гаплотипов

Выборки гаплотипов, которые публикуются в научной литературе, часто бедны, немногочисленны и урезаны, и, как правило, относятся только к коротким, шестимаркерным гаплотипам, намного реже к 8- или 10-маркерным, ещё реже в 17- или 22-маркерным. Впрочем, в последнее время ситуация стала улучшаться, и чаще стали типировать 17-маркерные гаплотипы. Гаплотипы с 25, 37 и 67 маркерами в научной литературе не приводятся, на это у учёных просто нет средств. Да и задачи в основном другие, опять же из-за отсутствия достаточных средств. Зато в коммерческих базах данных таких протяженных, полновесных гаплотипов — тысячи. Но в науке к таким базам данных — предубеждение. Работает научный снобизм — выборки «ненаучные», кто хотел — тот и прислал свой материал на тестирование, контроля за «контингентом пользователей» — никакого.

В работах одного из авторов настоящей книги этот разрыв между «наукой» И «коммерцией» был практически закрыт, то есть было показано, что в подавляющем большинстве случаев «научные» и «коммерческие» выборки приводят к одним и тем же результатам, только «коммерческие» зачастую точнее. Коммерческие базы данных предоставляют значительно более полную и многочисленную информацию по гаплотипам и позволяют получать более полные и более надёжные данные.

Естественно, есть крайние случаи, когда выборки содержат ошибочные гаплотипы, гаплогруппы или гаплотипы неправильно типированы, но и научные выборки не гарантируют от присутствия ошибок. Естественно, надо внимательно относиться к «коммерческим» выборкам, удалять из них дубли, и вообще осмысливать полученные данные, но это и к научным выборкам относится.

Редкий пример предположительно искаженных выборок — это коммерческие выборки по африканским гаплотипам (см.ниже в этой книге). Они составлены из гаплотипов тех, кто направил образцы своих ДНК в коммерческие лаборатории (как правило, в США) и смог оплатить анализ стоимостью в 150 — 300 долларов. Вряд ли в их число входят обитатели удалённых африканских племён. Это, как правило, образованные афро-американцы. Понятно, что среди их предков, доставленных в виде рабов в Америку, были и представители удалённых племён, и именно это и даёт время жизни их общего предка до 28 тысяч лет назад в гаплогруппе А и 37 тысяч лет назад по гаплогруппам А и В совместно. Тем не менее, можно ожидать, что реальные цифры окажутся заметно более древними.

Подобный пример можно привести и по индийцам. Коммерческие базы данных приводят гаплотипы почти исключительно индийцев-«индоевропейцев» носителей гаплогруппы R1a1, с гаплотипами, практически идентичными европейским, в частности, гаплотипам R1a1 этнических русских (гаплотип одного из авторов настоящей книги практически неотличим от индийских гаплотипов гаплогруппы R1a1 и находится на одной ветви дерева гаплотипов с индийцами, поляками, и сербами), и принципиально с тем же, европейским, возрастом общего предка, только на 800 лет «моложе» (примерно 4000 лет).

Потому и «индоевропейцы», оттого и индоевропейская семья языков. А вот гаплотипы некоторых индийских удалённых племён, имея ту же гаплогруппу R1 а1, значительно древнее, с общим предком 8 — 12 тысяч лет. Но в коммерческих базах данных представителей удалённых племён практически нет, их гаплотипы получены только в ходе научных экспедиций. Впрочем, оказалось, что и в некоторых племенах в индийских джунглях (например, племени Ченчу) гаплотипы «индоевропейские» И С возрастом около 3000 лет назад. Так что бывают и плохо предсказуемые варианты.

Но так бывает нечасто, а именно, когда разные группы населения одной страны или территории имеют совершенно разную историю в пределах одного рода. В Индии – почти уникальный случай, когда один и тот же род прибыл на одну территорию (хотя и обширную) с интервалом в 10 тысяч лет, и с тех пор практически не перемешивался. Для этого нужно иметь прочную кастовую структуру общества.

В качестве противоположного примера приведём сопоставление «научных» и «коммерческих» выборок по гаплотипам евреев гаплогрупп J1 и J2. До последнего времени их практически не разделяли. В самой известной статье по гаплотипам евреев [Behar et al, 2003] приведено почти двести гаплотипов, объединённых в одну сводную гаплогруппу J. А вот в коммерческой базе данных евреи есть и в разделе «Гаплогруппа J1», и в разделе «Гаплогруппа J2». Но можно ли использовать коммерческую базу данных, которая составлена добровольным участием, хотя и за деньги? А как же научные принципы формирования выборок?

Сравним научную выборку [Behar et al, 2003] и коммерческую.

В научной выборке — 194 гаплотипа евреев, имеющих гаплотипы группы J. Из них 91 гаплотип, или 47%, представляют один и тот же

14-16-23-10-11-12

который по правилам ДНК-генеалогии следует назвать базовым, или предковым гаплотипом. Действительно, он один сохраняется длительное время, а все остальные представляют его мутированные варианты, расходящиеся статистически по частным случаям — с одной мутацией там или здесь, с двумя, с тремя и так далее. Вот и набегают 103 мутированных гаплотипа из 194, каждого понемногу.

А в коммерческой выборке? В ней — 90 гаплотипов евреев, все гаплогруппы J1. Это — все, кто там оказались, судя по именам и фамилиям. Всего в этой базе данных 294 гаплотипа гаплогруппы J1, так что евреи в ней занимают немалую долю, около трети. Из остальных — определенно многие тоже евреи, но с нехарактерными (на наш взгляд) для евреев именами и фамилиями, а таюке арабы и другие обладатели гаплотипов группы J1. И из этих выбранных 90 «коммерческих» гаплотипов 41 — той же самой структуры

14-16-23-10-11-12.

Это — 46%. В «научной» выборке было 47%. То есть практически полное совпадение по доле базовых гаплотипов в научной и коммерческой выборках. Это, кстати, тот самый «модальный гаплотип коэнов». Он же «гаплотип двенадцати колен израилевых» в 6-маркерном варианте.

Хорошо, по доле базовых гаплотипов научная выборка, со всеми положенными критериями объективности, и научная, и коммерческая база дали совпадающие результаты. А по мутациям?

В научной выборке 194 гаплотипа содержат 263 мутации, или 1.36 мутации на гаплотип. В коммерческой — 90 гаплотипов содержат 123 мутации, то есть 1.37 мутации на гаплотип. Совпадение — лучше не бывает.

Другими словами, обе выборки дают практически идентичные результаты. По этим мутациям можно посчитать и время, когда жил общий предок и тех евреев, его потомков, что нашли отражение в научной базе (сводная гаплогруппа J), и тех, что в коммерческой (гаплогруппа J1). Это на самом деле физически разные потомки. 194 человека, гаплотипы которых попали в научную статью, были протестированы в конце 1990-х – начале 2000-х годов и бесплатно, в коммерческой базе данных — недавно (в основном 2005 — 2007 гг.) и за деньги.

В простейшем случае расчёты общего предка ведутся, принимая (по умолчанию) простое симметричное дерево мутаций. То есть дерево в виде симметричной пирамиды (или шестерёнки в другом формате, который мы здесь обычно используем), сходящейся вниз к гаплотипу общего предка (см. рисунки ниже). Что-то наподобие обычного генеалогического древа, но если в последнем порядок поколений уже заложен, то в дереве гаплотипов поколения беспорядочно упрятаны в ветвях. Чем больше в гаплотипе мутаций – тем дальше гаплотип отстоит от основания «шестерёнки», тем от более древнего предка он происходит, если в «дереве» смешаны гаплотипы потомков разных предков. То есть, гаплотипы недавнего предка жмутся у основания, гаплотипы древнего предка уходят вдаль в виде неких протуберанцев. Это и даёт основания для расчётов.

Как уже упоминалось и как будет показано ниже, средняя скорость мутации шестимаркерных гаплотипов, таких, как приведены выше — 0.0088 мутации на гаплотип на поколение. И тогда приведённые выше 1.36 мутации на гаплотип дадут 155 поколения (183 поколения — с поправкой на возвратные мутации) до общего предка, а 1.37 мутации на гаплотип дадут 156 поколения до общего предка (184 поколения — с поправкой). То есть примерно 4600 лет, считая 25 лет на поколение.

Казалось бы, можно объявить, что на двух разных выборках евреев, одна общей гаплогруппы J, другая – гаплогруппы J1 получено, что общий предок ближневосточных евреев жил 4600 лет назад. И с Ветхим Заветом примерно сходится, ну, может, на несколько веков больше по сравнению с известными толкованиями.

Но это не так. Потому что для срока в 184 поколения, или 4600 лет, слишком много сохранилось базового, предкового гаплотипа. Почти половина от гаплотипов в выборке. Его должно быть меньше.

А сколько меньше? И вот здесь работает способ расчёта, связывающий долю оставшегося нетронутым базового гаплотипа и временем до общего предка, причём независимо от числа мутаций. Чтобы понять, как рассматривать гаплотипы в отношении их происхождения, нам придётся заняться немного математикой и картинками «деревьев гаплотипов».

 

4. Определения.

5. Общие принципы ДНК-генеалогии.

5.1. Введение.

5.2. Систематическое рассмотрение основ и принципов ДНК-генеалогии.

5.2.1. Основные положения ДНК-генеалогии.

5.2.2. «Научные» и «коммерческие» выборки гаплотипов.

5.2.3. Кинетика мутаций гаплотипов, их калибровка и проверка. Принципы датировки. Основа исторических реконструкций.

5.2.3.1. Семейство Мак-Доналдов, таблица Чандлера и деревья гаплотипов.