Генографический проект
Изучать этногеномику начали в 1980-х годах, когда компьютеры еще не обладали таким быстродействием, а методы анализа ДНК были на несколько порядков медленнее и дороже нынешних. Сейчас самый простой, но достаточно полный анализ индивидуальной молекулярной генеалогии, по 12 маркерам Y-хромосомы, стоит $100–150, а более чем достаточный, по 37 маркерам Y-ДНК + полный тест митохондриальной ДНК, – около $400. Базы данных на десятки тысяч образцов ДНК есть у ряда коммерческих фирм и общественных институтов, и большинство из них (с определенными ограничениями на допуск к персональной информации) открыты для всех. За счет интереса людей к своим индивидуальным родословным информация в этих базах накапливается быстрее, чем ученые успевают ее обработать. Самое грандиозное из исследований целых популяций – Genographic Project («Генографический проект»), начатый в 2005 году Национальным географическим обществом США (National Geographic Society) при поддержке компании IBM. Цель проекта – за пять лет собрать не менее 100 000 образцов ДНК типичных представителей народов или племен, история которых известна по данным этнографии, истории и археологии, чтобы уточнить пути миграций человечества по Земле. На самом деле и такая огромная выборка – капля в море по сравнению с реальным разнообразием рас и племен, но по мере добавления информации результаты можно будет уточнять. Даже черновой план, составленный участниками проекта под руководством доктора Спенсера Уэллса, – захватывающее зрелище, особенно в виде интерактивной карты на сайте проекта. Но для начала разберемся с терминами.
Молекулярная генеалогия
При образовании половых клеток из диплоидных клеток-предшественников их соматические хромосомы (а у женщин – и половые) обмениваются участками – примерно так, как происходит, если не слишком тщательно перетасовать две колоды карт с рубашками разного цвета и снова разложить их на два одинаковых набора независимо от цвета рубашек. По четверти генома мы получаем от каждого из двух дедушек и двух бабушек, 1/8 – от прадедов и прабабок... В наших хромосомах есть гены не только Адама и Евы, но и всех их близких и дальних родственников, живших 70–80 тысяч лет назад, когда численность нашего вида снизилась до критической величины – примерно 10 000 особей, и более далеких предков, вплоть до первых млекопитающих и даже первых многоклеточных животных. Но от них мы получили только соматические и X-хромосомы, гены которых в результате постоянного перемешивания расплываются по всей популяции. Почти неизменными из поколения в поколение переходят только Y-хромосома и митохондриальная ДНК. На этом «почти» и основана вся молекулярная генеалогия, изучающая историю по мутациям, произошедшим у предков и сохранившимся в ДНК потомков.
Мутации: полезные, вредные и нейтральные
Обычно крупные мутации – например, перемещение на другое место, удвоение или, наоборот, выпадение крупного участка хромосомы, несущего один или несколько генов, – не приводят ни к чему хорошему. Как, впрочем, и часто встречающиеся одиночные нуклеотидные полиморфизмы – SNP (см. врезку), если они происходят в пределах одного из 21 000 человеческих генов.
Полезные мутации происходят намного реже и сохраняются в последующих поколениях. Вредные – удаляются из популяции вместе с носителем или еще на стадии эмбриона, или, при тяжелой наследственной болезни, до того, как этот носитель успеет обзавестись потомством. В результате действия стабилизирующего отбора и происходивших время от времени снижений численности вида, уменьшающих его генетическое разнообразие, строение генов у двух выбранных наугад людей совпадает на 99,9%. Все наши отличия, от цвета кожи и разреза глаз до роста и склонности к определенным болезням, определяют в основном генные полиморфизмы – незначительные различия в нуклеотидных последовательностях практически одинаковых генов и, соответственно, в строении и функциях закодированных в этих генах белков.
Во-первых, случайные мутации происходят постоянно, и полиморфизмами считают те из них, которые произошли давно и поэтому встречаются чаще, чем у 1% людей в данной популяции (граница здесь условная – можно было бы считать случайными и варианты генов, встречающиеся реже, чем у 2–3%). Во-вторых, полиморфизмы не оказывают заметного влияния на здоровье их носителей или даже носят приспособительный характер. Правда, и здесь граница довольно размытая. Классический пример – SNP, обусловливающий у гомозигот – носителей двух мутантных генов – тяжелое наследственное заболевание, серповидноклеточную анемию. Но гетерозиготы по этому гену – носители здорового варианта на одной хромосоме и «испорченного» на другой – реже болеют малярией, а симптомы анемии испытывают только в экстремальных условиях, например в высокогорье. Эта мутация встречается на юге Индии, в Средиземноморье и у жителей Западной Африки и их потомков на других континентах.
При копировании хромосом «снипы» происходят с вероятностью 10–8 на один нуклеотид за поколение. При размере гаплоидного генома в 3 млрд (3х109) нуклеотидов за счет случайных точечных мутаций каждый ребенок имеет в среднем около 30 однонуклеотидных различий со своими родителями. По счастью, большинство таких мутаций приходится не на гены, а на так называемую мусорную ДНК – примерно 95% человеческого генома, не кодирующих ни белков, ни служебных РНК. Эти мутации ни на что не влияют, отбору они безразличны – вот они и сохраняются среди остального генетического «хлама». Именно их, а также короткие тандемные повторы (см. врезку), и используют в молекулярной генеалогии в качестве хромосомных маркеров – характерных особенностей.
Мальчики и девочки
Начнем с Адама: с мужской молекулярной генеалогией разобраться проще (впрочем, все сказанное ниже о своем происхождении по мужской линии могут узнать и дамы – для этого нужно проанализировать ДНК отца, или брата, или дяди – любого прямого родственника по отцу).
Примерно 300 млн лет назад у первых млекопитающих одна из хромосом, несущая среди прочих несколько генов, определяющих принадлежность к мужскому полу, начала терять остальные гены и вместе с ними – способность обмениваться участками ДНК с парной хромосомой. У человека на Y-хромосоме осталось всего 27 генов, большинство из них работают в семенниках. Остальная часть Y-хромосомной ДНК может пригодиться разве что для этнографии и генеалогии. Мутации – выпадения, замены или добавления одиночных нуклеотидов (SNP) и изменения числа повторений трех-четырех одинаковых нуклеотидов (STR) – происходят в разных участках Y-хромосомы с разной частотой, в среднем – одна мутация на каждые 500 поколений. В самых консервативных участках мутации случаются раз в 100 000 лет.
Y-хромосомный Адам жил примерно 80 000 лет назад, но «раз в 100 000 лет» – это вероятность мутации в этом участке хромосомы в непрерывном ряду поколений, и можно подсчитать, что даже такой редкий случай может произойти один раз в поколение примерно у одной из 3000 пар «отец–сын». Время и место жизни нашего общего прямого предка вычислили по анализу распределения в популяциях из разных регионов планеты Y-хромосомных маркеров. Их используют и для исследований в области этногеномики, и для выяснения индивидуальных генеалогий.