Почему генетики используют понятие популяция
Вместо национальной или этнической принадлежности в генетике происхождения используются понятия популяция и популяционный состав. Это связано с тем, что понятие национальность скорее относится к политической идентификации, чем к этнической.
Этническая принадлежность или народность определяется в большей степени культурными нормами, а не генетикой. Поэтому человек, который вырос в определенной культурной среде, может относить себя к одному народу, а фактическое происхождение его предков при этом может быть другим. Поэтому ученые говорят о популяциях — группах, которые существовали в течение многих поколений и в которых более половины браков заключалось внутри группы.
Популяцию легче определить по географическим и этническим признакам, потому что обычно браки заключаются с живущими поблизости представителями той же группы. Большинство народов является по совместительству популяцией. Однако есть народы, в которых более 50% браков заключается с представителями другой группы. Их отнести к популяции нельзя.
Таблица с различиями между народом и популяцией. Источник.
В чем сложность определения популяций
Генетические отличия между разными группами людей низки в сравнении с другими приматами. Геномы шимпанзе Восточной и Западной Африки отличаются сильнее друг от друга, чем геномы двух других людей на планете, где бы они ни жили. В этом заключается трудность определения, к какой популяции принадлежит человек.
Другая сложность в том, что на протяжении истории люди, особенно это относится к европейцам, постоянно мигрировали, заключали браки с представителями других популяций, а гены родителей перемешивались. И чем больше люди одной популяции переселялись и смешивались с другой, тем более разнообразная ДНК получалась у следующих поколений и тем сложнее найти для них образцовые ДНК.
Из-за рекомбинации дети могут не унаследовать некоторые варианты генов, характерные для той или иной популяции.
ДНК человека может нести информацию о популяциях предков разных времен. И тех, что жили недавно, и тех, что жили сотни лет назад. Чтобы определить, какие это были популяции, участки хромосом пользователя сравниваются с образцами представителей разных групп.
Как изучают популяции
Для отбора образцов используется анализ главных компонент (PCA, principal component analysis). Этот алгоритм самостоятельно ищет паттерны в данных генотипирования и позволяет разбить образцы на кластеры в N-мерном пространстве, обычно двухмерном. Пример визуализации такого анализа можно посмотреть здесь. С помощью него мы отсеиваем промежуточные образцы и отбираем только те, что характерны для определенной популяции.
В этом примере можно увидеть, как формируются кластеры разных популяций. Промежуточные варианты, которые попадают в зону между разными кластерами — отсеиваются.
Таким образом мы получаем кластеры, размеры и границы которых зависят от схожести образцов внутри группы. С ними мы сравниваем данные генотипирования или полногеномного секвенирования и относим их к наиболее похожему кластеру.
Сравнивается не вся ДНК, а отдельные ее кусочки. К каждому из них подбирается максимально близкий образец из базы. Так как некоторые участки могут быть похожи у отличных друг от друга популяций, данные проходят дополнительную проверку. Мы проверяем все близлежащие участки. Например, если среди нескольких участков, которые относятся к популяциям Северной Европы, мы обнаружим образец из Восточной Азии — то проверим его еще раз.
Чем больше образцов содержит кластер, тем точнее алгоритм определит популяции. Помимо этого, точность зависит от исходных данных. При полногеномном секвенировании мы получаем больше информации для сравнения, чем после генотипирования. Однако важно помнить, что даже Полный геном не дает 100%-ный результат. Образцы, собранные у разных популяций, чаще всего содержат данные генотипирования, так как оно значительно дешевле. Алгоритм определения популяций происхождения будет становиться точнее по мере появления образцов с результатами полногеномного секвенирования.
Есть ошибочное мнение, что для определения популяционного состава анализируется только Y-хромосома и митохондриальная ДНК. То есть для женщин популяционный состав можно определить только по материнской линии. Это не так. По этим данным можно получить только информацию по гаплогруппам, но к конкретным популяциям они не относятся. Например, гаплогруппа R1a, которая часто встречается у русских, распространена среди западных и восточных славян, а также среди популяций Северной Индии.
Популяцию нельзя связать с одной гаплогруппой, потому что, как правило, в ней распространены и другие. Однако они помогают понять историю формирования популяции в целом. Подробнее о гаплогруппах читайте в нашей предыдущей статье.
Как это выглядит в Личном кабинете
В разделе География пользователь видит процентное соотношение между частями света. Например, между Европой, Азией и Африкой.
При нажатии кнопки Подробнее пользователь переходит на страницу популяционного состава. Здесь представлен подробный процентный состав по каждой популяции. На карте также отмечен примерный ареал каждой группы.
В следующей статье Атлас подробно расскажет про неандертальцев: какой процент их генов содержится у разных популяций, как их гены влияют на здоровье современного человека, а также какие ещё древние люди жили в то время.
Flashget
А можно ли у вас импортировать данные из других сервисов, например из уже сделанного теста на myheritage.com?