Атлас запустил новый продукт — Полный геном. Теперь мы можем исследовать не только отдельные точки в геноме, как в генетическом тесте, но и прочитать всю последовательность нуклеотидов генома. В этой статье рассказываем, что это и зачем это нужно.

Внимание! Мы подарим Полный геном одному из наших читателей, кто выполнит все задания. Подробнее — в конце статьи.

Полный геном


Что значит Полный геном?


Чтобы разобраться с полным геномом или полногеномным секвенированием (whole genome sequencing, WGS), мы сначала расскажем коротко о технологии обычного генетического теста.

Микрочип и обычный генетический тест


Генетический тест «Атлас», как и многие подобные тесты, делают с помощью ДНК-микрочипа (DNA-microarray, Beadchip). Поверхность ДНК-микрочипа содержит множество небольших углублений (порядка 700 тысяч), в каждом из которых находится по кремниевому шарику диаметром около 3 микрометров. На поверхности этого шарика находятся сотни тысяч сшитых с ним идентичных коротких последовательностей одноцепочечной ДНК, соответствующих участку генома человека, расположенному рядом с исследуемой вариацией (снип, SNV). Каждый шарик соответствует только одной генетической вариации, а координаты лунки на чипе для каждого шарика известны (Рисунок 2D).

Образовательный блок 1
Снип или SNV (Single Nucleotide Varition) — генетическая вариация, то есть изменение последовательности ДНК только в одном нуклеотиде. Например, на участке гена Х в определенной позиции может существовать один из трех нуклеотидов (аллелей) A, G или T, а в остальной части последовательности у разных людей нуклеотиды идентичны (Рисунок 1). От этой одной буквы может зависеть определенная особенность человека.


Рисунок 1 Автор иллюстраций Rentonorama

Например, полиморфизм rs4481887, который находится на первой хромосоме рядом с геном обонятельного рецептора OR2M7, имеет три аллеля: A, G и T. Наличие аллеля А на одной или на обеих хромосомах (генотипы A/G, A/T и A/A) определяет чувствительность к запаху мочи после употребления спаржи. При отсутствии аллеля А человек даже не будет догадываться о том, что после поедания спаржи с мочой выделяется вещество с характерным запахом.

Индел или INDEL (Insertion/Deletion) — другой тип генетических вариаций, в который относят удаление или вставку одного или нескольких нуклеотидов. Снипы и инделы вместе, наряду с возможными структурными изменениями: большими делециями, инсерциями, транслокациями, инверсиями, являются фактической разницей в геноме разных людей.


При сдаче генетического теста «Атлас» из слюны выделяют геномную и митохондриальную ДНК, увеличивают количество ее копий (амплифицируют) и фрагментируют — нарезают на небольшие отрезки (Рисунок 2А). Многочисленные одноцепочечные фрагменты человеческой ДНК соединяются с соответствующими им последовательностями на кремниевых шариках (Рисунок 2В), после чего происходит удлинение этих последовательностей на 1 искусственный флюоресцирующий нуклеотид (Рисунок 2С). Разные нуклеотиды светятся разными цветами: красным и зеленым. По соотношению интенсивностей свечения каждого цвета (Рисунок 2E) можно определить генотип, который соответствует шарику.


Рисунок 2

После сканирования всего чипа мы получаем около 700 тысяч генотипов вариаций и пропускаем их через нашу систему интерпретации. Часто пользователи пытаются сравнить результаты разных тестов, но замечают сильную разницу. Это происходит по нескольким причинам. Во-первых, разные компании используют разные версии чипов и наборы SNV. Как следствие, на одних чипах существуют уникальные наборы вариаций, которые нельзя найти на других чипах. Во-вторых, всегда существует ошибка генотипирования, которая может возникнуть по разным причинам, хотя она вносит наименьший вклад в различие результатов. Данные исследований показывают, что точность генотипирования на ДНК-микрочипах, которые использует Атлас, выше 99,5%. Но основная причина отличий результатов генетических тестов в интерпретации: разные компании делают ее по-разному даже для одинаковых исходных данных генотипирования.


Что такое полногеномное секвенирование?


Главное отличие полногеномного секвенирования от генотипирования на микрочипах — технология и обработка получаемых данных. При полногеномном секвенировании определяется почти вся последовательность ДНК. Почти — потому, что в геноме существуют участки, которые в силу различных причин невозможно прочитать. Часто это участки теломер и центромер — концов и центра хромосом. Для определения последовательностей подобных регионов генома используют малодоступные узкоспециализированные технологии. Такие исследования носят в основном исследовательский характер.

Определение последовательности ДНК позволяет узнать генотипы вариаций в любом месте генома, включая исследуемые вариации на ДНК микрочипе в генетическом тесте «Атлас». Для быстрого и эффективного определения последовательности генома используется технология NGS (next generation sequencing, секвенирование следующего поколения). Существует несколько принципиально отличающихся методов, созданных разными компаниями.

Суть метода Атласа заключается в следующем: выделенную и очищенную ДНК многократно амплифицируют и фрагментируют до определенной длины. К каждому фрагменту пришиваются специальные последовательности, которые позволяют управлять данным фрагментом. Прочитываются, именно эти обработанные фрагменты (Рисунок 3).


Рисунок 3. Процесс пошагового секвенирования: каждый следующий нуклеотид флуоресцирует в уникальном для него цветово канале

На каждом шаге происходит удлинение на один нуклеотид, с которым связан флуоресцентный зонд. Каждый из четырех нуклеотидов связан с зондом определенного цвета. Таким образом, шаг за шагом по цвету свечения можно определить порядок нуклеотидов в исследуемом фрагменте. Полученные последовательности каждого фрагмента называются прочтениями или ридами (reads), и их получается около 1 миллиарда на каждый образец исследуемой ДНК. Риды и показатели качества их прочтения хранятся в текстовом формате FASTQ.

Далее риды выравниваются (картируются) на референсный геном. С использованием специального программного обеспечения, например Burrows-Wheeler aligner, для каждого рида происходит поиск места на референсном геноме, которому он соответствует. Прочтение вместе с информацией о положении в геноме записывается в файл формата SAM или BAM. Визуализация картированных на геном ридов в SAM (BAM) файле с помощью геномного браузера IGV показана на Рисунке 4.


Рисунок 4. Визуализация BAM файла в программе IGV (участок хромосомы одного человека). Картированные риды обозначены горизонтальными блоками, позиция указана в треке сверху.

На рисунке также видно, что такое глубина прочтения (depth of coverage) — когда, любую позицию в референсном геноме покрывает несколько выровненных ридов. Значение усредняется по всему геному и используется как показатель качества исследования. Атлас гарантирует среднее покрытие генома глубиной выше 30, что обеспечивает высокое качество генотипирования. Увеличение глубины прочтения значительно увеличивает стоимость секвенирования, точность определения генетических вариаций и используется в узких онкологических исследованиях, например, в Атлас Онкодиагностике.

Образовательный блок 2
Референсный геном — это искусственно собранная последовательность ДНК биологического вида. Большинство последовательностей, из которых собран референсный геном человека, были взяты у одного человека Африкано-Европейского происхождения. Референсный геном регулярно обновляется: последняя версия, GRCh38, была выпущена в 2013 году и содержит в себе 3,3 млрд нуклеотидов. Несмотря на доступность новой версии, многие генетические тесты и сервисы по анализу генетических данных используют предыдущую — GRCh37. Для предоставления наиболее точных результатов анализа Атлас использует версию GRCh38.


Полученные после картирования файлы (SAM-файлы, sequencing alignment map, или в бинарном виде BAM — binary alignment map) фильтруются и используются для поиска вариаций в геноме, включая как однонуклеотидные вариации, так и короткие инсерции и делеции. Наличие однонуклеотидного варианта на хромосоме 1 в позиции 248333561 (приведенный ранее пример rs4481887 — вариант, определяющий чувствительность к запаху мочи после употребления спаржи) показано на Рисунке 5.


Рисунок 5. Визуализация BAM файла в программе IGV. Участок хромосомы 1. В позиции 248333561 находится полиморфизм rs4481887: нуклеотид в данной позиции не соответствует референсному геному и выделен цветом. Во всех ридах, которые покрывают данный участок генома, присутствует нуклеоид G, что говорит о гомозиготности генотипа. У человека с такими результатами секвенирования будет генотип G/G и нечувствительность к запаху мочи после употребления спаржи.

Найденные генетические вариации хранятся в VCF файле (variant call format). Он содержит обнаруженные аллели для каждой позиции генома, а также показатели качества генотипирования. VCF файл фильтруется: из него удаляются записи о наличии/отсутствии вариаций, которые не соответствуют порогам качества и являются потенциально ложными. Каждой найденной вариации присваиваются известные по ней данные из dbSNP, в частности, уникальные идентификаторы rsID.

Подробно ознакомиться со спецификой форматов хранения данных секвенирования и генотипирования можно по следующим ссылкам:
FASTQ — maq.sourceforge.net
SAM — samtools.github.io
VCF — samtools.github.io

Для визуализации картирования ридов (SAM или BAM файлов) используется различное программное обеспечение. Наиболее популярным является IGV (Integrative Genomics Viewer от Broad Institute). Загрузить IGV и ознакомиться с ним можно по ссылке.


Какие данные интерпретирует Атлас?


Полный геном содержит данные по тем вариантам генов, которые есть в генетическом тесте «Атлас», а также по признакам, которые нельзя подсчитать с помощью технологии генотипирования с использованием ДНК-микрочипов. Например, к таким признакам относятся риски онкологических заболеваний.

Здоровье


383 Наследственных заболеваний
Основной акцент всех тестов Атласа — раздел здоровье, и наш новый тест «Полный геном» не стал исключением. К признакам нашего основного теста мы добавили еще 65 наследственных заболеваний.

К наследственным или моногенным заболеваниям относятся болезни, которые передаются от родителей детям и на развитие которых не влияет образ жизни человека. Для развития такого заболевания достаточно мутации от одного или от обоих родителей в зависимости от типа наследования заболевания.



21 Многофакторное заболевание
На развитие многофакторных заболеваний влияют гены, образ жизни и факторы окружающей среды. К таким болезням относятся, например, сахарный диабет, ожирение, болезнь Паркинсона и Альцгеймера, атопический дерматит. В личном кабинете пользователю доступен расчет относительного риска развития заболевания на основе данных теста и опросника об образе жизни.

6 других признаков, связанных со здоровьем
Здесь мы собрали признаки, которые влияют на образ жизни человека. Например, продолжительность сна, хронотип, синдром хронической усталости, боязнь боли.



Клиническая генетика


43 Онкологических риска
Благодаря тому, что в полном геноме исследуется больше вариантов генов, мы получаем больше данных и можем оценить риски развития онкологических заболеваний. По результатам теста мы оцениваем предрасположенность к наследственным онкологическим синдромам.

Наследственные онкологические синдромы — генетические заболевания, которые могут передаваться в семье из поколения в поколение и повышать риски некоторых видов рака. Около 10% случаев онкологии имеют наследственную природу.
?
Поиск наследственных онкологических синдромов полезен в первую очередь тем, у кого в семье были случаи рака. На наследственную природу может указывать ранний возраст начала болезни (до 50 лет), наличие нескольких родственников по одной линии с одинаковым диагнозом, редкие формы рака. На основе результатов теста врач определит объем дополнительных исследований и составит персональную программу управления онкологическими рисками. Узнайте больше о том, как развиваются злокачественные образования, можно в нашей серии статей.



53 Показателей восприимчивости к активным компонентам лекарств
Каждый человек по разному реагирует на лекарства: у одних препарат действует хорошо, другие страдают от тяжелый побочных эффектов, а у третьих лечение оказывается неэффективным. В некоторых случаях это обусловлено работой генов, которые влияют на метаболизм активных веществ и риски побочных реакций.

Например, препарат Омепразол снижает секрецию соляной кислоты в желудке. Используется при лечении язвенной болезни желудка и двенадцатиперстной кишки, рефлюксной болезни. Ген CYP2C19 кодирует фермент, который отвечает за метаболизм омепразола. Поэтому, в зависимости от вариантов гена, необходимо корректировать дозу омепразола или использовать альтернативное лекарственное средство.

В тесте мы исследуем варианты генов, связанные с особенностями метаболизма 53 препаратов. Среди них есть антидепрессанты, гормональные контрацептивы, препарат для снижения свертываемости крови и некоторые другие.



Специализированный отчет по наследственным заболеваниям
Отчет — заключение Лаборатории клинической биоинформатики Федора Коновалова. Биоинформатики лаборатории ищут мутации, которые могут негативно влиять на здоровье, но по которым в настоящее время нет полноценных исследований. В заключении содержится вся необходимая информация для врача-генетика. С этим отчетом вы сможете обратиться к профильному специалисту в случае необходимости.

Такие генетические отчеты похожи на юридический документ с обилием сложных терминов, правильно оценить который может только специалист, в нашем случае — генетик. Поэтому мы не показываем данные клинической генетики до консультации. Во время встречи врач-генетик подробно рассказывает, что стоит обратить внимание с учетом вашей семейной истории и наличия симптомов. Это может помочь, например, для уточнения возраста начала скрининга определенных заболеваний или при планировании семьи.

Питание


28 Отчетов
По генетическим тестам и даже по полному геному подобрать оптимальное питание и составить рацион нельзя. Продуктов, их способов приготовления и блюд настолько много, что исследователям трудно найти какие-либо корреляции с вариантами генов. При этом некоторые данные все же есть.

По определенным вариантам генов мы можем узнать, есть ли у человека предрасположенность к непереносимости лактозы или глютена, быстро или медленно организм справляется с алкоголем или кофеином, а также оценить предрасположенность к определенному уровню железа, кальция, омега-3 и 6 жирных кислот. По этим данным человек может решить, какие продукты ему стоит убрать или наоборот добавить в рацион.

Спорт


16 Отчетов
Определить вид спорта, который вам больше подходит генетически — так же сложно, как и подобрать питание. Видов физической нагрузки сейчас множество, и понятие спорт с каждым годом расширяется. Так скейтбординг и серфинг добавили в программу олимпийских видов спорта. Видов физической нагрузки слишком много, чтобы это в большей степени было обусловлено генетикой. Поэтому не верьте генетическим тестам, которые обещают найти наиболее подходящий вам вид спорта. Выбирайте тот вид спорта, который просто нравится.

Научные сообщества генетиков обеспокоены, что родители делают генетические тесты детям, чтобы узнать, какой вид спорта им больше подходит. В таком случае ребенка могут отправить в группу, которая ему не нравится, но подходит по результатам теста. Если человек хочет добиться выдающихся результатов в спорте, то успех в большей степени будет зависеть от его амбиций, силы воли и характера. Варианты генов тут играют меньшую роль.

С помощью генетического теста можно узнать, как гены влияют на риски спортивных травм, количество свободного инсулиноподобного фактора роста-1, уровень эритроцитов, эритропоэтина, а также на особенности обмена аминокислот — валина, лейцина и L-карнитина. К результатам «Полного генома» мы добавили также риск невралгии седалищного нерва, уровень IGFBP?3, объем выдоха и другие.

Другие признаки


15 Отчетов
В этом разделе мы собрали признаки, которые относятся к особенностям организма: черты внешности, восприятие света, чувствительность к травам и запахам. В нашем тесте вы не найдете признаков, которые связаны с эмоциями, поведением или характером. В основном эти черты зависят от особенностей воспитания, окружения и привычек, и в меньшей степени на них влияют варианты генов. К тому же многие личные качества можно поменять или выработать во взрослом возрасте.

Происхождение


3 Отчета
Генетики не используют понятия этнической или национальной принадлежности. В большей степени они обусловлены культурными различиями, а не разными вариантами генов. Вместо этого генетики используют понятие популяция — группа людей, которая долгое время живет на одной территории. Сегодня доступны геномные данные определенных популяций, из них ученые выделили последовательности и варианты генов, характерные для каждой. Генетические исследования происхождения — это поиск таких вариантов в геноме и определение генетической схожести с известными популяциями в процентном соотношении.

Кроме популяционного состава по генетическому коду можно узнать свою гаплогруппу. Гаплогруппа — это группа людей с одинаковым вариантом гена, который случился у одного общего предка тысячи лет назад. Также по геному можно определить процент ДНК неандертальца. В геноме современного человека оказалось около 1–4 % ДНК неандертальцев. Сейчас известно только несколько признаков, которые зависят от наличия вариантов гена неандертальца, — рост волос на спине и уровень липопротеинов низкой плотности ЛПНП (плохой холестерин).


Сравнение Полного генома и генетического теста «Атлас»


Почему Полный геном?


Главный плюс Полного генома в том, что вы получаете всю информацию о своей ДНК. Когда появятся новые данные, мы просто добавим их в личный кабинет. С обычным генетическим тестом это работает не всегда, так как в нем исследуется около 660 000 вариантов — 0,1% всей ДНК. Для интерпретации новых признаков их может быть недостаточно.

Результаты теста помогут предпринять меры по профилактике заболеваний, планированию семьи, а врач сможет уточнить диагноз в будущем или уже сейчас. Тест доставят на дом и всё, что требуется от пользователя — собрать образец слюны и вызвать курьера для передачи пробирки в лабораторию.

Основа Полного генома «Атласа»: генетический анализ высокой точности (99,5%), контроль качества полученных данных, запатентованная система интерпретации данных, доступ к исходным данным, консультация генетика, а также отобранные научные статьи, которые доступны каждому пользователю. Всё это пользователь получает за 94 500 — самая низкая цена за подобные услуги в России. Тест уже можно купить на сайте Атласа.

Если вы умеете работать с большими данными, а особенно биоинформатическими, ваши сырые данные полного генома могут быть пластилином, с которым на досуге можно поиграть и узнать о себе больше. Например, можно отсеять варианты генов, которые изучают другие компании и загрузить в их базу интерпретации, узнать родственную связь с другим человеком, взять референсную ДНК шимпанзе или Неандертальца и сравнить насколько вы схожи.

А еще


Атлас приготовил большой подарок читателям Хабра! В следующих статьях мы дадим 3 задачи с примерами и вводными данными, а также информацией по необходимому ПО. Первый, кто решит все задачи, — получит Полный геном в подарок!

Первая задача будет в понедельник.

Комментарии (44)


  1. de-Bill
    13.12.2019 18:14

    «Во время встречи врач-генетик подробно рассказывает...» — т.е. вся самая важная информационная выжимка дается устно?


    1. asyaaam Автор
      13.12.2019 19:20
      +1

      Нет! Пользователь получает личный кабинет со всеми данными. Некоторые скриншоты личного кабинета есть в статье. До консультации не будет доступен только отчет биоинформатика. Но после консультации он появится в кабинете тоже.


  1. lisavr
    13.12.2019 19:34
    +1

    сколько будет длиться консультация с генетиком? к ней надо как-то готовиться?


    1. asyaaam Автор
      13.12.2019 19:55

      Консультация длится час. За это время врач покажет, как пользоваться личным кабинетом, и расскажет подробнее о результатах, особенно о заключении биоинформатика. Специальной подготовки не требуется.


  1. pillars
    13.12.2019 20:52
    +1

    Расскажите когда будут хотя бы сравнительно конкурентные цены. На дантелабс сейчас секвенируют полный геном за 300 евро, да, по акции, но акции регулярно и бывает даже дешевле. С обычными тестами тоже всё понятно, в среднем сырые данные и базовый анализ генеалогии по скидке можно получить за 50-75 долларов. Понимаю что у нас спрос не тот но откуда такая чудовищная пропасть в ценах?


    1. varnav
      14.12.2019 00:38

      Nebula за сотню делает полный геном и сырые данные сразу доступны для скачивания.


      1. Londoner
        14.12.2019 23:07

        А где сотня, я вижу за $149?


      1. Mad__Max
        16.12.2019 04:54
        +2

        На Небула за сотню (сейчас уже 150, видимо по 100 какая-то акция со скидками была) качество сканирования просто ниже плинтуса:
        Low-pass Whole Genome Sequencing (0.4x coverage)

        Уровень покрытия генома 0.4x против 30x у Атласа. Это даже полным геномом назвать нельзя — так «похватали поверхам» кусочки из которых даже одну полную копию генома не собрать, не говоря уже о количестве ошибок которое будет в таких данных — без избыточности считывания их не исправить программно.

        В общем ни о чем совершенно — сгодится только как аналог теста на микрочипах, которое тоже отдельные кусочки выхватывет. На чипах их правда намного меньше (обычно до 1 млн. позиций), но зато этот 1 млн. в «наиболее интересных» местах, а не случайно как тут и с меньшим количеством ошибок. У всех людей геном совпадает на 99.5% и содержит одну и туже информацию. Чипы собирают данные только в меняющихся участках составляющих доли %.

        А вот на дантелабс за 300 евро (в данный момент 160 но это скидка на время) вроде идет полноценное сканирование с 30х покрытием. Но это без анализа считанных данных, только сырые данные — их анализ заказывается отдельно за отдельную плату. И полный пакет анализа целых 500 евро стоит. Единственно что хорошо — можно выбрать только интересующие наборы отдельно и по отдельности они недорогие.


    1. Dron007
      14.12.2019 21:57

      Даже за 160 евро. Но там не всё так просто. Насколько я понял, качество данных хуже, чем у компаний, выполняющих выборочное секвенирование. Вот тут www.beholdgenealogy.com/blog/?p=2879 и в следующих двух статьях энтузиаст, уже имеющий данные от пяти компаний, заказал ещё и полный геном, но оказалось, что данные хуже согласуются, не полные. Просто так их сконвертировать в формат, который бы поняли генеалогические сайты, не выйдет. Не знаю как с этим у Атласа.


    1. asyaaam Автор
      16.12.2019 12:22

      Dante lab — интересная компания. У нас человек 7 заказали их полногеномные тесты ради исследовательского интереса год назад на Черную пятницу. Как итог: кто-то не получил свои данные до сих пор, хотя пробирки отправили в феврале, кто-то получил, но не с покрытием 30х, а с покрытием 7х, а также ограниченную интерпретацию без заключения биоинформатика, то есть без данных по раннее неописанным мутациям. Сырые данные высылают на жестком диске. И тоже кто-то ждет его уже полгода. В общем, у нас есть вопросы к такому подходу работы с полногеномными данными.

      Как мы писали в статье — наш тест самый дешевый на российском рынке. А разница цен с международными компаниями связана со стоимостью секвенирования на территории России. Мы не можем советовать, где лучше делать полногеномный анализ. Каждый покупатель решает этот вопрос сам. Кому-то подходят услуги, которые предлагают Dante, кому-то — нет.


  1. mm3
    13.12.2019 21:37
    +1

    А вы уже начали давать доступ к сырым результатам секвенирования? или до сих пор не считаете своих клиентов владельцами их собственного генома?


    1. asyaaam Автор
      13.12.2019 23:41

      Мы всегда выдавали сырые данные по запросу клиентов в службу поддержки.


      1. mm3
        14.12.2019 11:11
        +1

        На техническом ресурсе ваш продукт имел бы больше популярности если бы доступ к сырым данным, тому что больше всего может быть интересно IT специалисту, освещался более явно. Сам доступ к данным был бы более простым и понятным. И сбор образцов был бы так же более простым и лёгким для конечного пользователя. Как это сделано у некоторых ваших зарубежных конкурентов. А набор отчётов, который вы так старательно рекламируете, потеряет свою новизну и интерес сразу после прочтения и поэтому не выглядит стоящим той цены, которую вы за него просите.


        1. Dee3
          14.12.2019 21:03
          +2

          Погодите, ведь сырые данные доступны в ЛК Атласа в виде текстового файла. Или речь о чем то другом?


          1. mm3
            14.12.2019 22:59
            +1

            Я не знаю какие данные доступны в личном кабинете, а на сайте этот момент никак не описан, по этому и спросил. Можно предположить, что результат секвенирования полного генома должен быть достаточно объёмным, файлы могут быть размером в сотни гигабайт. В этой же статье упоминаются файлы формата sam и bam.


            1. asyaaam Автор
              15.12.2019 18:30
              +2

              Да, поиск по генам с данными по генотипам доступен в Личном кабинете пользователя. Также можно скачать файл с сырыми данными. Мы всегда их выдавали и будем выдавать. На сайт добавим. Спасибо, что заметили.


          1. Mad__Max
            16.12.2019 05:18
            +1

            До этого момента они предлагали только анализ на микрочипах и соответственно сырые данные представляли собой только перечень выявленных снипов (SNP).

            Этот тест кардинально отличается в техническом плане и тут целый набор файлов со своими форматами и на порядки большего объема, включая полную копию генома и то как он «реконструировался». Не ясно отдают ли они его или тоже только результат анализа в виде тех же SNP после сравнения вашего ген. кода с «эталонным человеком».


  1. stalinets
    13.12.2019 23:05

    Я вот почти полный ламер в вопросах генетики. Задам простой ламерский вопрос. Если я хочу, чтобы в недалёком (или далёком) будущем, или даже в настоящем, вырастили моего полного клона (разумеется, это будет младенец, не имеющий моих знаний; просто как бы однояйцевый брат-близнец, только моложе меня) — что для этого нужно сделать сейчас? Только сохранить свой биологический материал, или всё же можно сделать подобное описанному в статье считывание генома и записать на винт, и по этой информации можно будет однажды вырастить клона меня? То есть будет ли информация полной? Или это годится только для медицинских исследований?

    В статье написано вот, что часть генетического кода из теломер невозможно прочитать, это уже значит, что точного клона не вырастить?


    1. Mad__Max
      14.12.2019 14:20

      Теоретически этого генетического кода должно быть достаточно для сначала синтеза ДНК, а потом и создания клона из нее.
      В несчитываемых тут участках по текущим научным представлениям ничего полезного нет, это «технические» участки хоромосом, нужные для обеспечения сохранности остального (значимого) генетического материала. Например теломеры постепенно «обрезаются» при каждом делении клетки и служат своего рода «защитными колпачками» — не дают отрезать участки с важным ген. кодом.

      На практике — таких длинных и сложных цепочек нуклеотидов как человеческая ДНК сейчас синтезировать пока не умеют даже близко и не ясно когда это будет возможно. А то что умеют (ДНК уровня вирусов или максимум бактерий) стоит очень больших денег, на порядки дороже процесса считывания/оцифровки.


    1. DaneSoul
      14.12.2019 15:47

      Насколько знаю, на текущем уровне технологий наиболее реальный вариант — использование стволовых клеток, так что если планируете клона при жизни, то заранее что-то предпринимать не обязательно — стволовые клетки должны в небольшом количестве сохранятся в костном мозге.


    1. Dron007
      15.12.2019 04:06

      Я тоже не являюсь специалистом, но из того, что было в нескольких курсах, сделал вывод, что «текст» генома не является единственным источником правды для формирования организма, даже если не брать в расчёт среду. Помимо него есть ещё и так называемые эпигенетические маркеры — особые метки (например, с помощью присоединения метильных групп к цитозину), которые блокируют или наоборот активируют соответствующий ген. Таким образом, можно иметь весь код генома, но не имея информации об этих метках невозможно предсказать все особенности организма. В сумме это называют эпигеномом. Когда-нибудь и его научатся сканировать, но там уже разная картина в разных видах клеток, насколько я понимаю. Собственно, само формирование разных тканей и происходит благодаря ему. И он тоже в какой-то степени наследуется.

      Вообще, чем больше изучаешь механизмы эволюции видов и внутреннюю организацию клеток, тем больше осознание, что будь это программа, качество которой нужно оценить, ничего кроме «г… код» в голову бы не пришло. Тут тебе и смешение зон ответственности, и смешение данных и кода, куча грязных хаков, неоправданных усложнений и заброшенных частей. Алгоритмы работают плохо. Ну вот что стоило сделать абсолютно надёжный механизм контроля целостности ДНК? Нет, ничего подобного, постоянно возникают ошибки, ведущие к гибели и страданиям несчастных особей. Потому что до самих особей эволюции нет ни малейшего дела — это расходный материал. Особенно, если особь вышла из репродуктивного возраста. Для эволюции главное — видовое приспособление.


      1. stalinets
        15.12.2019 04:15

        Ну, однажды люди возьмут это под полный контроль. Может, подправят геном, а может, вовсе оцифруют сознания, объединят их в одно и запустят это мега-сознание в виртуальном мире. У Виктора Аргонова интересные идеи на этот счёт в рамках трансгуманизма, например, в его музыкальных видео «Переосмысляя прогресс».


      1. Mad__Max
        16.12.2019 02:42

        Эпигенетические факторы конечно тоже важны, но это же как раз полностью или почти полностью влияние среды при развитии. Начиная правда с самых ранних этапов развития — еще с первых делений клетки зародыша при вынашивании и даже чуть раньше (формирования половых клеток родителей, которые потом слившись и дадут зародыш).

        Поэтому в т.ч. даже однояйцевые близнецы имеющие идентичный генетический код чуть-чуть отличаются друг от друга уже с момента рождения, не говоря уже о дальнейшем развитии и росте когда факторы внешней среды для них могут начать существенно отличаться.

        Насколько знаю никто не доказал/не показал именно наследование эпигенетики за рамками воздействия среды в широком плане. В широком — это включая родителей как факторов этой среды (диета, привычки, образ и место жизни, гормональный фон и т.д.) влияющих на то как имеющий генетический код будет «исполняться» превращаясь в живой организм.

        P.S.
        Насчет «говнокода» полностью согласен. Чем больше изучаешь и понимаешь механизмы, тем больше именно такое впечатление. Причем это не только к генетике относится, но во многом к биологическому функционированию сложных организмов как человек в целом — системы обмена веществ, регуляции и обратных связей, систем иммунитета и прочих.

        Почти везде костыли на костылях и костылями погоняют и общая картина и «вот со всем этим дерьмом мы сейчас попытаемся взлететь».

        По сравнению с тем что «наваяла»нам природа в процессе эволюции пресловутый «индусский код» это просто образец аккуратности, строгости и логичности.


        1. Dron007
          16.12.2019 15:51
          +1

          Уже не совсем так. Эпигенетическое наследование чётко доказано для растений и беспозвоночных, а для млекопитающих ещё некоторые учёные упираются, но против фактов не попрёшь. Эпигенетические метки по идее должны стираться после оплодотворения и такой механизм есть, но как всегда спешили к релизу и работает он только на 99%.
          Тут хорошо описано: learn.genetics.utah.edu/content/epigenetics/inheritance


  1. technik
    14.12.2019 03:16

    А вы только в Москве есть? У вас филиалы есть в других городах?


    1. asyaaam Автор
      15.12.2019 18:33
      +2

      Мы отправляем тесты во все города России. Курьер привозит и забирает пробирку. В ней содержится специальный раствор, который сохраняет ДНК целой для проведения секвенирования. Данные автоматически появятся в личном кабинете.


  1. vnmukhin
    14.12.2019 11:19

    Я заинтересован в услугах, подобных вашим. Однако приобретенная параноидальность заставляет меня спросить: как я могу быть уверен, что вы исследовали именно мой геном? Ну, допустим, какие-то ключевые точки генома относятся ко мне, но ведь остальные данные вполне могут быть случайными, не моими — вполне логично снижать производственные расходы таким образом. Проверить полученные данные, как обычный потребитель, я не могу. К тому же, вы в статье указываете на то, что между результатами разных лабораторий могут быть серьезные отличия ввиду использования разных чипов/реактивов/методов анализа. А ведь вопрос серьезный: выявление каких-либо генетически детерминированных особенностей может повлечь за собой недешевую смену образа жизни. Или, скажем, привести к формированию невроза, если в силу каких-то причин я не смогу поменять образ жизни. А если результаты анализа будут фальшивы, то последующие расходы бессмысленны.
    Как мне понять, что полученные данные валидны? Какую ответственность вы, как юр. лицо, несёте за предоставляемую информацию?


  1. shadrap
    14.12.2019 11:58

    Это вы молодцы, что пошли в полногеномное секвенирование. В связи с этим вы закрываете «медицинские предсказания» по генотипирующим чипам или продолжите рисковать? )
    Ценник действительно хороший, если это с учетом интепретации. Расскажите подробнее, на чем будете секвенировать, Illumina, Pacbio? Интерпретацию сами будете делать? Или пока не понимаете объемов работы? Будете ли продвигать свои данные в сторону медицинских или останетесь популяризаторами генетики?
    Где будете хранить данные по полногеномному?


  1. XimikS
    14.12.2019 16:05

    Расскажите плз, чем это отличается от услуг конкурентов — ancestry и т.д.?


    1. asyaaam Автор
      15.12.2019 18:38
      +2

      У ancestry, 23andme и многих других генетических dtc компаний нет полногеномного секвенирования. У них тесты на основе ДНК-микрочипа, а не NGS


  1. tipsoid
    14.12.2019 22:02

    Правильно ли я понимаю, что имея полную ДНК и расшифровку без оснований полагать какой-либо определенный диагноз, я получаю N поводов для паранойи? То есть вроде как не все гены работают, и наличие некоторых мутаций может быть необходимым, но далеко не достаточным условием болезни X. Таким образом, я как Анжела Джоли встану перед выбором — отрезать заранее на всякий случай или авось повезет?


    1. asyaaam Автор
      16.12.2019 13:21

      По факту у Анджелины Джоли было 2 варианта: 1) выполнить себе радикальную операцию и избавиться от риска заболеть раком и 2) умереть от рака молочной железы. Наследственная форма рака молочной железы встречается в 5–10% случаев и значительно повышает риск развития заболевания.

      Результаты Полного генома вряд ли можно считать поводом для паранойи, скорее это повод либо успокоиться, либо занять активную позицию по управлению рисками заболеваний, либо взвешено подойти к планированию семьи.


  1. Doc_x800
    14.12.2019 22:02

    описанный вами здесь метод ngs секвенирования неточен. это больше похоже на классическое секвенирование по Сэнгеру. при сборке генома из ридов применяется термин assembly но никак не картирование. картирование это по сути определение роли «данного» фрагмента в геноме, т.е. к какой хромосоме или какому шену он относится. Да, процессы взаимосвязанные, но сначала идет «сборка» ридов. длина одного рида, если я правильно помню около 300 ар оснований (нуклеотидов), чтобы «увидеть» более длинную последовательность сначала ее надо собрать из ридов, что и называется «assembly»


    1. Mad__Max
      16.12.2019 03:18
      +2

      Судя по описанию они используют метод секвенирования Illumina/Solexa
      Вероятно закупили секвенатор из серии HiSeq 1500/2500

      Длину одно рида можно посмотреть увеличив скриншоты из программы в статье выше — по 100 пар оснований.

      Почему не точен? Ну вообще все существующие методы чтения генома не дают 100% точности и все включают нарезку ДНК на небольшие отрывки и последующую «сборку» из них исходной последовательности уже при цифровой обработке считанных данных.
      Но при точности чтения «сырых» данных такими секвенаторами >99% и среднем покрытии генома ридами >30 раз ошибок в восстановленной последовательности должно быть очень мало — почти все ошибки исходного считывания будут исправлены при сравнении многократно прочитанных копий одного и того же участка уже в программной обработке на компьютере.


    1. danilovkiri
      16.12.2019 10:24
      +1

      Для коллинга вариантов не нужно заниматься genome assembly и собирать контиги, которые никак не помогают достоверно определить наличие варианта с учетом LOD и постериорных вероятностей. Для коллинга как раз необходимо картирование ридов (100-150 bp обычно) и их стэкинг в бам/сам файл. Дальше с набором ридов, содержащих альтернативный аллель (или только референсный аллель, или как референсный, так и альтернативный аллель) работают ML и более сложные программные решения. Кстати, совсем не похоже на Сэнгер, если вдаваться в детали. Единственное, чем похоже, так это использованием флуоресцентных зондов. И да, они используются как в Сэнгере, так и в нескольких нгсных технологиях.


  1. gecube
    16.12.2019 02:54

    А теперь вопрос — насколько это предложение будет конкурентноспособно с аналогичным от https://www.fullgenomes.com/
    Речь не только про интерпретацию (она не всем нужна и ее всегда можно дозаказать при наличии BAM), а ещё и секвенирование отдельно.
    Конечно, круто, что в России есть лаборатория практически мирового уровня. Но экономическую подоплеку никто не отменял. И сделать цены доступными можно только при массовости продукта


    1. Mad__Max
      16.12.2019 03:29
      +2

      По сравнению с указанным по ссылке — в принципе вполне конкурентноспособно.
      По ссылке заявлена стоимость полногемного сканирования при глубине(качестве) прочтения 30х как у Атласа — 1150$ или 75.5 тыс. руб по текущему курсу. Как понимаю это без анализа вообще, только «сырые данные».
      А такое же 30х сканирование с развернутым анализом данных — 1800$ (113 т.р.)

      Ну а по меркам рынка РФ это вообще хорошо. Они и так подвинут местный рынок неплохо своим предложением. Около 2 лет назад таким вопросом интересовался и аналогичные услуги полногеномного сканирования + анализа у нас стоили начиная от 250-300к, на этом фоне выйти с предложением в 95к вполне адекватно.

      Глядишь через пару лет и совсем доступные цены будут.


      1. Mad__Max
        16.12.2019 05:36
        +2

        P.S.
        Сильно дешевым такие тесты все-равно пока не могут быть, массовость не особо поможет, т.к. есть большие расходы.
        стоимость необходимого оборудования — порядка несколько сотен тыс. $ за комплект + расходники на каждый тест
        длительность одного теста — несколько дней по времени
        + весьма ресурсоемкие обработка и хранение данных на мощных компах после считывания: на каждый проведенный тест получаем больше 100 ГБ сырых данных, которые нужно хранить и обсчитывать при анализе
        + работа нескольких задействованных в процессе человек разных профессий


        1. shadrap
          16.12.2019 16:17
          +1

          Большие расходы на оборудование, это потому что их делают большими, те кто его продает. У Иллюмины сколько сейчас доля? около 80% рынка…, это с покупкой Кайген или еще больше? Ждем китайцев, они наше все) Только на них надежда, что просадят ценник на сиквенс.
          СОгласен, от интерпретации никуда не деться, это сейчас самое главное «бутылочное горло»… и в будущем видимо это и будет основной составляющей цены.


  1. Mad__Max
    16.12.2019 04:28
    +1

    А что у вас на слайде сравнивающем новый тест с анализом Снипов на чипах за число в 590 млн. «позиций генома» фигурирует?

    Если заявлено полное сканирование всего генома, ну кроме небольших трудночитаемых участков типа упомянутых теломер и центромер, то это должно быть порядка 3 миллиардов пар оснований (bp). 3.3 млрд. всего в ДНК минус нечитаемые по данной технологии отрезки.

    Что за 590 млн позиций тогда?


    1. gecube
      16.12.2019 08:59

      Прошу прощение, за нубство. 3.3 млрд — это с экзомом или без?
      И 590 млн — я так понимаю — речь идёт о тех, для которых есть понимание за что они отвечают.


      1. asyaaam Автор
        16.12.2019 10:52
        +2

        В геноме человека уникальных нуклеотидов более 3 млрд. Из них >70% не меняется никогда ни у одного человека. Остальное, что в человеческой популяции хоть когда-нибудь было зафиксировано в нескольких состояниях, называется генетическая вариация и содержится в базе данных dbSNP. Это более 600 млн известных вариаций.

        В процессе анализа Полного генома читается >95% ДНК (исключение — центромеры, теломеры и некоторые другие сложные участки ДНК с множеством повторов). В худшем случае — на минимально допустимом среднем покрытии в 30Х — мы дадим результат о ~590 млн вариаций.

        Это в формате VCF. Также при первом запросе мы дадим данные и в самом сыром формате FASTQ — все прочтения напрямую с секвенатора, — и в формате SAM, где эти прочтения выровнены нами на GRCh38


        1. gecube
          16.12.2019 11:43

          Да, вспоминается история, что ДНК банана и человека на 99% совпадают )


          1. shadrap
            16.12.2019 16:18
            +1

            на 50, не принижайте уж так х-сапиенса