Термин «вирусное видео» приобретает новый смысл в связи с экспериментом, который провели учёные Гарвардской медицинской школы. Им удалось записать цифровую информацию не просто в синтезированный генетический материал, а в гены живой бактерии E.coli. Это значит, что живой организм может выступать носителем цифровой информации и хранить файлы непосредственно в ДНК.

Учёные давно экспериментируют с хранением цифровых файлов в ДНК, поскольку этот носитель отлично подходит для цифровой информации. В конце концов, это всего лишь код в четверичной системе счисления: генетическая программа кодируется четырьмя нуклеотидами, которые обозначаются символами A, G, C и T, и она вмещает очень много информации в ограниченном пространстве.

Эксперименты с записью файлов в ДНК были особенно успешными в последние пять лет. В 2012 году гарвардская группа записала в синтезированную макромолекулу ДНК текст книги на 53 000 слов. Абсолютный рекорд был поставлен в марте 2017 года, когда в ДНК записали 200 мегабайт информации. Даже Microsoft подключилась к этим научным опытам: год назад стало известно, что Microsoft заказала у компании Twist Bioscience синтез 10 млн макромолекул ДНК с определённой последовательностью нуклеотидов. Интересно, что производитель изготовил молекулы, не мог прочитать записанную туда информацию, потому что не имел ключа расшифровки.

До настоящего времени все эксперименты происходили преимущественно с синтезированными ДНК, ещё никогда учёным не удавалось записать цифровую информацию в живой организм, а затем успешно прочитать её. Это гораздо более сложный процесс, но исследователи из Гарварда сделали это с помощью техники редактирования генома CRISPR.

CRISPR (clustered, regularly interspaced, short palindromic repeats) базируется на механизме антивирусной защиты в организме. Иммунная система распознаёт чужеродные вирусы, захватывает у них фрагмент ДНК и помещает его в базу сигнатур, которая хранится геноме бактерии. Учёные обманули систему, подсовывая фрагменты своего анимированного файла, кадр за кадром, вместо вирусов. Обманутая иммунная система сама сложила из них нужную последовательность.

Для записи выбрали одно из первых в истории анимированных изображений в истории фотографии — чёрную лошадь, движущуюся на белом фоне, которую записал на своей ферме в Пало Альто (Калифорния) английский и американский фотограф Эдвард Мейбридж в 1877 году. Это был первый в мире успешный опыт хронофотографии. Спустя двадцать лет опыт перенимут братья Люмьер и назовут его кинематографом.


«Лошадь в движении» Мейбриджа

В ДНК был записан анимированный файл с бегущей лошадью размером 36?26 пикселей. Затем с помощью техники секвенирования ДНК исследователи восстановили анимацию с точностью 90%.




Плотность записи информации в ДНК гораздо выше, чем во флеш-памяти или на магнитных носителях. В 1 грамм ДНК можно записать около 1 зеттабайта файлов (10?? байт), а вся генетическая программа человека помещается в 1,6 ГБ. По другим оценкам, если посчитать общий объём информации в ДНК всех человеческих клеток, то выходит около 60 ЗБ, а 99,9% этой информации у всех одинаково.

Авторы научной работы говорят что ДНК имеет ценность не только как носитель существующей информации, но и как средство для записи биологических процессов в организме, которые потом можно будет считать и расшифровать, как лог-файлы с сервера. Например, науке неизвестно, как происходит развитие клеток на ранней стадии. Ведь всё разнообразие человеческих клеток развивается из совершенно одинаковых плюрипотентных стволовых клеток. По неведомым причинам некоторые из этих клеток превращаются в клетки мозга, другие — во внутренние органы, в кровяные клетки и т. д. Процесс выбора роли и времени, когда принимается «решение» о превращении в ту или иную клетку, а также о факторах, под воздействием которых принимается это решение, пока до конца не исследованы наукой. Возможно, «цифровые» логи — система записи и хранения информации внутри клеток — дадут хронологическую запись развития клетки и помогут нам разобраться в деталях этого процесса. Но сначала систему проверяют на цифровых данных.

Любопытно, что задолго до развития молекулярной биологии о записи информации в ДНК говорил Ричард Фейнман: «Биология не просто пишет информацию, она нечто делает с ней», — говорил он в лекции 1959 года. Та его лекция подтолкнула д-ра Леонарда Адельмана (один из соавторов алгоритма шифрования RSA, где его фамилию обозначает буква А) к первым экспериментам по записи данных в ДНК. В 1994 году он сообщил, что молекулярные вычисления сумели решить математическую задачу из комбинаторики.

Прогресс в биоинформатике идёт сумасшедшими темпами. Первое секвенирование человеческого генома заняло несколько лет и стоило $3 000 000 000. Самые оптимисты говорили, что спустя 50-60 лет мы сможем снизить стоимость до $1000. На самом деле для этого понадобилось шесть лет.

Научная работа опубликована 12 июля 2017 года в журнале Nature (doi:10.1038/nature23017, pdf).
Поделиться с друзьями
-->

Комментарии (15)


  1. himegood
    13.07.2017 20:56
    +2

    Приятно читать такую новость. В интересное время живем! Спасибо за статью.


  1. tormozedison
    13.07.2017 21:24

    "В конце концов, это всего лишь код в четверичной системе счисления: генетическая программа кодируется четырьмя нуклеотидами, которые обозначаются символами A, G, C и T, и она вмещает очень много информации в ограниченном пространстве".


    Что роднит её с БК и CGA, где каждый пиксель может принимать одно из четырёх состояний. Правда, там четверичная система эмулирована двумя двоичными битами.


  1. Lsh
    13.07.2017 22:06
    +1

    Потенциальные объёмы большие, да. А удобство использования хуже чем у ленточного накопителя.


    1. himch
      14.07.2017 00:29
      +2

      Подождем, пока разрабы не выкатят обучающие пилюли))


      1. Lsh
        14.07.2017 10:16
        +1

        Пилюли надо будет защищать от соляной кислоты в желудке. Проще уж свечи.


        1. runapa
          14.07.2017 19:37

          Современные пилюли вполне успешно справляются с задачей защиты от кислоты.


  1. Dioxin
    14.07.2017 07:25

    Совсем страшно жить становится.
    Поцеловал девушку — заразился шифровальщиком.


    1. Idot
      14.07.2017 09:08

      А затем у тебя перед глазами вылезет надпись выслать биткоины в течение 48 часов, а иначе отключат почки.


    1. romankonstant
      14.07.2017 18:33

      Теоретически, СПИД это уже готовый, в некотором смысле, «Шифровальщик» :)


  1. o5a
    14.07.2017 09:42
    +1

    Возможно и предназначение людей — хранить в себе анимацию галактической лошади. Все остальное — побочный эффект.


    1. Jamato
      15.07.2017 20:06
      +1

      Сферической и в вакууме?


  1. dostapn
    14.07.2017 10:48
    -1

    1 зеттабайта файлов

    Вы наверно имели в виду 1 зеттабайт информации/данных, или я чего-то не понимаю и у нас теперь файл является мерой?


  1. tot418
    15.07.2017 14:47

    Где то в будущем диалог:
    Куда ж вы голубчик в Linux лезите?
    У вас на роду Windows написано.


  1. SirStefan
    15.07.2017 18:44
    -1

    Т.е. они смогли иммунной системе в стандартный механизм подсунуть видео скачущей лошади, но не додумались подсунуть обновление базы сигнатур известных вирусов?


  1. Unk
    18.07.2017 11:24
    -1

    Ждём момента, когда можно будет записать коллекцию сохранённых картинок в свою Y-хромосому и обеспечить её наследственную передачу на много поколений вперёд.