Теоретически, в одном грамме ДНК можно разместить один миллиард терабайт данных. В определенных условиях запись может храниться тысячи лет. Но пока не решен вопрос эффективной записи и считывания информации из ДНК. Сейчас над этой проблемой работают корпорация Microsoft и Вашингтонский университет. В апреле этого года партнерам удалось сохранить в ДНК 150 КБ информации — три картинки. Теперь процесс усовершенствовали, и записать удалось уже 202 МБ. В молекулы дезоксирибонуклениовой кислоты записали музыкальное видео OK Go в высоком разрешении, к которому добавили Всеобщую декларацию прав человека, переведенную на 100 языков, топ-100 книг «Проекта Гутенберг» и базу данных по нитям ДНК от Crop Trust’s.
Проект по записи информации в ДНК получил название Project Palix.
Работа велась с синтетической ДНК, закупленной у компании Twist Bioscience в количестве 10 миллионов нитей. Синтетическая ДНК определенной конфигурации разрабатывается по заказу. Стоимость пары оснований такого материала составляет 10 центов. Цена постепенно снижается, и производитель рассчитывает достичь отметки в 2 цента за пару оснований.
Корпорация Microsoft и Вашингтонский университет — не первые, кто решил использовать идею записи данных в ДНК. В 2010 году биологи из Гонконга предложили метод внедрения в геном бактерии E.coli синтетическую ДНК. Китайцы для кодирования информации использовали четверичную систему счисления, по количеству нуклеотидов (0 = A, 1 = T, 2 = C, 3 = G). Ученые переводили тестовые данные в цифры по таблице ASCII (i = 105; G = 71; E = 69; M = 77), потом — в четверичную систему (105 > 1221; 71 > 0113; 69 > 0111; 77 > 0131), и после этого — в цепочку нуклеотидов.
Два года спустя гарвардские ученые, используя другой метод, записали в ДНК 643 килобайта данных. В Гарварде решили отказаться от работы с живыми организмами. Вместо этого синтетическая ДНК внедрялась в молекулу, сгенерированную на специальном ДНК-чипе. Достоинством этого метода является отсутствие опасности потери информации из-за мутаций организма-носителя.
Этим ученым удалось закодировать книгу Черча, причем с сохранением форматирования и иллюстраций.
Microsoft и Вашингтонский университет используют метод, предложенный специалистами из Гарварда. Сначала единицы и нули двоичного кода переводятся в комбинации нуклеотидов — аденин, гуанин, цитозин и тимин. После этого синтезируется искусственная ДНК, которая содержит эти данные. Само кодирование информации проводит компания Twist Bioscience, предоставляющая нити синтетической ДНК. Заказчики сообщают последовательность, компания производит цепочку с нуля. Что за информация закодирована в таких молекулах, Twist Bioscience не знает. Для определения конца и начала записываемых файлов в молекулу ДНК вводятся специальные маркеры.
По словам Луис Энрики Сез (Luis Henrique Ceze), одной из участников проекта, за последние несколько лет генетики достигли больших успехов как в кодировании, так и в декодировании ДНК-информации. Точность кодирования информации достигает 100%. Технология расшифровки данных позволяет восстанавливать закодированную информацию без потерь. Но пока что широко применять её нельзя — это возможно делать только в лабораторных условиях. Предстоит работать еще несколько лет до момента вывода технологии записи данных в ДНК на доступный для массового использования уровень.
«Используя новые технологии доступного секвенирования ДНК и синтеза, Twist Bioscience и Microsoft теперь могут реализовать на практике теорию хранения информации в ДНК. Основная цель — разработка методов, которые являются и практичными. и масштабируемыми. Возможность кодирования цифровой информации в нитях ДНК — крупное достижение в сфере хранения данных, поскольку молекулы ДНК лишены недостатков большинства современных средств хранения данных… Поскольку практически все живое на Земле существует благодаря ДНК, всегда будут технологии для считывания ДНК, так что можно быть уверенными в доступности сохраненных данных. Более того, с ростом актуальности ДНК-технологий в научных и медицинских исследований, методы чтения/записи информации в нитях ДНК будут постоянно совершенствоваться. Эти технологии востребованы во многих сферах деятельности человека», — говорится в совместном заявлении партнеров.
Методы работы с генетической информацией совершенствуются, а стоимость считывания ДНК снижается. Проект по расшифровке генома человека в 2003 году стоил $1 млрд. Сейчас стоимость расшифровки генома такой же сложности — всего $1000.
Комментарии (60)
dipsy
08.07.2016 12:05+4Непонятно зачем возня именно с ДНК. В одном грамме чего угодно можно записать миллиард терабайт данных, если оперировать на уровне атомов. Неужели органика более удобная может быть в перспективе, чем например объемная запись в прозрачном кристалле какого-нибудь кварца?
upsilon
08.07.2016 12:39+2Ну, эволюция выбрала ДНК для записи информации, если с чего-то начинать, то почему бы не с повторения успеха?
Alex_Hannibal
08.07.2016 12:41+2Я полагаю, что ДНК просто являет собой достаточно устойчивую структуру, способную восстанавливать себя после повреждений извне (ДНК-репарация).
sergku1213
08.07.2016 13:34В кристалле кварца выйдет записать на уровне дефектов решётки, он же КРИСТАЛЛ. Значит плотность записи уже ниже. Опять же — дефекты решётки — неустойчивы и имеют тенденцию мигрировать, исчезать и т.п. Можно представить себе какой-нибудь полимер, лучше на органической основе. Типа Акрилонитрил-бутадиен-стирол. Но! Как манипулировать функциональными группами — ну совсем-совсем не ясно. Даже конь не валялся. А с ДНКой и аминокислотами — всё уже миллиарды лет работает и даже есть механизмы восстановления и изучено неплохо. Хотя с точки зрения химической устойчивости — да, не супер, но технологические трудности…
willmore
08.07.2016 13:40+5Через миллион лет после пребывания человечества на Земле прилетит сюда иная цивилизация, станет исследовать биосферу. Вот бактериальные маты на горячих источниках. Открывают геном, а там — оп! — все альбомы Майкла Джексона. Поймали особь лося-мутанта в тропическом лесу — получили сборник документалок с 2000 по 4500 годы. :)
potan
08.07.2016 13:52Есть более-менее готовый стек технологий для работы с ДНК. Для чего-нибудь другого все придется создавать заново.
SGordon123
08.07.2016 12:06А просвятите, настоящую произвольную ДНК научились делать? Насколько хлопотно сосканировать реальную ДНК какой нить нимфузории и поменять в ней только пару оснований, чтобы посмотреть к чему это приведет?
Sadler
08.07.2016 12:50+1Для изменения пары оснований не надо синтезировать целую новую днк, достаточно исправить старую. Особых проблем с этим нет, в основном на данном этапе мешает этика.
SGordon123
08.07.2016 15:33Этика в ковырянии в существующей днк/ создании новой/ обоих случаях? Начинается с какого -то количества оснований?
Sadler
08.07.2016 16:23+1Спросите у тех, кто против развития технологии, откуда у них там начинаются проблемы с изменением генома.
potan
08.07.2016 13:57Был синтезирован полностью работоспособный геном микобактерии. Инфузории — очень сложные организмы со сложно устроенным геномом. Из эукариот наиболее простыми являются дрожжи, но даже их геном пока синтезировать не получается. Хотя технология не стоит на месте и скорее всего это станет возможно в течении десятилетия.
Varzhak
08.07.2016 16:21
Vadzimkan
08.07.2016 19:25В принципе собрать произвольную ДНК на сегодняшний день технические средства позволяют. Однако есть одно но — это будет очень короткое ДНК. С каждым новым основанием вероятность ошибки накапливается. Поэтому как правило вырезают/вставляют куски уже в существующие геномы. (а вот вставляемый кусок можно а) вырезать из другого генома, б) собрать из готовых кусков, в) синтезировать.)
ilyaplot
08.07.2016 12:07Интересно, что произойдет с носителем ДНК, если записывать туда то, что там быть не должно. Как какая-то железка при редактировании бинарника прошивки блокнотом откажется работать?
ploop
08.07.2016 12:18Да ничего, если структура не повреждена. Это как ресурсы в бинарнике — пиши туда хоть гигабайты, на исполняемый код это не повлияет, если его не затронуть.
FYR
08.07.2016 12:49Причем где-то видел что толи половина толи больше в нашей ДНК — уже неактивно и просто какой то мусор от вирусов оставшийся.
ploop
08.07.2016 16:21Угу, тоже слышал, и сходна практически со всеми живыми организмами на земле. Т.е. ДНК наша с вами и банана больше чем на половину идентичны :)
mihailfilatov
08.07.2016 12:43Т.е. скоро любой человек сможет себе распечатать ДНК какого-нибудь крутого вируса?
Vadzimkan
09.07.2016 13:11Любой — нелюбой, всё таки нужно обладать специальными знаниями и техническими возможностями, но собрать ДНК вируса на сегодняшний день уже возможно.
Cubicmeter
08.07.2016 13:03Нет ли в этом опасности, что некая информация в закодированном таким образом виде окажется генетическим кодом опасного вируса?
ClearAirTurbulence
08.07.2016 13:43Вирус — это не только ДНК\РНК\ДНК+РНК. Надо еще капсид, а в некоторых случаях — липидные оболочки.
Без всего этого можно получить разе что вироид. Но нужна РНК, а не ДНК, причем не простая, а кольцевая. И случайно получится он, конечно, может, но примерно с той же вероятностью, что толпа обезъян с пишущими машинками выдаст «Войну и мир».
А вот неслучайно — по мере развития нано- и биотеха — вполне. Но к тому времени прекоги будут присылать к редискам группу захвата еще до того, как они подключат свежекупленный биофабрикатор.
bubuq
08.07.2016 18:43Именно такой способ распростанения (интеграция в геном хозяина) и является штатным у ретровирусов, так что опасаться поздно. Поэтому так тяжело боросться с ВИЧем, например.
Andriy1218
08.07.2016 13:04+1Почему бы, для удобства вместо "… разместить один миллиард терабайт данных." не написать для удобства "… разместить 1 зеттабайт данных"?
OneOfUs
08.07.2016 15:16+2Можно и написать, только всё равно сноска нужна будет, поскольку к «тера-» уже привыкли и представляют, сколько это информации, а «зета-» ещё не так на слуху
Ugrum
08.07.2016 16:17Проблема с СХД для инициативы Яровой решена-всё писать в неё саму!
Или непосредственно в абонента?
xztau
08.07.2016 19:24// Оффтоп
Вот не пойму, Microsoft корпорация добра или зла? Ненавидеть её или же как?
С такой агрессивной политикой продвигает ОС и в тоже время тратит деньги на развитие науки и техники…o_serega
09.07.2016 15:40microsoft research, кстати, существует уже давно, очень уважаемая организация в мире науки
General_Failure
10.07.2016 10:16Ну так надо же откуда-то деньги на науку брать :)
Сама себя она окупает мягко говоря не быстро
ploop
11.07.2016 15:21+1Вот не пойму, Microsoft корпорация добра или зла? Ненавидеть её или же как?
Вот постой пример того, что мир не делится на чёрное и белое, и даже не на 50 оттенков серого…
xztau
08.07.2016 20:05А кстати, глупый вопрос по кодированию. Кто знает в 2-х словах поясните процесс.
Допустим, перестроили мы молекулы в ДНК в одной клетке, а как их скопировать в другие?black_semargl
09.07.2016 13:19Никак. Вирус «применяется» к каждой клетке.
притом если мы какие-то пропустим — не страшно. Если инсулин начнёт синтезировать не вся железа а только 3/4 — диабет всё равно окажется вылечен.
Syzd
Можно ли внедрить в ДНК человека или другого млекопитающего существа пару книг со знаниями обо всем на свете + пару картинок для подсказок и быть уверенным в передаче информации потомкам хотя бы на сотню другую лет, если род не прервется? Нет ли уже такой информации в ДНК существующих людей?
Murmand
вот — вот, надо проверить человеческую ДНК на присутствие такой информации, а то потом вдруг окажется, что в каждом человеке записано по паре терабайт порнухи.
Greendq
И окажется, что в «мусорном» участке содержатся откровения? :)
solariserj
> по паре терабайт порнухи
Походу так и есть. И ее человек подсознательно смотрит.
antstar
А код какой? Как информация закодирована?
thatsme
Народ у кого к этому архиву есть пароль? Или хотя-бы кряк посоветуйте…
RedSnowman
Учитывая, что вес сперматозоида измеряется числом в виде 10^-7, то в такую массу поместиться, если верить статье, около 1 тб.
Если забить болт на инфу по сборке лысой обезьяны, то записать в него выйдет пару десятков мб.
ploop
Проблема в том, что «знания обо всём на свете» постоянно меняются. Ну писали древние люди знания на пергаментах, а сейчас ценность в них только культурно-историческая.
PavelGatilov
Ну не будем так категоричны, я думаю если бы в генах человека были зашифрованы, например, математика, механика, астрономия и другие знания первых цивилизаций — это как минимум помогло бы науковедам проследить историю развития знания и эволюцию интеллекта.
Некоторые цивилизации были очень развиты в отдельных ремеслах — например египтяне в строительстве, майа в астрономии — так что возможно какие-то знания были утеряны навсегда и восстановить их — могло дать новые идеи в застоявшихся областях.
Scrooge2
Если человечество забудет математику, то с ДНК они ее точно не прочитают.
t_kanstantsin
По-моему, это и есть культурно-историческая ценность.
Или Вы планируете отрыть в ДНК какие-либо технологии инопланетян, которые (по некоторым «версиям») строили пирамиды?
PavelGatilov
Наука — это не только технологии.
Syzd
ну математика, а геометрия в особенности, со времен Пифагора не сильно изменилась.
ploop
Да понятно, базовые вещи не изменились, но если потомки в состоянии прочитать ДНК, то уж Пифаргоровскую геометрию точно знать должны.
Alex_Hannibal
А потом при размножении мы получим половину книги от отца и пару от мамы… Тут остро встает вопрос размножения и сохранения информации в неизменном виде. На сколько я помню за всю жизнь у человека происходит до 10 неисправленных мутаций ДНК.
kxx
Записывать в митохондриальную ДНК — она по материнской линии наследуется.
setevoy4
Если уж мечтать, то интересно — как в таком случае решался бы вопрос с правообладателями? Не будет ли это считаться «пиратством» — получить книгу в «наследство» (хотя — почему в кавычках?)…
deviant_9
Митохондриальный геном маленький, испытывает сильное воздействие активных форм кислорода и плохо ремонтируется.
Тогда уж лучше в Y-хромосому.
Mad__Max
В отличии от основной (ядерной) ДНК там объем очень маленький — всего около 16к пар оснований (32 килобита/4 килобайта), причем большая часть кода критически важна для работы самих митохондрий.
Так что ничего полезного записать не получится, разве что-нибудь в стиле «Да, мы сделали это!» + имя ученого/название лаборатории просто в качестве доказательства возможности записи.
Artur_Domhan
Секундочку. Информация, записанная таким образом в ДНК никак не сможет быть обработана организмом носителя. То есть совсем. ДНК это правила и алгоритмы построения организма, это архитектурная информация, не имеющая никакого отношения к наполнению того, что будет заключено в конечной конструкции. Странно, откуда вообще взялась идея такой возможности.
shteyner
Ну, тут все просто: прилетели инопланетяне и запилили. Как только люди научаться секвенировать ДНК и расшифруют записанное — у них появятся гипердвигатели и прочие плюшки)
potan
Внедрить то можно, только пользоваться он ей вне специально оборудованной лаборатории не сможет.
Но малозначимые участки генома мутируют быстрее (точнее мутации в них с большей вероятностью закрепляются в популяции), так что даже пронести эти знания через многие поколения может не получиться.