Oligotheca

Хранение данных в ДНК / DNA Data Storage 

кто владеет информацией – тот владеет миром

История технологии

Ричард Фейнман

Ричард Фейнман

(1918—1988)

Ричард Фейнман (англ. Richard Feynman; 11 мая 1918, Куинс, Нью-Йорк, США — 15 февраля 1988, Лос-Анджелес, США) — американский физик, основные достижения относятся к области теоретической физики и квантовой физики. Лауреат Нобелевской премии по физике 1965 г. Один из основоположников нанотехнологии.

Михаил Самойлович Нейман

(1905—1975)

Михаил Самойлович Нейман (1905—1975) — советский ученый-физик, доктор технических наук, профессор. В 1964 – 1965 гг. впервые высказал идею об использовании биополимеров (ДНК) для хранения небиологической информации

«Пятьдесят лет назад хранение данных в молекулах ДНК считалось научной фантастикой», — заявила недавно генеральный директор и соучредитель Twist Biosciences Эмилия Лепруст, — «Сегодня это наука, имеющая путь к широкому внедрению. Мы ожидаем, что в ближайшие три-пять лет, при соответствующем объеме государственных и отраслевых инвестиций, она станет реальностью для долгосрочного хранения информации».

Актуальность разработки

Некоторые количественные показатели, связанные с долговременным хранением разной информации в молекулах ДНК

По некоторым оценкам, объем накопленной человечеством информации составляет сейчас более 80 зеттабайт и возрастает с каждым годом приблизительно наполовину.

По другим оценкам человечество в 2025 году произведет 175 зеттабайт информации.

Считается, что к 2040 году накопленные данные составят более 3 йоттабайт, для хранения которых потребуется более 109 кг кремния особой чистоты.

килобайт — кбайт — 103
мегабайт — Мбайт — 106
гигабайт — Гбайт — 109
терабайт — Тбайт — 1012
петабайт — Пбайт — 1015
эксабайт — Эбайт — 1018
зеттабайт — Збайт — 1021
йоттабайт — Йбайт — 1024

1 г одноцепочечной ДНК может хранить 455 эксабайт информации, что эквивалентно приблизительно 100 млрд. стандартных DVD дисков

Общий принцип составления участков ДНК, несущих информацию для ее хранения

В данном случае длина олигонукдлеотида 245 звеньев (что почти на пределе нынешнего синтеза химическим методом). Из них только 168 нуклеотидов несут значимую информацию, остальные – служебные последовательности.

Главный недостаток всех этих способов долговременного хранения информации в молекулах ДНК — это подверженность последних действию нуклеаз (ДНКаз), которые в водных растворах на этапе закладки и извлечения информации способны порушить всю информацию.

Решение проблемы хранения информации в молекулах ДНК

Решением проблемы является применение неприродных молекул ДНК, не подверженных нуклеазным атакам, но в способах, рассчитанных на ферментативную амплификацию и секвенирование ДНК, такие принципиально использованы быть не могут. Однако мономолекулярное нанопоровое секвенирование, не требующее амплификации может быть пригодно.

Неприродных ДНК, называемых обобщенно XNA (Xeno-), существует немало (PNA, LNA, GNA, TNA, L-DNA etc.) и некоторые могут оказаться пригодны для организации долговременного хранения любой информации на ДНК-чипах, не требующих ферментативных действий.

Существующие проблемы и стоящие задачи в DNA Data Storage

В технологиях Запада – одной из главных проблем является снижение стоимости химического синтеза олигонуклеотидов и увеличение длины синтезируемых молекул

Мы знаем как удешевить синтез и увеличить длину синтезируемых олигонуклеотидов до 1000 и более звеньев. Сейчас их длина составляет 200 – 300 нуклеотидов. В том числе ее можно увеличить с использованием нашей PyPu-кодировки.

Разрабатываемый ферментативный синтез олигонуклеотидов с помощью терминальной ДНК трансферазы довольно дорог и вряд ли вытеснит химический синтез.

Мы предлагаем использовать иной фермент для синтеза более протяженных олигонуклеотидов длиной более тысячи звеньев опять-таки с помощью PyPu-кодировки.