Хранение данных при помощи ДНК скоро станет вирусным

Хранение данных при помощи ДНК скоро станет вирусным
В 1862 году Грегор Мендель разводил горох для изучения наследственности. Через 100 лет, в 1962 Джеймс Уотсон, Фрэнсис Крик и Морис Уилкинс были награждены Нобелевской премией за открытие структуры ДНК. В век биотехнологий, наша способность читать, писать и редактировать ДНК меняет все - от здоровья человека до производства. Следующее перемены могут произойти в мире хранения данных.
Технологические гиганты, включая Facebook и Amazon и миллионы пользователей, каждую секунду генерируют петабайты данных в Интернете. Microsoft работает, чтобы хранить эту информацию в As, Ts, Cs и Gs вместо бинарного кода.
Microsoft и UW демонстрируют первое полностью автоматизированное хранилище данных ДНК.
«Подумайте о том, чтобы сжать всю информацию в Интернете в обувную коробку», - говорит Карин Штраус, главный исследователь Microsoft. «С хранением данных в ДНК это возможно».
Карин работает с Луисом Цезе, профессором компьютерных наук и инженерии в Вашингтонском университете. Используя синтетические молекулы ДНК, команда успешно сохранила более одного гигабайта читаемой информации, включая 100 лучших книг от ProjectGutenberg, и музыкальное видео в высоком разрешении группы OK Go.

Плотность информации ДНК замечательна - только один грамм ДНК может хранить 215 петабайт или 215 миллионов гигабайт данных. Для контекста, средний жесткий диск в ноутбуке может вместить только одну миллионную часть этой суммы. «Мы кодируем все данные на молекулярном уровне, делая их как можно меньшими по размеру, и храним их в среде, которая прослужит довольно долго и не устареет, как гибкие диски, из-за ее вечной значимости для жизни», - говорит Штраус.
Усовершенствованные методы чтения и записи ДНК, в том числе увеличение длины нитей ДНК, пригодных для этих целей, способствовали быстрому увеличению объема возможного хранения данных в ДНК.
В дополнение к новаторскому хранилищу данных высокой плотности Цезе и Штраус также провели поиск сходства между изображениями с использованием ДНК, и создали первую полностью автоматизированную систему хранения ДНК для записи и чтения.
«Мы пытаемся улучшить компьютеры с помощью системного подхода, который находит отличные альтернативы и решения в природе», - говорит Штраус. «Вычислительные подходы, поддерживаемые работой с ДНК, делают его еще более привлекательным вариантом для хранения данных», - добавляет Цезе. «У нас есть свобода выбора, как отображать биты в последовательности ДНК, создавая избыточность и высокую устойчивость к ошибкам при чтении и записи ДНК».


Как работает эта технология? Это на удивление просто. Данные сначала переводятся из бинарного кода в As, Ts, C и G. Этот генетический код затем синтезируется в фактическую молекулу и процесс «кодирования» завершен.
Получение данных немного сложнее. Должны быть выполнены два шага - «обработка» и «декодирование». Имитирующая оперативную память, полимеразная цепная реакция (ПЦР) оттачивает на целевом участке последовательности, которые затем реплицируется, секвенируют, декодируются и корректируются на ошибки для извлечения исходных данных.
Полимеразная цепная реакция или ПЦР, представляет собой метод, позволяющий делать множество копий определенной области ДНК in vitro (в пробирке, а не в организме).
Этот целевой подход эффективен, поскольку включает в себя только желаемую последовательность, а не весь набор данных. Рост хранения данных ДНК, который раньше был предметом научной фантастики, стал возможен благодаря достижениям в области биотехнологии, в частности, благодаря улучшению высокопроизводительного секвенирования и синтеза ДНК.
Поскольку эти биопрограммисты контролируют, какие материалы входят в их эксперименты, и их последовательности не требуют тщательной разработки для функционирования в живом организме, затраты по сравнению с типичными экспериментами в области наук о жизни снижаются. Однако путешествие не обошлось без дорожных заграждений. Несмотря на значительное улучшение, работа с ДНК может быть медленной и дорогой. Дальнейшая оптимизация все еще необходима. «Автоматизация была и остается одной из наших самых больших проблем», - говорит Штраус.
Междисциплинарная команда Microsoft и UW видит ценность в ее разнообразном прошлом. «Если технология продолжит развиваться так, как мы ее видим прямо сейчас, вполне возможно, что мы будем рассматривать хранение ДНК как форму архивирования для широкой публики в течение десятилетия».

Комментарии