
В 1862 году Грегор Мендель разводил горох для изучения наследственности. Через 100 лет, в 1962 Джеймс Уотсон, Фрэнсис Крик и Морис Уилкинс были награждены Нобелевской премией за открытие структуры ДНК. В век биотехнологий, наша способность читать, писать и редактировать ДНК меняет все - от здоровья человека до производства. Следующее перемены могут произойти в мире хранения данных.
Технологические
гиганты, включая Facebook и Amazon и миллионы
пользователей, каждую секунду генерируют
петабайты данных в Интернете. Microsoft
работает, чтобы хранить эту информацию
в As, Ts, Cs и Gs вместо бинарного кода.
![]() |
Microsoft и UW демонстрируют первое полностью автоматизированное хранилище данных ДНК. |
«Подумайте о
том, чтобы сжать всю информацию в
Интернете в обувную коробку», - говорит
Карин Штраус, главный исследователь
Microsoft. «С хранением данных в ДНК это
возможно».
Карин работает
с Луисом Цезе, профессором компьютерных
наук и инженерии в Вашингтонском
университете. Используя синтетические
молекулы ДНК, команда успешно сохранила
более одного гигабайта читаемой
информации, включая 100 лучших книг от
ProjectGutenberg, и музыкальное видео в
высоком разрешении группы OK Go.
Плотность
информации ДНК замечательна - только
один грамм ДНК может
хранить 215 петабайт или 215 миллионов
гигабайт данных. Для контекста, средний
жесткий диск в ноутбуке может вместить
только одну миллионную часть этой суммы.
«Мы кодируем все данные на молекулярном
уровне, делая их как можно меньшими по
размеру, и храним их в среде, которая
прослужит довольно долго и не устареет,
как гибкие диски, из-за ее вечной
значимости для жизни», - говорит Штраус.
Усовершенствованные
методы чтения и записи ДНК, в том числе
увеличение длины нитей ДНК, пригодных
для этих целей, способствовали быстрому
увеличению объема возможного хранения
данных в ДНК.
В дополнение
к новаторскому хранилищу данных высокой
плотности Цезе и Штраус также провели
поиск сходства
между изображениями с использованием
ДНК, и создали первую полностью
автоматизированную систему хранения ДНК для записи и чтения.
Как работает
эта технология? Это на удивление просто.
Данные сначала переводятся из бинарного
кода в As, Ts, C и G. Этот генетический код
затем синтезируется в фактическую
молекулу и процесс «кодирования»
завершен.
Получение
данных немного сложнее. Должны быть
выполнены два шага - «обработка» и
«декодирование». Имитирующая оперативную
память, полимеразная цепная реакция
(ПЦР) оттачивает на целевом участке
последовательности, которые затем
реплицируется, секвенируют, декодируются
и корректируются на ошибки для извлечения
исходных данных.
Полимеразная цепная реакция или ПЦР,
представляет собой метод, позволяющий
делать множество копий определенной
области ДНК in vitro (в пробирке, а не в
организме).
Этот целевой
подход эффективен, поскольку включает
в себя только желаемую последовательность,
а не весь набор данных. Рост хранения
данных ДНК, который раньше был предметом
научной фантастики, стал возможен
благодаря достижениям
в области биотехнологии, в частности,
благодаря улучшению высокопроизводительного
секвенирования и синтеза ДНК.


Поскольку эти биопрограммисты
контролируют, какие материалы входят
в их эксперименты, и их последовательности
не требуют тщательной разработки для
функционирования в живом организме,
затраты по сравнению с типичными
экспериментами в области наук о жизни
снижаются. Однако путешествие не обошлось
без дорожных заграждений. Несмотря на
значительное улучшение, работа с ДНК
может быть медленной и дорогой. Дальнейшая
оптимизация все еще необходима.
«Автоматизация была и остается одной
из наших самых больших проблем», - говорит
Штраус.
Междисциплинарная
команда Microsoft и UW видит ценность в ее
разнообразном прошлом. «Если технология
продолжит развиваться так, как мы ее
видим прямо сейчас, вполне возможно,
что мы будем рассматривать хранение
ДНК как форму архивирования для широкой
публики в течение десятилетия».
Комментарии
Отправить комментарий