Хранение информации в молекулах в течение миллионов лет

Книги могут гореть. Компьютеры взломаны. DVD ухудшаются. Технологии хранения информации — чернила на бумаге, компьютеры, компакт-диски и DVD-диски и даже ДНК — продолжают совершенствоваться. И все же угрозы, такие простые, как вода, и такие сложные, как кибератаки, могут все еще испортить наши записи.

По мере того, как бум данных продолжает развиваться, все больше и больше информации поступает на все меньше и меньше места. Даже облако — чье имя обещает непрозрачное, бесконечное пространство — в конце концов выйдет из космоса, не сможет помешать всем хакерам и поглотит энергию. Теперь новый способ хранения информации может стабильно хранить данные в течение миллионов лет, жить за пределами взломанного интернета и после написания не потреблять энергию. Все, что вам нужно, это химик, несколько дешевых молекул и ваша ценная информация.

«Подумайте о хранении содержимого Нью-Йоркской публичной библиотеки с чайной ложкой белка», — говорит Брайан Кафферти, первый автор статьи, которая описывает новую технику и докторскую диссертацию в лаборатории Джорджа Уайтсайда, Вудфорда Л. и Энн А. Профессор университета цветов в Гарвардском университете. Работа была выполнена в сотрудничестве с Миланом Мрксичем и его группой в Северо-Западном университете.

«По крайней мере, на данном этапе мы не видим, чтобы этот метод конкурировал с существующими методами хранения данных», — говорит Кафферти. «Вместо этого мы рассматриваем это как дополнение к этим технологиям и в качестве первоначальной цели хорошо подходящее для долговременного хранения архивных данных».

Химический инструмент Кафферти не может заменить облако. Но система хранения файлов предлагает заманчивую альтернативу биологическим инструментам хранения, таким как ДНК. Недавно ученые обнаружили, как манипулировать нашим верным хранителем генетической информации, чтобы кодировать больше, чем просто цвет глаз. Теперь исследователи могут синтезировать нити ДНК, чтобы записывать любую информацию, в том числе видео о кошках, о тенденциях в диете и о кулинарных уроках (должен ли это быть другой вопрос).

Но хотя ДНК мала по сравнению с компьютерными чипами, макромолекула велика в молекулярном мире. И синтез ДНК требует квалифицированного и часто повторяющегося труда. Если каждое сообщение должно быть разработано с нуля, хранение макромолекул может стать долгой и дорогой работой.

«Мы намерены изучить стратегию, которая не заимствует непосредственно из биологии», — говорит Кафферти. «Вместо этого мы полагались на методы, обычные в органической и аналитической химии, и разработали подход, в котором для кодирования информации используются небольшие молекулы с низким молекулярным весом».

С помощью всего лишь одного синтеза команда может производить достаточно маленьких молекул для кодирования видео с несколькими кошками одновременно, что делает этот подход менее трудоемким и более дешевым, чем тот, который основан на ДНК.

Для их молекул с малым весом команда выбрала олигопептиды (два или более пептида, связанных вместе), которые являются общими, стабильными и меньше, чем ДНК, РНК или белки.

Олигопептиды также различаются по массе в зависимости от их количества и типа аминокислот. Смешанные вместе, они отличаются друг от друга, как буквы в алфавитном супе.

Делать слова из букв немного сложно: в микроячейке — как в миниатюрной версии «удар-моль», но с 384 мольными отверстиями — каждая лунка содержит олигопептиды с различными массами. Так же, как чернила поглощаются на странице, смеси олигопептидов затем собираются на металлической поверхности, где они хранятся. Если команда хочет прочитать то, что они «написали», они смотрят на одну из лунок через масс-спектрометр, который сортирует молекулы по массе. Это говорит им, какие олигопептиды присутствуют или отсутствуют: их масса отдает их.

Затем, чтобы перевести беспорядочный состав молекул в буквы и слова, они позаимствовали двоичный код. Например, «М» использует четыре из восьми возможных олигопептидов, каждый из которых имеет различную массу. Четверо, плавающие в скважине, получают «1», а остальные четыре — «0». Молекулярно-двоичный код указывает на соответствующую букву или, если информация является изображением, соответствующий пиксель.

С помощью этого метода смесь из восьми олигопептидов может хранить один байт информации; 32 может хранить четыре байта; и больше может хранить еще больше.

До сих пор Кафферти и его команда «писали», хранили и «читали» знаменитую лекцию физика Ричарда Фейнмана «Внизу много места», фотографию Клода Шеннона (известного как отец теории информации) и Хокусая. роспись по дереву Большая волна у Канагавы. Поскольку к 2020 году мировой цифровой архив достигнет 44 триллионов гигабайт (в десять раз больше, чем в 2013 году), изображение цунами кажется подходящим.

Прямо сейчас, команда может получить свои сохраненные шедевры с точностью 99,9%. Их «запись» в среднем составляет 8 бит в секунду, а «чтение» — в среднем 20 бит в секунду. Несмотря на то, что скорость их «написания» намного превышает скорость написания синтетической ДНК, с макромолекулой чтение может быть и быстрее, и дешевле.

Но с более быстрой технологией скорость команды, несомненно, увеличится. Например, струйный принтер может генерировать капли со скоростью 1000 в секунду и помещать больше информации в меньшие области. И улучшенные масс-спектрометры могут принимать даже больше информации за раз.

Команда также может улучшить стабильность, цену и емкость своего молекулярного хранилища с помощью различных классов молекул. Их олигопептиды изготавливаются на заказ и, следовательно, дороже. Но будущие создатели библиотек могли бы купить недорогие молекулы (например, алкантиолы), которые стоили бы всего один цент, чтобы записать 100 000 000 бит информации.

В отличие от других систем хранения молекулярной информации, которые полагаются на одну конкретную молекулу, этот подход может использовать любую податливую молекулу, если она может быть преобразована в различимые биты.

Олигопептиды — и подобные варианты — уже устойчивы. «Олигопептиды обладают стабильностью в течение сотен или тысяч лет при подходящих условиях», — говорится в документе. Выносливые молекулы могут существовать без света и кислорода, при высокой температуре и засухе. И, в отличие от облака, к которому хакеры могут получить доступ со своего любимого удобного кресла, доступ к молекулярному хранилищу может быть получен только лично. Даже если вор обнаружит тайник с данными, потребуется немного химии, чтобы получить код.

Масштабируемая молекулярная библиотека Cafferty — это стабильный, не потребляющий энергии и устойчивый к коррупции вариант для будущего хранения информации. Таким образом, если книги сгорают, компьютеры взламываются, а DVD-диски выходят из строя, может сохраниться огромное количество информации, которая напомнит будущему человечеству, насколько мы любим хорошее видео для кошек.