Зберігання інформації в молекулах протягом мільйонів років

Книги можуть горіти. Комп'ютери зламані. DVD погіршуються. Технології зберігання інформації – чорнило на папері, комп'ютери, компакт-диски та DVD-диски і навіть ДНК – продовжують удосконалюватися. І все ж таки загрози, такі прості, як вода, і такі складні, як кібератаки, можуть все ще зіпсувати наші записи.

У міру того, як бум даних продовжує розвиватися, все більше і більше інформації надходить на дедалі менше місця. Навіть хмара - чиє ім'я обіцяє непрозорий, нескінченний простір - врешті-решт вийде з космосу, не зможе перешкодити всім хакерам і поглине енергію. Тепер новий спосіб зберігання інформації може стабільно зберігати дані протягом мільйонів років, жити поза межами зламаного інтернету і після написання не споживати енергію. Все, що вам потрібно, це хімік, кілька дешевих молекул та ваша цінна інформація.

«Подумайте про зберігання вмісту Нью-Йоркської публічної бібліотеки з чайною ложкою білка», - говорить Брайан Кафферті, перший автор статті, яка описує нову техніку та докторську дисертацію в лабораторії Джорджа Уайтсайда, Вудфорда Л. та Енн А. Професор університету квітів у Гарвард . Робота була виконана у співпраці з Міланом Мрксичем та його групою у Північно-Західному університеті.

"Принаймні, на даному етапі ми не бачимо, щоб цей метод конкурував з існуючими методами зберігання даних", - каже Кафферті. «Натомість ми розглядаємо це як доповнення до цих технологій і як початкову мету, що добре підходить для довготривалого зберігання архівних даних».

Хімічний інструмент Кафферті не може замінити хмару. Але система зберігання файлів пропонує привабливу альтернативу біологічним інструментам зберігання, таким як ДНК. Нещодавно вчені виявили, як маніпулювати нашим вірним зберігачем генетичної інформації, щоб кодувати більше ніж просто колір очей. Тепер дослідники можуть синтезувати нитки ДНК, щоб записувати будь-яку інформацію, у тому числі відео про кішок, про тенденції в дієті та про кулінарні уроки (чи це має бути інше питання).

Але хоча ДНК мала порівняно з комп'ютерними чіпами, макромолекула велика молекулярному світі. І синтез ДНК вимагає кваліфікованої і часто повторюваної праці. Якщо кожне повідомлення має бути розроблене з нуля, зберігання макромолекул може стати довгою та дорогою роботою.

"Ми маємо намір вивчити стратегію, яка не запозичує безпосередньо з біології", - говорить Кафферті. «Натомість ми покладалися на методи, звичайні в органічній та аналітичній хімії, та розробили підхід, у якому для кодування інформації використовуються невеликі молекули з низькою молекулярною вагою».

За допомогою всього лише одного синтезу команда може виробляти досить маленьких молекул для кодування відео з кількома кішками одночасно, що робить цей підхід менш трудомістким і дешевшим, ніж той, який заснований на ДНК.

Для їх молекул з малою вагою команда обрала олігопептиди (два або більше пептиду, пов'язаних разом), які є загальними, стабільними та меншими, ніж ДНК, РНК або білки.

Олігопептиди також різняться за масою в залежності від їх кількості та типу амінокислот. Змішані разом вони відрізняються один від одного, як літери в алфавітному супі.

Робити слова з літер трохи складно: у мікроосередку – як у мініатюрній версії "удар-моль", але з 384 мольними отворами – кожна лунка містить олігопептиди з різними масами. Так само, як чорнило поглинається на сторінці, суміші олігопептидів потім збираються на металевій поверхні, де вони зберігаються. Якщо команда хоче прочитати те, що вони написали, вони дивляться на одну з лунок через мас-спектрометр, який сортує молекули по масі. Це говорить їм, які олігопептиди присутні або відсутні: їхня маса віддає їх.

Потім, щоб перевести безладний склад молекул у літери та слова, вони запозичили двійковий код. Наприклад, "М" використовує чотири з восьми можливих олігопептидів, кожен з яких має різну масу. Четверо, що плавають у свердловині, одержують «1», а решта чотири – «0». Молекулярно-двійковий код вказує на відповідну літеру або якщо інформація є зображенням, відповідний піксель.

За допомогою цього методу суміш із восьми олігопептидів може зберігати один байт інформації; 32 може зберігати чотири байти; і більше може зберігати ще більше.

Досі Кафферті та його команда «писали», зберігали та «читали» знамениту лекцію фізика Річарда Фейнмана «Внизу багато місця», фотографію Клода Шеннона (відомого як батько теорії інформації) та Хокусая. розпис по дереву Велика хвиля біля Канагави. Оскільки до 2020 року світовий цифровий архів досягне 44 трильйонів гігабайт (вдесятеро більше, ніж у 2013 році), зображення цунамі здається слушним.

Прямо зараз команда може отримати свої збережені шедеври з точністю 99,9%. Їх «запис» у середньому становить 8 біт за секунду, а «читання» - у середньому 20 біт за секунду. Незважаючи на те, що швидкість їхнього «написання» набагато перевищує швидкість