Система искусственного интеллекта способна считать данные, хранящиеся в нитях ДНК, за 10 минут, а не за несколько дней, как этого требовали предшествующие методы, что приближает к практическому внедрению ДНК-хранилищ в вычислительной технике.

Новый метод, основанный на технологии искусственного интеллекта, обеспечивает высокоточное считывание информации с нитей ДНК почти в 90 раз более оперативно, чем старые методы. Ученые считают, что благодаря ИИ в перспективе можно будет использовать ДНК для хранения огромных объемов цифровых данных.
Новый метод, основанный на технологии искусственного интеллекта, обеспечивает высокоточное считывание информации с нитей ДНК почти в 90 раз более оперативно, чем старые методы. Ученые считают, что благодаря ИИ в перспективе можно будет использовать ДНК для хранения огромных объемов цифровых данных.
«ДНК может хранить огромные объемы информации в чрезвычайно компактной форме и оставаться невредимой в течение тысяч лет», - говорит Даниэлла Бар-Лев из Калифорнийского университета в Сан-Диего. « Помимо этого, ДНК поддается естественной репликации, что дает уникальное преимущество для долгосрочного хранения данных».
Однако извлечение информации, закодированной в ДНК, представляет собой сложнейшую задачу, поскольку при ее хранении нити смешиваются и перемешиваются в хаотическом порядке. В процессе кодирования данных отдельные нити иногда воспроизводятся с ошибками, а некоторые фрагменты могут быть полностью утеряны. Таким образом, процесс считывания данных из ДНК, чем-то напоминает реконструкцию древней книги с истрепанными, испорченными страницами.
«Традиционными средствами трудно справиться с этим хаосом. Ранее все это требовало нескольких дней обработки», - говорит Бар-Лев. Новый подход с помощью искусственного интеллекта, обученного находить закономерности в шуме, заметно «упрощает эту задачу», - говорит эксперт.
Ученые разработали метод на основе ИИ под названием DNAformer, позволяющий быстро и точно декодировать беспорядочные последовательности ДНК. Система состоит из модели глубокого обучения, обученной восстанавливать последовательности ДНК, специального компьютерного алгоритма, который обнаруживает и устраняет ошибки, и еще одного алгоритма декодирования, который преобразует все в цифровые данные, исправляя оставшиеся ошибки.
В ходе экспериментов нейросеть DNAformer смогла считать 100 мегабайт данных записанных в ДНК почти в 90 раз быстрее, чем ближайшая по скорости технология, разработанная с использованием традиционных вычислительных алгоритмов, добившись при этом более высокой или сравнимой точности. Среди расшифрованных данных были цветные фотографии пробирок, 24-секундная аудиохроника Нила Армстронга о высадке на Луну и текстовый файл о том, насколько перспективна ДНК в качестве хранилища данных.
По словам Омера Сабари из Техниона - Израильского технологического института, в планах команды - разработка версий DNAformer, адаптированных к новейшим методам кодирования данных в ДНК. « Поскольку наш подход не зависит от конкретных способов синтеза или секвенирования [ДНК], его можно легко адаптировать к будущим, пока еще не разработанным технологиям, потенциально более жизнеспособным с коммерческой точки зрения. Мы уже ведем переговоры с партнерами в сфере облачных сервисов и архивного хранения», - отметил ученый.
Первые коммерческие решения планируется представить к 2026 году. Среди потенциальных применений — создание «вечных» архивов для музеев, защищенные хранилища для правительственных структур и экологичная альтернатива традиционным дата-центрам. |