Сегодня 04 декабря 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Шекспировского «Гамлета» закодировали в ДНК и показали быстрый поиск по ключевым словам

Ведущий разработчик систем хранения информации на базе ДНК — компания Catalog Technologies — сообщил об «историческом прорыве». Компания показала возможность быстрого параллельного поиска по данным, зашифрованным в ДНК. Работа с ДНК не отличается скоростью, но Catalog смогла найти возможность ускорить эти процессы. В перспективе это обещает привести к появлению беспрецедентных по плотности записи носителей информации, в миллионы раз лучше современных аналогов.

 Источник изображения: Depositphotos

Источник изображения: Depositphotos

Компания Catalog разрабатывает систему записи и считывания данных на ДНК из синтетических нуклеотидов. В природе биологическая информация записывается всего четырьмя нуклеотидами. Если себя этим не ограничивать, то можно в два, три и даже больше раз увеличить «разрядность» кодирования данных, а это, прежде всего, рост плотности записи. Таким образом, в одном грамме раствора из ДНК можно хранить до 200 Пбайт информации, с чем современные методы записи совершенно не сравнятся.

В Catalog провели эксперимент, в котором показали способность записывать относительно большой массив данных в ДНК и проводить в нём поиск по ключевым словам. Так, большой отрывок из Шекспировского «Гамлета» размером в 17 тыс. слов был записан в ДНК на опытной установке компании. Никакой предварительной обработке данные не подвергались, включая индексацию. На запись и поиск по ключевым словам ушли считанные минуты, о чём раньше даже не мечтали. Система нашла все вхождения искомого слова.

 Источник изображения: Catalog Technologies

Установка для кодирования информации в синтетической ДНК. Источник изображения: Catalog Technologies

Поскольку химические процессы, в результате которых происходят реакции с ДНК, по своей сути параллельны, то нет разницы, какой по объёму массив данных будет обрабатываться: 17 тыс., 170 тыс. или 17 млн. В новом году, например, компания обещает запустить поиск на массиве из более 100 млн зашифрованных в ДНК слов. Подобные возможности, помимо многократного увеличения плотности записи, обеспечат потребности нейросетей и ИИ при обработке больших массивов информации.

Сегодня установка Catalog Shannon не отличается компактностью — размерами она как «кухня для обычной семьи». Поиск тоже не блещет скоростью: 17 тыс. слов в среднем по 5 символов каждое — это всего лишь 472 байт/с. Но это только начало. Придёт время, когда записывать данные на ДНК и считывать их будут маленькие чипы. Вместе с компанией Catalog это время приближает её партнёр — компания Seagate. Но это уже другая история.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Microsoft узнала о новой антимонопольной проверке из СМИ и теперь обвиняет FTC в утечке данных 35 мин.
Windows 10 внезапно набрала популярность — до конца поддержки ОС осталось меньше года 2 ч.
XDefiant закроется спустя год после запуска, а студию разработчиков расформируют — терпение Ubisoft кончилось 2 ч.
Аналитики ожидают трёхкратный рост российского облачного рынка к 2028 году 4 ч.
ChatGPT уличили в наглом вранье при поиске новостей в интернете 11 ч.
Intel выпустила приложение Intel Graphics Software для разгона и настройки своих видеокарт 12 ч.
Firaxis: новая система эпох в Sid Meier’s Civilization VII поможет решить одну из главных проблем серии 13 ч.
Из Game Pass в декабре удалят Party Animals, Rise of the Tomb Raider, Amnesia: The Bunker и ещё 10 игр, зато добавят Crash Team Racing Nitro-Fueled 14 ч.
Commandos: Origins не выйдет в 2024 году из-за отзывов игроков — что улучшат к релизу 17 ч.
Intel представила технологию XeSS2 с генерацией кадров — FPS вырастет до четырёх раз 18 ч.