Сегодня 29 сентября 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Шекспировского «Гамлета» закодировали в ДНК и показали быстрый поиск по ключевым словам

Ведущий разработчик систем хранения информации на базе ДНК — компания Catalog Technologies — сообщил об «историческом прорыве». Компания показала возможность быстрого параллельного поиска по данным, зашифрованным в ДНК. Работа с ДНК не отличается скоростью, но Catalog смогла найти возможность ускорить эти процессы. В перспективе это обещает привести к появлению беспрецедентных по плотности записи носителей информации, в миллионы раз лучше современных аналогов.

 Источник изображения: Depositphotos

Источник изображения: Depositphotos

Компания Catalog разрабатывает систему записи и считывания данных на ДНК из синтетических нуклеотидов. В природе биологическая информация записывается всего четырьмя нуклеотидами. Если себя этим не ограничивать, то можно в два, три и даже больше раз увеличить «разрядность» кодирования данных, а это, прежде всего, рост плотности записи. Таким образом, в одном грамме раствора из ДНК можно хранить до 200 Пбайт информации, с чем современные методы записи совершенно не сравнятся.

В Catalog провели эксперимент, в котором показали способность записывать относительно большой массив данных в ДНК и проводить в нём поиск по ключевым словам. Так, большой отрывок из Шекспировского «Гамлета» размером в 17 тыс. слов был записан в ДНК на опытной установке компании. Никакой предварительной обработке данные не подвергались, включая индексацию. На запись и поиск по ключевым словам ушли считанные минуты, о чём раньше даже не мечтали. Система нашла все вхождения искомого слова.

 Источник изображения: Catalog Technologies

Установка для кодирования информации в синтетической ДНК. Источник изображения: Catalog Technologies

Поскольку химические процессы, в результате которых происходят реакции с ДНК, по своей сути параллельны, то нет разницы, какой по объёму массив данных будет обрабатываться: 17 тыс., 170 тыс. или 17 млн. В новом году, например, компания обещает запустить поиск на массиве из более 100 млн зашифрованных в ДНК слов. Подобные возможности, помимо многократного увеличения плотности записи, обеспечат потребности нейросетей и ИИ при обработке больших массивов информации.

Сегодня установка Catalog Shannon не отличается компактностью — размерами она как «кухня для обычной семьи». Поиск тоже не блещет скоростью: 17 тыс. слов в среднем по 5 символов каждое — это всего лишь 472 байт/с. Но это только начало. Придёт время, когда записывать данные на ДНК и считывать их будут маленькие чипы. Вместе с компанией Catalog это время приближает её партнёр — компания Seagate. Но это уже другая история.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Голосование по введению повышенных пошлин на китайские электромобили в ЕС перенесено на 4 октября 17 мин.
Рождение экосистемы: Intel объявила о доступности ИИ-ускорителей Gaudi3 и решений на их основе 8 ч.
Корабль SpaceX Dragon Crew-9 с россиянином и американцем отправился на МКС 11 ч.
Министр энергетики США не против иностранных инвестиций в ИИ ЦОД 12 ч.
Google представила технологию проектирования микросхем AlphaChip с помощью ИИ 13 ч.
В Швейцарии придумали роборуку, которая может отсоединяться от манипулятора и самостоятельно ползать 16 ч.
Мировой облачный рынок стремительно растёт: затраты в сегменте ЦОД за полгода подскочили почти на треть 18 ч.
В Ирландии построят первое в Европе хранилище энергии на батареях с обратимой коррозией металла 18 ч.
В Китае впервые представили лунный скафандр — мощный и элегантный 21 ч.
Apple не будет инвестировать в OpenAI 24 ч.