Сегодня 27 июля 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → днк

Учёные облачили ДНК в искусственный янтарь — получилось сверхплотное и долговечное хранилище данных

ДНК — значительно более плотный носитель данных, чем что-либо, что создали люди, но проблема в том, что этот носитель крайне хрупкий. Для её решения учёные решили воспользоваться ещё одним достижением природы и создали искусственный янтарь, способный защитить хранящиеся в ДНК данные в течение длительного времени.

 Источник изображений: news.mit.edu

Источник изображений: news.mit.edu

Один грамм ДНК способен хранить до 215 Пбайт (215 млн гигабайт) данных — объёма с обувную коробку хватило бы на весь интернет. Это побудило учёных начать экспериментировать с записью данных в ДНК и их последующим считыванием, но необходимо обеспечить и их сохранность. Поэтому исследователи Массачусетского технологического института (США) создали своего рода искусственный янтарь, способный обеспечить защиту ДНК в течение длительного времени, а также последующее считывание данных. Это термореактивный материал — при нагревании он становится стекловидным твёрдым веществом, а при необходимости разрушается под воздействием химических соединений.

Учёные создали смесь мономеров, которые формируют сферические комплексы ДНК внутри и имеют водоотталкивающий слой снаружи — он нужен, потому что влага может повредить ДНК. Смесь нагревается и образует стекловидный блок, а ДНК с сохранёнными данными остаётся внутри. Когда возникает потребность считать эти данные, искусственный янтарь подвергается воздействию цистеамина — вещества, который его разрушает. После этого применяется детергент (моющее средство) под названием SDS, который отделяет ДНК, не повреждая её. Технологии присвоили название T-REX (Thermoset-REinforced Xeropreservation).

На испытаниях учёные успешно применили технологию T-REX для хранения последовательностей ДНК различной длины при температурах до 75 °C. На тестовые последовательности они записали изданную Авраамом Линкольном «Прокламацию об освобождении рабов», логотип Массачусетского технологического института и музыкальную тему из фильма «Парк юрского периода» (Jurassic Park). Когда ДНК извлекли и секвенировали, ошибок обнаружено не было. Сейчас на процесс T-REX требуются несколько часов, и учёные говорят, что его можно оптимизировать. Едва ли накопители на основе ДНК когда-нибудь появятся в потребительских компьютерах, но для долгосрочного архивного хранения данных она может оказаться полезной.

Проводящая анализы ДНК компания 23andMe признала утечку данных 6,9 млн клиентов

Компания 23andMe, которая проводит анализы ДНК, сообщила, что в результате недавнего взлома произошла утечка данных, принадлежащих 6,9 млн пользователей. Инцидент коснулся 5,5 млн пользователей с активной функцией DNA Relatives (сопоставление людей со схожими ДНК) и 1,4 млн с профилями генеалогического древа.

 Источник изображения: Darwin Laganzon / pixabay.com

Источник изображения: Darwin Laganzon / pixabay.com

Компания раскрыла информацию об инциденте в заявлении Комиссии по ценным бумагам и биржам (SEC) США, а также в официальном блоге. Злоумышленники, по версии 23andMe, получили доступ к информации, воспользовавшись методом подстановки данных: люди часто пользуются одинаковыми логинами и паролями на разных сервисах, из-за чего компрометация данных на одном открывает доступ к другим. В результате хакерам удалось войти в 0,1 % (14 000) учётных записей в системе компании. Сделав это, они воспользовались функцией DNA Relatives, предполагающей сопоставление ДНК вероятных родственников, и получили дополнительную информацию нескольких миллионов других профилей.

Первые сведения об инциденте были преданы огласке в октябре, когда 23andMe подтвердила, что данные её пользователей выставили на продажу в даркнете. Впоследствии компания заявила, что проверяет сообщения о публикации 4 млн генетических профилей жителей Великобритании, а также «самых богатых людей, проживающих в США и Западной Европе». В базе утечки 5,5 млн пользователей DNA Relatives оказались их отображаемые в системе имена, вероятные связи с другими людьми, число пользователей с совпадениями в ДНК, сведения о происхождении, указанные самими пользователями местоположения, места рождения предков, фамилии, изображения профиля и многое другое. Ещё 1,4 млн пользователей имели доступ к профилям генеалогического древа — из этой базы были похищены их отображаемые имена, родственные связи, годы рождения и указанные этими пользователями местоположения. Во второй базе, однако, не было степеней совпадения ДНК.

В 23andMe сообщили, что продолжают уведомлять пострадавших от утечки пользователей. Компания стала предупреждать клиентов о необходимости сменить пароли и принудительно внедрять двухфакторную авторизацию, которая ранее была необязательной.

Китайские учёные представили базу для создания универсальных компьютеров на ДНК

Несмотря на все достижения в области работы с ДНК — шаблоном и инструментом для воспроизведения и развития живых организмов на Земле — попытки использовать этот же механизм для выполнения математических алгоритмов пока не могут считаться достаточно успешными. В то же время логика на ДНК способна на колоссальный параллелизм, что позволит умножить мощность компьютеров, в чём далеко продвинулись китайские учёные.

 Источник изображения: Pixabay

Источник изображения: Pixabay

Наука далеко шагнула в области записи данных на ДНК. Это базовая опция дезоксирибонуклеиновой кислоты. Запись и хранение данных относительно нетребовательны к скорости работы платформы, которая зависит от скорости протекания биохимических реакций. Другое дело вычислительные цепи, скорость работы которых должна быть максимальной. В принципе, параллелизм частично решает эту проблему. Но до последнего времени электронные цепи на ДНК, с которыми работали учёные, не могли похвастаться универсальностью — они выполняли лишь ограниченный круг алгоритмов.

Группа исследователей из Китая разработала интегральную схему ДНК, которая способна выполнять множество разнообразных операций. По словам учёных, реконфигурируемый базовый элемент (электронная цепь) с 24 адресуемыми двухканальными затворами может быть представлен в виде 100 млрд вариаций цепей, каждая из которых сможет выполнять собственную подпрограмму. Из этого следует, что на основе этого решения можно спроектировать процессор общего назначения для запуска любых программ.

В своей работе, которая была опубликована в журнале Nature, исследователи показали, как с помощью трёхслойной матрицы из цепей на базе их ДНК-чипа можно обеспечивать простейшие математические операции. Представленная платформа легко масштабируется, что позволяет рассчитывать на создание в будущем очень мощных процессоров.

Для решения вопроса масштабирования учёные проделали другую работу. Ведь для прохождения сигнала в цепях из ДНК потребуется передача биохимических данных в заданном направлении и без затухания. И чем длиннее будет этот путь (масштаб), тем выше будет вероятность потери «сигнала» — фрагмента ДНК или концентрации фрагментов ДНК. В качестве «сигнала» китайские учёные испытали олигонуклеотиды — короткие фрагменты ДНК, которые уже используются как детекторы и носители ДНК-информации. В своих экспериментах китайцы показали, что типовые одноцепочечные олигонуклеотиды хорошо работают в качестве унифицированного сигнала для передачи, что позволяет надёжно интегрировать крупномасштабные цепи с минимальной утечкой и высокой точностью для вычислений общего назначения.

«Способность интегрировать крупномасштабные сети DPGA [ДНК БИС] без явного ослабления сигнала знаменует собой ключевой шаг на пути к ДНК-вычислениям общего назначения», — заявляют исследователи.

 Источник изображения: Nature

Вычисления в пробирке. Буквально. Источник изображения: Nature

В качестве примера учёные создали схему, решающую квадратные уравнения, которая собрана с использованием трёх слоев каскадных ЦВМ, состоящих из 30 логических вентилей и содержащих около 500 нитей ДНК. Более того, интеграция DPGA с аналого-цифровым преобразователем позволит классифицировать микро-РНК, связанные с заболеваниями. Иными словами, предложенная платформа сможет не только работать как обычный компьютер, но также будет способна на мгновенную диагностику вирусных и других заболеваний. И ещё большой вопрос, которая из этих возможностей окажется наиболее полезной.

Для хранения данных на ДНК предложены крошечные капсулы — это снизит уровень ошибок и защитит от потерь информации

Природа придумала поразительное по плотности хранения данных решение — ДНК. Всю информацию из интернета, включая бесконечные фотографии котиков, можно записать на ДНК в объёме коробки для котика средних размеров. Учёные давно пытаются повторить этот трюк и у них даже есть успехи.

 Источник изображения: Pixabay

Источник изображения: Pixabay

Используя для кодирования данных на ДНК только четыре природных азотистых основания в объёме коробки для обуви можно записать 215 Пбайт данных. Но если синтезировать искусственные азотистые основания и довести их до 11 базовых кодов, то объём хранимых в «коробке» данных можно удвоить! При должном подходе эта информация может храниться миллионы лет в отличие от данных на жёстких дисках и SSD. Когда-нибудь это произойдёт, но пока исследователи решают ряд связанных с записью на ДНК проблем, в частности, это проблема разрушения данных при многократном обращении к ним и, как следствие, нарастание ошибок и потеря данных.

В новой статье в журнале Nature группа исследователей предложила интересную методику защиты и маркировки информационного ДНК-носителя, которая защищает носитель от разрушения в процессе чтения, а также облегчает сортировку ДНК-файлов и ведёт к созданию роботизированных библиотек.

Сегодня в базовом процессе работы с записанной на ДНК информацией всё происходит следующим образом: в «суп» из ДНК-носителей подаётся затравка — праймер — которая запускает реакцию ПЦР (полимеразная цепная реакция) с реплицированием нужного «файла». Каждый «файл» — это записанная нить ДНК, помеченная определённым образом, и праймер цепляется к ней и запускает процесс тиражирования. Современным инструментам по расшифровке ДНК нужны миллионы одинаковых последовательностей, чтобы надёжно расшифровать один «файл». Каждое такое «чтение» вносит ошибки и, в конечном итоге, разрушает информацию. Наконец, становится трудно работать с несколькими «файлами» одновременно.

Чтобы избежать всего этого учёные придумали заключать файл-ДНК в полимерную капсулу, но не просто так, а только при нагреве до температуры выше 50 °C. Процесс ПЦР запускается при меньшей температуре, затем при нагреве исходный «файл» прячется в капсулу и дальше всё идёт без него. Это позволяет защитить исходные данные в процессе чтения (реплицирования), а также даёт возможность присвоить каждому «файлу» свою метку — в данном случае это флюоресценция разных оттенков.

Свечение даёт возможность роботизировать каталогизацию и последующий отбор файлов — это путь к созданию библиотек. Для чтения реплицированных ДНК систему достаточно остудить и выделить из неё всё, что воспроизвелось в процессе ПЦР. Исходный ДНК-носитель в таком случае остаётся незатронутым в процесс ПЦР и не вносит в свою структуру ошибки, а цветовая метка, по которой его можно сортировать, остаётся при нём.

 Источник изображения: Tom de Greef

Микрокапсулы с ДНК, помеченные флюоресцирующими метками, под микроскопом. Источник изображения: Tom de Greef

По словам исследователей, предложенная методика позволяет считывать до 25 файлов одновременно, и теряет только 0,3 % файла после трёх считываний, а не 35 %, как при использовании существующих методов.

«Теперь остается только ждать, когда стоимость синтеза ДНК снизится еще больше, — сказал Том де Гриф (Tom de Greef), ведущий автор исследования. — Тогда техника будет готова к применению».

Шекспировского «Гамлета» закодировали в ДНК и показали быстрый поиск по ключевым словам

Ведущий разработчик систем хранения информации на базе ДНК — компания Catalog Technologies — сообщил об «историческом прорыве». Компания показала возможность быстрого параллельного поиска по данным, зашифрованным в ДНК. Работа с ДНК не отличается скоростью, но Catalog смогла найти возможность ускорить эти процессы. В перспективе это обещает привести к появлению беспрецедентных по плотности записи носителей информации, в миллионы раз лучше современных аналогов.

 Источник изображения: Depositphotos

Источник изображения: Depositphotos

Компания Catalog разрабатывает систему записи и считывания данных на ДНК из синтетических нуклеотидов. В природе биологическая информация записывается всего четырьмя нуклеотидами. Если себя этим не ограничивать, то можно в два, три и даже больше раз увеличить «разрядность» кодирования данных, а это, прежде всего, рост плотности записи. Таким образом, в одном грамме раствора из ДНК можно хранить до 200 Пбайт информации, с чем современные методы записи совершенно не сравнятся.

В Catalog провели эксперимент, в котором показали способность записывать относительно большой массив данных в ДНК и проводить в нём поиск по ключевым словам. Так, большой отрывок из Шекспировского «Гамлета» размером в 17 тыс. слов был записан в ДНК на опытной установке компании. Никакой предварительной обработке данные не подвергались, включая индексацию. На запись и поиск по ключевым словам ушли считанные минуты, о чём раньше даже не мечтали. Система нашла все вхождения искомого слова.

 Источник изображения: Catalog Technologies

Установка для кодирования информации в синтетической ДНК. Источник изображения: Catalog Technologies

Поскольку химические процессы, в результате которых происходят реакции с ДНК, по своей сути параллельны, то нет разницы, какой по объёму массив данных будет обрабатываться: 17 тыс., 170 тыс. или 17 млн. В новом году, например, компания обещает запустить поиск на массиве из более 100 млн зашифрованных в ДНК слов. Подобные возможности, помимо многократного увеличения плотности записи, обеспечат потребности нейросетей и ИИ при обработке больших массивов информации.

Сегодня установка Catalog Shannon не отличается компактностью — размерами она как «кухня для обычной семьи». Поиск тоже не блещет скоростью: 17 тыс. слов в среднем по 5 символов каждое — это всего лишь 472 байт/с. Но это только начало. Придёт время, когда записывать данные на ДНК и считывать их будут маленькие чипы. Вместе с компанией Catalog это время приближает её партнёр — компания Seagate. Но это уже другая история.

Seagate начнут работать с технологиями записи данных в ДНК

В компании Seagate увидели перспективу в записи данных в ДНК. Ожидается, что запись информации в комбинации молекул аминокислот в миллион раз увеличит плотность хранения данных. Может пройти не так уж много времени, и вместо жёстких дисков или SSD в компьютерах появятся «биологические» накопители невообразимой ёмкости.

 Источник изображения: Depositphotos

Источник изображения: Depositphotos

Разработкой систем записи данных на ДНК компания Seagate будет заниматься с разработчиком оригинальной технологии — с компанией Catalog Technologies. Последняя предлагает записывать данные в синтетически созданных ДНК, а не в «живых» последовательностях. И в этом есть смысл, ведь для кодирования данных таким способом можно использовать не четыре аминокислоты биологического происхождения, а намного больше химических соединений, что сразу умножает плотность записи.

По словам разработчиков, синтетические ДНК могут хранить свыше 200 Пбайт в одном грамме. Это в миллион раз больше, чем позволяют современные SSD. Также намного дольше срок «биологической» сохранности данных — до 1000 лет и больше. Пока остаются трудности с записью информации в ДНК. Установка Catalog Shannon, к примеру, имеет размеры «кухни средней семьи». Впрочем, мы это уже проходили с ЭВМ размером с комнату и жёсткими дисками размером со шкаф. Рано или поздно компания Catalog или её конкуренты создадут «лабораторию на чипе» для работы с ДНК на уровне микрочипов.

Интересно добавить, что Catalog Technologies смотрит шире простой записи данных. Компания также разрабатывает технологии вычислений с помощью ДНК. Это не новое видение. Учёные давно экспериментируют с ДНК в качестве основы для выполнения запрограммированных алгоритмов. Раз уж аминокислоты могут собираться по заданной природой или учёными программе, то почему бы им не собираться для получения некоего результата вычислений?

Компания Seagate как специалист по наращиванию плотности записи сможет применить свои знания для исследований в микромире ДНК. В конечном итоге для Seagate важно снижать стоимость хранения данных и делать такие системы проще.


window-new
Soft
Hard
Тренды 🔥
Дешёвые сканеры штрихкодов помогли в кратчайшие сроки восстановить пострадавшие от CrowdStrike компьютеры 4 ч.
Новая статья: Flintlock: The Siege of Dawn — хорошие идеи в неудачной обёртке. Рецензия 4 ч.
Анонсирован китайский ролевой детектив Kill the Shadow, напоминающий смесь Disco Elysium и The Last Night 5 ч.
Соцсеть X начала без уведомления использовать данные пользователей для обучения Grok 7 ч.
Mirthwood получила новый трейлер и дату выхода — это ролевой симулятор жизни в фэнтезийном мире, вдохновлённый Fable, Stardew Valley и The Sims 7 ч.
Журналисты выяснили, какие игры пострадают от забастовки актёров озвучки — GTA VI в безопасности 9 ч.
Разработчики Gran Turismo 7 извинились за баг, который запускает машины в космос 10 ч.
Хинштейн пояснил, почему в России замедлится YouTube 11 ч.
Windows 11 сможет добавлять синхронизированный с ПК Android-смартфон в «Проводник» 11 ч.
Заказы на ИИ и мейнфреймы z16 помогли IBM увеличить выручку и прибыль 11 ч.