Сегодня 06 февраля 2023
18+
MWC 2018 2018 Computex IFA 2018
Теги → днк
Быстрый переход

Шекспировского «Гамлета» закодировали в ДНК и показали быстрый поиск по ключевым словам

Ведущий разработчик систем хранения информации на базе ДНК — компания Catalog Technologies — сообщил об «историческом прорыве». Компания показала возможность быстрого параллельного поиска по данным, зашифрованным в ДНК. Работа с ДНК не отличается скоростью, но Catalog смогла найти возможность ускорить эти процессы. В перспективе это обещает привести к появлению беспрецедентных по плотности записи носителей информации, в миллионы раз лучше современных аналогов.

 Источник изображения: Depositphotos

Источник изображения: Depositphotos

Компания Catalog разрабатывает систему записи и считывания данных на ДНК из синтетических нуклеотидов. В природе биологическая информация записывается всего четырьмя нуклеотидами. Если себя этим не ограничивать, то можно в два, три и даже больше раз увеличить «разрядность» кодирования данных, а это, прежде всего, рост плотности записи. Таким образом, в одном грамме раствора из ДНК можно хранить до 200 Пбайт информации, с чем современные методы записи совершенно не сравнятся.

В Catalog провели эксперимент, в котором показали способность записывать относительно большой массив данных в ДНК и проводить в нём поиск по ключевым словам. Так, большой отрывок из Шекспировского «Гамлета» размером в 17 тыс. слов был записан в ДНК на опытной установке компании. Никакой предварительной обработке данные не подвергались, включая индексацию. На запись и поиск по ключевым словам ушли считанные минуты, о чём раньше даже не мечтали. Система нашла все вхождения искомого слова.

 Источник изображения: Catalog Technologies

Установка для кодирования информации в синтетической ДНК. Источник изображения: Catalog Technologies

Поскольку химические процессы, в результате которых происходят реакции с ДНК, по своей сути параллельны, то нет разницы, какой по объёму массив данных будет обрабатываться: 17 тыс., 170 тыс. или 17 млн. В новом году, например, компания обещает запустить поиск на массиве из более 100 млн зашифрованных в ДНК слов. Подобные возможности, помимо многократного увеличения плотности записи, обеспечат потребности нейросетей и ИИ при обработке больших массивов информации.

Сегодня установка Catalog Shannon не отличается компактностью — размерами она как «кухня для обычной семьи». Поиск тоже не блещет скоростью: 17 тыс. слов в среднем по 5 символов каждое — это всего лишь 472 байт/с. Но это только начало. Придёт время, когда записывать данные на ДНК и считывать их будут маленькие чипы. Вместе с компанией Catalog это время приближает её партнёр — компания Seagate. Но это уже другая история.

Seagate начнут работать с технологиями записи данных в ДНК

В компании Seagate увидели перспективу в записи данных в ДНК. Ожидается, что запись информации в комбинации молекул аминокислот в миллион раз увеличит плотность хранения данных. Может пройти не так уж много времени, и вместо жёстких дисков или SSD в компьютерах появятся «биологические» накопители невообразимой ёмкости.

 Источник изображения: Depositphotos

Источник изображения: Depositphotos

Разработкой систем записи данных на ДНК компания Seagate будет заниматься с разработчиком оригинальной технологии — с компанией Catalog Technologies. Последняя предлагает записывать данные в синтетически созданных ДНК, а не в «живых» последовательностях. И в этом есть смысл, ведь для кодирования данных таким способом можно использовать не четыре аминокислоты биологического происхождения, а намного больше химических соединений, что сразу умножает плотность записи.

По словам разработчиков, синтетические ДНК могут хранить свыше 200 Пбайт в одном грамме. Это в миллион раз больше, чем позволяют современные SSD. Также намного дольше срок «биологической» сохранности данных — до 1000 лет и больше. Пока остаются трудности с записью информации в ДНК. Установка Catalog Shannon, к примеру, имеет размеры «кухни средней семьи». Впрочем, мы это уже проходили с ЭВМ размером с комнату и жёсткими дисками размером со шкаф. Рано или поздно компания Catalog или её конкуренты создадут «лабораторию на чипе» для работы с ДНК на уровне микрочипов.

Интересно добавить, что Catalog Technologies смотрит шире простой записи данных. Компания также разрабатывает технологии вычислений с помощью ДНК. Это не новое видение. Учёные давно экспериментируют с ДНК в качестве основы для выполнения запрограммированных алгоритмов. Раз уж аминокислоты могут собираться по заданной природой или учёными программе, то почему бы им не собираться для получения некоего результата вычислений?

Компания Seagate как специалист по наращиванию плотности записи сможет применить свои знания для исследований в микромире ДНК. В конечном итоге для Seagate важно снижать стоимость хранения данных и делать такие системы проще.

Некоторые системы для расшифровки ДНК оказались уязвимы для хакеров, что грозит подделкой или кражей генетической информации

Регулирующие органы США предупредили поставщиков медицинских услуг о риске взлома некоторых установок компании Illumina для расшифровки генома, что может привести к краже данных пациентов. Это не первая угроза такого рода. Ранее отмечались атаки на базы ДНК и системы секвенирования генома. Разработчик установок сообщил, что работает над решением проблемы и не допустит взлома фирменных систем.

По данным Управления по санитарному надзору за качеством пищевых продуктов и медикаментов (FDA), несколько установок нового поколения компании Illumina имеют уязвимость в программном обеспечении. Уязвимости позволяют неавторизованному пользователю удалённо получить контроль над системой и изменить настройки или данные. Например, хакер сможет изменить клинический диагноз пациента или получить доступ к конфиденциальной генетической информации.

Компания Illumina стала монополистом на рынке секвенирования генома. Её оборудование широко используется как для исследований, так и в медицинской практике. В компании отреагировали на предупреждение FDA тем, что программные исправления уже разработаны и в будущем программное обеспечение будет переписано с исправлением замеченных недостатков.

«Illumina очень серьёзно относится к конфиденциальности данных и кибербезопасности и уделяет первостепенное внимание безопасности устройств и защите геномных и персональных данных», — заявил представитель компании.

Утечка генетических данных чревата серьёзнейшими проблемами. ДНК содержит огромную сокровищницу личной информации о здоровье, характере и семейной истории. По мере роста популярности генетического тестирования как в медицинском, так и в потребительском секторе, растёт и требование обеспечить строгую защиту этой информации. С утечками столкнулись как минимум две компании — Veritas Genetics и MyHeritage, хотя они отрицают доступ злоумышленников к генетическим данным. Но рано или поздно, к сожалению, такое произойдёт.

Fujifilm присоединилась к альянсу по разработке технологии записи данных на ДНК

В ноябре 2020 года компаниями Illumina, Microsoft, Twist Bioscience и Western Digital был создан DNA Data Storage Alliance для продвижения в массы идеи хранения архивных данных на ДНК. Высочайшая плотность записи на этом биологическом носителе позволила бы записать всю информацию мира всего лишь на 20 граммах. За два года в Альянс вошло более 50 компаний, а 50-м участником на днях стала компания Fujifilm Recording Media USA.

 Источник изображения: Depositphotos

Источник изображения: Depositphotos

За плечами компании Fujifilm громадный опыт в создании систем хранения данных, а также знания в области биологических наук. И если сегодня компания является лидером производства магнитных лент, то в недалёком будущем ей понадобится переходить на принципиально новые носители архивных данных. В теории один грамм ДНК способен хранить один зеттабайт данных (1021 байт или 1 млрд терабайт). Чтобы записать всю имеющуюся сегодня в мире информацию понадобится чуть больше 20 граммов ДНК.

Сегодня в Альянс входят 11 государственных компаний, 14 частных компаний, 2 консалтинговые компании, 2 венчурные фирмы, 17 университетов, 5 исследовательских некоммерческих организаций и 1 фонд. С момента своего основания Альянс расширил своё присутствие в интернете, опубликовал технический документ An Introduction to DNA Data Storage, организовал серию докладов DNA Data Storage на конференции разработчиков SNIA Storage и принял участие в нескольких отраслевых мероприятиях. Из этого следует сделать вывод, что на текущем этапе своей деятельности Альянс сосредоточен на популяризации идеи, хотя исследования в этой области продолжают идти своим чередом.

«Мы рады наблюдать растущий интерес к рынку систем хранения данных на ДНК, о чём свидетельствует количество компаний, присоединившихся к Альянсу DNA Data Storage, — сказал Штеффен Хеллмольд (Steffen Hellmold), вице-президент по развитию бизнеса в области хранения данных на ДНК компании Twist Bioscience. — Разнообразие компаний-членов Альянса, представляющих все аспекты экосистемы хранения данных на ДНК, является основой для обеспечения надёжной и идеальной траектории роста».

Данные на ДНК записываются с помощью кодирования устойчивыми парами четырёх оснований нуклеиновых кислот ДНК: аденина (A), гуанина (G), цитозина (C) и тимина (T). Например, 00 = A, 01 = C, 10 = G и 11 = T. Кодирование происходит четырьмя комбинациями, что увеличивает плотность записи. Более того, учёные рассматривают вариант искусственного синтеза азотистых оснований, что ещё сильнее увеличит плотность записи.

Учёные удвоили плотность записи данных на ДНК — более 400 тыс. Тбайт в одном грамме

За миллиарды лет эволюции биологической жизни на Земле в живых организмах выработался механизм записи для передачи генетической информации из одного поколения в последующие. Это формирование нитей ДНК в виде чередования пар комбинаций из четырёх азотистых оснований: аденина (A), гуанина (G), цитозина (C) и тимина (T). Четыре единицы кодирования лучше двух (0 и 1), но это не предел, сказали учёные и синтезировали ещё семь органических соединений.

 Источник изображения: Depositphotos

Источник изображения: Depositphotos

Расширение «алфавита» для кодирования данных в ДНК с 4 до 11 символов позволит как минимум удвоить и без того невероятную ёмкость подобных методов хранения информации. Такой подход, кстати, также повысит скорость записи данных в последовательности ДНК, что сегодня считается серьёзным тормозом для работ в этом направлении. Также необходимо понимать, что современные методы секвенирования ДНК не смогут определять синтезированные азотистые основания. Для их чтения необходимы новые инструменты и реакции. Но это всё решаемые проблемы, уверены исследователи из Университета Иллинойса в Урбан-Шампейн.

Для расшифровки ДНК её нить проходит через нанопору в специально разработанном белке, который может обнаружить отдельные азотистые основания независимо от того, являются ли они естественными или синтетическими. Затем алгоритмы машинного обучения декодируют хранящуюся внутри информацию. Да, без ИИ в этом вопросе не обойтись, настолько сложные процессы кодирования и дешифровки. В будущем, по мере развития технологии, всё будет намного проще.

Сегодня с учётом использования для кодирования данных только четырёх базовых азотистых оснований в одном грамме ДНК может храниться до 215 Пбайт данных. Одиннадцать оснований удвоят эту плотность, и это не предел.

«Мы попробовали 77 различных комбинаций из 11 азотистых оснований, и наш метод смог отлично различить каждое из них, — сказал Чао Пан (Chao Pan), соавтор исследования. — Механизм глубокого обучения, используемый в нашем методе для идентификации различных нуклеотидов, является универсальным, что позволяет распространить наш подход на многие другие приложения».

Установлен рекорд скорости расшифровки ДНК, попавший в Книгу рекордов Гиннесса

В блоге NVIDIA вышла запись о рекордном по скорости секвенировании ДНК. Геном пациента удалось полностью расшифровать за 5 часов и 2 минуты. До этого подобные операции требовали дней и даже недель. Наука доказала, что вплотную приблизилась к возможности расшифровывать генетическую информацию едва ли не в режиме реального времени, что позволит бороться с заболеваниями и спасать жизни людям.

 Источник изображения: Steve Fisch, courtesy of Stanford University

Источник изображения: Steve Fisch, courtesy of Stanford University

Сообщается, что рекорд был установлен исследователями из Стэнфордского университета при участии NVIDIA, Oxford Nanopore Technologies, Google, Медицинского колледжа Бейлора и Калифорнийского университета в Санта-Круз. Сам эксперимент был проведен больше месяца назад при секвенировании ДНК 12 пациентов. Статья о работе вышла на днях в журнале The New England Journal of Medicine. Официальное утверждение рекорда также состоялось на днях в Инженерном центре Стэнфордского университета имени Дженсена Хуанга (Jensen Huang), названном в честь основателя и генерального директора NVIDIA, выпускника Стэнфорда.

Исследователи добились рекордной скорости благодаря оптимизации каждого этапа рабочего процесса секвенирования. Они использовали высокопроизводительное нанопоровое секвенирование на проточных ячейках PromethION компании Oxford Nanopore для получения более 100 гигабаз данных в час (гигабаза — это один миллиард нуклеотидов), а также ускорили поиск оснований и вариантов с помощью графических процессоров NVIDIA в Google Cloud. Для пятерых пациентов секвенирование ДНК прошло в течение обычного рабочего дня (за 7–8 часов), а для одного заняло рекордно короткое время в 5 часов и 2 минуты.

«Я думаю, мы единодушны в том, что это не что иное, как чудо, — сказала Кимберли Пауэлл (Kimberly Powell), вице-президент по здравоохранению в NVIDIA. — Это достижение, которое войдет в книги истории и вдохновит еще 5–10 лет фантастической работы в революции цифровой биологии, в которой геномика занимает ведущее место».

Американские учёные сообщили о большом прогрессе в записи и хранении данных на ДНК

Биологические методы записи и передачи информации весьма неторопливые. У природы впереди миллиарды лет эволюции и спешка противопоказана, ведь информацию без критических повреждений необходимо пронести через бездну времени. ДНК оказалась именно таким инструментом для хранения и переноса данных о биологических организмах. Неудивительно, что учёные задумались о том, как можно использовать ДНК для хранения любой информации.

 Источник изображения: Sean McNeil / BBC

Источник изображения: Sean McNeil / BBC

Ранее Агентство передовых исследований в сфере разведки США (Intelligence Advanced Research Projects Activity, IARPA) запустило программу MIST (молекулярное хранение информации). В рамках программы выделился проект SMASH (Scalable Molecular Archival Software and Hardware). Контракт по программе SMASH был заключён с Институтом технологических исследований штата Джорджия (GTRI). Программа предусматривает разработку полупроводниковых платформ (чипов) для записи и считывания данных с ДНК.

По программе SMASH вместе с учёными из института из Атланты работают компании Twist Bioscience и Roswell Biotechnologies, а также Вашингтонский университет и компания Microsoft. Как сообщило сегодня информагентство BBC, учёные доложили о большом прогрессе в записи и хранении данных на ДНК. По словам разработчиков, они смогли нащупать возможность в 100 раз повысить плотность записи на ДНК по сравнению с актуальными решениями. В перспективе, например, это может позволить записать все фильмы в истории человечества в объёме одного кубика сахара.

Для записи данных на ДНК может использоваться не двоичный код, а кодирование из четырёх базовых символов, что резко повышает плотность записи в сравнении с записью с использованием двоичного кода. Как известно, нить ДНК содержит последовательности из четырёх оснований нуклеиновых кислот: аденина (A), гуанина (G), цитозина (C) и тимина (T). К примеру, для кодирования можно представить основания следующим образом, где 00 = A, 01 = C, 10 = G, а 11 = T. Закодированные этими кислотами данные записываются в ДНК и упаковываются для сохранения в небольшой контейнер. При низкой температуре ДНК и записанные на неё данные могут сохраняться тысячелетия почти без повреждения.

Проблема с записью данных в ДНК заключается в низкой скорости синтеза и такой же низкой скорости секвенирования. Кроме того — это дорого. На синтез ДНК с записью 200 Мбайт данных у учёных уходит до 24 часов. Поэтому задача стоит упростить, ускорить и снизить стоимость этапов записи и чтения, чему поможет размещение ДНК на чипах. Учёные из GTRI придумали и реализовали один из таких подходов с одним важным усовершенствованием. Они научились синтезировать одиночные нити ДНК параллельно во многих ячейках сразу. И чем больше будет таких ячеек, тем быстрее будет идти запись и тем выше будет плотность записываемой информации.

В новом году исследователи планируют вооружить чип для синтеза ДНК электронной обвязкой для ускорения процессов и полной их автоматизации. В перспективе это может позволить отказаться от магнитных лент для долговременного хранения данных. Ленты приходится обновлять каждые 10 лет, а данные на ДНК могут храниться сотни и тысячи лет без обновления.

Создан первый в мире рабочий процессор на основе молекул ДНК

Вычисления на основе ДНК рассматриваются как одна из технологий, которая изменит технологическую отрасль в будущем. Группа исследователей из Инчхонского национального университета в Южной Корее разработала довольно простой процессор, построенный на базе молекул ДНК. Учёные уверены, что такие чипы в будущем смогут заменить традиционные кремниевые процессоры.

 tomshardware.com

tomshardware.com

Использование молекул ДНК в технологической сфере рассматривалось в качестве средства хранения информации. Исследователи экспериментировали с ДНК, создавая ёмкие решения для хранения информации. Однако у таких продуктов есть проблемы со скоростью чтения и записи данных. Это связано с тем, что хранение информации в ДНК работает по своеобразному принципу и требует новых подходов к работе с данными. Таким образом, исследователи пришли к выводу, что решением проблемы может стать процессор, основанный на молекулах ДНК, который будет работать по тому же принципу, что и ДНК-накопители. Именно такое устройство представили корейские учёные.

По данным издания The Register, исследователи из Инчхонского национального университета в Южной Корее разработали новую технологию, которая использует молекулы ДНК для простых вычислений. Устройство выполнено в виде чипа, который получил название Microfluidic Processing Unit (MPU). Первый прототип MPU может выполнять базовые операции компьютерной логики, такие как AND, OR, XOR и NOT, которые являются довольно простыми, однако знаменуют огромный скачок вперёд. Раньше для выполнения каких-либо операций с ДНК исследователям приходилось вручную настраивать сложные конфигурации, которые выполнялись в реакционных пробирках. Этот подход был очень медленным и непрактичным. MPU же совершает все вычисления автоматически, используя 3D-принтер. Это снижает сложность и позволяет сделать первый шаг к созданию пригодного для реального использования процессора на основе молекул ДНК.

Исследователи управляли чипом с ПК, хотя, по их словам, делать это можно и со смартфона. Это значит, что для управления им по-прежнему требуются внешние инструменты. Учёные заявляют, что «будущие исследования будут сосредоточены на создании решений для вычисления на полной ДНК, с алгоритмами ДНК и системами хранения на базе ДНК». Исследователи утверждают, что с таким убедительным подтверждением жизнеспособности концепции, как они представили, будущее процессоров на базе ДНК может наступить совсем скоро.

Ученые «программируют» живые бактерии для хранения данных

Перспективы тысячекратно уплотнить запись и сохранять целостность данных благодаря самовоспроизведению информации в генах заставляют учёных искать возможность записи данных в ДНК. На этом пути уже сделаны первые интересные шаги и будет сделано ещё немало открытий. Свой вклад в общее дело внесли учёные из Колумбийского университета в США, предложившие простую систему прямой записи данных с компьютера непосредственно в геном бактерий.

 Источник изображения: Sproetniek/iStock

Источник изображения: Sproetniek/iStock

Традиционные методы записи информации в ДНК предполагают кодирование единиц и нулей файла данных в виде комбинации четырех азотистых оснований: аденина, гуанина, цитозина и тимина. Обычно длина закодированных последовательностей не превышает 200 или 300 оснований (фрагментов), поскольку иначе страдает точность искусственного синтеза ДНК. Чтение происходит в процессе секвенирования закодированных последовательностей. Стоимость такого процесса кодирования и декодирования достигает $3500 за Мбит. К тому же последовательности со временем деградируют и теряют информацию. Выходит дорого и ненадёжно.

Исследователи из Колумбийского университета ещё в 2017 году методом CRISPR смогли отредактировать ДНК плазмидов кишечной палочки (Escherichia coli) так, что те смогли распознавать и запоминать попадание сахарной фруктозы в клетки бактерий. В составе ДНК бактерий этот модифицированный элемент мог хранить 0 или 1 в зависимости от того, подавалась в раствор с бактериями фруктоза или нет. Фактически фруктоза кодировала участок ДНК. Эти данные учёные могли извлечь в процессе секвенирования ДНК бактерий в любое удобное для себя время, поскольку данные — участок ДНК с закодированной информацией — передавались в колонии бактерий в процессе размножения от одного поколения к другому.

 Схема эксперимента. Источник изображения: Nature Chemical Biology

Схема эксперимента. Источник изображения: Nature Chemical Biology

В новом исследовании, о котором учёные сообщили в недавнем издании журнала Nature Chemical Biology, исследователи смогли создать условия для записи 72 битов данных в ДНК. В плазмиды живых бактерий E. coli была записана закодированная фраза «Hello world!», которую потом успешно прочли после секвенирования ДНК живых бактерий.

Таким образом, данные кодировались прямо с ПК в ДНК живых бактерий без искусственного синтеза ДНК. По крайней мере, экономия появилась на этапе синтеза.

Природный жёсткий диск: Western Digital и Microsoft будут развивать системы хранения данных на ДНК

Человечество с каждым днём генерирует всё больше данных, и немало из них хочет сохранить надолго. К 2030 году, прогнозируют в Western Digital, половина новых носителей будет предназначена для архивов. Громадные деньги будут тратиться на сохранение данных, тогда как плотность носителей будет увеличиваться очень медленно. Переломить тенденцию смогут только новые методы записи, например, на ДНК.

Вчера компании Western Digital, Microsoft, Twist Bioscience и Illumina объявили о создании Альянса по хранению данных на ДНК (DNA Data Storage Alliance). Организация ставит перед собой цель разработать «дорожную карту» создания экосистемы для записи информации с помощью ДНК, включая соответствующие устройства для записи и считывания. Также альянс будет продвигать и популяризировать идею хранения информации на ДНК, как и заниматься обучением.

В составе альянса компания Twist BioScience будет предоставлять фрагменты ДНК и технологии записи данных на них. Компания Illumina специализируется на секвенировании ДНК (считывании). Компания Microsoft имеет значительный опыт в постановке экспериментов с записью данных на ДНК. Что касается четвёртого основателя альянса — компании Western Digital, то она интересуется этой областью как крупнейший игрок на рынке накопителей для записи данных.

Кроме четвёрки основателей в альянс вошли такие компании и организации, как Ansa Biotechnologies, CATALOG, The Claude Nobs Foundation, DNA Script, EPFL, ETH Zurich, imec, Iridia, Molecular Assemblies и Лаборатория молекулярных информационных систем Вашингтонского университета.

Запись информации на ДНК обещает недорогую и чрезвычайную плотность хранения. Так, один грамм носителя ДНК может хранить порядка одного зеттабайта данных. Для записи всей информации сегодняшнего мира понадобится менее 20 граммов носителя. Теоретическое время сохранности такой записи может достигать тысячелетий, ведь даже сегодня учёные могут расшифровывать фрагменты ДНК из живой природы, которым сотни тысяч лет.

Интересно, что для записи данных на ДНК предлагается использовать не двоичный подход, а кодирование из четырёх базовых символов. В частности, с помощью соединений из четырёх оснований нуклеиновых кислот ДНК; аденина (A), гуанина (G), цитозина (C) и тимина (T). Например, 00 = A, 01 = C, 10 = G и 11 = T. Закодированные этими кислотами данные записываются в короткие фрагменты ДНК и упаковываются для сохранения в какой-то контейнер, например стеклянный шарик.

Сегодня это выглядит фантастикой. Пока на запись и считывание пяти байт данных, записанных в ДНК, требуется около суток. Но когда-нибудь это может стать реальностью. Другой вопрос, что подавляющее большинство генерируемых сегодня данных — это цифровой мусор, практическая польза от хранения которого очень и очень неочевидна.

Новый проект приблизит коммерческую запись данных на основе ДНК

Миру необходимы новые носители информации для долговременного хранения данных. Они должны быть намного более компактные, чем могут предложить актуальные технологии. Одной из перспективных технологий в этой области остаётся запись данных на основе ДНК.

Идея хранить данные в виде кодирования нуклеотидов по методу формирования цепочек ДНК начала витать в воздухе с 60-х годов прошлого века. Первые успешные эксперименты в этой области были поставлены в 80-годах, а к настоящему времени учёные смогли существенно увеличить скорость записи (кодирование) и плотность хранения данных на основе ДНК.

Тем не менее, данная технология пока ещё остаётся уделом фантастов, а не инструментом администраторов центров хранения данных. Может ли что-то приблизить коммерческую запись данных на основе ДНК? В Институте технологических исследований штата Джорджия (GTRI) считают, что новая инициатива с финансированием на уровне $25 млн поможет в обозримом будущем создать масштабируемое архивное хранилище на основе ДНК.

Агентство передовых исследований в сфере разведки США (IARPA) учредило программу MIST (молекулярное хранение информации). В рамках программы заключён масштабный многоуровневый контракт на исследования с институтом GTRI, компаниями Twist Bioscience и Roswell Biotechnologies, а также с Вашингтонским университетом и компанией Microsoft. Последняя, как мы не раз сообщали, плотно занимается проблемами записи данных с использованием ДНК.

Совместный проект всех перечисленных выше участников программы MIST под названием SMASH (Scalable Molecular Archival Software and Hardware) будет направлен на разработку платформы для синтеза ДНК на основе кремниевых (полупроводниковых) решений. Эта платформа должна будет записывать загружаемые данные в виде цепочек ДНК и позволять считывать их в виде секвенирования ДНК. В перспективе должна получиться система хранения данных размерами с настольное устройство вместо огромного зала с дисковыми стойками.

Учёные утверждают, что в объёме размером с кубик сахара может храниться эксабайт данных. При правильном хранении записанная по методу ДНК информация может сохраняться тысячелетия, ведь учёные успешно расшифровывают ДНК давным-давно умерших животных и людей. Чтобы проект был признан успешным, необходимо научиться в сутки кодировать и декодировать сотни терабайт данных с энергетическими и прочими затратами в 100 раз меньшими, чем это происходит сегодня при записи на актуальные носители информации. И пока перспективной альтернативы записи по методу ДНК нет, уверены разработчики.

Инвесторы ставят на синтез ДНК для жизни и хранения данных

Сравнительно недавно принято считать, что данные можно записывать в последовательностях ДНК. Раз уж это реализовано природой, то почему бы ни воспользоваться этим на благо технологического развития человека? Также изучение механизмов синтеза ДНК обещает привести к появлению индивидуальной медицины на уровне персональной коррекции генов. Проблема только в том, что синтез длинных, чистых и устойчивых цепочек ДНК ― это сложнейший процесс с использованием токсичных химических соединений. Прорывом может стать так называемый энзиматический синтез ДНК (enzymatic DNA synthesis), когда для создания нужных последовательностей используются ферменты, а не «жёсткая» химия.

Среди прочих компаний и научных лабораторий энзиматический синтез ДНК разрабатывает довольно молодая компания Molecular Assemblies. Она создана в 2013 году, но за ней стоит 30-летний опыт профильных учёных, образовавших Molecular Assemblies. Считается, что Molecular Assemblies первой предложила коммерческий метод относительно простого способа синтеза длинных цепочек ДНК. В свете интереса к модификациям генома и необходимости в новых методах записи информации это не могло не привлечь инвесторов. Сообщается, что на днях в первом сборе инвестиций серии A компания смогла привлечь $12,2 млн средств на развитие.

Метод синтеза длинных цепочек ДНК, разработанный Molecular Assemblies, в своей основе использует водные растворы и неопасные химические соединения. Также технология отличается простой обработкой цепочек после синтеза для извлечения из растворов и дальнейшей работы с ними. После этого цепочки ДНК можно использовать для нужд медицины (клеточная CAR-T-терапия и генное редактирование CRISPR), для модификации сельскохозяйственной продукции, для промышленности и для изучения технологий записи данных на молекулярном уровне.

Первый компьютерный геном может привести к созданию синтетических форм жизни

Все последовательности ДНК исследованных учёными форм жизни хранятся в базе данных, принадлежащей Национальному центру биотехнологической информации в США. И 1 апреля в базе данных появилась новая запись: «Caulobacter ethensis-2.0». Это первый в мире полностью смоделированный на компьютере и затем синтезированный синтетический геном живого организма, разработанный учёными из ETH Zurich (Швейцарской высшей технической школы Цюриха). Однако следует подчеркнуть, что хотя геном C. ethensis-2.0 успешно был получен в виде большой молекулы ДНК, соответствующего живого организма пока ещё не существует.

 Caulobacter crescentus. Electron microscope image: Science Photo Library / Martin Oeggerli

Caulobacter crescentus. Electron microscope image: Science Photo Library / Martin Oeggerli

Исследовательскую работу провели Бит Кристен, профессор экспериментальной системной биологии, и его брат Маттиас Кристен — химик. Новый геном, названный Caulobacter ethensis-2.0, был создан путем очистки и оптимизации естественного кода бактерии Caulobacter crescentus безвредной бактерии, живущей в пресной воде по всему миру.

 Caulobacter ethensis-2.0. / www.ethz.ch

Caulobacter ethensis-2.0. / www.ethz.ch

Более десяти лет назад команда под руководством генетика Крейга Вентера создала первую «синтетическую» бактерию. В ходе своей работы учёные синтезировали копию генома Mycoplasma mycoides, затем он был имплантирован в клетку-носитель, которая после этого оказалась полностью жизнеспособной и сохранила способность к самовоспроизведению.

Новое исследование продолжает работу Крейгера. Если ранее учёные создали цифровую модель ДНК реального организма и на её основе синтезировали молекулу, новый проект идёт дальше, используя оригинальный код ДНК. Учёные значительно переработали его, прежде чем синтезировать и проверить работоспособность.

Исследователи начали с оригинального генома C. crescentus, который содержит 4000 генов. Как и у любых живых организмов, большая часть этих генов не несёт никакой информации и является «мусорной ДНК». После проведённого анализа учёные пришли к выводу, что только около 680 из них необходимы для поддержания жизни бактерии в лаборатории.

После удаления «мусорной ДНК» и получения минимального генома C. crescentus команда продолжила работу. Для ДНК живых организмов характерно наличие встроенной избыточности, заключающейся в том, что синтез одного и того же белка кодируется различными генами в нескольких участках цепи. Исследователи заменили более 1/6 из 800 000 букв ДНК в ходе оптимизации по удалению дублирующего кода.

«Благодаря нашему алгоритму мы полностью переписали геном в новую последовательность букв ДНК, которая больше не похожа на исходную», — говорит Бит Кристен, соведущий автор исследования. «При этом биологическая функция на уровне синтеза белка осталась без изменений».

Чтобы проверить, будет ли полученная цепочка работать должным образом в живой клетке, исследователи вырастили штамм бактерий, которые имели в своём ДНК как естественный геном Caulobacter, так и сегменты искусственного генома. Учёные выключали отдельные естественные гены и проверяли способность их искусственных аналогов выполнять ту же биологическую роль. Результат оказался достаточно впечатляющим: около 580 из 680 искусственных генов оказались работоспособными.

«Благодаря полученным знаниям мы сможем улучшить наш алгоритм и разработать новую версию генома 3.0», — говорит Кристен. «Мы полагаем, что в ближайшем будущем создадим живые бактериальные клетки с полностью синтетическим геномом».

На первой стадии такие исследования помогут генетикам проверить верность своих познаний в области понимания ДНК и роли отдельных генов в нём, так как любая ошибка в синтезе цепочки приведёт к тому, что организм с новым геномом погибнет или будет неполноценным. В будущем же они приведут к появлению синтетических микроорганизмов, которые будут создаваться для заранее определённых задач. Искусственные вирусы смогут бороться с их естественными сородичами, а специальные бактерии будут производить витамины или лекарства.

Исследование было опубликовано в журнале PNAS.

Учёные превратили ДНК в логические вентили: сделан шаг к химическим компьютерам

Группа учёных под руководством исследователей из Калифорнийского технологического университета смогла сделать небольшой, но значимый шаг в разработке произвольно программируемых химических компьютеров. В качестве базовых вычислительных элементов в таких системах используются наборы ДНК, которые по своей природной сущности обладают способностью к самоорганизации и росту. Всё, что надо для работы вычислительных систем на основе ДНК ― это тёплая солоноватая вода, закодированный в ДНК алгоритм роста и базовые стандартные наборы ДНК-последовательностей.

 Вычисления с помощью ДНК подобно работе ткацкого станка, где каждый новый слой - это шаг исполненния одной команды (Erik Winfree/Caltech)

Вычисления с помощью ДНК подобны работе ткацкого станка, где каждый новый слой ― это шаг исполнения одной команды (Erik Winfree/Caltech)

До сих пор «вычисления» с помощью ДНК проводились строго с использованием какой-либо одной последовательности. Для произвольных вычислений действующие методики не годились. Учёные из Калтеха (Caltech) смогли преодолеть это ограничение и представили технологию, которая может выполнять произвольные алгоритмы, используя один базовый набор из условно логических ДНК-элементов и отвечающую за алгоритм «расчёта» выборку из 355 базовых ДНК-последовательностей ― аналога компьютерных инструкций. В солевой раствор вносится логическое «семя» и набор «инструкций», после чего начинается расчёт ― сборка последовательности.

 Примеры алгоритмов с использованием вентилей-ДНК и набором заданных последоваельностей

Примеры алгоритмов с использованием вентилей-ДНК и набором заданных последовательностей

Базовый элемент или «семя» представляет собой ДНК-свёртку (ДНК оригами) ― это нанотрубка длиной 150 нм и диаметром 20 нм. Структура «семени» остаётся практически неизменной вне зависимости от алгоритма, который будет вычисляться. Периферия «семени» сформирована таким образом, что на его окончании стартует сборка последовательностей ДНК. Растущая нить ДНК, как известно, собирается из последовательностей, которые по молекулярной структуре и химическому составу подходят предложенным последовательностям, а не случайным образом. Поскольку периферия «семени» представлена в виде шести условных вентилей, где каждый вентиль обладает двумя входами и двумя выходами, рост ДНК начинает подчиняться заданной логике (алгоритму) который, как уже сказано выше, представлен помещенным в раствор заданным набором ДНК-последовательностей из 355 базовых вариантов.

Учёные в ходе опытов показали возможность исполнения 21 алгоритма, включая счёт от 0 до 63, выбор лидера, определение деления на три и другие, хотя этими алгоритмами всё не ограничивается. Процесс вычисления идёт шаг за шагом, по мере роста нитей ДНК на всех шести выходах «семени». Этот процесс может занимать от одних до двух суток. На изготовление «семени» уходит существенно меньше времени ― от часа до двух. Результат расчётов можно воочию увидеть под электронным микроскопом. Трубка разворачивается в ленту, а на ленте в местах каждого значения «1» на последовательности ДНК присоединяется видимая в микроскоп молекула протеина. Нули в микроскоп не видны.

 Развёрнутые последовательности ДНК после вычисления под электронным микроскопом (Damien Woods/Maynooth University)

Развёрнутые последовательности ДНК под электронным микроскопом после вычисления . Цифры ― это код алгоритма, выгравированный на «семени», а всё что справа от цифр ― это последовательность выполнения команд в виде выросших нитей ДНК. На ленте видны только единицы благодаря молекулам протеина (Damien Woods/Maynooth University)

Безусловно, в представленном виде технология далека от выполнения полноценных расчётов. Пока это похоже на чтение ленты с телетайпа, растянутое на двое суток. Тем не менее, технология работает и оставляет за собой обширное поле для совершенствования. Стало понятно в каком направлении можно двигаться, и что необходимо делать для приближения химических компьютеров.

Lexus запустила службу генетического подбора автомобилей

Бренд Lexus известен своими автомобилями класса люкс, которые можно подбирать под себя с учётом разнообразных предпочтений, модифицируя оснащение и оформление салона даже в мелких нюансах. Но японцы всё время движутся вперёд, чтобы сделать свои автомобили поистине индивидуальными для каждого отдельного человека.

С этой целью Lexus представила Genetic Select — первую в мире службу, позволяющую подбирать автомобиль в полном соответствии с генетическим кодом будущего владельца. Чтобы достичь этого, Lexus заключила соглашение с 23andMe — частной биотехнологической компанией из Маунтин-Вью. Последняя специализируется на предоставлении частным заказчикам информации об их предрасположенности к заболеваниям на основании анализа биоматериала на однонуклеотидный полиморфизм по нескольким тысячам SNP.

Lexus и 23andMe создают уникальный профиль водителя на основании ДНК (нужно сдать образец слюны), после чего машина производится с учётом всех особенностей индивида. Система может определить такие особенности, как предрасположенность к употреблению кофе (появится соответствующий подстаканник), склонность к загару (появится панорамная крыша), вероятность болей в спине (точная подгонка кресел под анатомию), любовь к острым ощущениям (будет установлен двигатель повышенной мощности), чувствительность кожи (стёкла получат соответствующую тонировку) и так далее.

Через 48 часов после сдачи биоматериалов и оплаты пользователь в США получит автомобиль своей мечты — он будет доставлен прямо к дому. Даже наличие проблем зрения будет учтено: лобовое стекло снимет необходимость использования коррекционных очков. Будут подобраны нужные размеры подголовников, а салон наполнен предпочтительными запахами. Ещё одна уникальная возможность такого автомобиля — принципиальная устойчивость к угону. Он не требует ключей: чтобы завести двигатель, нужно просто лизнуть особую область на руле: только проверив соответствие биометрии, автоматика активирует зажигание. Почитать подробнее об инициативе можно на официальном сайте.

window-new
Soft
Hard
Тренды 🔥