OpenAI представила ИИ-модель GPT-Rosalind для учёных-биологов
Читать в полной версииOpenAI анонсировала большую языковую модель искусственного интеллекта, специально обученную для работы в области биологической науки. Она получила название GPT-Rosalind, и это редкий случай, когда крупная технологическая компания выпускает модель, ориентированную на относительно узкий круг научных знаний.
Источник изображения: Growtika / unsplash.com
Система разработана для решения двух основных проблем, с которыми сталкиваются современные исследователи в области биологии. Первая — это огромные массивы данных, сформированные за несколько десятилетий секвенирования генома и белков, которые могут оказаться слишком обширными для отдельного исследователя. Второе — наличие множества узкоспециализированных разделов биологической науки, у каждого из которых есть собственные методы и терминология. Так, у специалиста, который работает над геном, активным в клетках мозга, могут возникнуть сложности с изучением огромного объёма литературы по нейробиологии.
OpenAI обучила большую языковую модель на 50 наиболее распространённых биологических алгоритмах, а также на механизмах работы с основными общедоступными базами данных с информацией по биологии. При дальнейшем обучении система получила возможность предлагать вероятные механизмы клеточных процессов и расставлять приоритеты для мишеней при разработке препаратов. Разработчики снизили свойственную большим языковым моделям склонность к подхалимскому поведению, сделав GPT-Rosalind более скептической в ответах, в том числе при создании препаратов. Компания обеспечила модели способность к рассуждениям — к обработке многоэтапных процессов, — а также высокий экспертный уровень, который подтвердился на тестовых примерах.
На текущий момент OpenAI ограничила доступ к модели из опасений, что ей могут злоупотреблять, например, попросив повысить инфекционность вируса — заявки принимаются только от американских организаций. Впоследствии компания выпустит Life Sciences Research Plugin — ограниченный по возможностям вариант системы.