Гуманоидный робот Eve показал, что научился выполнять длинные последовательности голосовых команд
Читать в полной версииРобототехническая компания 1X (бывшая Halodi Robotics) продемонстрировала, как её колёсный сервисный робот Eve во время уборки помещения выполняет длинную последовательность заданий, озвученных на естественном языке. Компания была основана в 2014 году с целью разработки универсальных роботов для совместной работы с людьми. В 2022 году 1X заключила партнёрское соглашение с OpenAI, «чтобы объединить робототехнику и ИИ и заложить основу для воплощённого обучения».
В настоящее время 1X сосредоточена на обучении роботов на рабочем месте, чтобы они могли «понимать как естественный язык, так и физическое пространство, и выполнять реальные задачи на вашем рабочем месте и в вашем мире». 1X разработала интерфейс управления роботами, использующий естественный язык. Оператор может одновременно управлять несколькими гуманоидными роботами при помощи последовательностей голосовых команд.
Ещё в марте компания сообщила, что ей удалось разработать автономную модель, которая позволяет добавить большое количество задач в одну поведенческую модель ИИ, например, извлечение покупок из сумки с их дальнейшей сортировкой и размещением в соответствующих местах для хранения. При этом наблюдалось снижение качества выполнения других задач, что удалось преодолеть, увеличив количество параметров и затратив больше времени на обучение.
«Управление роботами с помощью этого высокоуровневого языкового интерфейса предлагает новый пользовательский опыт для сбора данных, — сообщает компания в своём блоге. — Вместо того, чтобы использовать VR для управления одним роботом, оператор может управлять несколькими роботами с помощью высокоуровневого языка. Поскольку высокоуровневые команды не требуется отдавать часто, операторы могут даже управлять роботами удалённо».
По словам компании, голосовой интерфейс на естественном языке позволяет операторам «связывать возможности краткосрочного горизонта между несколькими небольшими моделями в более длинные». Эти однозадачные модели затем могут быть объединены по мере продвижения разработки к единой модели с конечной целью автоматизации высокоуровневых действий с использованием ИИ.
1X утверждает, что роботы Eve на представленном видео не управляются дистанционно, все их действия контролируются нейронной сетью. В видео отсутствует компьютерная графика, «монтаж, ускорение видео или воспроизведение траектории по сценарию».
В дальнейшем компания планирует интегрировать в свою систему управления такие большие языковые модели, как GPT-4o, VILA и Gemini Vision.