Сегодня 16 июля 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Google научила робота выполнять команды и ездить по офису с помощью нейросети Gemini

Команда Google DeepMind Robotics продемонстрировала на этой неделе, как обученный с помощью нейросети Google Gemini 1.5 Pro робот RT-2 может выполнять команды, озвученные на естественном языке, и перемещаться по офисному помещению.

 Источник изображений: Google DeepMind

Источник изображений: Google DeepMind

DeepMind Robotics опубликовала статью под названием «Mobility VLA: мультимодальная навигация по инструкциям с помощью VLM с длинным контекстом и топологическими графами», в которой в серии видеороликов робот выполняет различные задачи в офисном помещении площадью 9000 кв. футов (836 м2).

В одном из видеороликов сотрудник Google просит робота отвести его куда-нибудь, чтобы порисовать. «Хорошо, — отвечает тот, — дай мне минутку. Размышляем вместе с Gemini...». Затем робот подводит человека к лекционной доске размером со стену.

Во втором видео другой сотрудник предлагает роботу следовать указаниям на доске. Он рисует простую карту, на которой показано, как добраться до «Синей зоны». И снова робот на мгновение задумывается, прежде чем отправиться по указанному маршруту к месту, которое оказывается площадкой для испытаний робототехники. «Я успешно выполнил указания на доске», — докладывает робот.

Перед записью видеороликов роботов ознакомили с пространством с помощью решения «Мультимодальная навигация по инструкциям с демонстрационными турами (MINT)». Благодаря этому робот может перемещаться по офису в соответствии с указанными с помощью речи различными ориентирами. Затем DeepMind Robotics использовала иерархическую систему «Видение-Язык-Действие» (VLA), «которая сочетает в себе понимание окружающей среды и силу здравого смысла». После объединения процессов робот получил способность реагировать на написанные и нарисованные команды, а также на жесты и ориентироваться на местности.

Как утверждает Google, примерно в 90 % из 50 взаимодействий с сотрудниками роботы успешно выполняли данные им инструкции.

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Для комфортной игры в Nobody Wants to Die понадобится RTX 3070 Ti — системные требования амбициозного неонуарного детектива 40 мин.
Британские антимонопольщики проверят Microsoft из-за переманивания сотрудников Inflection AI 44 мин.
Apple и другие без разрешения обучали ИИ-модели на роликах YouTube 54 мин.
WhatsApp полностью перестанет работать на кнопочных телефонах Nokia и других в феврале 2025 года 2 ч.
«Мы ещё не прощаемся»: Larian анонсировала «бету» седьмого крупного патча для Baldur’s Gate 3 и пообещала пока не бросать игру 4 ч.
В Сеть утекло более 1 Тбайт внутренних данных Walt Disney Company — проводится расследование 5 ч.
FTC начала антимонопольную проверку $6,4-млрд сделки IBM и HashiCorp 5 ч.
BioWare объяснила, почему компаньоны из Dragon Age: The Veilguard станут лучшими во всей серии 5 ч.
Еженедельный чарт Steam: Elden Ring не удержалась на первом месте, а MMO-выживалка Once Human стартовала в топ-10 6 ч.
CD Projekt Red раскрыла секрет, как стать разработчиком игр — половина авторов квестов для сиквела Cyberpunk 2077 раньше были моддерами 7 ч.
TECNO объявила о скидках до 25 % на смартфоны серии CAMON 30 16 мин.
Геймерский смартфон Red Magic 9S Pro поступил в глобальную продажу, но не улучшенная версия 9S Pro+ 3 ч.
ИИ-серверы вместо лекарств: Supermicro попала в индекс Nasdaq 100, вытеснив Walgreens Boots Alliance 4 ч.
AMD упомянула архитектуры Zen 6 и Zen 6c в своих планах, а также подтвердила разработку Zen 7 4 ч.
Тысячи дронов будут перевозить посетителей Всемирной выставки в Эр-Рияде 5 ч.
После массовых сокращений Tesla открыла почти 800 новых вакансий 5 ч.
Спонсируемый ASML университет оказался в центре американо-китайской войны чипов 6 ч.
Сотрудники Amazon обвинили компанию в искажении истинных экологических показателей 7 ч.
ИИ и глобальные амбиции: Аркадий Волож рассказал, чем займётся зарубежная часть «Яндекса» после разделения 7 ч.
Разработку российской консоли оценили всего в 1 млрд рублей, но в целом денег понадобится куда больше 7 ч.