Сегодня 15 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Google научила робота выполнять команды и ездить по офису с помощью нейросети Gemini

Команда Google DeepMind Robotics продемонстрировала на этой неделе, как обученный с помощью нейросети Google Gemini 1.5 Pro робот RT-2 может выполнять команды, озвученные на естественном языке, и перемещаться по офисному помещению.

 Источник изображений: Google DeepMind

Источник изображений: Google DeepMind

DeepMind Robotics опубликовала статью под названием «Mobility VLA: мультимодальная навигация по инструкциям с помощью VLM с длинным контекстом и топологическими графами», в которой в серии видеороликов робот выполняет различные задачи в офисном помещении площадью 9000 кв. футов (836 м2).

В одном из видеороликов сотрудник Google просит робота отвести его куда-нибудь, чтобы порисовать. «Хорошо, — отвечает тот, — дай мне минутку. Размышляем вместе с Gemini...». Затем робот подводит человека к лекционной доске размером со стену.

Во втором видео другой сотрудник предлагает роботу следовать указаниям на доске. Он рисует простую карту, на которой показано, как добраться до «Синей зоны». И снова робот на мгновение задумывается, прежде чем отправиться по указанному маршруту к месту, которое оказывается площадкой для испытаний робототехники. «Я успешно выполнил указания на доске», — докладывает робот.

Перед записью видеороликов роботов ознакомили с пространством с помощью решения «Мультимодальная навигация по инструкциям с демонстрационными турами (MINT)». Благодаря этому робот может перемещаться по офису в соответствии с указанными с помощью речи различными ориентирами. Затем DeepMind Robotics использовала иерархическую систему «Видение-Язык-Действие» (VLA), «которая сочетает в себе понимание окружающей среды и силу здравого смысла». После объединения процессов робот получил способность реагировать на написанные и нарисованные команды, а также на жесты и ориентироваться на местности.

Как утверждает Google, примерно в 90 % из 50 взаимодействий с сотрудниками роботы успешно выполняли данные им инструкции.

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
OpenAI Codex и Anthropic Claude заставляют разработчиков отказываться от традиционного кодинга 37 мин.
Новая статья: Code Vein 2 — от отличного к странному. Рецензия 15 ч.
Новая статья: Gamesblender № 763: ремейк God of War, «Джон Уик», новая Silent Hill — анонсы State of Play 15 ч.
Хоррор Cronos: The New Dawn от авторов ремейка Silent Hill 2 получил лёгкий режим — для любителей сюжета 17 ч.
Голливуд вовсю осваивает ИИ: растёт число школ по кинопроизводству с нейросетями 19 ч.
ByteDance представила Doubao 2.0 — самый популярный ИИ-бот Китая стал мощнее и подготовился к «эре агентов» 23 ч.
Реклама Anthropic с подтруниванием над OpenAI сработала — аудитория Claude выросла на 11 % 14-02 12:39
Apple рассказала, насколько сильно iOS 26 проникла на iPhone по всему миру 14-02 12:15
Google с задержкой в пару дней выпустила первую бету Android 17 14-02 06:14
OpenAI убила самую эмоциональную ИИ-модель, несмотря на протесты пользователей 14-02 06:08
Характеристики и цена смартфона Google Pixel 10a стали известны до анонса 3 ч.
Январская статистика Amazon показывает, что рынок центральных процессоров просел, но выросла популярность старых моделей 7 ч.
Наличие у Lenovo запасов памяти на весь год не помешало компании поднять цены на компьютеры 8 ч.
Количество пользователей спутникового интернета Starlink превысило 10 млн человек 9 ч.
Власти США признали парниковые газы безопасными для людей — ДВС, уголь и нефть снова в игре 18 ч.
У NASA снова испортилась лунная ракета SLS — при попытке её заправить, топливо перестало поступать в баки 19 ч.
Робопсы будут патрулировать мексиканский стадион на Чемпионате мира по футболу 23 ч.
Китай запретит нетрадиционные рули в автомобилях — под ударом штурвалы Tesla 24 ч.
TSMC придётся вложить ещё $100 млрд в американское производство чипов ради сделки США и Тайваня 24 ч.
Disney потребовала от ByteDance отключить новейший ИИ-генератор видео Seedance 2.0 — он копирует персонажей Star Wars и Marvel 24 ч.