Сегодня 12 марта 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Google научила робота выполнять команды и ездить по офису с помощью нейросети Gemini

Команда Google DeepMind Robotics продемонстрировала на этой неделе, как обученный с помощью нейросети Google Gemini 1.5 Pro робот RT-2 может выполнять команды, озвученные на естественном языке, и перемещаться по офисному помещению.

 Источник изображений: Google DeepMind

Источник изображений: Google DeepMind

DeepMind Robotics опубликовала статью под названием «Mobility VLA: мультимодальная навигация по инструкциям с помощью VLM с длинным контекстом и топологическими графами», в которой в серии видеороликов робот выполняет различные задачи в офисном помещении площадью 9000 кв. футов (836 м2).

В одном из видеороликов сотрудник Google просит робота отвести его куда-нибудь, чтобы порисовать. «Хорошо, — отвечает тот, — дай мне минутку. Размышляем вместе с Gemini...». Затем робот подводит человека к лекционной доске размером со стену.

Во втором видео другой сотрудник предлагает роботу следовать указаниям на доске. Он рисует простую карту, на которой показано, как добраться до «Синей зоны». И снова робот на мгновение задумывается, прежде чем отправиться по указанному маршруту к месту, которое оказывается площадкой для испытаний робототехники. «Я успешно выполнил указания на доске», — докладывает робот.

Перед записью видеороликов роботов ознакомили с пространством с помощью решения «Мультимодальная навигация по инструкциям с демонстрационными турами (MINT)». Благодаря этому робот может перемещаться по офису в соответствии с указанными с помощью речи различными ориентирами. Затем DeepMind Robotics использовала иерархическую систему «Видение-Язык-Действие» (VLA), «которая сочетает в себе понимание окружающей среды и силу здравого смысла». После объединения процессов робот получил способность реагировать на написанные и нарисованные команды, а также на жесты и ориентироваться на местности.

Как утверждает Google, примерно в 90 % из 50 взаимодействий с сотрудниками роботы успешно выполняли данные им инструкции.

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Google рассказала, как улучшит производительность и автономность Android-смартфонов 7 ч.
Microsoft добавит «режим Xbox» на каждый компьютер с Windows 11 8 ч.
Valve отвергла обвинения властей Нью-Йорка в организации азартных игр и сравнила лутбоксы в Counter-Strike 2 c Лабубу 9 ч.
Две критические уязвимости Microsoft Office получили экстренные патчи 9 ч.
Nvidia выпустила Nemotron 3 Super 120B — открытую LLM для ИИ-агентов с пятикратным приростом скорости 9 ч.
Спустя 13 лет моддеры возродили отменённый мультиплеерный шутер Star Wars: First Assault, который должен был проложить дорогу Battlefront 3 10 ч.
Valve: 5863 игры в Steam заработали по $100 000 и больше за прошлый год 10 ч.
Meta запустила ИИ-защиту от фишинговых ссылок и дипфейков знаменитостей 10 ч.
Создатели Styx: Blades of Greed анонсировали Warhammer Blood Bowl — первый трейлер, демо в Steam и бесплатный апгрейд 11 ч.
Спидраннер наткнулся в Uncharted: Drake's Fortune на секрет, который скрывался от игроков почти 20 лет 12 ч.
Илон Маск объяснил, что будет представлять собой Macrohard — совместный проект xAI и Tesla 2 ч.
Новая статья: Обзор GIGABYTE GAMING A16 PRO: самый доступный игровой ноутбук с графикой на 16 Гбайт 7 ч.
Xbox Project Helix получит ИИ-генератор кадров и рейтрейсинг нового поколения — девкиты выйдут в 2027 году 8 ч.
Valve рассказала, как будет проверять игры на совместимость с приставкой Steam Machine и VR-гарнитурой Steam Frame 9 ч.
Framework повысила цены на память и SSD для своих ноутбуков и ПК — в третий раз за четыре месяца 10 ч.
Телевизоры Hisense начали показывать неотключаемую рекламу даже при переключении входов и каналов 11 ч.
Apple продаст до конца года около 5 млн MacBook Neo, а будущий Neo 2 получит сенсорный экран 11 ч.
Nvidia бросит вызов Tesla и Waymo на рынке автопилота 14 ч.
Intel внезапно представила десктопные процессоры Core Ultra 200S Plus — ядер больше, память быстрее, а цена ниже 14 ч.
В жаркие дни ИИ ЦОД способны потреблять воды как весь Нью-Йорк за день 16 ч.