Сегодня 27 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Google DeepMind дала роботам ИИ, с которым они могут выполнять сложные задания без предварительного обучения

Лаборатория Google DeepMind представила две новые модели ИИ, которые помогут роботам «выполнять более широкий спектр реальных задач, чем когда-либо прежде». Gemini Robotics — это модель «зрение-язык-действие», способная понимать новые ситуации без предварительного обучения. А Gemini Robotics-ER компания описывает как передовую модель, которая может «понимать наш сложный и динамичный мир» и управлять движениями робота.

 Источник изображений: Google DeepMind

Источник изображений: Google DeepMind

Модель Gemini Robotics построена на основе Gemini 2.0, последней версии флагманской модели ИИ от Google. ПО словам руководителя отдела робототехники Google DeepMind Каролины Парада (Carolina Parada), Gemini Robotics «использует мультимодальное понимание мира Gemini и переносит его в реальный мир, добавляя физические действия в качестве новой модальности».

Новая модель особенно сильна в трёх ключевых областях, которые, по словам Google DeepMind, необходимы для создания по-настоящему полезных роботов: универсальность, интерактивность и ловкость. Помимо способности обобщать новые сценарии, Gemini Robotics лучше взаимодействует с людьми и их окружением. Модель способна выполнять очень точные физические задачи, такие как складывание листа бумаги или открывание бутылки.

«Хотя в прошлом мы уже достигли прогресса в каждой из этих областей по отдельности, теперь мы приносим [резко] увеличивающуюся производительность во всех трёх областях с помощью одной модели, — заявила Парада. — Это позволяет нам создавать роботов, которые более способны, более отзывчивы и более устойчивы к изменениям в окружающей обстановке».

Модель Gemini Robotics-ER разработана специально для робототехников. С её помощью специалисты могут подключаться к существующим контроллерам низкого уровня, управляющим движениями робота. Как объяснила Парада на примере упаковки ланч-бокса — на столе лежат предметы, нужно определить, где что находится, как открыть ланч-бокс, как брать предметы и куда их класть. Именно такой цепочки рассуждений придерживается Gemini Robotics-ER.

Разработчики уделили серьёзное внимание безопасности. Исследователь Google DeepMind Викас Синдхвани (Vikas Sindhwani) рассказал, как лаборатория использует «многоуровневый подход», при котором модели Gemini Robotics-ER «обучаются оценивать, безопасно ли выполнять потенциальное действие в заданном сценарии».

Кроме того, Google DeepMind разработала ряд эталонных тестов и фреймворков, чтобы помочь дальнейшим исследованиям безопасности в отрасли ИИ. В частности, в прошлом году лаборатория представила «Конституцию робота» — набор правил, вдохновлённых «Тремя законами робототехники», сформулированными Айзеком Азимовым в рассказе «Хоровод» в 1942 году.

В настоящее время Google DeepMind совместно с компанией Apptronik разрабатывает «следующее поколение человекоподобных роботов». Также лаборатория предоставила доступ к своей модели Gemini Robotics-ER «доверенным тестировщикам», среди которых Agile Robots, Agility Robotics, Boston Dynamics и Enchanted Tools.

«Мы полностью сосредоточены на создании интеллекта, который сможет понимать физический мир и действовать в этом физическом мире, — сказала Парада. — Мы очень рады использовать это в нескольких воплощениях и во многих приложениях для нас».

Напомним, что в сентябре 2024 года исследователи из Google DeepMind продемонстрировали метод обучения, позволяющий научить робота выполнять некоторые требующие определённой ловкости действия, такие как завязывание шнурков, подвешивание рубашек и даже починка других роботов.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Следующее дополнение отправит игроков PowerWash Simulator 2 в далёкую-далёкую галактику — анонсирован кроссовер со «Звёздными войнами» 38 мин.
Европа откроет лазейку для массовой слежки за тем, что граждане ищут в Google 2 ч.
«Не терпится поиграть в Returnal 2»: журналисты показали первые 8 минут геймплея Saros 3 ч.
Календарь релизов 27 апреля – 3 мая: Saros, Diablo IV: Lord of Hatred и HoM&M: Olden Era 3 ч.
Сценарист Assassin’s Creed Black Flag Resynced заинтриговал фанатов новыми сюжетными сценами 3 ч.
DeepSeek-V4 вышла без «вау-эффекта» — рынок уже привык к дешёвому ИИ 3 ч.
Река Забвения, карма и 18 кругов ада — представлен трейлер восточной метроидвании Karma Exorcist 5 ч.
«К2Тех» запустил платформу для управления ИИ-гипотезами и оценки экономического эффекта инициатив 5 ч.
Google подготовила иконки для приложений в новом дизайне, но сроки их внедрения пока неизвестны 5 ч.
GPT-5.2 обошла абитуриентов, сдав вступительные экзамены в Токийский и Киотский университеты лучше всех 6 ч.
Телеком-отрасли Бангладеш грозит коллапс из-за нехватки топлива 41 мин.
Toyota создала игровое кресло из переднего сиденья седана Crown — с электроприводом, подогревом, вентиляцией и USB Type-C 2 ч.
Неизвестный стартап подал в суд на Samsung — требует запретить Galaxy Fold и Flip из-за кражи технологий 2 ч.
Noctua опубликовала 3D-модели своих вентиляторов — но печатать их самостоятельно не разрешила 3 ч.
Meta договорилась о покупке 1 ГВт солнечной энергии из космоса — технология пока существует лишь на бумаге 3 ч.
ИИ вдвое ускорит разработку новых автомобилей — дизайн и аэродинамика теперь считаются за минуты 4 ч.
MSI рассказала, как делает неколючие материнские платы — PinSafe убережёт пальцы от порезов 4 ч.
РТК-ЦОД ввёл в эксплуатацию третью очередь ЦОД в Екатеринбурге 5 ч.
MSI выпустила игровой монитор MAG 275CQDF X24 — 27 дюймов, изогнутый экран и до 400 Гц всего за €200 6 ч.
«Гравитон» представил российские серверы на базе Intel Xeon для облаков, виртуализации и ИИ 7 ч.