Сегодня 28 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Google DeepMind представила ИИ-модель Genie 2, которая может превращать тексты в трёхмерные игры

Команда Google DeepMind представила Genie 2 — вторую версию фундаментальной модели ИИ, способной на лету генерировать новые интерактивные цифровые окружения, или игровые миры.

 Источник изображений: Google

Источник изображений: Google

Напомним, оригинальная Genie была выпущена в феврале и могла генерировать виртуальные 2D-миры из синтезированных изображений. Genie 2 способна делать это в 3D и на основе текстовых команд.

Пользователь может описать желаемый мир, выбрать подходящий рендеринг и ступить в новое окружение. На каждом шагу человек/агент совершает действие (движение мыши, нажатие клавиши на клавиатуре), а Genie 2 имитирует его последствия.

 В основе каждого примера — изображение, сгенерированное ИИ-моделью Imagen 3 на основе текстовой подсказки

В основе каждого примера — изображение, сгенерированное ИИ-моделью Imagen 3 на основе текстовой подсказки

По словам Google DeepMind, Genie 2 может генерировать последовательные интерактивные миры продолжительностью около минуты, хотя большинство показанных (см. видео ниже) примеров длятся 10−20 секунд.

По сравнению с первой версией Genie 2:

  • может запоминать элементы мира, которые не находятся в поле зрения;
  • может создавать окружение с разными перспективами (от первого или третьего лица, изометрическая камера и так далее);
  • может создавать комплексные трёхмерные сцены;
  • может моделировать разнообразные взаимодействия с объектами вроде лопания воздушных шаров, открытия дверей или подрыва взрывоопасным бочек выстрелом;
  • научилась анимировать персонажей разных типов;
  • научилась моделировать NPC и взаимодействия с ними;
  • научилась моделировать эффекты воды, дыма, гравитацию, освещение, отражения;
  • научилась моделировать интерактивное окружение на основе реальных фотографий.

По мнению Google DeepMind, Genie 2 демонстрирует потенциал фундаментальных моделей мира для создания разнообразных трёхмерных окружений и ускорения тренировок/тестирования ИИ-агентов (вроде того же SIMA).

Google DeepMind уточняет, что исследование находится на ранней стадии и требует значительных улучшений в областях возможностей агентов и генерации среды, но уже видит в Genie 2 решение структурной проблемы безопасной тренировки ИИ-агентов.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
YouTube научился собирать персональную ленту видео по описанию 3 ч.
Google и CrowdStrike обезвредили ботнет Glassworm, два года атаковавший разработчиков открытого ПО 4 ч.
No Man’s Sky получила обновление The Swarm с фракциями для игроков, роем дронов и масштабными космическими сражениями 5 ч.
«Удивит и впечатлит людей»: инсайдеры раскрыли название, место анонса и дату выхода ремейка Rayman Legends 5 ч.
Avanpost открыла публичное тестирование облачного сервиса Avanpost Identity Cloud 5 ч.
Telegram в России оштрафовали в третий раз за месяц 7 ч.
Robinhood выпустила кредитку для ИИ-агентов, чтобы те могли оплачивать покупки за пользователей 7 ч.
Кодзима наконец покорил космос, но лишь в ИИ-рекламе для Prada 7 ч.
Спустя пять лет после анонса разработка новой Dragon Quest стартовала с нуля — первый трейлер и подробности Dragon Quest XII: Beyond Dreams 9 ч.
YouTube научился автоматически помечать видео, созданные с помощью ИИ 10 ч.
Valve возобновила продажи Steam Deck, но цена взлетела на сотни долларов 4 ч.
Китайский производитель памяти CXMT готовит крупнейшее за последние годы IPO, чтобы бросить вызов Samsung и Micron 5 ч.
Американский стартап в 1000 раз ускорил протипирование печатных плат — жидкий металл меняет разводку печатных плат почти мгновенно 6 ч.
Будущие смартфоны Huawei Mate 90 получат процессор Kirin на аналоге 3-нм техпроцесса 7 ч.
«Это не было запланировано»: Motorola признала скрытую подмену ссылок Amazon на своих смартфонах 7 ч.
Из-за ИИ-бума TSMC повысит цены на 3-нм чипы на 15 % в этом году и ещё на 10 % — в следующем 7 ч.
$800 млрд под угрозой: половине запланированных в США ЦОД угрожают стихийные бедствия 9 ч.
MediaTek представила чип Dimensity 8550 для мощных смартфонов среднего уровня — он поддерживает Gemini Nano v3 9 ч.
В очередь за холодом: Modine получила предзаказ на системы охлаждения для ЦОД на $4 млрд 9 ч.
Apple повысила выплаты за старые iPhone и MacBook по программе трейд-ин 10 ч.