Сегодня 12 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Google DeepMind представила ИИ-модель Genie 2, которая может превращать тексты в трёхмерные игры

Команда Google DeepMind представила Genie 2 — вторую версию фундаментальной модели ИИ, способной на лету генерировать новые интерактивные цифровые окружения, или игровые миры.

 Источник изображений: Google

Источник изображений: Google

Напомним, оригинальная Genie была выпущена в феврале и могла генерировать виртуальные 2D-миры из синтезированных изображений. Genie 2 способна делать это в 3D и на основе текстовых команд.

Пользователь может описать желаемый мир, выбрать подходящий рендеринг и ступить в новое окружение. На каждом шагу человек/агент совершает действие (движение мыши, нажатие клавиши на клавиатуре), а Genie 2 имитирует его последствия.

 В основе каждого примера — изображение, сгенерированное ИИ-моделью Imagen 3 на основе текстовой подсказки

В основе каждого примера — изображение, сгенерированное ИИ-моделью Imagen 3 на основе текстовой подсказки

По словам Google DeepMind, Genie 2 может генерировать последовательные интерактивные миры продолжительностью около минуты, хотя большинство показанных (см. видео ниже) примеров длятся 10−20 секунд.

По сравнению с первой версией Genie 2:

  • может запоминать элементы мира, которые не находятся в поле зрения;
  • может создавать окружение с разными перспективами (от первого или третьего лица, изометрическая камера и так далее);
  • может создавать комплексные трёхмерные сцены;
  • может моделировать разнообразные взаимодействия с объектами вроде лопания воздушных шаров, открытия дверей или подрыва взрывоопасным бочек выстрелом;
  • научилась анимировать персонажей разных типов;
  • научилась моделировать NPC и взаимодействия с ними;
  • научилась моделировать эффекты воды, дыма, гравитацию, освещение, отражения;
  • научилась моделировать интерактивное окружение на основе реальных фотографий.

По мнению Google DeepMind, Genie 2 демонстрирует потенциал фундаментальных моделей мира для создания разнообразных трёхмерных окружений и ускорения тренировок/тестирования ИИ-агентов (вроде того же SIMA).

Google DeepMind уточняет, что исследование находится на ранней стадии и требует значительных улучшений в областях возможностей агентов и генерации среды, но уже видит в Genie 2 решение структурной проблемы безопасной тренировки ИИ-агентов.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Обновлённая Siri «на 100 %» откажется превращаться в ИИ-девушку пользователя 13 мин.
Google намерена узнать, что произойдёт, когда миллионы ИИ-агентов начнут действовать вместе 16 мин.
Слухи: разработку ремейка Resident Evil 0 перезапустили с нуля, но есть и хорошая новость 27 мин.
«Важно лишь то, насколько отполирована игра»: разработчики Phantom Blade Zero не испугались конкуренции с GTA VI 42 мин.
WhatsApp расширил поддержку нескольких аккаунтов в приложении для iOS 2 ч.
«Вышитое» средневековое приключение Scarlet Deer Inn не заставит себя долго ждать — новый трейлер и дата выхода в Steam 3 ч.
Telegram получил клиенты для смарт-часов, поддержку форматирования у ботов, ИИ-модерацию в группах и многое другое 3 ч.
SemiAnalysis: подписная модель на ИИ-сервисы оказалась до семи раз дешевле доступа по API 4 ч.
В Steam пробралась демоверсия ретрофутуристического хоррора RetroSpace, вдохновлённого System Shock 14 ч.
Ролевой боевик Valor Mortis от создателей Ghostrunner не выйдет в один день с Control Resonant — объявлена новая дата релиза 16 ч.
Nvidia начнёт продавать самые передовые чипы в Китай — но обучать ИИ на них вряд ли получится 10 мин.
Аэротакси Vertical Aerospace впервые взлетело с пилотом на борту — это резко приблизило сертификацию 35 мин.
Создан самый маленький QR-код в истории — он состоит из отдельных атомов серебра 52 мин.
Microsoft разрешила функциям Copilot+ PC работать на видеокартах Nvidia 2 ч.
Бум ИИ споткнулся о бетономешалки: забастовка водителей грозит сорвать расширение фабрик Samsung и SK hynix 2 ч.
Япония успешно запустила ракету-носитель H3 в легчайшей конфигурации 3 ч.
Глава TSMC пожаловался, что больше всего компании не хватает кадров и воды 3 ч.
Впервые солнечная энергетика в США на целый месяц затмила угольную 5 ч.
Сегодня SpaceX проведёт крупнейшее IPO в истории — и продаст акций на рекордные $75 млрд 5 ч.
Телевизоры TCL первыми получили голосовое контекстное управление на базе Gemini 6 ч.