Сегодня 22 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Google DeepMind представила ИИ-модель Genie 2, которая может превращать тексты в трёхмерные игры

Команда Google DeepMind представила Genie 2 — вторую версию фундаментальной модели ИИ, способной на лету генерировать новые интерактивные цифровые окружения, или игровые миры.

 Источник изображений: Google

Источник изображений: Google

Напомним, оригинальная Genie была выпущена в феврале и могла генерировать виртуальные 2D-миры из синтезированных изображений. Genie 2 способна делать это в 3D и на основе текстовых команд.

Пользователь может описать желаемый мир, выбрать подходящий рендеринг и ступить в новое окружение. На каждом шагу человек/агент совершает действие (движение мыши, нажатие клавиши на клавиатуре), а Genie 2 имитирует его последствия.

 В основе каждого примера — изображение, сгенерированное ИИ-моделью Imagen 3 на основе текстовой подсказки

В основе каждого примера — изображение, сгенерированное ИИ-моделью Imagen 3 на основе текстовой подсказки

По словам Google DeepMind, Genie 2 может генерировать последовательные интерактивные миры продолжительностью около минуты, хотя большинство показанных (см. видео ниже) примеров длятся 10−20 секунд.

По сравнению с первой версией Genie 2:

  • может запоминать элементы мира, которые не находятся в поле зрения;
  • может создавать окружение с разными перспективами (от первого или третьего лица, изометрическая камера и так далее);
  • может создавать комплексные трёхмерные сцены;
  • может моделировать разнообразные взаимодействия с объектами вроде лопания воздушных шаров, открытия дверей или подрыва взрывоопасным бочек выстрелом;
  • научилась анимировать персонажей разных типов;
  • научилась моделировать NPC и взаимодействия с ними;
  • научилась моделировать эффекты воды, дыма, гравитацию, освещение, отражения;
  • научилась моделировать интерактивное окружение на основе реальных фотографий.

По мнению Google DeepMind, Genie 2 демонстрирует потенциал фундаментальных моделей мира для создания разнообразных трёхмерных окружений и ускорения тренировок/тестирования ИИ-агентов (вроде того же SIMA).

Google DeepMind уточняет, что исследование находится на ранней стадии и требует значительных улучшений в областях возможностей агентов и генерации среды, но уже видит в Genie 2 решение структурной проблемы безопасной тренировки ИИ-агентов.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Яндекс» выпустит «Нейроаналитика» — ИИ-агента для визуализации данных 10 мин.
Дикторов в московском метро дополнит ИИ — тестирование уже началось 25 мин.
Функции складного iPhone станут приоритетом при разработке iOS 27 40 мин.
Игрой Saber Interactive по «Восставшему из ада» оказался хоррор нового уровня Clive Barker’s Hellraiser: Revival — первый трейлер и подробности 2 ч.
Хакеры научились обходить многофакторную авторизацию FIDO 2 ч.
Почти идеальный финал, крутой геймплей и 20 часов на сюжет: Techland раскрыла новые подробности Dying Light: The Beast 3 ч.
В Spotify в профилях покойных музыкантов стали появляться песни, созданные ИИ — сервис «принимает меры» 3 ч.
Госдума окончательно запретила россиянам искать экстремистские материалы в интернете 3 ч.
Один из самых драматичных сюжетных поворотов Clair Obscur: Expedition 33 появился в игре благодаря шутке 4 ч.
Сериал по Mass Effect в надёжных руках: производством шоу займётся команда «Фоллаут» 6 ч.
Всё своё, от «железа» до ПО: «Группа Астра» и YADRO строят полностью российское облако 7 мин.
Sharp представили VR-перчатки, которые передают тактильные ощущения от прикосновений к виртуальным объектам 16 мин.
Samsung теряет рынок складных смартфонов — в этом году её доля почти сравняется с Huawei 20 мин.
Elgato представила карту видеозахвата Game Capture 4K S с поддержкой 4K при 60 FPS по цене $160 25 мин.
xAI купила за $10 территорию бывшей газовой электростанции неподалёку от будущего ИИ ЦОД 39 мин.
Nothing представила смарт-часы CMF Watch 3 Pro за $99 с увеличенным экраном, но без сменного безеля 2 ч.
Два миллиона GPU и 4,5 ГВт: Oracle и OpenAI договорились построить в США дата-центры для ИИ 4 ч.
Galax GeForce RTX 5080 NOX OC Black Edition получила зеркальную панель и магнитный кожух 4 ч.
Устройства Google Home и Nest перестали понимать команды — и никто не знает почему 4 ч.
Учёные впервые увидели звезду-компаньона у Бетельгейзе — жить ей осталось недолго 4 ч.