В августе Google представила Genie 3 — «универсальную модель мира, способную генерировать разнообразные игровые среды». Теперь подписчики тарифного плана Google AI Ultra из США могут поработать с ней на платформе Project Genie.
Источник изображения: Google
Задача модели мира — имитировать динамику окружающей среды, предсказывать её развитие, изменения под влиянием различных действий; система призвана ориентироваться в разнообразии реального мира. Экспериментальный исследовательский прототип предлагает пользователю описать некое пространство на свой выбор, ответив на вопрос «Как выглядит твой мир?», и способ перемещения по этому миру: ходьба, езда, полёт — и точку зрения, от первого или третьего лица. Далее описывается основной персонаж — это может быть человек, животное, кто-то или что-то ещё, — после чего Project Genie генерирует эскиз при помощи модели Nano Banana Pro. Пользователь получает представление, как будет выглядеть генерируемый мир, и может внести изменения, прежде чем переместиться в него.
Фотореалистичные миры генерируются в разрешении 720p, взаимодействие с ними отображается с частотой от 20 до 24 кадров в секунду; время сеанса ограничено 60 секундами. При движении Genie 3 «на основе ваших действий генерирует путь в реальном времени»; физика и взаимодействие с объектами моделируются с «прорывной стабильностью», уверяет Google. Есть возможность регулировать положение камеры и скачивать видео прогулок по виртуальным мирам. Ещё одна функция — создание ремиксов миров по текстовым запросам или через рандомизатор.
Помимо 60-секундного ограничения, Google предупредила, что созданный ИИ мир может выглядеть не вполне реалистично, не всегда в точности «соответствовать запросам, изображениям и законам физики реального мира». Пользовательские персонажи также не идеальны — они «могут быть не вполне управляемыми или иметь большую задержку в управлении». Открыв доступ к Project Genie, компания Google стремится «лучше понять, как люди будут использовать модели мира в различных областях — для исследований в области ИИ и генеративных медиа». На практике у технологии есть перспективы в «робототехнике и моделировании, анимации и художественной литературе, а также в исследовании локаций и исторических мест», считают в Google. Работать с сервисом могут пользователи в возрасте от 18 лет.