Сегодня 12 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Runway представила свою первую ИИ-модель мира и добавила звук в генератор видео

Компания Runway, которая ранее выпускала генераторы изображений и видео, представила модель искусственного интеллекта для генерации виртуальных миров, получившую название GWM-1. Она работает за счёт покадрового прогнозирования, создаёт симуляции с пониманием физики и того, как ведёт себя мир с течением времени.

 Источник изображений: Runway

Источник изображений: Runway

Модель мира — это система ИИ, изучающая внутренние симуляции с процессами, которые могут происходить в мире. Она может рассуждать, планировать и осуществлять действия без необходимости в обучении на каждом возможном сценарии в реальной жизни. «Чтобы создать модель мира, нам сначала нужно было разработать по-настоящему качественную модель видео. Мы считаем, что правильный путь к созданию моделей мира — их обучение предсказывать пиксели напрямую, и это лучший способ добиться универсального моделирования. При достаточном масштабе и с правильными данными можно создать модель, которая достаточно хорошо понимает, как работает мир», — рассказал гендиректор Runway Анастасис Германидис (Anastasis Germanidis).

Компания представила три версии новой модели мира: GWM-Worlds, GWM-Robotics и GWM-Avatars. GWM-Worlds — приложение, позволяющее создавать интерактивные проекты. Пользователь задаёт первоначальную сцену по текстовому запросу или образцу на изображении, и по мере исследования пространства модель генерирует мир с учётом геометрии, физики и освещения. Моделирование осуществляется с разрешением 720p и скоростью 24 кадра в секунду. GWM-Worlds может пригодиться в разработке игр, она также подходит для обучения навигационных агентов и агентов действия в реальном мире. GWM-Robotics предназначается для генерации синтетических данных, обогащаемых новыми параметрами, такими как изменения погодных условий или возникновение препятствий. Этот метод поможет выявить, когда и при каких условиях роботы способны нарушать правила с учётом различных сценариев. GWM-Avatars предназначается для создания реалистичных аватаров и имитации человеческого поведения. Сейчас Worlds, Robotics и Avatars работают как отдельные модели, но Runway планирует их объединить.

Компания также сообщила об обновлении своей базовой модели Gen 4.5 — она научилась генерировать встроенный звук и создавать длинные многокадровые ролики. Это могут быть одноминутные клипы с согласованностью персонажей, встроенными диалогами, фоновым звуком и сложными кадрами с разных ракурсов. Можно также редактировать существующий звуковой ряд, добавлять диалоги и изменять многокадровые видеоролики любой длины. Работать с генератором видео Runway Gen 4.5 могут все пользователи платных тарифных планов. GWM-Robotics будет доступна через SDK; ведутся переговоры с партнёрами об интеграции GWM-Robotics и GWM-Avatars для создателей робототехники и других предприятий.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Нереалистичные сроки, неумелое руководство и страх отмены: журналисты рассказали о проблемах разработки новой Ghost Recon 10 мин.
В работе Facebook и Instagram произошёл масштабный сбой — ленты не обновляются, видео и картинки не загружаются 2 ч.
Crimson Desert продолжает превращаться в симулятор разведения животных — подробности обновления 1.11.00 2 ч.
«Полмиллиона Безымянных героев»: THQ Nordic похвасталась продажами ремейка «Готики» за первую неделю 3 ч.
Вирус Hades распугивает ИИ-сканеры запросами на создание ядерного и биологического оружия 4 ч.
HarmonyOS 6 распространилась на 66 млн устройств, следующая цель — 100 млн 4 ч.
Huawei анонсировала HarmonyOS 7 с повышенной производительностью и встроенным ИИ-агентом 5 ч.
Oracle превысила прогнозы Уолл-стрит, но акции упали из-за планов по займам для постройки ИИ ЦОД 5 ч.
ИИ-боты повадились рассказывать истории об Элиасе Торне — и никто не знает, кто это такой 7 ч.
Google раскрыла преступную группировку, промышлявшую фишингом с помощью ИИ-сервиса Gemini 7 ч.