Сегодня 11 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Runway представила свою первую ИИ-модель мира и добавила звук в генератор видео

Компания Runway, которая ранее выпускала генераторы изображений и видео, представила модель искусственного интеллекта для генерации виртуальных миров, получившую название GWM-1. Она работает за счёт покадрового прогнозирования, создаёт симуляции с пониманием физики и того, как ведёт себя мир с течением времени.

 Источник изображений: Runway

Источник изображений: Runway

Модель мира — это система ИИ, изучающая внутренние симуляции с процессами, которые могут происходить в мире. Она может рассуждать, планировать и осуществлять действия без необходимости в обучении на каждом возможном сценарии в реальной жизни. «Чтобы создать модель мира, нам сначала нужно было разработать по-настоящему качественную модель видео. Мы считаем, что правильный путь к созданию моделей мира — их обучение предсказывать пиксели напрямую, и это лучший способ добиться универсального моделирования. При достаточном масштабе и с правильными данными можно создать модель, которая достаточно хорошо понимает, как работает мир», — рассказал гендиректор Runway Анастасис Германидис (Anastasis Germanidis).

Компания представила три версии новой модели мира: GWM-Worlds, GWM-Robotics и GWM-Avatars. GWM-Worlds — приложение, позволяющее создавать интерактивные проекты. Пользователь задаёт первоначальную сцену по текстовому запросу или образцу на изображении, и по мере исследования пространства модель генерирует мир с учётом геометрии, физики и освещения. Моделирование осуществляется с разрешением 720p и скоростью 24 кадра в секунду. GWM-Worlds может пригодиться в разработке игр, она также подходит для обучения навигационных агентов и агентов действия в реальном мире. GWM-Robotics предназначается для генерации синтетических данных, обогащаемых новыми параметрами, такими как изменения погодных условий или возникновение препятствий. Этот метод поможет выявить, когда и при каких условиях роботы способны нарушать правила с учётом различных сценариев. GWM-Avatars предназначается для создания реалистичных аватаров и имитации человеческого поведения. Сейчас Worlds, Robotics и Avatars работают как отдельные модели, но Runway планирует их объединить.

Компания также сообщила об обновлении своей базовой модели Gen 4.5 — она научилась генерировать встроенный звук и создавать длинные многокадровые ролики. Это могут быть одноминутные клипы с согласованностью персонажей, встроенными диалогами, фоновым звуком и сложными кадрами с разных ракурсов. Можно также редактировать существующий звуковой ряд, добавлять диалоги и изменять многокадровые видеоролики любой длины. Работать с генератором видео Runway Gen 4.5 могут все пользователи платных тарифных планов. GWM-Robotics будет доступна через SDK; ведутся переговоры с партнёрами об интеграции GWM-Robotics и GWM-Avatars для создателей робототехники и других предприятий.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Китайская Zhipu готовит ИИ-модель, которая сможет потягаться с DeepSeek 13 мин.
Система расследования инцидентов Staffcop Enterprise дополнилась файловым сканером и функцией перехвата данных в Max 30 мин.
Разработчики «Войны Миров: Сибирь» вышли из состава 1C Game Studios и продолжат делать игру в независимой студии 49 мин.
ИИ-модели Google стали отклонять запросы с упоминаниями персонажей Disney 51 мин.
Индонезия предложила России сотрудничество в игровой индустрии, включая обмен технологиями и совместную разработку 2 ч.
«Сбербанк» сократил 20 % сотрудников из-за ИИ, который «поменяет всё и везде» 2 ч.
Amazon задумала запустить маркетплейс лицензий на контент для обучения ИИ 2 ч.
Microsoft закрыла 58 уязвимостей в Windows 11, шесть из которых эксплуатировались хакерами 3 ч.
Замедленный Telegram оштрафовали на 10,8 млн рублей за неисполнение российских законов 3 ч.
MWS Cloud запустила сервис Managed Kubernetes в промышленную эксплуатацию 4 ч.
Канадцы собрали «копеечный» аналог квантового компьютера для решения задач оптимизации 47 мин.
Microsoft изучает использование сверхпроводников для питания ЦОД 2 ч.
All-Flash СХД IBM FlashSystem 5600, 7600 и 9600 получили автономное ИИ-управление 2 ч.
Каждый четвёртый активный смартфон в мире в 2025 году — это какой-нибудь iPhone 3 ч.
Видео: GeForce RTX 5090 устроила огненное шоу прямо при первом запуске — и случай не гарантийный 3 ч.
Власти США «по-хорошему» призывают гиперскейлеров самим финансировать расширение ИИ-проектов, а не перекладывать затраты на жителей 3 ч.
ИИ обвалил курс акций финансовых компаний США 3 ч.
PocketBook выпустила 10,3-дюймовый ридер InkPad One — альтернатива Kindle Scribe без привязки к экосистеме Amazon 4 ч.
Госдума поддержала спорный закон о реестре IMEI: незарегистрированным смартфонам отключат связь 4 ч.
Trane Technologies приобрела поставщика СЖО для ЦОД LiquidStack 4 ч.