Сегодня 11 сентября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Google DeepMind представила ИИ-генератор видео Veo 2, который создаёт двухминутные ролики в 4K

Подразделение Google DeepMind представило Veo 2 — основанный на искусственном интеллекте генератор видео нового поколения. Он создаёт видеоролики в разрешении 4K (4096 × 2160 пикселей) продолжительностью до двух минут. Таким образом, он в 4 раза превосходит OpenAI Sora по разрешению и в 6 раз — по продолжительности видео.

 Источник изображений: Google DeepMind

Источник изображений: Google DeepMind

На данный момент это преимущество, однако, носит лишь теоретический характер: испробовать Veo 2 можно лишь на экспериментальной площадке VideoFX, где разрешение ограничено 720p, а длина видео — 8 секундами. Для сравнения, доступная для пользователей версия генератора OpenAI Sora предлагает 1080p и 20 секунд. Чтобы начать работу с VideoFX, придётся записаться в список ожидания, хотя Google пообещала на этой неделе расширить аудиторию. В перспективе Veo 2 появится на платформе для бизнес-пользователей Vertex AI, но точные сроки в Google не указали.

Veo 2, как и её предшественница, генерирует видео по текстовым подсказкам, которые можно сопровождать изображениями. По сравнению с Veo первого поколения, новая модель лучше «понимает» физику, изображение отличается повышенной чёткостью, усовершенствованы механизмы движения виртуальной камеры. Veo 2 более реалистично моделирует движение (например, изображает наливаемый в кружку кофе) и свойства света (тени и отражения); правдоподобно имитируются разные линзы на виртуальной камере и кинематографические эффекты.

Разработчик также уверяет, что у новой модели с меньшей вероятностью проявляются галлюцинации: дополнительные пальцы или «неожиданные объекты»; при этом, как показала практика, от эффекта «зловещей долины» избавиться не удалось. А на видео с движущимся автомобилем дорога при ближайшем рассмотрении оказывается чрезвычайно гладкой, пешеходы сливаются друг с другом, а некоторые фасады домов имеют вид, который противоречит законам физики.

Новый генератор видео был обучен на большом числе роликов; в DeepMind не уточнили, какие источники для этого использовались, но одним из них, вероятно, является принадлежащая Google платформа YouTube. Чтобы снизить риск возникновения дипфейков, в Veo 2 встроили систему SynthID — невидимую маркировку генерируемых моделью видео.

В DeepMind также сообщили, что улучшили работу генератора статических изображений Imagen 3 — созданные с его помощью картинки стали более яркими, детализированными, а сама модель теперь более точно следует запросам пользователя. В пользовательском интерфейсе ImageFX, где доступен генератор изображений, появились выпадающие списки, которые появляются прямо в поле запроса и помогают добиться более точного результата.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Cyberpunk 2077 получила патч 2.31 с улучшенным автопилотом и новыми настройками для фоторежима 42 мин.
Критики вынесли вердикт Borderlands 4 — всё ещё не уровень Borderlands 2, но уже лучше Borderlands 3 59 мин.
Игровая выставка РЭД ЭКСПО 2025 отменена — «Леста Игры» выбрала «Игромир» и Comic Сon 3 ч.
Вышла предварительная версия Microsoft Visual Studio 2026: обновился дизайн, углубилась интеграция с ИИ 4 ч.
Счастливый финал с подвохом: с дополнением Legacy of the Forge в Kingdom Come: Deliverance 2 появилась новая секретная концовка 4 ч.
Технокомпании обучают ИИ на миллионах роликов, скаченных с YouTube, без разрешения их авторов 4 ч.
Apple заблокирует функцию онлайн-перевода в AirPods для пользователей из Европы 4 ч.
Разрушительный шутер The Finals получил поддержку русского языка спустя почти два года после выхода 5 ч.
Стартап Mistral AI привлёк на развитие €1,7 млрд при участии ASML 7 ч.
Минцифры расширит белый список интернет-сервисов в несколько этапов 7 ч.
Intel воскресила легендарный шестиядерник Core i5-10400 под новым именем Core i5-110 8 мин.
darkFlash представила необычный корпус Floatron F1 с пьедесталом 16 мин.
Samsung работает над камерой для смартфонов с непрерывным зумом, но первыми её получат китайцы 22 мин.
Китайская Ant Group показала гуманоидного робота с ИИ — он умеет готовить и давать медицинские советы 2 ч.
Отключения мобильного интернета сыграли на руку операторам сотовой связи, провайдерам и продавцам роутеров 2 ч.
В облаке Astra Cloud появились выделенные серверы с процессорами Baikal-S 3 ч.
Kioxia вместе с Nvidia разрабатывают PCIe 7.0 SSD в 100 раз быстрее нынешних — его представят в 2027 году 3 ч.
Новые наушники Nothing Ear (3) получат кейс с микрофоном и кнопкой Talk — зачем они, производитель не говорит 4 ч.
Утёкшие рендеры Samsung Galaxy S26 Pro подтверждают его сходство с Galaxy S25 4 ч.
Перезагрузка кадров в высшем эшелоне должна помочь Intel в укреплении бизнеса 4 ч.