Сегодня 11 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Google DeepMind представила ИИ-генератор видео Veo 2, который создаёт двухминутные ролики в 4K

Подразделение Google DeepMind представило Veo 2 — основанный на искусственном интеллекте генератор видео нового поколения. Он создаёт видеоролики в разрешении 4K (4096 × 2160 пикселей) продолжительностью до двух минут. Таким образом, он в 4 раза превосходит OpenAI Sora по разрешению и в 6 раз — по продолжительности видео.

 Источник изображений: Google DeepMind

Источник изображений: Google DeepMind

На данный момент это преимущество, однако, носит лишь теоретический характер: испробовать Veo 2 можно лишь на экспериментальной площадке VideoFX, где разрешение ограничено 720p, а длина видео — 8 секундами. Для сравнения, доступная для пользователей версия генератора OpenAI Sora предлагает 1080p и 20 секунд. Чтобы начать работу с VideoFX, придётся записаться в список ожидания, хотя Google пообещала на этой неделе расширить аудиторию. В перспективе Veo 2 появится на платформе для бизнес-пользователей Vertex AI, но точные сроки в Google не указали.

Veo 2, как и её предшественница, генерирует видео по текстовым подсказкам, которые можно сопровождать изображениями. По сравнению с Veo первого поколения, новая модель лучше «понимает» физику, изображение отличается повышенной чёткостью, усовершенствованы механизмы движения виртуальной камеры. Veo 2 более реалистично моделирует движение (например, изображает наливаемый в кружку кофе) и свойства света (тени и отражения); правдоподобно имитируются разные линзы на виртуальной камере и кинематографические эффекты.

Разработчик также уверяет, что у новой модели с меньшей вероятностью проявляются галлюцинации: дополнительные пальцы или «неожиданные объекты»; при этом, как показала практика, от эффекта «зловещей долины» избавиться не удалось. А на видео с движущимся автомобилем дорога при ближайшем рассмотрении оказывается чрезвычайно гладкой, пешеходы сливаются друг с другом, а некоторые фасады домов имеют вид, который противоречит законам физики.

Новый генератор видео был обучен на большом числе роликов; в DeepMind не уточнили, какие источники для этого использовались, но одним из них, вероятно, является принадлежащая Google платформа YouTube. Чтобы снизить риск возникновения дипфейков, в Veo 2 встроили систему SynthID — невидимую маркировку генерируемых моделью видео.

В DeepMind также сообщили, что улучшили работу генератора статических изображений Imagen 3 — созданные с его помощью картинки стали более яркими, детализированными, а сама модель теперь более точно следует запросам пользователя. В пользовательском интерфейсе ImageFX, где доступен генератор изображений, появились выпадающие списки, которые появляются прямо в поле запроса и помогают добиться более точного результата.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
AMD приобрела ИИ-стартап MK1, созданный ветеранами Neuralink 13 мин.
Музыкальное приключение Mixtape от создателей The Artful Escape не выйдет в 2025 году 2 ч.
Sony разочаровалась в Destiny 2 и признала обесценение активов Bungie 3 ч.
Вышла новая версия WineHelper — программы для запуска Windows-приложений в ОС «Альт» Linux 3 ч.
Евросоюз собрался принести приватность обычных граждан в жертву ИИ 4 ч.
«Случилось невообразимое»: спустя всего пять месяцев Dune: Awakening начала уступать Conan Exiles по количеству игроков в Steam 6 ч.
Журналисты показали, как выглядит версия Diablo IV для Китая — никакой крови, черепов и скелетов 6 ч.
Стартап Spectral Compute по переносу CUDA-приложений на сторонние платформы получил на развитие $6 млн 7 ч.
Запуск Arc Raiders стал лучшим в истории Nexon — 4 миллиона проданных копий менее чем за две недели 8 ч.
Google объявила охоту на приложения, «пожирающие» батареи смартфонов 9 ч.
Бывшая Yandex N.V. взлетела — выручка Nebius подскочила на 355 % после сделки с Meta 2 ч.
Экзоскелет из Death Stranding 2 стал реальностью и скоро поступит в продажу — Кодзима приложил руку 2 ч.
По телевизорам Samsung начал расселяться ИИ-помощник Bixby на базе Microsoft Copilot и Perplexity 2 ч.
Ветеран разработки Windows протестировал 25 своих ПК с 1976 года — современный быстрее как минимум в 200 000 раз 2 ч.
Быстро, но недалеко: Kyocera объявила о прорыве в беспроводной связи под водой — 5,2 Гбит/с по лазеру 3 ч.
Новая статья: Обзор медиаприставки SberBox Max: быстрый Макс 3 ч.
Apple представила авоську для iPhone — экстравагантный чехол Pocket по цене $150–230 4 ч.
Из Tesla сбежали руководители, отвечавшие за Cybertruck и Model Y 4 ч.
Tapestry, «ИИ-управляющий» энергосетями от Google X, поможет обеспечить надёжное питание кампуса Rio AI City мощностью 1,8 ГВт 5 ч.
Облака и ЦОД Northern Data будут проданы Rumble для создания экосистемы Freedom-First с упором на свободу слова и приватность, а майнинговые мощности достанутся Elektron Energy 5 ч.