Сегодня 21 августа 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Google DeepMind представила ИИ-генератор видео Veo 2, который создаёт двухминутные ролики в 4K

Подразделение Google DeepMind представило Veo 2 — основанный на искусственном интеллекте генератор видео нового поколения. Он создаёт видеоролики в разрешении 4K (4096 × 2160 пикселей) продолжительностью до двух минут. Таким образом, он в 4 раза превосходит OpenAI Sora по разрешению и в 6 раз — по продолжительности видео.

 Источник изображений: Google DeepMind

Источник изображений: Google DeepMind

На данный момент это преимущество, однако, носит лишь теоретический характер: испробовать Veo 2 можно лишь на экспериментальной площадке VideoFX, где разрешение ограничено 720p, а длина видео — 8 секундами. Для сравнения, доступная для пользователей версия генератора OpenAI Sora предлагает 1080p и 20 секунд. Чтобы начать работу с VideoFX, придётся записаться в список ожидания, хотя Google пообещала на этой неделе расширить аудиторию. В перспективе Veo 2 появится на платформе для бизнес-пользователей Vertex AI, но точные сроки в Google не указали.

Veo 2, как и её предшественница, генерирует видео по текстовым подсказкам, которые можно сопровождать изображениями. По сравнению с Veo первого поколения, новая модель лучше «понимает» физику, изображение отличается повышенной чёткостью, усовершенствованы механизмы движения виртуальной камеры. Veo 2 более реалистично моделирует движение (например, изображает наливаемый в кружку кофе) и свойства света (тени и отражения); правдоподобно имитируются разные линзы на виртуальной камере и кинематографические эффекты.

Разработчик также уверяет, что у новой модели с меньшей вероятностью проявляются галлюцинации: дополнительные пальцы или «неожиданные объекты»; при этом, как показала практика, от эффекта «зловещей долины» избавиться не удалось. А на видео с движущимся автомобилем дорога при ближайшем рассмотрении оказывается чрезвычайно гладкой, пешеходы сливаются друг с другом, а некоторые фасады домов имеют вид, который противоречит законам физики.

Новый генератор видео был обучен на большом числе роликов; в DeepMind не уточнили, какие источники для этого использовались, но одним из них, вероятно, является принадлежащая Google платформа YouTube. Чтобы снизить риск возникновения дипфейков, в Veo 2 встроили систему SynthID — невидимую маркировку генерируемых моделью видео.

В DeepMind также сообщили, что улучшили работу генератора статических изображений Imagen 3 — созданные с его помощью картинки стали более яркими, детализированными, а сама модель теперь более точно следует запросам пользователя. В пользовательском интерфейсе ImageFX, где доступен генератор изображений, появились выпадающие списки, которые появляются прямо в поле запроса и помогают добиться более точного результата.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Google AI Mode заработает в 180 странах, но не в России 51 мин.
Ожидание почти закончилось: спустя шесть лет после анонса Hollow Knight: Silksong всё-таки получила дату выхода 2 ч.
Meta завышала эффективность рекламы и тайно собирала данные пользователей iPhone вопреки запрету Apple 2 ч.
«Софтлайн» рассчитывает на валовую прибыль до 50 млрд руб. по итогам 2025 года 2 ч.
Microsoft придумала, как ускорить загрузку в играх до 10 раз — разработан новый метод компиляции шейдеров 4 ч.
Microsoft отключила китайским компаниям оповещения об уязвимостях в ПО 5 ч.
«Катастрофа»: Elden Ring на Nintendo Switch 2 шокировала журналистов ужасной производительностью 7 ч.
Олдскульный хоррор на выживание Tormented Souls 2 в антураже чилийской глубинки обзавёлся датой релиза 7 ч.
В Steam стартовало открытое тестирование Militsioner — сюрреалистической игры о побеге от милиционера-великана 8 ч.
ИИ-помощник Google Gemini Live научился видеть мир через камеру смартфона — точно и без задержек 8 ч.
Xiaomi выпустила беспроводную мышь «для длительных рабочих сессий» с бесшумными кнопками за $11 2 ч.
Honor представила Magic V Flip 2 — первую раскладушку с 200-Мп камерой и батареей на 5500 мА·ч 2 ч.
Почти все Google Pixel 10 получили быструю флеш-память и секретное средство её долговечности 2 ч.
Kioxia разогнала флеш-память до 64 Гбайт/с в прототипе SSD будущего 4 ч.
Vivo представила ответ Apple Vision Pro — лёгкую MR-гарнитуру Vision с 8K-дисплеями Micro-OLED 4 ч.
В России стартовали продажи смартфона Poco M7 с батареей на 7000 мА·ч по цене от 13,5 тыс. рублей 5 ч.
Состоялся пятый успешный запуск лёгкой ракеты-носителя «Ангара-1.2» 5 ч.
Xiaomi скатилась на девятое место среди крупнейших производителей электромобилей в мире 5 ч.
Доступность колокейшн-ЦОД в Северной Америке установила антирекорд — 2,3 % 5 ч.
В США создали роботов-геодезистов — они разметят участок в любую погоду без перерывов на обед 6 ч.