Сегодня 17 января 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Google DeepMind представила ИИ-генератор видео Veo 2, который создаёт двухминутные ролики в 4K

Подразделение Google DeepMind представило Veo 2 — основанный на искусственном интеллекте генератор видео нового поколения. Он создаёт видеоролики в разрешении 4K (4096 × 2160 пикселей) продолжительностью до двух минут. Таким образом, он в 4 раза превосходит OpenAI Sora по разрешению и в 6 раз — по продолжительности видео.

 Источник изображений: Google DeepMind

Источник изображений: Google DeepMind

На данный момент это преимущество, однако, носит лишь теоретический характер: испробовать Veo 2 можно лишь на экспериментальной площадке VideoFX, где разрешение ограничено 720p, а длина видео — 8 секундами. Для сравнения, доступная для пользователей версия генератора OpenAI Sora предлагает 1080p и 20 секунд. Чтобы начать работу с VideoFX, придётся записаться в список ожидания, хотя Google пообещала на этой неделе расширить аудиторию. В перспективе Veo 2 появится на платформе для бизнес-пользователей Vertex AI, но точные сроки в Google не указали.

Veo 2, как и её предшественница, генерирует видео по текстовым подсказкам, которые можно сопровождать изображениями. По сравнению с Veo первого поколения, новая модель лучше «понимает» физику, изображение отличается повышенной чёткостью, усовершенствованы механизмы движения виртуальной камеры. Veo 2 более реалистично моделирует движение (например, изображает наливаемый в кружку кофе) и свойства света (тени и отражения); правдоподобно имитируются разные линзы на виртуальной камере и кинематографические эффекты.

Разработчик также уверяет, что у новой модели с меньшей вероятностью проявляются галлюцинации: дополнительные пальцы или «неожиданные объекты»; при этом, как показала практика, от эффекта «зловещей долины» избавиться не удалось. А на видео с движущимся автомобилем дорога при ближайшем рассмотрении оказывается чрезвычайно гладкой, пешеходы сливаются друг с другом, а некоторые фасады домов имеют вид, который противоречит законам физики.

Новый генератор видео был обучен на большом числе роликов; в DeepMind не уточнили, какие источники для этого использовались, но одним из них, вероятно, является принадлежащая Google платформа YouTube. Чтобы снизить риск возникновения дипфейков, в Veo 2 встроили систему SynthID — невидимую маркировку генерируемых моделью видео.

В DeepMind также сообщили, что улучшили работу генератора статических изображений Imagen 3 — созданные с его помощью картинки стали более яркими, детализированными, а сама модель теперь более точно следует запросам пользователя. В пользовательском интерфейсе ImageFX, где доступен генератор изображений, появились выпадающие списки, которые появляются прямо в поле запроса и помогают добиться более точного результата.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
В Microsoft 365 появится Copilot, но стомость подписки увеличится на $3 6 ч.
Google заявила, что её ИИ самый лучший в мире — осталось убедить людей им пользоваться 8 ч.
На Mac с Apple Silicon наконец-то стало возможным запустить Windows и Linux, но с ворохом ограничений 10 ч.
Intel выпустила драйвер с поддержкой Arc B570 и исправлениями старых ошибок 10 ч.
Warhammer 40,000: Space Marine 2 достигла новой вершины продаж, а Games Workshop уже открыла охоту на свой следующий видеоигровой хит 11 ч.
От заката до рассвета: экранизация Until Dawn от режиссёра «И гаснет свет…» получила первый трейлер 12 ч.
«Роскошно даже на минималках»: Square Enix показала сравнение настроек графики ПК-версии Final Fantasy VII Rebirth и работу игры на Steam Deck 13 ч.
Брутальный экшен-хоррор Butcher's Creek уже скоро ворвётся в Steam — дата выхода смеси Condemned: Criminal Origins и Anger Foot от создателя Dusk 15 ч.
Microsoft Project по-прежнему лидирует на российском рынке, хотя и сократил долю вдвое 17 ч.
Аналитик предложил Take-Two повысить цену GTA VI до $100, чтобы помочь игровой индустрии 20 ч.
Быстрому развитию производственной инфраструктуры TSMC в США мешает множество причин 55 мин.
Amazon подала заявку на прокладку своего первого подводного трансатлантического интернет-кабеля 3 ч.
Руководство TSMC верит в высокие темпы роста рынка ИИ в период до 2028 года 3 ч.
США готовятся к созданию суперкомпьютера нового поколения с 10 Пбайт RAM 9 ч.
Google представила инстансы C4A с фирменными Titanium SSD и Arm-процессорами Axiom 10 ч.
Новая статья: Обзор Full HD-монитора Raskat I27F10DAP c 100-Гц IPS-матрицей: особый подход 10 ч.
В первых игровых тестах консольный процессор Ryzen Z2 Go оказался всего на 10 % медленнее Ryzen Z1 Extreme 11 ч.
Обнаружен загадочный источник радиосигналов из области Вселенной, где ничего нет 13 ч.
Broadcom представила FC64-коммутатор седьмого поколения Brocade G710 13 ч.
«Всемирный фонд памятников» озаботился защитой культурного наследия Луны от туристов 13 ч.