Сегодня 17 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Конец немого ИИ-видео: Google представила Veo 3 — первый генератор видео со звуком

Google представила на конференции I/O 2025 новейшую ИИ-модель для генерации видео по текстовым описаниям Veo 3, которая создаёт не только картинку, но и звуковое сопровождение. В отличие от аналогов, алгоритм понимает содержание кадров и создаёт аудио без дополнительных подсказок. А для защиты от дипфейков все ролики будут помечаться невидимым водяным знаком.

 Источник изображения: Google

Источник изображения: Google

Алгоритм умеет создавать звуковые эффекты, фоновые шумы и даже диалоги, синхронизируя их с изображением. По словам главы подразделения Google DeepMind Демиса Хассабиса (Demis Hassabis), пользователи могут задать описание персонажей, окружения и даже указать, как должны звучать реплики. Компания не раскрывает, на каких данных обучали Veo 3, но, скорее всего, как пишет TechCrunch, использовались материалы YouTube, так как Google, владеющая этой платформой, ранее подтверждала, что её контент «может» применяться для тренировки моделей.

Рынок генеративного видео уже перенасыщен: Runway, OpenAI, Alibaba и десятки стартапов выпускают похожие модели. Однако Google пошла дальше, внедрив полноценное звуковое сопровождение. Ранее DeepMind разрабатывала технологию «видео-в-аудио» (video-to-audio), что, вероятно, и стало основой для новой системы, которая анализирует пиксели видео и автоматически подбирает соответствующее аудио. Чтобы противостоять распространению дезинформации и дипфейков, все ролики Veo 3 помечаются невидимым встроенным водяным знаком SynthID.

Одновременно с этим многие художники и мультипликаторы выражают обеспокоенность происходящим. По данным исследования, заказанного Гильдией аниматоров Голливуда (Animation Guild), к 2026 году около 100 тысяч рабочих мест в киноиндустрии, на телевидении и в анимации в США могут быть потеряны из-за ИИ.

Эксперты отмечают, что Veo 3 может стать серьёзным конкурентом на перегруженном рынке генеративного видео — при условии, что Google сдержит обещания по качеству звука. Модель уже доступна в приложении Gemini для подписчиков тарифа AI Ultra стоимостью $249 в месяц.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Telegram начал процесс приземления в России 37 мин.
«Время для ещё одного прохождения»: Cyberpunk 2077 получила крупное обновление 2.3 и вышла на Mac 2 ч.
Госдума одобрила штрафы за поиск запрещённых материалов — VPN станет отягощающим обстоятельством 2 ч.
Google почти запустила аналог ChatGPT раньше OpenAI, но руководство струсило 3 ч.
Сгенерированная ИИ музыка набирает вирусную популярность — отрасли придётся адаптироваться 3 ч.
Telegram больше всех выиграл от запрета на рекламу в Instagram — Forbes выяснил, сколько зарабатывают блогеры 4 ч.
Создатель Silent Hill и Siren подтвердил работу над новой игрой, и это не Slitterhead 2 5 ч.
Депутаты разъяснили, за что будут, а за что не будут штрафовать россиян в интернете по новому закону 6 ч.
Успех не спасает от сокращений: разработчиков The Elder Scrolls IV: Oblivion Remastered из студии Virtuos настигли массовые увольнения 6 ч.
OpenAI избавляется от зависимости от Microsoft: часть инфраструктуры ChatGPT переедет в Google Cloud 7 ч.
Самый большой марсианский метеорит на Земле ушёл с молотка за $5,3 миллиона 2 ч.
Бразилия потратит $4,2 млрд на развитие ИИ и хочет построить один из мощнейших в мире суперкомпьютеров 2 ч.
LiXiang L7 на автопилоте ошарашил сотрудников ГИБДД в Казани — пассажиров всё равно оштрафовали 3 ч.
Многострадальный Boeing Starliner снова полетит на МКС в начале 2026 года, но людей ему в этот раз не доверят 3 ч.
Японский робопёс KLEIYN с гибкой спиной научился лазать по стенам 3 ч.
США приостановили поставку в ОАЭ ИИ-ускорителей NVIDIA из-за опасений, что они в итоге достанутся Китаю 4 ч.
Налоговые инициативы Трампа помогут Гейтсу в развитии малых реакторов TerraPower для ИИ ЦОД 4 ч.
OpenAI воспользуется услугами Google Cloud для поддержки ИИ-нагрузок 4 ч.
Tecno представила концепт трёхстворчатого складного смартфона Phantom Ultimate G Fold 5 ч.
Ближайшая волна сокращений лишит работы 5000 сотрудников Intel только в США 6 ч.