Сегодня 21 мая 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Конец немого ИИ-видео: Google представила Veo 3 — первый генератор видео со звуком

Google представила на конференции I/O 2025 новейшую ИИ-модель для генерации видео по текстовым описаниям Veo 3, которая создаёт не только картинку, но и звуковое сопровождение. В отличие от аналогов, алгоритм понимает содержание кадров и создаёт аудио без дополнительных подсказок. А для защиты от дипфейков все ролики будут помечаться невидимым водяным знаком.

 Источник изображения: Google

Источник изображения: Google

Алгоритм умеет создавать звуковые эффекты, фоновые шумы и даже диалоги, синхронизируя их с изображением. По словам главы подразделения Google DeepMind Демиса Хассабиса (Demis Hassabis), пользователи могут задать описание персонажей, окружения и даже указать, как должны звучать реплики. Компания не раскрывает, на каких данных обучали Veo 3, но, скорее всего, как пишет TechCrunch, использовались материалы YouTube, так как Google, владеющая этой платформой, ранее подтверждала, что её контент «может» применяться для тренировки моделей.

Рынок генеративного видео уже перенасыщен: Runway, OpenAI, Alibaba и десятки стартапов выпускают похожие модели. Однако Google пошла дальше, внедрив полноценное звуковое сопровождение. Ранее DeepMind разрабатывала технологию «видео-в-аудио» (video-to-audio), что, вероятно, и стало основой для новой системы, которая анализирует пиксели видео и автоматически подбирает соответствующее аудио. Чтобы противостоять распространению дезинформации и дипфейков, все ролики Veo 3 помечаются невидимым встроенным водяным знаком SynthID.

Одновременно с этим многие художники и мультипликаторы выражают обеспокоенность происходящим. По данным исследования, заказанного Гильдией аниматоров Голливуда (Animation Guild), к 2026 году около 100 тысяч рабочих мест в киноиндустрии, на телевидении и в анимации в США могут быть потеряны из-за ИИ.

Эксперты отмечают, что Veo 3 может стать серьёзным конкурентом на перегруженном рынке генеративного видео — при условии, что Google сдержит обещания по качеству звука. Модель уже доступна в приложении Gemini для подписчиков тарифа AI Ultra стоимостью $249 в месяц.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Глава Gearbox: «настоящий фанат» найдёт способ купить Borderlands 4 и за $80 52 мин.
ИИ-платформа Microsoft Discovery создала жидкость для СЖО за 200 часов вместо нескольких месяцев 2 ч.
«Славься, Повелитель Ночи»: разработчики Warhammer 40,000: Rogue Trader заинтриговали фанатов тизером скорого анонса 2 ч.
Google мощно обновила приложение Gemini: изучение мира в реальном времени, улучшенный Deep Research и многое другое 3 ч.
Google начала тестирование нового пользовательского интерфейса в Android 16 3 ч.
Из раннего доступа Steam скоро выйдет The Wandering Village — градостроительная стратегия о выживании на спине гигантского зверя 4 ч.
Google добавила ИИ-помощника Gemini в Chrome — он сделает сёрфинг в интернете удобнее 4 ч.
«Мы вернулись, друзья»: спустя почти пять лет судебной борьбы Fortnite вновь стала доступна в американском App Store 4 ч.
Запуск Doom: The Dark Ages стал крупнейшим в истории id Software, но есть нюанс 6 ч.
Google анонсировала Beam — платформу 3D-видеосвязи для бизнеса 8 ч.
«Я вообще-то не только танцую»: роботы Tesla Optimus учатся готовить обед и прибираться в доме 18 мин.
Репортаж со стенда GIGABYTE на выставке Computex 2025: материнские платы и видеокарты на любой вкус 30 мин.
«Российский Starlink» получит статус нацпроекта 44 мин.
Представлен ПАК Tantor XData 2B — машина баз данных на российском процессоре Baikal-S 49 мин.
Россияне стали пересаживаться с прокатных электросамокатов на личные — они удобнее и не контролируются 50 мин.
По пятам Apple: 2-нм чипы MediaTek будут готовы к производству уже к сентябрю 53 мин.
AMD представила профессиональную видеокарту Radeon AI Pro R9700 с 32 Гбайт памяти 2 ч.
Tesla придётся попотеть: беспилотные такси Waymo удвоили число поездок до 10 млн всего за пять месяцев 2 ч.
Японцы изобрели камеру, способную снимать голограммы живых органов в реальном времени 2 ч.
Meizu вернулась на глобальный рынок со множеством новых смартфонов, очками дополненной реальности и смарт-кольцом 3 ч.