Сегодня 22 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Google представила мощную нейросеть Lumiere для генерации реалистичных видео

Google представила Lumiere«модель пространственно-временной диффузии для реалистичной генерации видео», основанную на искусственном интеллекте. Как показала практика, это, возможно, самый мощный на сегодняшний день ИИ-генератор видео, создающий динамические изображения по текстовому описанию.

 Источник изображения: lumiere-video.github.io

Источник изображения: lumiere-video.github.io

Важнейшим отличием Google Lumiere от существующих аналогов является уникальная архитектура модели — видео по всей его продолжительности генерируется за один проход. Другие модели работают по иному принципу: они генерируют несколько ключевых кадров, а затем производят интерполяцию по времени, что затрудняет согласованность генерируемого ролика. Lumiere работает в нескольких режимах, например, производит преобразование текста в видео, конвертирует статические изображения в динамические, создаёт видеоролики в заданном стиле на основе образца, позволяет редактировать существующее видео по письменным подсказкам, анимирует определённые области статического изображения или редактирует видео фрагментарно — например, может изменить предмет гардероба на человеке.

«Мы обучаем нашу модель T2V [преобразования текста в видео] на наборе данных, включающем 30 млн видеороликов с текстовыми описаниями. Видео имеют длину 80 кадров с частотой 16 кадров в секунду. Базовая модель обучена на разрешении 128 × 128 пикселей», — пояснили в Google. На выходе получаются 5-секундные ролики с разрешением 1024 × 1024 пикселей.

Google Lumiere — конечно, не первый ИИ-генератор видео. Сама Google ранее демонстрировала модель Imagen Video, которая генерировала ролики разрешением 1280 × 768 точек с частотой 24 кадра в секунду, но её творения были намного более скромными. Меньшим реализмом отличались результаты таких проектов как Meta Make-A-Video, Runway Gen2 и Stable Video Diffusion. В Google понимают угрозу, которую могут представлять подобные проекты: «Основная наша цель в этой работе — дать начинающим пользователям возможность генерировать визуальный контент гибко и творчески. Однако существует риск неправомерного [создания] подделок или вредоносного контента при помощи нашей технологии, и мы считаем, что крайне важно разрабатывать и применять инструменты выявления случаев предвзятости и злонамеренного использования, чтобы обеспечить безопасную и добросовестную работу [модели]».

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Nvidia устранила некоторые критические проблемы видеокарт GeForce с помощью экстренного обновления драйвера 3 ч.
В Steam начался фестиваль передвижения ящиков — со скидками на головоломки, в которых игрок является «главной движущей силой» 5 ч.
Московский суд оштрафовал Telegram на 4 млн рублей за неудаление запрещённой информации 6 ч.
Опубликовано 25 минут геймплея футуристического шутера La Quimera от бывших разработчиков Metro — игру сравнивают с Killzone и Crysis 6 ч.
«К2Тех» и «К2 Кибербезопасность» анонсировали услугу по защите от вирусов-шифровальщиков 6 ч.
Arenadata приобрела у Orion soft СУБД Proxima DB и переименовала её в Arenadata Prosperity (ADP) 6 ч.
Исследование Honor: люди всё чаще прибегают к помощи ИИ, но скрывают это 7 ч.
Календарь релизов — 21–27 апреля: Tempest Rising, Clair Obscur: Expedition 33 и Steel Seed 7 ч.
В I квартале 2025 года количество масштабных IT-инцидентов в России выросло на четверть 8 ч.
R-Vision запускает линейку продуктов для цифровизации бизнеса 8 ч.