Сегодня 13 мая 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Google представила мощную нейросеть Lumiere для генерации реалистичных видео

Google представила Lumiere«модель пространственно-временной диффузии для реалистичной генерации видео», основанную на искусственном интеллекте. Как показала практика, это, возможно, самый мощный на сегодняшний день ИИ-генератор видео, создающий динамические изображения по текстовому описанию.

 Источник изображения: lumiere-video.github.io

Источник изображения: lumiere-video.github.io

Важнейшим отличием Google Lumiere от существующих аналогов является уникальная архитектура модели — видео по всей его продолжительности генерируется за один проход. Другие модели работают по иному принципу: они генерируют несколько ключевых кадров, а затем производят интерполяцию по времени, что затрудняет согласованность генерируемого ролика. Lumiere работает в нескольких режимах, например, производит преобразование текста в видео, конвертирует статические изображения в динамические, создаёт видеоролики в заданном стиле на основе образца, позволяет редактировать существующее видео по письменным подсказкам, анимирует определённые области статического изображения или редактирует видео фрагментарно — например, может изменить предмет гардероба на человеке.

«Мы обучаем нашу модель T2V [преобразования текста в видео] на наборе данных, включающем 30 млн видеороликов с текстовыми описаниями. Видео имеют длину 80 кадров с частотой 16 кадров в секунду. Базовая модель обучена на разрешении 128 × 128 пикселей», — пояснили в Google. На выходе получаются 5-секундные ролики с разрешением 1024 × 1024 пикселей.

Google Lumiere — конечно, не первый ИИ-генератор видео. Сама Google ранее демонстрировала модель Imagen Video, которая генерировала ролики разрешением 1280 × 768 точек с частотой 24 кадра в секунду, но её творения были намного более скромными. Меньшим реализмом отличались результаты таких проектов как Meta Make-A-Video, Runway Gen2 и Stable Video Diffusion. В Google понимают угрозу, которую могут представлять подобные проекты: «Основная наша цель в этой работе — дать начинающим пользователям возможность генерировать визуальный контент гибко и творчески. Однако существует риск неправомерного [создания] подделок или вредоносного контента при помощи нашей технологии, и мы считаем, что крайне важно разрабатывать и применять инструменты выявления случаев предвзятости и злонамеренного использования, чтобы обеспечить безопасную и добросовестную работу [модели]».

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
iPhone научатся дольше работать от батареи — Apple поручит ИИ управление питанием 3 ч.
Sony случайно «слила» трейлер с датой выхода Stellar Blade на ПК 4 ч.
Microsoft показала, каким мог бы быть новый «Пуск» в Windows 11 — компания выбрала самый скучный вариант 7 ч.
«Давайте нам деньги и вычислительные ресурсы и не путайтесь под ногами»: OpenAI и Microsoft пытаются договориться о продолжении сотрудничества на фоне роста амбиций стартапа 7 ч.
Календарь релизов — 12–18 мая: Doom: The Dark Ages, The Precinct и Preserve 7 ч.
Remedy анонсировала закрытое тестирование шутера FBC: Firebreak по мотивам Control — сроки, системные требования, доступный контент 7 ч.
Nvidia выпустила драйвер GeForce с поддержкой Doom: The Dark Ages 9 ч.
Вышла новая версия песочницы Kaspersky Research Sandbox 3.0 с расширенными возможностями для ИБ-специалистов 9 ч.
«Игра, которую невозможно создать в наше время»: издатель «Приключений капитана Блада» призвал не судить воскресший экшен по современным меркам 10 ч.
Смартфоны Honor 400 смогут анимировать фото с помощью ИИ-генератора от Google 10 ч.
Samsung представила сверхтонкий смартфон Galaxy S25 Edge за €1249: двойная камера, Snapdragon 8 Elite и батарея на 3900 мА·ч 24 мин.
Новая статья: Обзор робота-пылесоса Midea VCR S10 Plus: одноразовые мешки для сбора мусора, прощайте! 4 ч.
Google и Elementl реализуют в США три 600-МВт атомных проекта 6 ч.
Western Digital инвестирует в технологию вечного хранения данных на керамике Cerabyte 7 ч.
Оперативная память скоро подорожает: Samsung подняла контрактные цены на DRAM 9 ч.
Космический телескоп «Джеймс Уэбб» показал полярное сияние на Юпитере — в сотни раз ярче, чем на Земле 9 ч.
CoreWeave всего через несколько недель после IPO захотела взять в долг ещё $1,5 млрд 10 ч.
Облако.ру предлагает ИИ-системы, которые позволят запускать даже мощные ИИ-модели 10 ч.
Apple поднимет цены на iPhone, но пока не придумала, чем это объяснить 11 ч.
Акции техногигантов подскочили после приостановки тарифов между США и Китаем 11 ч.