Сегодня 30 января 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Alibaba представила нейросеть EMO — она оживляет портреты, заставляя их разговаривать и даже петь

Исследователи из Института интеллектуальных вычислений Alibaba разработали (PDF) систему искусственного интеллекта EMO (Emote Portrait Alive), которая анимирует статическое изображение человека, заставляя его реалистично говорить или петь.

 Источник изображения: youtube.com/@ai_beauty303

Источник изображения: youtube.com/@ai_beauty303

Система изображает реалистичную мимику и движения головы, точно соответствующие эмоциональным оттенкам звукового ряда, на основе которого генерируется анимация. «Традиционные методы зачастую неспособны передать полный спектр человеческих выражений лица и уникальность отдельных его стилей. Для решения этих проблемы мы предлагаем EMO — новый фреймворк, использующий подход прямого синтеза из аудио в видео, минуя потребность в промежуточных 3D-моделях или лицевых опорных точках», — пояснил глава группы разработчиков Линьжуй Тянь (Linrui Tian).

В основе системы EMO лежит диффузионная модель ИИ, зарекомендовавшая себя как способная генерировать реалистичные изображения. Исследователи обучили её на массиве данных, включающем более 250 часов видеозаписей «говорящей головы»: выступлений, фрагментов фильмов, телешоу и вокальных выступлений. В отличие от предыдущих методов, предполагающих создание трёхмерной модели или механизмов имитации человеческой мимики, EMO предполагает прямое преобразование звука в видеоряд. Это позволяет системе передавать мельчайшие движения и связанные с естественной речью особенности личности.

Авторы проекта утверждают, что EMO превосходит существующие методы по показателям качества видео, сохранения идентичности и выразительности. Исследователи опросили фокус-группу, и та показала, что созданные EMO видеоролики более естественны и эмоциональны, чем произведения других систем. Система создаёт анимацию не только на основе речи, но и с использованием звукового ряда с вокалом — она учитывает форму рта человека на оригинальном изображении, добавляет соответствующую мимику и синхронизирует движения с вокальной партией. Единственной связанной с EMO проблемой является вероятность злоупотребления этой технологией. Исследователи сообщают, что планируют изучить методы выявления созданных ИИ видеороликов.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Нацелены выпустить выдающуюся игру»: ведущий разработчик Beyond Good and Evil 2 подтвердил статус долгостроя после чистки в Ubisoft 23 мин.
ИИ схлестнулся с людьми в битве на креативность — результаты неоднозначны 3 ч.
Nvidia обновила драйвер для устаревших видеокарт Maxwell, Pascal и Volta — только патчи и никаких игровых оптимизаций 4 ч.
В США расследуют, имели ли сотрудники Meta доступ к «секретным» чатам WhatsApp 4 ч.
ChatGPT скоро лишится устаревших моделей GPT-4o, GPT-4.1, GPT-4.1 mini и o4-mini 4 ч.
«Игра явно не готова к выходу»: ролевой аниме-боевик Code Vein 2 стартовал в Steam с рейтингом 52 % 5 ч.
Спустя 13 лет классическая Final Fantasy VII в Steam получит новую версию — когда и зачем, Square Enix не сказала 5 ч.
Microsoft попытается вернуть доверие к Windows 11, подорванное багами, замедлением и насаждением Edge, Bing, OneDrive и Copilot 5 ч.
Китайский ролевой боевик Genigods: Nezha отправит сражаться с богами и спасать мир от пространственно-временного коллапса — геймплейный трейлер 6 ч.
Google открыла широкий доступ к Genie — ИИ-генератору игровых миров 6 ч.
Прибыль Sandisk взлетела в восемь раз после отделения от Western Digital — ИИ стал главным драйвером 53 мин.
Россиян предупредили, что смартфоны подорожают на 10–30 % уже весной 2 ч.
Батареи с БАКом: дома французов начали обогревать теплом от Большого адронного коллайдера 3 ч.
Дефицит диктует приоритеты: Apple сосредоточится на самых дорогих iPhone в этом году 4 ч.
Биоинженеры впервые встроили квантовый механизм в природный белок 4 ч.
В России стартовали продажи смартфонов Oppo Reno 15 и Reno15 F с 50-Мп фронтальными камерами и ёмкими батареями 5 ч.
Выручка Western Digital подскочила на четверть — 9 из 10 жестких дисков теперь идут в серверы 5 ч.
Астрономы нашли похожую на Землю планету-снежок 6 ч.
Нужно больше финансирования: OpenAI наметила выход на IPO на четвёртый квартал 2026 года 6 ч.
Спасите наши SSD: VAST Data запустила программу VAST Amplify для повышения эффективности использования имеющихся SSD 7 ч.