Сегодня 01 мая 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Microsoft показала нейросеть, которая делает говорящие что угодно дипфейки по одному фото

За последние пару лет генеративные нейросети преодолели важный этап развития, став более мощными и способными создавать по текстовому описанию не только изображения, но и видео. Новый алгоритм VASA-1 от Microsoft, вероятно, сумеет удивить многих, поскольку для его работы вообще не нужно описание. Достаточно предоставить одно изображение человека и аудиодорожку, на основе которых нейросеть сгенерирует видео говорящего человека с широким спектром эмоций и естественной мимикой.

 Источник изображения: Microsoft

Источник изображения: Microsoft

Результат работы VASA-1 выглядит очень естественно и правдоподобно. Всего из одного снимка лица и записи голоса алгоритм создаёт реалистичное видео, на котором запечатлённый на снимке человек буквально «оживает», а его мимика, движения губ и головы выглядят вполне натурально. Поскольку созданные с помощью VASA-1 видео с ходу сложно отличить от реальных, уже высказываются опасения по поводу того, что алгоритм может использоваться злоумышленниками для создания фейков.

Что касается самой нейросети, то главным её отличием от других подобных алгоритмов является наличие целостной модели генерации лицевой мимики и движений головы. Специалисты Microsoft провели обширную исследовательскую работу, включая оценку ряда новых метрик. В результате они установили, что новый алгоритм значительно превосходит представленные ранее аналоги по многим параметрам.

«Наш метод не только обеспечивает генерацию видео высокого качества с реалистичной мимикой лица и движениями головы, но также поддерживает функцию онлайн-генерации видео 512×512 точек с частотой 40 кадров в секунду с незначительной начальной задержкой. Это открывает путь к взаимодействию в реальном времени с реалистичными аватарами, имитирующими поведение человека во время разговора», — говорится в сообщении Microsoft.

Другими словами, нейросеть может создавать качественные фейковые видео на основе всего одного изображения. Поэтому не удивительно, что Microsoft называет VASA-1 «исследовательской демонстрацией» и не планирует выводить его на коммерческий рынок, по крайней мере, в ближайшее время.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Microsoft готова судиться с правительством США, если оно попытается лишить Европу продуктов компании 6 ч.
Google подтвердила, что близка к внедрению ИИ-модели Gemini в iPhone 7 ч.
YouTube начал размывать превью на видео для взрослых — пока в тестовом режиме 8 ч.
Бесплатный аддон Throes of the Watchmaker отправит игроков Sea of Stars спасать механический мир от проклятого карнавала — дата выхода и новый трейлер 8 ч.
Nvidia выпустила драйвер Game Ready 576.28 WHQL с исправлением ошибок прошлого и повышением стабильности в играх 9 ч.
Дело техники: «Википедия» поручит генеративному ИИ рутину, чтобы не испортить труд людей 9 ч.
Безжалостный российский боевик Kiborg вышел на ПК и консолях — первые игроки в восторге 9 ч.
Спустя 11 лет легендарная Flappy Bird вернулась на Android в качестве эксклюзива Epic Games Store 12 ч.
Nvidia придумала, как с помощью ИИ генерировать точные изображения без текстовых запросов — подойдёт он не всем 13 ч.
Карточный роглайк «Бессмертный. Сказки Старой Руси» от авторов «Войны Миров: Сибирь» получил крупное обновление и взял курс на Epic Games Store 13 ч.
Новая статья: Обзор видеокарты Palit GeForce RTX 5080 GamingPro OC 6 ч.
Google готовит мегаваттные стойки с питанием 400 В и СЖО для ИИ-платформ будущего 7 ч.
«Байкал электроникс» поставила в Россию 85 тыс. процессоров Baikal 7 ч.
Новая статья: Система жидкостного охлаждения DeepCool LE360 V2: удешевление без потерь? 7 ч.
Для термоядерного реактора ITER изготовлена крупнейшая и мощнейшая магнитная система в мире — она могла бы поднять авианосец 9 ч.
Western Digital отчиталась о росте продаж HDD, в том числе сверхъёмких и дорогих — всё благодаря ИИ и облакам 13 ч.
Российские вендоры предложили полностью запретить продажу иностранной электроники на госзакупках 13 ч.
Meta разрешила своим умным очкам постоянно «смотреть» и «слушать» — отказаться от этого непросто 13 ч.
«Выдающийся и чрезвычайно прибыльный год»: Logitech отчиталась о росте почти по всем направлениям 14 ч.
Supermicro недосчиталась порядка $1 млрд по итогам квартала — акции рухнули на 19 % 14 ч.