Сегодня 12 марта 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Google представила VLOGGER — ИИ для реалистичного «оживления» фотографий

Исследователи Google разработали VLOGGER — новый ИИ, создающий реалистичные видеоролики с говорящими, двигающимися и жестикулирующими людьми по одной фотографии. Помимо фотографии, можно добавить аудиодорожку, из которой ИИ создаст короткое видео говорящего человека с соответствующей мимикой и жестикуляцией.

 Источник изображения: everypixel.com

Источник изображения: everypixel.com

«В отличие от прошлых работ, наша модель не требует отдельного обучения для каждой фотографии и работает не только с лицами, создавая полноценное изображение человека, а не только лица или губ, что открывает новые возможности, необходимые для правильного воссоздания общающихся людей», — прокомментировали разработку исследователи Google.

Разработка Google может найти применение в самых разных областях человеческой деятельности, одна из которых — создание трёхмерных фотореалистичных аватаров для игр и виртуальной реальности. Возможно, некоторые актёры пожелают оцифровать себя и продавать трёхмерные модели киностудиям. Одним из основных применений технологии Google видит создание реалистичных чат-ботов, с которыми можно общаться как с живыми людьми.

«VLOGGER можно использовать как решение для презентаций, обучающих программ, общения в сетях с низкой пропускной способностью, в качестве виртуального рассказчика или интерфейса для текстового общения человека с компьютером», — рассказали исследователи.

 Источник изображения: enriccorona.github.io

Источник изображения: enriccorona.github.io

Не менее очевидно и возможное применение технологии для создания дипфейков, растущая популярность которых беспокоит законодателей и специалистов по безопасности со всего мира.

«Предложенная нами модель превосходит другие современные разработки по качеству картинки, сохранению личности человека и временной согласованности», — отметили исследователи.

Сейчас у VLOGGER есть объективные недостатки: видео получаются довольно короткими, фон статичен, люди не перемещаются в пространстве, их мимика и речь хоть и довольно реалистичны, но всё равно выдают работу ИИ. Тем не менее, нельзя не отметить заметный скачок в технологии анимации изображений.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Google инвестировала в одного из главных конкурентов OpenAI больше, чем считалось ранее 8 мин.
Naughty Dog вынесла урок из скандалов вокруг The Last of Us Part II — новые подробности Intergalactic: The Heretic Prophet 43 мин.
Google выпустила Gemma 3 — самую мощную модель ИИ для запуска на одной видеокарте 50 мин.
Apple выпустит концерт Metallica с погружением для Vision Pro с «беспрецедентным доступом» к музыкантам 2 ч.
Психогеографическая RPG Hopetown получила тизер-трейлер с озвучкой от рассказчика Disco Elysium и готовится к выходу на Kickstarter 2 ч.
Microsoft скоро начнёт насаждать рекламу прямо в переписке с ИИ-ботом Copilot 2 ч.
Обновление Basis Dynamix Enterprise 4.2: расширение возможностей управления СХД и более 60 новых функций 3 ч.
Мультиплеерный экшен про боевых роботов Steel Hunters от создателей World of Tanks скоро ворвётся в ранний доступ Steam — дата выхода и новый трейлер 3 ч.
OpenAI создала ИИ-модель, которая мастерски пишет художественные тексты 8 ч.
Бывшие разработчики Gothic и Elex анонсировали Rootbound — завязанный на физике экшен с разумным рюкзаком 14 ч.
Google стала ещё на шаг ближе к выпуску смарт-очки после долгого перерыва 10 мин.
G.Skill представила самую быструю память DDR5 для AMD Ryzen — низкие задержки, до 8000 МТ/с и до 192 Гбайт 29 мин.
Китайская Changan начнёт тестировать твердотельные аккумуляторы с запасом хода до 1500 км уже в этом году 37 мин.
WD представила портативные жёсткие диски на 26 Тбайт и хранилища до 208 Тбайт за $8300 41 мин.
Российскую розницу завалило поддельными наушниками Apple и других известных брендов 51 мин.
Конкуренты SpaceX завалили Федеральную комиссию связи США жалобами на монополию Starlink 59 мин.
Mini-ITX-плата Sapphire Edge+ VPR-5050 содержит чип AMD Ryzen V2748 и FPGA Versal 2 ч.
Мировые продажи смарт-часов упали впервые в истории: у Apple продажи рухнули, а у Xiaomi — взлетели 2 ч.
Nissan сменит генерального директора после провала сделки с Honda 2 ч.
MSI представила компактную GeForce RTX 5070 Shadow 2X всего с двумя вентиляторами 3 ч.