Сегодня 29 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

YouTube научится синхронизировать автоматический дубляж с губами спикера

YouTube тестирует технологию на базе искусственного интеллекта (ИИ), предназначенную для синхронизации движений губ спикеров при автоматическом переводе. Эта разработка дополняет существующую функцию автодублирования, которая уже использует ИИ для перевода аудиодорожки.

 Источник изображения: AI

Источник изображения: AI

По словам руководителя продукта по автодублированию Будхики Коттахаччи (Buddhika Kottahachchi), команде пришлось разработать инструменты, способные «модифицировать пиксели на экране так, чтобы они соответствовали переведённой речи». Для этого система анализирует не только форму губ, но и положение зубов, мимику, осанку и другие визуальные параметры. По сообщению PCMag, на текущем этапе тестирования технология показала наилучшие результаты в видео с разрешением Full HD. В 4K её эффективность ниже, однако качество может быть улучшено к моменту официального запуска.

Напомним, YouTube впервые продемонстрировал функцию на мероприятии в сентябре, но дата публичного релиза пока не объявлена. Первая версия инструмента поддерживает синхронизацию губ при переводе на английский, французский, немецкий, испанский и португальский языки. В дальнейшем планируется расширить охват на все языки, поддерживаемые системой автодублирования, включая бенгальский, голландский, иврит, хинди, индонезийский, итальянский, японский, корейский, малаялам (дравидийский язык), польский, панджаби, румынский, русский, тамильский, телугу, турецкий, украинский и вьетнамский. Стоимость использования функции не раскрывается.

В настоящее время функция находится на ранней стадии тестирования, и доступ к ней ограничен избранными пользователями платформы.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Ролевая игра The Witch's Bakery подружит геймеров с общительной ведьмой-пекарем из Парижа — релиз намечен на август 52 мин.
Дополнение «Баллады прошлого» к The Witcher 3 станет «прологом» к будущему «Ведьмака» 2 ч.
Кроссовер с Clair Obscur, онлайн-кооператив и элементы 3D: инсайдеры поделились новыми подробностями ремейка Rayman Legends 3 ч.
Стартап Shift предложил бесплатную уборку домов ради обучения роботов 4 ч.
Project Lightwell: IBM и Red Hat предложили корпорациям скинуться на патчи безопасности для open source ПО и сами вложат $5 млрд 4 ч.
Фирма случайно спустила $500 млн на Anthropic Claude всего за месяц 4 ч.
В «Google Фото» появятся новые средства управления «Воспоминаниями» 6 ч.
Meta рассматривает выход на рынок облачных услуг 7 ч.
Ролевой экшен Grim Dawn спустя 10 лет после релиза получит самое масштабное дополнение Fangs of Asterkarn — дата релиза уже известна 7 ч.
Улучшение посадки семян, эксклюзивные анимации для питомцев и перенастройка управления: для Crimson Desert вышел патч 1.09.00 7 ч.
Acer представила «доступный всем» игровой ноутбук Nitro 16 с Ryzen 9 9955HX3D и GeForce RTX 5070 Ti 2 мин.
Acer представила флагманский игровой ноутбук Predator Helios 18 с чипами Core Ultra 9 290HX и RTX 5090 18 мин.
Работа МКС будет продлена до 2030 года, даже если Россия уйдёт со станции 21 мин.
TSMC: чистая производительность чипов больше не главное — приоритетом стала энергоэффективность 2 ч.
MSI представила первый в мире игровой монитор с QD-OLED и тремя режимами — 4K@360 Гц, 2K@520 Гц и FHD@680 Гц 2 ч.
«Воронья слободка»: Joby, Archer и Vertical погрязли в судебных войнах и поставили под удар массовый запуск аэротакси 2 ч.
G.Skill показала модули DDR5-9200 без экстремального напряжения и перегрева 3 ч.
BYD спроектировала первый в Китае 4-нм чип для систем автопилота 3 ч.
Lenovo пережила лучший месяц за 27 лет — её стоимость взлетела вдвое 3 ч.
Союзные ЦОДы: российские дата-центры пригласили в Беларусь 4 ч.