Сегодня 10 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

YouTube научится синхронизировать автоматический дубляж с губами спикера

YouTube тестирует технологию на базе искусственного интеллекта (ИИ), предназначенную для синхронизации движений губ спикеров при автоматическом переводе. Эта разработка дополняет существующую функцию автодублирования, которая уже использует ИИ для перевода аудиодорожки.

 Источник изображения: AI

Источник изображения: AI

По словам руководителя продукта по автодублированию Будхики Коттахаччи (Buddhika Kottahachchi), команде пришлось разработать инструменты, способные «модифицировать пиксели на экране так, чтобы они соответствовали переведённой речи». Для этого система анализирует не только форму губ, но и положение зубов, мимику, осанку и другие визуальные параметры. По сообщению PCMag, на текущем этапе тестирования технология показала наилучшие результаты в видео с разрешением Full HD. В 4K её эффективность ниже, однако качество может быть улучшено к моменту официального запуска.

Напомним, YouTube впервые продемонстрировал функцию на мероприятии в сентябре, но дата публичного релиза пока не объявлена. Первая версия инструмента поддерживает синхронизацию губ при переводе на английский, французский, немецкий, испанский и португальский языки. В дальнейшем планируется расширить охват на все языки, поддерживаемые системой автодублирования, включая бенгальский, голландский, иврит, хинди, индонезийский, итальянский, японский, корейский, малаялам (дравидийский язык), польский, панджаби, румынский, русский, тамильский, телугу, турецкий, украинский и вьетнамский. Стоимость использования функции не раскрывается.

В настоящее время функция находится на ранней стадии тестирования, и доступ к ней ограничен избранными пользователями платформы.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новая статья: Heroes of Might and Magic: Olden Era — время расцвета. Предварительный обзор 12 ч.
Anthropic отучила свой ИИ шантажировать пользователей при угрозе отключения 17 ч.
Microsoft улучшила работу Windows 11 с тачпадом и сенсорной клавиатурой, а также повысила стабильность «Проводника» 19 ч.
Пользователей Instagram лишили сквозного шифрования в личных сообщениях 19 ч.
ИИ всё чаще пишет научные статьи — отличить от человеческих становится невозможно, и это пугает 22 ч.
ИИ-модель OpenAI GPT-5.5 оказалась в 1,5–2 раза дороже предшественницы 22 ч.
В ЕС назвали VPN лазейкой для обмана систем проверки возраста — и её хотят закрыть 24 ч.
Департамент DOGE Илона Маска использовал ChatGPT глупым и незаконным способом 24 ч.
С опозданием на месяц OpenAI ответила на Claude Mythos — вышла модель GPT-5.5-Cyber, которая не боится обсуждать кибератаки и эксплойты 09-05 10:14
Новая статья: Saros — исправление ошибок, которых не было. Рецензия 09-05 00:02
Samsung расширила группу по созданию человекоподобных роботов и ускорила ИИ-трансформацию 49 мин.
Nvidia в этом году потратила на покупку активов других компаний более $40 млрд 4 ч.
Запрещённые к ввозу в США дроны и маршрутизаторы смогут получать обновления безопасности до января 2029 года 11 ч.
Под руководством Лип-Бу Тана компания Intel так и не избавилась от основных проблем 11 ч.
Война на Ближнем Востоке усугубила дефицит строительных материалов и компонентов для ЦОД 13 ч.
Учёные предложили квантовый процессор с подвижными кубитами — он прост в производстве и гибок в работе 14 ч.
В США расследуют аварии с участием роботакси Avride, ранее входившей в «Яндекс» 19 ч.
Жители США бунтуют против дата-центров — запреты множатся по всей стране 19 ч.
Sony призналась, что ещё не решила, когда и по какой цене выпустит PlayStation 6 22 ч.
Lian Li выпустила СЖО с 6,67-дюймовым изогнутым дисплеем — HydroShift II OLED Curved 360 AIO 22 ч.