Сегодня 09 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

YouTube научится синхронизировать автоматический дубляж с губами спикера

YouTube тестирует технологию на базе искусственного интеллекта (ИИ), предназначенную для синхронизации движений губ спикеров при автоматическом переводе. Эта разработка дополняет существующую функцию автодублирования, которая уже использует ИИ для перевода аудиодорожки.

 Источник изображения: AI

Источник изображения: AI

По словам руководителя продукта по автодублированию Будхики Коттахаччи (Buddhika Kottahachchi), команде пришлось разработать инструменты, способные «модифицировать пиксели на экране так, чтобы они соответствовали переведённой речи». Для этого система анализирует не только форму губ, но и положение зубов, мимику, осанку и другие визуальные параметры. По сообщению PCMag, на текущем этапе тестирования технология показала наилучшие результаты в видео с разрешением Full HD. В 4K её эффективность ниже, однако качество может быть улучшено к моменту официального запуска.

Напомним, YouTube впервые продемонстрировал функцию на мероприятии в сентябре, но дата публичного релиза пока не объявлена. Первая версия инструмента поддерживает синхронизацию губ при переводе на английский, французский, немецкий, испанский и португальский языки. В дальнейшем планируется расширить охват на все языки, поддерживаемые системой автодублирования, включая бенгальский, голландский, иврит, хинди, индонезийский, итальянский, японский, корейский, малаялам (дравидийский язык), польский, панджаби, румынский, русский, тамильский, телугу, турецкий, украинский и вьетнамский. Стоимость использования функции не раскрывается.

В настоящее время функция находится на ранней стадии тестирования, и доступ к ней ограничен избранными пользователями платформы.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новая статья: Saros — исправление ошибок, которых не было. Рецензия 9 ч.
«Мощный инструмент, но не замена художников и творцов»: руководство Sony прояснило использование генеративного ИИ в играх PlayStation 10 ч.
Роскомнадзор заявил, что не ограничивал доступ к GitHub 13 ч.
Шпионский боевик 007 First Light от создателей Hitman получил системные требования для игры в 4K, а трассировку пути придётся подождать 14 ч.
ИИ теперь пишет 60 % нового кода Airbnb — и сам решает 40 % запросов в техподдержку 15 ч.
Google начала тестировать ИИ-агента Remy — конкурента OpenClaw 16 ч.
Россияне массово жалуются на блокировки аккаунтов в Anthropic Claude — потеряны проекты и переписки с ИИ 16 ч.
Амбициозный хоррор Paranormal Activity: Threshold от создателя The Mortuary Assistant отменён из-за конфликта с Paramount Pictures 16 ч.
Архивировать интернет становится всё сложнее: Wayback Machine и Wikimedia страдают от дефицита HDD 16 ч.
«Золотой глобус» не будет дисквалифицировать номинантов из-за ИИ, но излишеств не допустит 18 ч.
TSMC отправит устаревшее оборудование для выпуска 28-нм чипов с Тайваня в Германию 52 мин.
В прошлом квартале AMD впервые выручила в сегменте ЦОД больше Intel 2 ч.
Грузовики Tesla Semi получили батареи меньшей ёмкости, чем планировалось, но на запасе хода это не сказалось 3 ч.
Акции Intel подскочили в цене на 14 % после появления информации о сделке с Apple 4 ч.
Intel снова будет производить чипы для Apple, но не как раньше — WSJ узнала о предварительном соглашении 10 ч.
Logitech нарастит инвестиции в игровые продукты, ИИ и корпоративный сегмент 12 ч.
Пентагон рассекретил первую партию файлов об НЛО — впечатлить скептиков не удалось 13 ч.
У заднеприводных Cybertruck могут отвалиться колёса — Tesla отзывает все 173 проданных электромобиля 15 ч.
iFixit объявила «короля ремонтопригодности» среди наушников — у AirPods Max 2 всего 4 балла из 10 15 ч.
Asus выпустила 12,3" портативный сенсорный монитор ROG Strix XG129C и 34" геймерский ROG Strix OLED XG34WCDMS 15 ч.