Сегодня 27 июля 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → синтез речи

Spotify будет дублировать подкасты на иностранные языки голосами самих авторов с помощью ИИ

Сотрудничество Spotify с OpenAI позволит подкастерам синтезировать собственный голос для автоматического создания версий своих шоу на иностранных языках. Это основная идея новой функции голосового перевода Spotify на базе ИИ, которая воспроизводит подкасты на других языках, используя синтезированный голос создателя. Теперь подкастеру достаточно просто «щёлкнуть выключателем» и мгновенно заговорить на другом языке.

 Источник изображения: unsplash.com

Источник изображения: unsplash.com

Компания уже заключила договоры с несколькими подкастерами о переводе созданных ими англоязычных эпизодов на испанский с помощью своего нового инструмента, и планирует в ближайшие недели выпустить переводы на французский и немецкий языки. Первыми будут переведены эпизоды подкастеров с такими громкими именами, как Дакс Шепард (Dax Shepard), Моника Пэдман (Monica Padman), Лекс Фридман (Lex Fridman), Билл Симмонс (Bill Simmons) и Стивен Бартлетт (Steven Bartlett). В дальнейшем Spotify планирует расширить эту группу, включив в неё The Rewatchables и предстоящее шоу Тревора Ноа (Trevor Noah).

Основой функции перевода является ИИ-инструмент синтезирования голоса OpenAI Whisper, который умеет как транскрибировать английскую речь, так и переводить на английский с других языков. Но инструмент Spotify выходит за рамки простого перевода речи в текст — эта функция переведёт подкаст на другой язык и воспроизведёт его в синтезированной версии голосом подкастера.

«Сопоставляя собственный голос создателя, Voice Translation даёт слушателям по всему миру возможность открывать для себя новых подкастеров и вдохновляться ими более аутентично, чем когда-либо прежде», — уверен Зиад Султан (Ziad Sultan), вице-президент Spotify по персонализации.

OpenAI сегодня утром объявила о запуске инструмента, который может создавать «человеческий звук из просто текста и нескольких секунд образца речи». Доступность нового инструмента будет существенно ограничена из-за опасений по поводу безопасности и конфиденциальности. Вероятно, это одна из причин, почему технология перевода Spotify пока тестируется только с «избранной группой» подкастеров, а компания не делает прогнозов о массовом внедрении новой функции.


window-new
Soft
Hard
Тренды 🔥
Минюст США обвинил TikTok в незаконном сборе информации о взглядах американцев и цензуре контента по указаниям из Пекина 39 мин.
Анонсы от авторов Mortal Kombat 1: сюжетное дополнение Khaos Reigns, подвох с Kombat Pack 2 и возвращение анималити 4 ч.
Криптовалюты вернулись к росту, но Ethereum всё равно подешевел по итогам недели 4 ч.
Теперь в TikTok можно находить песни, просто напевая их 4 ч.
Смартфоны Google Pixel 9 смогут добавлять пользователя на фото, где его изначально не было 5 ч.
Дешёвые сканеры штрихкодов помогли в кратчайшие сроки восстановить пострадавшие от CrowdStrike компьютеры 15 ч.
Новая статья: Flintlock: The Siege of Dawn — хорошие идеи в неудачной обёртке. Рецензия 15 ч.
Анонсирован китайский ролевой детектив Kill the Shadow, напоминающий смесь Disco Elysium и The Last Night 16 ч.
Соцсеть X начала без уведомления использовать данные пользователей для обучения Grok 18 ч.
Mirthwood получила новый трейлер и дату выхода — это ролевой симулятор жизни в фэнтезийном мире, вдохновлённый Fable, Stardew Valley и The Sims 18 ч.
Возвращение застрявших на МКС астронавтов с Boeing Starliner могут поручить SpaceX 35 мин.
Синий свет от экрана смартфона пагубно влияет на кожу, выяснили учёные 42 мин.
Infinix GT 20 Pro стал официальным смартфоном крупнейшего мирового чемпионата – PUBG Mobile World Cup 2 ч.
Определение планеты скоро снова могут поменять, но Плутон этот статус всё равно не вернёт 3 ч.
Colorful представила оперативную память iGame Jiachen Zhilong DDR5 в стиле китайского года дракона 3 ч.
«Уэбб» нашёл недалеко от Земли ещё один мир с потенциальным подповерхностным океаном — Ариэль, спутник Урана 4 ч.
Аргоннская национальная лаборатория намерена создать СХД ёмкостью 400 Пбайт за $20 млн 5 ч.
InfoWatch представила межсетевые экраны «ARMA Стена» с производительностью до 10 Гбит/с 5 ч.
Первый в истории частный выход в открытый космос отложили на конец августа 5 ч.
Thermal Grizzly вывела на рынок инновационные термопрокладки с эффектом фазового перехода 8 ч.