Сегодня 28 февраля 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Spotify будет дублировать подкасты на иностранные языки голосами самих авторов с помощью ИИ

Сотрудничество Spotify с OpenAI позволит подкастерам синтезировать собственный голос для автоматического создания версий своих шоу на иностранных языках. Это основная идея новой функции голосового перевода Spotify на базе ИИ, которая воспроизводит подкасты на других языках, используя синтезированный голос создателя. Теперь подкастеру достаточно просто «щёлкнуть выключателем» и мгновенно заговорить на другом языке.

 Источник изображения: unsplash.com

Источник изображения: unsplash.com

Компания уже заключила договоры с несколькими подкастерами о переводе созданных ими англоязычных эпизодов на испанский с помощью своего нового инструмента, и планирует в ближайшие недели выпустить переводы на французский и немецкий языки. Первыми будут переведены эпизоды подкастеров с такими громкими именами, как Дакс Шепард (Dax Shepard), Моника Пэдман (Monica Padman), Лекс Фридман (Lex Fridman), Билл Симмонс (Bill Simmons) и Стивен Бартлетт (Steven Bartlett). В дальнейшем Spotify планирует расширить эту группу, включив в неё The Rewatchables и предстоящее шоу Тревора Ноа (Trevor Noah).

Основой функции перевода является ИИ-инструмент синтезирования голоса OpenAI Whisper, который умеет как транскрибировать английскую речь, так и переводить на английский с других языков. Но инструмент Spotify выходит за рамки простого перевода речи в текст — эта функция переведёт подкаст на другой язык и воспроизведёт его в синтезированной версии голосом подкастера.

«Сопоставляя собственный голос создателя, Voice Translation даёт слушателям по всему миру возможность открывать для себя новых подкастеров и вдохновляться ими более аутентично, чем когда-либо прежде», — уверен Зиад Султан (Ziad Sultan), вице-президент Spotify по персонализации.

OpenAI сегодня утром объявила о запуске инструмента, который может создавать «человеческий звук из просто текста и нескольких секунд образца речи». Доступность нового инструмента будет существенно ограничена из-за опасений по поводу безопасности и конфиденциальности. Вероятно, это одна из причин, почему технология перевода Spotify пока тестируется только с «избранной группой» подкастеров, а компания не делает прогнозов о массовом внедрении новой функции.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новая Alone in the Dark получила «безумный» трейлер и системные требования — напугать они не смогут 32 мин.
Sony подтвердила линейку игр PS Plus на март 2024 года — в неё вошло четыре проекта 2 ч.
В ответ на обвинения в воровстве контента OpenAI обвинила New York Times во взломе ChatGPT 2 ч.
Хакеры заполучили почти 200 Гбайт внутренних данных Epic Games, но это не точно 3 ч.
Легендарный разработчик Call of Duty открыл студию BulletFarm для создания олдскульного кооперативного AAA-шутера 4 ч.
Игрок прошёл The Elder Scrolls V: Skyrim на 100 % без читов и модов — его персонаж достиг 1337-го уровня, но не стал неуязвимым 4 ч.
Биткоин вырос до $60 000, аналитики прогнозируют новые рекорды 6 ч.
Telegram начнёт платить владельцам каналов за показ рекламы 6 ч.
Слухи: студия-разработчик Star Citizen замаскировала массовые сокращения под релокацию сотрудников 7 ч.
Гоночный симулятор F1 24 поступит в продажу 31 мая — и вновь ни слова по-русски, но с поддержкой VR и обновлённым сюжетным режимом 8 ч.
«Джеймс Уэбб» впервые обнаружил в ранней Вселенной быстрорастущую сверхмассивную чёрную дыру 3 мин.
На МКС обнаружили утечку воздуха — «Роскосмос» заявил, что угрозы экипажу нет 16 мин.
Самый быстрый в мире FPV-дрон сможет стримить Формулу-1 — он летает со скоростью 350 км/ч 3 ч.
Tecno представила ноутбук Megabook T16 Pro 2024 Ultra на базе Intel Core Ultra с автономностью 22 часа 3 ч.
AWS откроет в Мексике свой первый облачный регион и вложит $5 млрд в развитие ЦОД 4 ч.
ZTE представила 200-долларовый камерофон Nubia Focus 5G Pro с 108-Мп камерой 5 ч.
Вьетнам стал вторым крупнейшим экспортёром смартфонов после Китая, а доля Индии почти не растёт 5 ч.
ZTE анонсировала 200-долларовый игровой смартфон Nubia Neo 2 5G 5 ч.
Американский суд оправдал китайскую Fujian Jinhua по делу о краже секретов у Micron 6 ч.
В 2023 году корпоративные клиенты на 70 % увеличили закупки компьютеров российской сборки 6 ч.