Сегодня 27 сентября 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Meta✴ представила ИИ-модель Voicebox, которая генерирует и редактирует устную речь

Инженеры Meta рассказали о нейросетевой модели Voicebox, которая обладает широкими возможностями по работе с устной речью: генерация, редактирование или стилизация по образцу. Авторы проекта охарактеризовали её как прорыв в моделях речевого ИИ.

 Источник изображения: ***

Источник изображения: Meta

Voicebox озвучивает заданный текст с высоким качеством или производит обработку уже готовой записи голоса, например, удаляет из него посторонние звуки вроде автомобильных гудков и собачьего лая, сохраняя содержание и стилистику речи. При необходимости можно даже «переиграть» фрагмент записи, точечно исправив, например, неправильно произнесённое слово. Поддерживаются шесть языков: английский, французский, немецкий, испанский, польский и португальский. Voicebox может использоваться в качестве синхронного переводчика, передавая голос и манеру речи собеседника.

Модель была обучена на 50 часах аудиокниг, и этого ей хватило, чтобы овладеть навыками устной речи в полной мере: она составляет профиль голоса и манеры речи на основе образца продолжительностью всего две секунды, после чего может воспроизвести её с любым текстом. На практике эти возможности могут оказаться полезными в приложениях метавселенной, обеспечив естественное звучание голосов для виртуальных помощников и неигровых персонажей; или для слабовидящих людей — модель может озвучивать письма голосами их авторов.

Meta часто делает свои ИИ-модели общедоступными, но не на сей раз. В компании не раскрыли, на каких материалах производилось обучение Voicebox, и не предложили испытать технологию на практике — опасаются злоупотреблений.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Konami показала 11 минут геймплея Metal Gear Solid Delta: Snake Eater в джунглях Советского Союза 52 мин.
Южная Корея ввела уголовную ответственность за просмотр, хранение и  распространение сексуальных дипфейков 2 ч.
Microsoft наконец устранила давнюю проблему единого входа в Windows 10 3 ч.
В «Яндекс Музыке» теперь можно смотреть видеоклипы без подписки 3 ч.
Meta хранила пароли европейцев в открытом виде — её оштрафовали на €91 млн 3 ч.
ИИ Google Gemini сделал умные ответы в Gmail ещё умнее 4 ч.
Продажи Black Myth: Wukong за первый месяц превысили 20 миллионов копий — Elden Ring к этой вершине стремилась год 5 ч.
Google пообещала не лишать россиян доступа к своим сервисам и решить проблемы с регистрацией аккаунтов 6 ч.
Blizzard взялась за новый шутер во вселенной StarCraft — на этот раз с бывшим продюсером Far Cry у руля 6 ч.
Valve позволит игрокам Deadlock превращать читеров в лягушек — как это выглядит 8 ч.
Миллионы автомобилей Kia можно взломать, просто отсканировав номерной знак 50 мин.
Lenovo готовит к выпуску портативные игровые приставки Legion Go 2 и Legion Go Lite 3 ч.
Blackstone вложит £10 млрд в строительство в Великобритании крупнейшего в Европе ИИ ЦОД 4 ч.
Cloudflare представила серверы 12-го поколения на базе AMD EPYC Genoa-X 4 ч.
Европа запустит 200-кг спутник, чтобы посмотреть, как он сгорит в атмосфере 4 ч.
«Мы, робот»: Tesla разослала приглашения на презентацию роботакси 10 октября 4 ч.
Deutsche Telekom и Meta устроили перепалку из-за оплаты трафика, но немецкий оператор отсудил у соцсети €20 млн 5 ч.
Xiaomi представила смартфон Redmi Note 14 5G и беспроводные наушники Redmi Buds 6 5 ч.
LG, Razer и MediaTek представили технологию Bluetooth Ultra-Low Latency с задержкой ввода в 1 мс 5 ч.
Марс может стать индикатором первичных чёрных дыр — он «вздрогнет» в момент её пролёта через Солнечную систему 6 ч.