Сегодня 21 мая 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Meta✴ представила ИИ-модель Voicebox, которая генерирует и редактирует устную речь

Инженеры Meta рассказали о нейросетевой модели Voicebox, которая обладает широкими возможностями по работе с устной речью: генерация, редактирование или стилизация по образцу. Авторы проекта охарактеризовали её как прорыв в моделях речевого ИИ.

 Источник изображения: ***

Источник изображения: Meta

Voicebox озвучивает заданный текст с высоким качеством или производит обработку уже готовой записи голоса, например, удаляет из него посторонние звуки вроде автомобильных гудков и собачьего лая, сохраняя содержание и стилистику речи. При необходимости можно даже «переиграть» фрагмент записи, точечно исправив, например, неправильно произнесённое слово. Поддерживаются шесть языков: английский, французский, немецкий, испанский, польский и португальский. Voicebox может использоваться в качестве синхронного переводчика, передавая голос и манеру речи собеседника.

Модель была обучена на 50 часах аудиокниг, и этого ей хватило, чтобы овладеть навыками устной речи в полной мере: она составляет профиль голоса и манеры речи на основе образца продолжительностью всего две секунды, после чего может воспроизвести её с любым текстом. На практике эти возможности могут оказаться полезными в приложениях метавселенной, обеспечив естественное звучание голосов для виртуальных помощников и неигровых персонажей; или для слабовидящих людей — модель может озвучивать письма голосами их авторов.

Meta часто делает свои ИИ-модели общедоступными, но не на сей раз. В компании не раскрыли, на каких материалах производилось обучение Voicebox, и не предложили испытать технологию на практике — опасаются злоупотреблений.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Журналисты показали 50 минут геймплея дополнения Lies of P: Overture — зоопарк врагов, новые режимы и уровни сложности 48 мин.
Криптобиржа Coinbase признала утечку персональных данных не менее 69 000 клиентов 2 ч.
Google показала режим рабочего стола для Android 16 — создавать его помогала Samsung 2 ч.
«Бросаю деньги в монитор, ничего не происходит»: ремейк «Готики» добавил в список желаемого Steam уже миллион «Безымянных героев», а даты выхода всё нет 3 ч.
Биткоин установил исторический рекорд, поднявшись выше $109 500 3 ч.
Metaphor: ReFantazio и The Division 2 возглавили вторую волну майских новинок Game Pass, а Remnant 2 скоро подписку покинет 4 ч.
Сергей Брин признал, что допустил много ошибок при создании умных очков Google Glass 4 ч.
Microsoft обвинила Apple в саботаже запуска магазина Xbox на iPhone 4 ч.
Windows 11 получит функцию Cross Device Resume для бесшовного переключения между устройствами 5 ч.
Senua's Saga: Hellblade II выйдет на PS5 с новыми функциями и оптимизацией под PS5 Pro — первые кадры и подробности 5 ч.
В Москве и области начнут следить за иностранцами через смартфоны 17 мин.
Первые независимые обзоры GeForce RTX 5060 — карта морально устарела сразу после выхода 20 мин.
Учёные поищут лучшие лекарства в космических кристаллах — в этом им поможет реинкарнация «Шаттла» от Sierra Space 60 мин.
Thermaltake представила СЖО MINECUBE 360 Ultra ARGB с четырьмя экранами и другие новинки 2 ч.
Представлен геймерский смартфон Infinix GT 30 Pro с Dimensity 8350 Ultimate и ёмкостными GT-триггерами 2 ч.
Maxun показала концепт компактной СЖО для внешних видеокарт с большим экраном 4 ч.
Многие украденные по всему миру iPhone в итоге оказываются в одном здании в Китае 4 ч.
Gigabyte показала Radeon RX 9060 XT Gaming OC и другие свежие видеокарты 4 ч.
ASRock представила видеокарты Radeon RX 9060 XT, Radeon AI Pro R9700 и Intel Arc Pro B60 5 ч.
Seasonic показала 3200-Вт блок питания, умный кабель для видеокарты с защитой от оплавления и другие новинки 5 ч.