Сегодня 29 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Meta✴ представила ИИ-модель Voicebox, которая генерирует и редактирует устную речь

Инженеры Meta рассказали о нейросетевой модели Voicebox, которая обладает широкими возможностями по работе с устной речью: генерация, редактирование или стилизация по образцу. Авторы проекта охарактеризовали её как прорыв в моделях речевого ИИ.

 Источник изображения: ***

Источник изображения: Meta

Voicebox озвучивает заданный текст с высоким качеством или производит обработку уже готовой записи голоса, например, удаляет из него посторонние звуки вроде автомобильных гудков и собачьего лая, сохраняя содержание и стилистику речи. При необходимости можно даже «переиграть» фрагмент записи, точечно исправив, например, неправильно произнесённое слово. Поддерживаются шесть языков: английский, французский, немецкий, испанский, польский и португальский. Voicebox может использоваться в качестве синхронного переводчика, передавая голос и манеру речи собеседника.

Модель была обучена на 50 часах аудиокниг, и этого ей хватило, чтобы овладеть навыками устной речи в полной мере: она составляет профиль голоса и манеры речи на основе образца продолжительностью всего две секунды, после чего может воспроизвести её с любым текстом. На практике эти возможности могут оказаться полезными в приложениях метавселенной, обеспечив естественное звучание голосов для виртуальных помощников и неигровых персонажей; или для слабовидящих людей — модель может озвучивать письма голосами их авторов.

Meta часто делает свои ИИ-модели общедоступными, но не на сей раз. В компании не раскрыли, на каких материалах производилось обучение Voicebox, и не предложили испытать технологию на практике — опасаются злоупотреблений.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Indiana Jones and the Great Circle впервые возглавила недельный чарт продаж в США, но лишь благодаря релизу на PS5 3 мин.
В Москве создадут «госозеро» обезличенных персональных данных для обучения ИИ 16 мин.
В финансовом отчёте Nacon нашли указание на новый перенос Terminator: Survivors — симулятор выживания по «Терминатору» задержится до 2026 года 54 мин.
ChatGPT стал «слишком льстивым и раздражающим», признал Сэм Альтман 2 ч.
Зелёная сова против людей: Duolingo начала увольнять сотрудников, которых может заменить ИИ 2 ч.
Последний шанс обновить смартфон LG: cерверы прекратят работу 30 июня 2 ч.
Суд продлил конкурсное производство в российском ООО «Гугл» до октября 3 ч.
Devolver анонсировала Mycopunk — кооперативный шутер про грибное нашествие планетарного масштаба 3 ч.
Каждый пятый россиянин предпочитает общаться с ИИ вместо людей 4 ч.
Alibaba представила семейство ИИ-моделей Qwen3, которые быстрее и эффективнее DeepSeek 8 ч.
Viettel начала строительство своего крупнейшего кампуса ЦОД в Хошимине 27 мин.
«Яндекс» собрался выпускать человекоподобных роботов, но потом 2 ч.
GreenSquareDC и Green Critical Minerals создадут графитовые радиаторы нового типа 2 ч.
Кредиторы Илона Маска только сейчас перепродали долг на $13 млрд, выданный на покупку Twitter 2 ч.
Учёные набили тату живым тихоходкам с помощью литографа — это шаг к настоящему чипированию людей и не только 3 ч.
Китай стал вторым по величине рынком полупроводниковых материалов, сместив Южную Корею 4 ч.
«Подмаслить» ИИ: ЦОД AI Green Bytes задействует погружные СЖО и жидкость Oleon Qloe растительного происхождения 4 ч.
Sony готовится отделить и вывести на биржу свой полупроводниковый бизнес 5 ч.
Frontier Power и Ethos Green Energy построят ЦОД в Великобритании на 5 ГВт — с энергохранилищами и возобновляемой энергией 5 ч.
Arm подвела итоги 40-летия, объявив о поставке 250 млрд чипов 7 ч.