Сегодня 19 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI представила ИИ Voice Engine, который клонирует ваш голос по 15-секундному образцу

OpenAI представила результаты предварительного тестирования ИИ-модели Voice Engine, которая на основе 15-секундного образца может реалистично озвучить введённый текст, стараясь максимально точно передать голос и речевые особенности говорящего.

 Источник изображения: Unsplash, Igor Omilaev

Источник изображения: Unsplash, Igor Omilaev

Первые наработки Voice Engine появились в конце 2022 года и использовались в API для преобразования текста в речь, а также совместно с ChatGPT Voice and Read Aloud. В OpenAI осознают последствия возможного злоупотребления технологией синтезированных голосов, поэтому надеется получить отклик от общества по возможным опасностям и сферам применения. Что касается последних, с прошлого года OpenAI предложила протестировать Voice Engine небольшой группе партнёров — и получила примеры использования:

  • Помощь имеющим проблемы с чтением людям и детям посредством естественных, эмоциональных и разнообразных голосов. Так, специализирующаяся на образовательных технологиях компания Age of Learning использует Voice Engine для озвучки контента, а также, совместно с GPT-4, персонализированных ответов учащимся в реальном времени.
  • Перевод контента, например, видеороликов и подкастов, позволит авторам и компаниям расширить аудиторию по всему миру, сообщая информацию собственными голосами и голосами сотрудников. Одним из первопроходцев стала компания HeyGen — ИИ-платформа визуального повествования для корпоративных клиентов, предназначенная для создания человекоподобных аватаров в различных целях — от продуктового маркетинга до торговых предложений. Voice Engine сохраняет родной акцент диктора, поэтому при озвучении английского текста французским диктором будет слышен французский акцент.
  • Поддержка людей с проблемами речи, терапевтические приложения, образовательные дополнения. Livox — ИИ-приложение для устройств альтернативной и дополненной коммуникации помогает людям с проблемами в общении. Используя Voice Engine, Livox предложит немым людям уникальные, нероботозированные голоса. Пользователь может выбрать наиболее подходящий ему голос, который будет говорить на разных языках.
  • Помощь в восстановлении голоса при внезапных и дегенеративных нарушениях речи. Институт Нейронаук Нормана Принца (NPNI) проводит пилотную программу помощи людям с онкологическими или неврологическими нарушениями речи. Благодаря способности Voice Engine воcпроизводить речь по 15-секундному образцу, доктора Фатима Мирза (Fatima Mirza), Рохаид Али (Rohaid Ali) и Константина Свокос (Konstantina Svokos) воспользовались аудиозаписью из видеоролика для школьного проекта и восстановили голос молодой пациентки с проблемами речи из-за сосудистой опухоли мозга.

Партнёры OpenAI согласились с правилами использования технологии, запрещающими с её помощью выдавать себя за другого человека, чего не скажешь о возможных злоумышленниках, всё чаще использующих нейросетевые технологии в преступных целях.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Австралиец погиб, не сумев вызвать скорую с Samsung Galaxy — на смартфоне не было обновлено ПО 18 мин.
Люди начали массово заводить романы с ИИ — доходит до виртуальных браков и детей 38 мин.
Игры на движке Unity скоро появятся в Fortnite — Epic Games и Unity заключили «уникальное партнёрство» 46 мин.
Google назвала лучшие приложения и игры «Play Маркета» за 2025 год 2 ч.
«Сырая и сломанная, но всё ещё прекрасная»: возрождённая ролевая песочница Hytale в духе Minecraft получила 16 минут геймплея, и фанаты в восторге 2 ч.
Авторы ремейка «Готики» рассказали и показали, как прокачали боевую систему благодаря отзывам игроков 3 ч.
Microsoft исправила проблему с установкой первого платного обновления безопасности для Windows 10 3 ч.
«Мы подвели весь интернет»: технический директор Cloudflare извинился за сбой, уронивший половину интернета 3 ч.
Релиз почтового сервера RuPost 4.0: поддержка геокластеризации и повышенная безопасность 4 ч.
Capcom похвасталась продажами Dragon’s Dogma 2 — игроки требуют обещанных улучшений и DLC 5 ч.
Новым ИТ-директором с Intel поделилась Adobe 17 мин.
Xpeng собралась выпустить миллион человекоподобных роботов по цене электромобиля — как Tesla 39 мин.
Немцы совершили прорыв в создании квантовых повторителей для «запутанного» интернета 51 мин.
Самый протяжённый в мире подводный интернет-кабель Meta 2Africa охватил треть населения Земли 55 мин.
В ближайшие месяцы DRAM подорожает ещё на 50 %, а Nvidia придётся оснащать ИИ-ускорители смартфонной памятью 2 ч.
Jeep представила электрический внедорожник Recon со съёмными дверями и задними стёклами за $65 000 2 ч.
«Яндекс» выпустил «Станцию 3» мощностью 50 Вт с окружающей подсветкой и пиксельным дисплеем 3 ч.
DJI начала продажи экшн-камеры Osmo Action 6 с квадратным сенсором по цене от €379 3 ч.
Второй европейский экзафлопсный суперкомпьютер Alice Recoque получит чипы AMD EPYC Venice и ускорители Instinct MI430X 3 ч.
Ровер Perseverance нашёл на Марсе камень, которого там не должно было быть 3 ч.