Сегодня 08 октября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI представила ИИ Voice Engine, который клонирует ваш голос по 15-секундному образцу

OpenAI представила результаты предварительного тестирования ИИ-модели Voice Engine, которая на основе 15-секундного образца может реалистично озвучить введённый текст, стараясь максимально точно передать голос и речевые особенности говорящего.

 Источник изображения: Unsplash, Igor Omilaev

Источник изображения: Unsplash, Igor Omilaev

Первые наработки Voice Engine появились в конце 2022 года и использовались в API для преобразования текста в речь, а также совместно с ChatGPT Voice and Read Aloud. В OpenAI осознают последствия возможного злоупотребления технологией синтезированных голосов, поэтому надеется получить отклик от общества по возможным опасностям и сферам применения. Что касается последних, с прошлого года OpenAI предложила протестировать Voice Engine небольшой группе партнёров — и получила примеры использования:

  • Помощь имеющим проблемы с чтением людям и детям посредством естественных, эмоциональных и разнообразных голосов. Так, специализирующаяся на образовательных технологиях компания Age of Learning использует Voice Engine для озвучки контента, а также, совместно с GPT-4, персонализированных ответов учащимся в реальном времени.
  • Перевод контента, например, видеороликов и подкастов, позволит авторам и компаниям расширить аудиторию по всему миру, сообщая информацию собственными голосами и голосами сотрудников. Одним из первопроходцев стала компания HeyGen — ИИ-платформа визуального повествования для корпоративных клиентов, предназначенная для создания человекоподобных аватаров в различных целях — от продуктового маркетинга до торговых предложений. Voice Engine сохраняет родной акцент диктора, поэтому при озвучении английского текста французским диктором будет слышен французский акцент.
  • Поддержка людей с проблемами речи, терапевтические приложения, образовательные дополнения. Livox — ИИ-приложение для устройств альтернативной и дополненной коммуникации помогает людям с проблемами в общении. Используя Voice Engine, Livox предложит немым людям уникальные, нероботозированные голоса. Пользователь может выбрать наиболее подходящий ему голос, который будет говорить на разных языках.
  • Помощь в восстановлении голоса при внезапных и дегенеративных нарушениях речи. Институт Нейронаук Нормана Принца (NPNI) проводит пилотную программу помощи людям с онкологическими или неврологическими нарушениями речи. Благодаря способности Voice Engine воcпроизводить речь по 15-секундному образцу, доктора Фатима Мирза (Fatima Mirza), Рохаид Али (Rohaid Ali) и Константина Свокос (Konstantina Svokos) воспользовались аудиозаписью из видеоролика для школьного проекта и восстановили голос молодой пациентки с проблемами речи из-за сосудистой опухоли мозга.

Партнёры OpenAI согласились с правилами использования технологии, запрещающими с её помощью выдавать себя за другого человека, чего не скажешь о возможных злоумышленниках, всё чаще использующих нейросетевые технологии в преступных целях.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
С начала года северокорейские хакеры украли криптовалюты на $2 млрд — это рекорд 30 мин.
Vampire Survivors получит большое обновление с онлайн-кооперативом и ответом на «животрепещущий вопрос, который нам задавали тысячи раз» 2 ч.
Atari уберёт классическую версию System Shock 2 из продажи в Steam, оставив только более дорогой ремастер 3 ч.
«Увидимся на поле боя, господа»: взрывной релизный трейлер Battlefield 6 готовит игроков к тотальной войне 3 ч.
Steam и Riot Games отключили миллионы игроков из-за мощнейшей DDoS-атаки 5 ч.
Google представила модель Gemini, которая заполняет в браузере формы и играет в 2048 5 ч.
Meta представила новые функции Reels в Facebook, чтобы сделать сервис более похожим на TikTok 12 ч.
Steam сломался второй раз за день — проблемы наблюдаются по всему миру 15 ч.
«Вы передо мной в долгу», — Трамп вернулся в TikTok и сразу же обратился к молодёжи 17 ч.
Хакеры заявили о взломе Huawei и получении доступа к средствам разработки и исходному коду 17 ч.
Мультимедийное будущее наступило: как современные проекторы захватили гостиные 5 мин.
Китай продолжает закупать импортное оборудование для производства чипов на десятки миллиардов долларов 37 мин.
HPE отдала Nokia «ненужные» технологии Juniper Networks для мобильных сетей, часть сотрудников и одного вице-президента 3 ч.
Глава Nvidia заверил сотрудников, что будет платить по $100 000 за выдачу виз H-1B для них 3 ч.
Nvidia поддержит xAI деньгами, чтобы та смогла арендовать больше её ускорителей 3 ч.
Пациент с мозговым имплантом Neuralink продемонстрировал способность управлять роботизированной рукой 4 ч.
Tesla представила «доступные» Model 3 и Model Y — без многих опций, но всё равно с ценой от $37 000 5 ч.
Be quiet! представила корпуса-аквариумы Light Base 500 LX и Light Base 500 c ARGB-подсветкой и без 10 ч.
Новая статья: Обзор смартфона Apple iPhone 17: долгожданные улучшения 11 ч.
Qualcomm купила Arduino: бренд и экосистему обещают сохранить 12 ч.