Сегодня 22 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI представила ИИ Voice Engine, который клонирует ваш голос по 15-секундному образцу

OpenAI представила результаты предварительного тестирования ИИ-модели Voice Engine, которая на основе 15-секундного образца может реалистично озвучить введённый текст, стараясь максимально точно передать голос и речевые особенности говорящего.

 Источник изображения: Unsplash, Igor Omilaev

Источник изображения: Unsplash, Igor Omilaev

Первые наработки Voice Engine появились в конце 2022 года и использовались в API для преобразования текста в речь, а также совместно с ChatGPT Voice and Read Aloud. В OpenAI осознают последствия возможного злоупотребления технологией синтезированных голосов, поэтому надеется получить отклик от общества по возможным опасностям и сферам применения. Что касается последних, с прошлого года OpenAI предложила протестировать Voice Engine небольшой группе партнёров — и получила примеры использования:

  • Помощь имеющим проблемы с чтением людям и детям посредством естественных, эмоциональных и разнообразных голосов. Так, специализирующаяся на образовательных технологиях компания Age of Learning использует Voice Engine для озвучки контента, а также, совместно с GPT-4, персонализированных ответов учащимся в реальном времени.
  • Перевод контента, например, видеороликов и подкастов, позволит авторам и компаниям расширить аудиторию по всему миру, сообщая информацию собственными голосами и голосами сотрудников. Одним из первопроходцев стала компания HeyGen — ИИ-платформа визуального повествования для корпоративных клиентов, предназначенная для создания человекоподобных аватаров в различных целях — от продуктового маркетинга до торговых предложений. Voice Engine сохраняет родной акцент диктора, поэтому при озвучении английского текста французским диктором будет слышен французский акцент.
  • Поддержка людей с проблемами речи, терапевтические приложения, образовательные дополнения. Livox — ИИ-приложение для устройств альтернативной и дополненной коммуникации помогает людям с проблемами в общении. Используя Voice Engine, Livox предложит немым людям уникальные, нероботозированные голоса. Пользователь может выбрать наиболее подходящий ему голос, который будет говорить на разных языках.
  • Помощь в восстановлении голоса при внезапных и дегенеративных нарушениях речи. Институт Нейронаук Нормана Принца (NPNI) проводит пилотную программу помощи людям с онкологическими или неврологическими нарушениями речи. Благодаря способности Voice Engine воcпроизводить речь по 15-секундному образцу, доктора Фатима Мирза (Fatima Mirza), Рохаид Али (Rohaid Ali) и Константина Свокос (Konstantina Svokos) воспользовались аудиозаписью из видеоролика для школьного проекта и восстановили голос молодой пациентки с проблемами речи из-за сосудистой опухоли мозга.

Партнёры OpenAI согласились с правилами использования технологии, запрещающими с её помощью выдавать себя за другого человека, чего не скажешь о возможных злоумышленниках, всё чаще использующих нейросетевые технологии в преступных целях.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Проводник» в Windows 11 будет автоматически загружаться в фоновом режиме, чтобы стать быстрее 2 ч.
Биткоин рухнул вслед за акциями технокомпаний — уже на 40 тыс. меньше исторического максимума 2 ч.
Соцсеть X запустила маркетплейс редких и «спящих» никнеймов 2 ч.
Google опровергла «вводящие в заблуждение» сообщения об обучении ИИ на письмах из Gmail 3 ч.
Хакеры взломали приложение Gainsight и могли похитить данные более двухсот компаний 4 ч.
Россияне стали больше слушать радио после замедления YouTube 4 ч.
Новая статья: Call of Duty: Black Ops 7 — такой «колды» ещё не было. Рецензия 15 ч.
Google теперь использует письма пользователей Gmail для обучения ИИ, но это можно отключить 19 ч.
У Grok сломался регулятор подхалимства к Илону Маску — бот решил, что он совершенен во всём и даже может воскрешать людей 19 ч.
Разработчики Nioh 3 раскрыли системные требования для игры в 1080p с апскейлерами 19 ч.
Китайцы создали EUV-сканер на гармониках — в тысячи раз компактнее «шкафов» ASML 2 ч.
ASUS представила модульную ИИ-систему PE3000N на платформе NVIDIA Jetson Thor T5000 3 ч.
В Microsoft Azure появились инстансы с Intel Xeon 6 и CXL-памятью 3 ч.
Суд намерен устранить монополию Google в онлайн-рекламе пока ен поздно, но скорого успеха не ожидает 3 ч.
В США испытали беспроводное питание для спутников 4 ч.
Японский «заменитель TSMC» получит от местных властей $6,38 млрд на производство 2-нм чипов 7 ч.
Рынок не поверил Хуангу: акции бигтехов обвалились после квартального отчёта Nvidia 8 ч.
Власти США задумались о снятии запрета на поставки ускорителей Nvidia H200 в Китай 9 ч.
По-настоящему космический микроконтроллер STMicroelectronics STM32V8 пропишется в спутниках Starlink: 800 Мгц, защита от радиации и работа при +140 °C 16 ч.
Huawei пообещала флагманам Mate 80 автономность до 14 дней, но чем-то придётся жертвовать 18 ч.