Сегодня 20 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI представила ИИ Voice Engine, который клонирует ваш голос по 15-секундному образцу

OpenAI представила результаты предварительного тестирования ИИ-модели Voice Engine, которая на основе 15-секундного образца может реалистично озвучить введённый текст, стараясь максимально точно передать голос и речевые особенности говорящего.

 Источник изображения: Unsplash, Igor Omilaev

Источник изображения: Unsplash, Igor Omilaev

Первые наработки Voice Engine появились в конце 2022 года и использовались в API для преобразования текста в речь, а также совместно с ChatGPT Voice and Read Aloud. В OpenAI осознают последствия возможного злоупотребления технологией синтезированных голосов, поэтому надеется получить отклик от общества по возможным опасностям и сферам применения. Что касается последних, с прошлого года OpenAI предложила протестировать Voice Engine небольшой группе партнёров — и получила примеры использования:

  • Помощь имеющим проблемы с чтением людям и детям посредством естественных, эмоциональных и разнообразных голосов. Так, специализирующаяся на образовательных технологиях компания Age of Learning использует Voice Engine для озвучки контента, а также, совместно с GPT-4, персонализированных ответов учащимся в реальном времени.
  • Перевод контента, например, видеороликов и подкастов, позволит авторам и компаниям расширить аудиторию по всему миру, сообщая информацию собственными голосами и голосами сотрудников. Одним из первопроходцев стала компания HeyGen — ИИ-платформа визуального повествования для корпоративных клиентов, предназначенная для создания человекоподобных аватаров в различных целях — от продуктового маркетинга до торговых предложений. Voice Engine сохраняет родной акцент диктора, поэтому при озвучении английского текста французским диктором будет слышен французский акцент.
  • Поддержка людей с проблемами речи, терапевтические приложения, образовательные дополнения. Livox — ИИ-приложение для устройств альтернативной и дополненной коммуникации помогает людям с проблемами в общении. Используя Voice Engine, Livox предложит немым людям уникальные, нероботозированные голоса. Пользователь может выбрать наиболее подходящий ему голос, который будет говорить на разных языках.
  • Помощь в восстановлении голоса при внезапных и дегенеративных нарушениях речи. Институт Нейронаук Нормана Принца (NPNI) проводит пилотную программу помощи людям с онкологическими или неврологическими нарушениями речи. Благодаря способности Voice Engine воcпроизводить речь по 15-секундному образцу, доктора Фатима Мирза (Fatima Mirza), Рохаид Али (Rohaid Ali) и Константина Свокос (Konstantina Svokos) воспользовались аудиозаписью из видеоролика для школьного проекта и восстановили голос молодой пациентки с проблемами речи из-за сосудистой опухоли мозга.

Партнёры OpenAI согласились с правилами использования технологии, запрещающими с её помощью выдавать себя за другого человека, чего не скажешь о возможных злоумышленниках, всё чаще использующих нейросетевые технологии в преступных целях.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Adobe стала владельцем основанного россиянами разработчика ПО Semrush — сумма сделки составила $1,9 млрд 58 мин.
Apple объявила финалистов премии App Store Awards 2025 60 мин.
Скандал в NetApp: бывший техдиректор продал разработки конкуренту и скрылся в Исландии 8 ч.
«Столько циников!»: глава ИИ Microsoft раскритиковал недовольных нашествием ИИ-агентов в Windows 8 ч.
EA объявила о победе над Call of Duty — компания назвала Battlefield 6 «самым продаваемым шутером» 2025 года 10 ч.
В ранний доступ Steam ворвался ролевой роглайк Moonlighter 2: The Endless Vault про двойную жизнь торговца и искателя приключений 12 ч.
Выросшие в интернете зумеры использует пароли слабее, чем их дедушки и бабушки 13 ч.
Первое крупное обновление принесёт в Ghost of Yotei режим «Новая игра +» и не только — геймплейный трейлер и дата выхода 14 ч.
В ЕС готовят конец эпохе раздражающих cookie-окон — всё решится на уровне браузера 14 ч.
The Temple of Elemental Evil не заставит себя долго ждать — объявлена дата выхода в Steam переиздания культовой RPG от соавторов Fallout 15 ч.
Китайская сторона выразила удовлетворение решением властей Нидерландов не вмешиваться в деятельность Nexperia 22 мин.
Это другое: глава Nvidia отверг опасения по поводу формирования ИИ-пузыря 3 ч.
Новая статья: Обзор ноутбука ASUS Vivobook S14 (M3407HA): разрыв шаблонов рынка 7 ч.
AMD и Nvidia готовятся урезать или даже полностью остановить выпуск дешёвых видеокарт из-за глобального дефицита памяти 7 ч.
Xiaomi предупредила, что смартфоны значительно подорожают в 2026 году — виноват снова ИИ 8 ч.
Qualcomm: графика Adreno X2 для ПК запустит 9 из 10 игр и будет до 50 % быстрее флагманской «встройки» Intel 8 ч.
Samsung и BOE наконец договорились по трёхлетнему патентному спору по технологиям OLED 10 ч.
PowerColor присоветовала закупаться видеокартами — после Нового года они подорожают 10 ч.
Представлен «самый мощный серийный Porsche всех времён» — 1139-сильный Cayenne Electric 12 ч.
На Луне открыли свежий метеоритный кратер — это напомнило о рисках колонизации спутника 13 ч.