Сегодня 13 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI представила ИИ Voice Engine, который клонирует ваш голос по 15-секундному образцу

OpenAI представила результаты предварительного тестирования ИИ-модели Voice Engine, которая на основе 15-секундного образца может реалистично озвучить введённый текст, стараясь максимально точно передать голос и речевые особенности говорящего.

 Источник изображения: Unsplash, Igor Omilaev

Источник изображения: Unsplash, Igor Omilaev

Первые наработки Voice Engine появились в конце 2022 года и использовались в API для преобразования текста в речь, а также совместно с ChatGPT Voice and Read Aloud. В OpenAI осознают последствия возможного злоупотребления технологией синтезированных голосов, поэтому надеется получить отклик от общества по возможным опасностям и сферам применения. Что касается последних, с прошлого года OpenAI предложила протестировать Voice Engine небольшой группе партнёров — и получила примеры использования:

  • Помощь имеющим проблемы с чтением людям и детям посредством естественных, эмоциональных и разнообразных голосов. Так, специализирующаяся на образовательных технологиях компания Age of Learning использует Voice Engine для озвучки контента, а также, совместно с GPT-4, персонализированных ответов учащимся в реальном времени.
  • Перевод контента, например, видеороликов и подкастов, позволит авторам и компаниям расширить аудиторию по всему миру, сообщая информацию собственными голосами и голосами сотрудников. Одним из первопроходцев стала компания HeyGen — ИИ-платформа визуального повествования для корпоративных клиентов, предназначенная для создания человекоподобных аватаров в различных целях — от продуктового маркетинга до торговых предложений. Voice Engine сохраняет родной акцент диктора, поэтому при озвучении английского текста французским диктором будет слышен французский акцент.
  • Поддержка людей с проблемами речи, терапевтические приложения, образовательные дополнения. Livox — ИИ-приложение для устройств альтернативной и дополненной коммуникации помогает людям с проблемами в общении. Используя Voice Engine, Livox предложит немым людям уникальные, нероботозированные голоса. Пользователь может выбрать наиболее подходящий ему голос, который будет говорить на разных языках.
  • Помощь в восстановлении голоса при внезапных и дегенеративных нарушениях речи. Институт Нейронаук Нормана Принца (NPNI) проводит пилотную программу помощи людям с онкологическими или неврологическими нарушениями речи. Благодаря способности Voice Engine воcпроизводить речь по 15-секундному образцу, доктора Фатима Мирза (Fatima Mirza), Рохаид Али (Rohaid Ali) и Константина Свокос (Konstantina Svokos) воспользовались аудиозаписью из видеоролика для школьного проекта и восстановили голос молодой пациентки с проблемами речи из-за сосудистой опухоли мозга.

Партнёры OpenAI согласились с правилами использования технологии, запрещающими с её помощью выдавать себя за другого человека, чего не скажешь о возможных злоумышленниках, всё чаще использующих нейросетевые технологии в преступных целях.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Google представила геймерского ИИ-агента SIMA 2 — он умеет проходить незнакомые игры 2 ч.
AMD выпустила драйвер Radeon с поддержкой Ryzen 5 7500X3D, а также игр Call of Duty: Black Ops 7, Anno 117: Pax Romana и ARC Raiders 2 ч.
«Улыбка до ушей»: Amazon порадовала фанатов официальным трейлером второго сезона «Фоллаут» 3 ч.
Google грозит новый штраф в ЕС — на этот раз из-за неправильной борьбы со спамом 4 ч.
ИИ Google пробежится по рождественским распродажам за пользователя — сам выберет, сам закажет… и сам воспользуется? 4 ч.
Власти Франции полностью сняли с главы Telegram Павла Дурова запрет на выезд из страны 5 ч.
Анонсирована третья экранизация Death Stranding — мультсериал Death Stranding Isolations с новой историей и смелой анимацией 5 ч.
Apple заработает миллиарды на пользователях WeChat — компания договорилась с Tencent о комиссии в 15 % 6 ч.
Похоже, Red Dead Redemption выйдет на PS5, Switch 2, Xbox Series X и S раньше, чем RDR 2 6 ч.
«Ростелеком» приобретает долю в одном из старейших разработчиков российского Linux — «Базальт СПО» 7 ч.
Tesla отзывает более 10 000 домашних аккумуляторов Powerwall 2 — они могут спалить дом из-за дефектных элементов 15 мин.
Baidu анонсировала суверенные ИИ-ускорители Kunlun M100 и M300 для инференса и обучения 2 ч.
Вышла глобальная версия смартфона OnePlus 15 – цена от $900 2 ч.
Steam Machine превратится в «Куб-Компаньон» из игр Portal — Dbrand представила скин для грядущей приставки 3 ч.
Китай испытал самый большой в мире воздушный змей для добычи электричества из подъёмной силы ветра 3 ч.
Google инвестирует €5,5 млрд в дата-центры в Германии 5 ч.
Меж болот и прерий: Meta начала строительство юбилейного 30-го дата-центра за $1 млрд 6 ч.
DJI выпустила селфи-дрон Neo 2 за €239 на глобальный рынок, но не в США 6 ч.
1024 ядра, 6 ГГц и 48 Тбайт DDR5-17600: Tachyum обновила характеристики несуществующего процессора Prodigy 7 ч.
Samsung выпустила портативные смарт-мониторы Movingstyle диагональю 27 и 32 дюйма 7 ч.