Сегодня 17 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI представила ИИ Voice Engine, который клонирует ваш голос по 15-секундному образцу

OpenAI представила результаты предварительного тестирования ИИ-модели Voice Engine, которая на основе 15-секундного образца может реалистично озвучить введённый текст, стараясь максимально точно передать голос и речевые особенности говорящего.

 Источник изображения: Unsplash, Igor Omilaev

Источник изображения: Unsplash, Igor Omilaev

Первые наработки Voice Engine появились в конце 2022 года и использовались в API для преобразования текста в речь, а также совместно с ChatGPT Voice and Read Aloud. В OpenAI осознают последствия возможного злоупотребления технологией синтезированных голосов, поэтому надеется получить отклик от общества по возможным опасностям и сферам применения. Что касается последних, с прошлого года OpenAI предложила протестировать Voice Engine небольшой группе партнёров — и получила примеры использования:

  • Помощь имеющим проблемы с чтением людям и детям посредством естественных, эмоциональных и разнообразных голосов. Так, специализирующаяся на образовательных технологиях компания Age of Learning использует Voice Engine для озвучки контента, а также, совместно с GPT-4, персонализированных ответов учащимся в реальном времени.
  • Перевод контента, например, видеороликов и подкастов, позволит авторам и компаниям расширить аудиторию по всему миру, сообщая информацию собственными голосами и голосами сотрудников. Одним из первопроходцев стала компания HeyGen — ИИ-платформа визуального повествования для корпоративных клиентов, предназначенная для создания человекоподобных аватаров в различных целях — от продуктового маркетинга до торговых предложений. Voice Engine сохраняет родной акцент диктора, поэтому при озвучении английского текста французским диктором будет слышен французский акцент.
  • Поддержка людей с проблемами речи, терапевтические приложения, образовательные дополнения. Livox — ИИ-приложение для устройств альтернативной и дополненной коммуникации помогает людям с проблемами в общении. Используя Voice Engine, Livox предложит немым людям уникальные, нероботозированные голоса. Пользователь может выбрать наиболее подходящий ему голос, который будет говорить на разных языках.
  • Помощь в восстановлении голоса при внезапных и дегенеративных нарушениях речи. Институт Нейронаук Нормана Принца (NPNI) проводит пилотную программу помощи людям с онкологическими или неврологическими нарушениями речи. Благодаря способности Voice Engine воcпроизводить речь по 15-секундному образцу, доктора Фатима Мирза (Fatima Mirza), Рохаид Али (Rohaid Ali) и Константина Свокос (Konstantina Svokos) воспользовались аудиозаписью из видеоролика для школьного проекта и восстановили голос молодой пациентки с проблемами речи из-за сосудистой опухоли мозга.

Партнёры OpenAI согласились с правилами использования технологии, запрещающими с её помощью выдавать себя за другого человека, чего не скажешь о возможных злоумышленниках, всё чаще использующих нейросетевые технологии в преступных целях.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Яндекс» выкупил права на платформу для игрового облачного сервиса «Плюс Гейминг» 3 ч.
CD Projekt Red держит в тайне, выйдет ли The Witcher 3: Wild Hunt на Nintendo Switch 2 3 ч.
«Нанёс непоправимый ущерб индустрии»: глава New Blood Interactive раскритиковал влияние Escape from Tarkov на FromSoftware и игры в целом 4 ч.
Grok научился запоминать предпочтения пользователя 4 ч.
ИИ-помощник Gemini «прозрел» у бесплатных пользователей на Android 5 ч.
«Группа Астра» с партнёрами создала СП для развития и продвижения отечественной open source среды разработки OpenIDE 5 ч.
Доказательства скорой премьеры The Elder Scrolls IV: Oblivion Remastered обнаружили на сайте самой Bethesda 6 ч.
«Почти тотальное доминирование» поисковика Google может обойтись компании в £5 млрд 6 ч.
Microsoft научила бесплатный Copilot «подсматривать» за тем, что пользователь делает в браузере Edge 6 ч.
Ubisoft взялась за королевскую битву в духе Apex Legends, хотя сомневается в будущем жанра 6 ч.
Robokos представила в России умных беспроводных роботов-газонокосилок RoboUP T600, RV600bi и RoboUP T1200 6 мин.
Масса космического мусора на околоземной орбите превысила 6600 тонн 2 ч.
Европа намерена добывать биотопливо для авиации и судоходства с помощью ГМО-микробов 2 ч.
Китай запретил использовать термины «автономное вождение» и «умное вождение» в рекламе автомобилей 3 ч.
Представлена электронная книга, максимально похожая на настоящую — у неё складывающийся экран 3 ч.
Сначала NVIDIA, потом AMD: США не позволили продать в Китай ускорители Instinct на $800 млн 3 ч.
«Джеймс Уэбб» засёк признаки жизни на далёкой планете — но есть нюансы 3 ч.
В России начались продажи смартфона Xiaomi Redmi Note 14S с 200-Мп камерой и чипом Helio G99-Ultra 4 ч.
Глава TSMC опроверг слухи создании с Intel совместного предприятия по выпуску чипов 4 ч.
В ядре Млечного Пути происходит что-то непонятное —  в этом замешана новая форма тёмной материи, решили учёные 4 ч.