Сегодня 27 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI представила ИИ Voice Engine, который клонирует ваш голос по 15-секундному образцу

OpenAI представила результаты предварительного тестирования ИИ-модели Voice Engine, которая на основе 15-секундного образца может реалистично озвучить введённый текст, стараясь максимально точно передать голос и речевые особенности говорящего.

 Источник изображения: Unsplash, Igor Omilaev

Источник изображения: Unsplash, Igor Omilaev

Первые наработки Voice Engine появились в конце 2022 года и использовались в API для преобразования текста в речь, а также совместно с ChatGPT Voice and Read Aloud. В OpenAI осознают последствия возможного злоупотребления технологией синтезированных голосов, поэтому надеется получить отклик от общества по возможным опасностям и сферам применения. Что касается последних, с прошлого года OpenAI предложила протестировать Voice Engine небольшой группе партнёров — и получила примеры использования:

  • Помощь имеющим проблемы с чтением людям и детям посредством естественных, эмоциональных и разнообразных голосов. Так, специализирующаяся на образовательных технологиях компания Age of Learning использует Voice Engine для озвучки контента, а также, совместно с GPT-4, персонализированных ответов учащимся в реальном времени.
  • Перевод контента, например, видеороликов и подкастов, позволит авторам и компаниям расширить аудиторию по всему миру, сообщая информацию собственными голосами и голосами сотрудников. Одним из первопроходцев стала компания HeyGen — ИИ-платформа визуального повествования для корпоративных клиентов, предназначенная для создания человекоподобных аватаров в различных целях — от продуктового маркетинга до торговых предложений. Voice Engine сохраняет родной акцент диктора, поэтому при озвучении английского текста французским диктором будет слышен французский акцент.
  • Поддержка людей с проблемами речи, терапевтические приложения, образовательные дополнения. Livox — ИИ-приложение для устройств альтернативной и дополненной коммуникации помогает людям с проблемами в общении. Используя Voice Engine, Livox предложит немым людям уникальные, нероботозированные голоса. Пользователь может выбрать наиболее подходящий ему голос, который будет говорить на разных языках.
  • Помощь в восстановлении голоса при внезапных и дегенеративных нарушениях речи. Институт Нейронаук Нормана Принца (NPNI) проводит пилотную программу помощи людям с онкологическими или неврологическими нарушениями речи. Благодаря способности Voice Engine воcпроизводить речь по 15-секундному образцу, доктора Фатима Мирза (Fatima Mirza), Рохаид Али (Rohaid Ali) и Константина Свокос (Konstantina Svokos) воспользовались аудиозаписью из видеоролика для школьного проекта и восстановили голос молодой пациентки с проблемами речи из-за сосудистой опухоли мозга.

Партнёры OpenAI согласились с правилами использования технологии, запрещающими с её помощью выдавать себя за другого человека, чего не скажешь о возможных злоумышленниках, всё чаще использующих нейросетевые технологии в преступных целях.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Opera добавила в ИИ-браузер Neon минутные глубокие исследования и интеграцию с «Google Документами» 2 ч.
CD Projekt подтвердила, что не покажет The Witcher 4 на The Game Awards 2025 2 ч.
Google начала внедрять Gemini в «Google Карты» для всех режимов навигации 7 ч.
Оригинал учредительных документов Apple 1976 года уйдёт с молотка — за лот хотят выручить до $4 млн 13 ч.
Cyberpunk 2077 стала главным источником дохода CD Projekt — компания отчиталась об ударных результатах за третий квартал 13 ч.
«Новый год пришёл раньше времени»: Sony включила в декабрьскую линейку PS Plus сразу пять игр, в том числе Lego Horizon Adventures и Killing Floor 3 15 ч.
Продажи Cyberpunk 2077 превысили 35 миллионов копий, а команда Cyberpunk 2 растёт не по дням, а по часам 15 ч.
ЕС откажется от сканирования переписок — ИТ-гиганты выиграли битву за конфиденциальность пользователей 16 ч.
Новый геймплейный трейлер Warhammer 40,000: Dark Heresy показал в деле огрина Когга, поумневшего благодаря аугментации коры головного мозга 16 ч.
Китай штампует новые ИИ-модели еженедельно — США уже проигрывают гонку открытого ИИ 16 ч.
Почти 5 Гбайт на квадратный миллиметр: Kioxia и SanDisk готовят флеш-память рекордной плотности 13 мин.
Атмосфера Марса вовсю искрит, выяснил марсоход NASA Perseverance 17 мин.
Дизайнер превратил кроссовки Nike в полноценную ретро-консоль с играми SNES 26 мин.
Intel охотится за инженерами TSMC в Аризоне — зарплаты обещают на 20–30 % выше 2 ч.
Basis Dynamix стала основой инфраструктуры первого отечественного ядра 4G-сети оператора Т2 2 ч.
xAI потратит $375 млн на аккумуляторное хранилище Tesla Megapack и построит солнечную электростанцию для ИИ ЦОД Colossus 3 ч.
Выручка производителей памяти DRAM в прошлом квартале взлетела на 30,9 % — и это только начало 3 ч.
Intel уверена в невиновности нанятого ею бывшего старшего вице-президента TSMC 3 ч.
На Apple снова подали в суд за использование конфликтных минералов в iPhone и других продуктах 4 ч.
В ИИ очень легко переинвестировать, показал печальный опыт Intel 6 ч.