Сегодня 21 января 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI представила ИИ Voice Engine, который клонирует ваш голос по 15-секундному образцу

OpenAI представила результаты предварительного тестирования ИИ-модели Voice Engine, которая на основе 15-секундного образца может реалистично озвучить введённый текст, стараясь максимально точно передать голос и речевые особенности говорящего.

 Источник изображения: Unsplash, Igor Omilaev

Источник изображения: Unsplash, Igor Omilaev

Первые наработки Voice Engine появились в конце 2022 года и использовались в API для преобразования текста в речь, а также совместно с ChatGPT Voice and Read Aloud. В OpenAI осознают последствия возможного злоупотребления технологией синтезированных голосов, поэтому надеется получить отклик от общества по возможным опасностям и сферам применения. Что касается последних, с прошлого года OpenAI предложила протестировать Voice Engine небольшой группе партнёров — и получила примеры использования:

  • Помощь имеющим проблемы с чтением людям и детям посредством естественных, эмоциональных и разнообразных голосов. Так, специализирующаяся на образовательных технологиях компания Age of Learning использует Voice Engine для озвучки контента, а также, совместно с GPT-4, персонализированных ответов учащимся в реальном времени.
  • Перевод контента, например, видеороликов и подкастов, позволит авторам и компаниям расширить аудиторию по всему миру, сообщая информацию собственными голосами и голосами сотрудников. Одним из первопроходцев стала компания HeyGen — ИИ-платформа визуального повествования для корпоративных клиентов, предназначенная для создания человекоподобных аватаров в различных целях — от продуктового маркетинга до торговых предложений. Voice Engine сохраняет родной акцент диктора, поэтому при озвучении английского текста французским диктором будет слышен французский акцент.
  • Поддержка людей с проблемами речи, терапевтические приложения, образовательные дополнения. Livox — ИИ-приложение для устройств альтернативной и дополненной коммуникации помогает людям с проблемами в общении. Используя Voice Engine, Livox предложит немым людям уникальные, нероботозированные голоса. Пользователь может выбрать наиболее подходящий ему голос, который будет говорить на разных языках.
  • Помощь в восстановлении голоса при внезапных и дегенеративных нарушениях речи. Институт Нейронаук Нормана Принца (NPNI) проводит пилотную программу помощи людям с онкологическими или неврологическими нарушениями речи. Благодаря способности Voice Engine воcпроизводить речь по 15-секундному образцу, доктора Фатима Мирза (Fatima Mirza), Рохаид Али (Rohaid Ali) и Константина Свокос (Konstantina Svokos) воспользовались аудиозаписью из видеоролика для школьного проекта и восстановили голос молодой пациентки с проблемами речи из-за сосудистой опухоли мозга.

Партнёры OpenAI согласились с правилами использования технологии, запрещающими с её помощью выдавать себя за другого человека, чего не скажешь о возможных злоумышленниках, всё чаще использующих нейросетевые технологии в преступных целях.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
У Nvidia закончились игровые видеокарты в облаке 8 мин.
Российское ПО не удовлетворяет 63 % айтишников по части совместимости с другим софтом 15 мин.
Олдскульная стратегия Tempest Rising в духе Command & Conquer стала доступна для предзаказа в российском Steam и обзавелась временной демоверсией 24 мин.
Золотой век наступил раньше времени: разработка Sid Meier’s Civilization VII официально завершена 2 ч.
«Мечты сбываются»: амбициозный мод GTA: Vice City Nextgen Edition на движке от GTA IV наконец получил точную дату выхода 2 ч.
RuStore стал вторым самым популярным магазином Android-приложений в России 2 ч.
«Начало новой эры»: Marvel Snap возобновила работу в США после разблокировки TikTok и готовится к переменам 4 ч.
Трамп подписал указ, который отсрочил на 75 дней блокировку TikTok в США 7 ч.
Canon выпустила приложение для стриминга с нескольких камер, но не своих собственных 8 ч.
Китайцы создали нейросеть, которая превзошла мыслящую OpenAI o1 в важных тестах 14 ч.
Amazon снова стала крупнейшим в мире корпоративным покупателем возобновляемой энергии в 2024 году 10 мин.
Учёные отказали частицам тёмной материи в возможности быть сверхтяжёлыми 24 мин.
Спецслужбы США и ЕС: причиной обрывов кабелей в Балтийском море стали не диверсии, а низкая квалификация экипажей 32 мин.
Seagate начала поставки HAMR-дисков Exos M вместимостью 36 Тбайт 50 мин.
Трамп отменил принудительный перевод США на электромобили 51 мин.
AAEON выпустила плату Boxer-8654AI-Kit на базе NVIDIA Jetson Orin NX 53 мин.
Huawei стала помогать клиентам внедрять ИИ-ускорители Ascend, чтобы отвоевать рынок у Nvidia 54 мин.
Huawei показала взрывной рост и стала вторым брендом смартфонов в Китае — Apple быстрее всех теряет рынок 2 ч.
Российским операторам разрешили готовиться к тестированию 5G 2 ч.
Seagate представила HDD на 36 Тбайт — это самый плотный жёсткий диск с CMR-записью 4 ч.