Сегодня 09 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI представила ИИ Voice Engine, который клонирует ваш голос по 15-секундному образцу

OpenAI представила результаты предварительного тестирования ИИ-модели Voice Engine, которая на основе 15-секундного образца может реалистично озвучить введённый текст, стараясь максимально точно передать голос и речевые особенности говорящего.

 Источник изображения: Unsplash, Igor Omilaev

Источник изображения: Unsplash, Igor Omilaev

Первые наработки Voice Engine появились в конце 2022 года и использовались в API для преобразования текста в речь, а также совместно с ChatGPT Voice and Read Aloud. В OpenAI осознают последствия возможного злоупотребления технологией синтезированных голосов, поэтому надеется получить отклик от общества по возможным опасностям и сферам применения. Что касается последних, с прошлого года OpenAI предложила протестировать Voice Engine небольшой группе партнёров — и получила примеры использования:

  • Помощь имеющим проблемы с чтением людям и детям посредством естественных, эмоциональных и разнообразных голосов. Так, специализирующаяся на образовательных технологиях компания Age of Learning использует Voice Engine для озвучки контента, а также, совместно с GPT-4, персонализированных ответов учащимся в реальном времени.
  • Перевод контента, например, видеороликов и подкастов, позволит авторам и компаниям расширить аудиторию по всему миру, сообщая информацию собственными голосами и голосами сотрудников. Одним из первопроходцев стала компания HeyGen — ИИ-платформа визуального повествования для корпоративных клиентов, предназначенная для создания человекоподобных аватаров в различных целях — от продуктового маркетинга до торговых предложений. Voice Engine сохраняет родной акцент диктора, поэтому при озвучении английского текста французским диктором будет слышен французский акцент.
  • Поддержка людей с проблемами речи, терапевтические приложения, образовательные дополнения. Livox — ИИ-приложение для устройств альтернативной и дополненной коммуникации помогает людям с проблемами в общении. Используя Voice Engine, Livox предложит немым людям уникальные, нероботозированные голоса. Пользователь может выбрать наиболее подходящий ему голос, который будет говорить на разных языках.
  • Помощь в восстановлении голоса при внезапных и дегенеративных нарушениях речи. Институт Нейронаук Нормана Принца (NPNI) проводит пилотную программу помощи людям с онкологическими или неврологическими нарушениями речи. Благодаря способности Voice Engine воcпроизводить речь по 15-секундному образцу, доктора Фатима Мирза (Fatima Mirza), Рохаид Али (Rohaid Ali) и Константина Свокос (Konstantina Svokos) воспользовались аудиозаписью из видеоролика для школьного проекта и восстановили голос молодой пациентки с проблемами речи из-за сосудистой опухоли мозга.

Партнёры OpenAI согласились с правилами использования технологии, запрещающими с её помощью выдавать себя за другого человека, чего не скажешь о возможных злоумышленниках, всё чаще использующих нейросетевые технологии в преступных целях.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Mistral AI хочет привлечь $1 млрд для конкуренции с OpenAI 17 мин.
За год замедления YouTube в России Rutube нарастил просмотры в 7,5 раза 35 мин.
Два американца ответят в суде за хищение $650 млн через криптовалютную пирамиду OmegaPro — они обещали доход до 300 % 2 ч.
VK опубликовала рейтинг самых популярных игр и приложений в RuStore 5 ч.
ИИ неделями дурачил пользователей музыкального сервиса, выдавая себя за рок-группу из живых людей 5 ч.
Суд США заблокировал правило FTC о простой отмене подписок «в один клик» 5 ч.
Выпущена обновлённая версия AMOS — распространённый вирус для macOS стал ещё опаснее 5 ч.
Не просто HD-версия: разработчики ремейка «Готики» рассказали об отличиях от классической игры Piranha Bytes 6 ч.
ByteDance ещё не согласилась на сделку с Oracle и лишь раздумывает над созданием чисто американских приложений 7 ч.
Роскомнадзор заявил, что каждый день выявляет 1,2 млн звонков с подменой номера 7 ч.
Samsung представила смарт-часы Galaxy Watch8 и Watch8 Classic с измерением антиоксидантов и ценой от 25 990 рублей 0 мин.
Samsung представила обновлённые смарт-часы Galaxy Watch Ultra с титановым корпусом за 44 990 рублей 1 мин.
SambaManaged превратит почти любой ЦОД в ИИ ЦОД всего за три месяца 31 мин.
Флеш-память подорожает на 8–13 % в текущем квартале и потянет за собой цены на SSD 41 мин.
Глава OpenAI пообещал миру принципиально новый компьютер — современные не подходят для мира с ИИ 60 мин.
Европейский разработчик серверных Arm-процессоров SiPearl закрыл раунд финансирования на €130 млн 2 ч.
256 ядер, 2048 потоков и 64 Тбайт DDR5: IBM анонсировала «бесперебойные» серверы POWER11 3 ч.
Arm похвалилась успехами в серверном сегменте — рост в 14 раз за четыре года 3 ч.
Motorola представила смартфон Moto G96 — 144-Гц OLED, Snapdragon 7s Gen 2 и батарея на 5500 мА·ч за $210 3 ч.
SpaceX собралась подорожать до $400 млрд 3 ч.