Сегодня 18 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI представила ИИ Voice Engine, который клонирует ваш голос по 15-секундному образцу

OpenAI представила результаты предварительного тестирования ИИ-модели Voice Engine, которая на основе 15-секундного образца может реалистично озвучить введённый текст, стараясь максимально точно передать голос и речевые особенности говорящего.

 Источник изображения: Unsplash, Igor Omilaev

Источник изображения: Unsplash, Igor Omilaev

Первые наработки Voice Engine появились в конце 2022 года и использовались в API для преобразования текста в речь, а также совместно с ChatGPT Voice and Read Aloud. В OpenAI осознают последствия возможного злоупотребления технологией синтезированных голосов, поэтому надеется получить отклик от общества по возможным опасностям и сферам применения. Что касается последних, с прошлого года OpenAI предложила протестировать Voice Engine небольшой группе партнёров — и получила примеры использования:

  • Помощь имеющим проблемы с чтением людям и детям посредством естественных, эмоциональных и разнообразных голосов. Так, специализирующаяся на образовательных технологиях компания Age of Learning использует Voice Engine для озвучки контента, а также, совместно с GPT-4, персонализированных ответов учащимся в реальном времени.
  • Перевод контента, например, видеороликов и подкастов, позволит авторам и компаниям расширить аудиторию по всему миру, сообщая информацию собственными голосами и голосами сотрудников. Одним из первопроходцев стала компания HeyGen — ИИ-платформа визуального повествования для корпоративных клиентов, предназначенная для создания человекоподобных аватаров в различных целях — от продуктового маркетинга до торговых предложений. Voice Engine сохраняет родной акцент диктора, поэтому при озвучении английского текста французским диктором будет слышен французский акцент.
  • Поддержка людей с проблемами речи, терапевтические приложения, образовательные дополнения. Livox — ИИ-приложение для устройств альтернативной и дополненной коммуникации помогает людям с проблемами в общении. Используя Voice Engine, Livox предложит немым людям уникальные, нероботозированные голоса. Пользователь может выбрать наиболее подходящий ему голос, который будет говорить на разных языках.
  • Помощь в восстановлении голоса при внезапных и дегенеративных нарушениях речи. Институт Нейронаук Нормана Принца (NPNI) проводит пилотную программу помощи людям с онкологическими или неврологическими нарушениями речи. Благодаря способности Voice Engine воcпроизводить речь по 15-секундному образцу, доктора Фатима Мирза (Fatima Mirza), Рохаид Али (Rohaid Ali) и Константина Свокос (Konstantina Svokos) воспользовались аудиозаписью из видеоролика для школьного проекта и восстановили голос молодой пациентки с проблемами речи из-за сосудистой опухоли мозга.

Партнёры OpenAI согласились с правилами использования технологии, запрещающими с её помощью выдавать себя за другого человека, чего не скажешь о возможных злоумышленниках, всё чаще использующих нейросетевые технологии в преступных целях.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Китайские разработчики за полгода вложили в рекламу в RuStore больше, чем за весь прошлый год 2 ч.
Mistral добавила в Le Chat функции конкурентов: поиск, редактирование фото и мультиязычность 2 ч.
Илон Маск получил больше времени на подготовку к судебному заседанию по делу о покупке Twitter 2 ч.
Консорциум Unicode утвердил новые эмодзи — в их числе снежный человек и яблочный огрызок 3 ч.
OpenAI представила агента в ChatGPT, который управляет ПК и выполняет поручения 4 ч.
Самостоятельный аддон Unfinished Business для RoboCop: Rogue City разочаровал критиков, а в Steam заслужил больше 90 % положительных отзывов 11 ч.
Легендарный турнир, знакомые персонажи и фаталити: вышел первый полноценный трейлер фильма «Мортал Комбат 2» 13 ч.
Adobe Firefly научился добавлять звуковое сопровождение к генерируемым ИИ видео 14 ч.
Netflix запустила в производство «неопровержимый» сериал по Assassin’s Creed — первые подробности 14 ч.
Telegram начал процесс приземления в России 15 ч.
Faraday Future напомнила о своём существовании анонсом электрического минивэна с дисплеем вместо радиаторной решётки 53 мин.
Вкалывают роботы: UBTech показала технологию автоматической замены батарей, которая позволит роботам трудиться без остановки 3 ч.
HP Inc сама займётся демонстрацией рекламы на своих ноутбуках и ПК 5 ч.
Новая статья: Обзор игрового QD-OLED 4K-монитора Gigabyte MO32U: снова в яблочко 10 ч.
Исторической стыковке кораблей «Союз» и «Аполлон» на орбите Земли исполнилось 50 лет 11 ч.
Meta и акционеры заключили мировое соглашение по иску на $8 млрд из-за утечек данных Facebook 12 ч.
Самые дорогие процессоры для ПК: AMD раскрыла цены Threadripper PRO 9000WX 13 ч.
«Степлер-убийцу» консолей Switch 2 продали на аукционе за $250 000  вместе с первой жертвой 14 ч.
Самый большой марсианский метеорит на Земле ушёл с молотка за $5,3 миллиона 16 ч.
Бразилия потратит $4,2 млрд на развитие ИИ и хочет построить один из мощнейших в мире суперкомпьютеров 16 ч.