Сегодня 28 марта 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI представила ИИ Voice Engine, который клонирует ваш голос по 15-секундному образцу

OpenAI представила результаты предварительного тестирования ИИ-модели Voice Engine, которая на основе 15-секундного образца может реалистично озвучить введённый текст, стараясь максимально точно передать голос и речевые особенности говорящего.

 Источник изображения: Unsplash, Igor Omilaev

Источник изображения: Unsplash, Igor Omilaev

Первые наработки Voice Engine появились в конце 2022 года и использовались в API для преобразования текста в речь, а также совместно с ChatGPT Voice and Read Aloud. В OpenAI осознают последствия возможного злоупотребления технологией синтезированных голосов, поэтому надеется получить отклик от общества по возможным опасностям и сферам применения. Что касается последних, с прошлого года OpenAI предложила протестировать Voice Engine небольшой группе партнёров — и получила примеры использования:

  • Помощь имеющим проблемы с чтением людям и детям посредством естественных, эмоциональных и разнообразных голосов. Так, специализирующаяся на образовательных технологиях компания Age of Learning использует Voice Engine для озвучки контента, а также, совместно с GPT-4, персонализированных ответов учащимся в реальном времени.
  • Перевод контента, например, видеороликов и подкастов, позволит авторам и компаниям расширить аудиторию по всему миру, сообщая информацию собственными голосами и голосами сотрудников. Одним из первопроходцев стала компания HeyGen — ИИ-платформа визуального повествования для корпоративных клиентов, предназначенная для создания человекоподобных аватаров в различных целях — от продуктового маркетинга до торговых предложений. Voice Engine сохраняет родной акцент диктора, поэтому при озвучении английского текста французским диктором будет слышен французский акцент.
  • Поддержка людей с проблемами речи, терапевтические приложения, образовательные дополнения. Livox — ИИ-приложение для устройств альтернативной и дополненной коммуникации помогает людям с проблемами в общении. Используя Voice Engine, Livox предложит немым людям уникальные, нероботозированные голоса. Пользователь может выбрать наиболее подходящий ему голос, который будет говорить на разных языках.
  • Помощь в восстановлении голоса при внезапных и дегенеративных нарушениях речи. Институт Нейронаук Нормана Принца (NPNI) проводит пилотную программу помощи людям с онкологическими или неврологическими нарушениями речи. Благодаря способности Voice Engine воcпроизводить речь по 15-секундному образцу, доктора Фатима Мирза (Fatima Mirza), Рохаид Али (Rohaid Ali) и Константина Свокос (Konstantina Svokos) воспользовались аудиозаписью из видеоролика для школьного проекта и восстановили голос молодой пациентки с проблемами речи из-за сосудистой опухоли мозга.

Партнёры OpenAI согласились с правилами использования технологии, запрещающими с её помощью выдавать себя за другого человека, чего не скажешь о возможных злоумышленниках, всё чаще использующих нейросетевые технологии в преступных целях.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Nintendo раскрыла дату выхода экранизации The Legend of Zelda, но подробности фильма держит в секрете 31 мин.
Россия заняла третье место в мире по объёму вредоносного бот-трафика 2 ч.
Android Auto получила полную поддержку игр для Android, но на ходу они запускаться не будут 2 ч.
Не всё потеряно: студия Nightdive обнадёжила фанатов, заждавшихся новостей о System Shock 3 5 ч.
Разработчики Warhammer 40,000: Space Marine 2 пообещали, что «никто не забрасывает игру» ради Space Marine 3 5 ч.
Mozilla закрыла уязвимость Firefox, аналогичную обнаруженной ранее в Google Chrome 6 ч.
Полицейский экшен The Precinct с элементами первых GTA не заставит долго ждать — дата выхода и геймплейный трейлер 7 ч.
«Думал, не доживу»: первый за восемь лет полноценный трейлер симулятора школы магии Witchbrook очаровал игроков 8 ч.
Сюжетное дополнение к Hogwarts Legacy стало жертвой реструктуризации Warner Bros. Games 9 ч.
Facebook вернул свой 2007-й: запущена лента только с публикациями друзей, без алгоритмического мусора 18 ч.
Crusoe привлекла $225 млн на закупку чипов NVIDIA для развития облачной ИИ-инфраструктуры 12 мин.
Разработчик легендарных смарт-часов Pebble раскрыл подробности о новых часах Core 2 Duo и Core Time 2 21 мин.
Немецкий ретейлер начал продавать слегка б/у GeForce RTX 5090 с дефектным GPU, но за полную стоимость 32 мин.
Разработана перчатка для передачи разных ощущений в виртуальной реальности 53 мин.
Gigabyte выпустила плату B760M Aorus Elite WIFI6E Gen5 с разъёмом PCIe 5.0 x16 и поддержкой Wi-Fi 6E 2 ч.
Public Power Corp (PPC) представила план строительства ЦОД в старых угольных шахтах Греции 3 ч.
Космический телескоп «Гайя» прекратил работу — его пытались выключить с января, но он сопротивлялся 3 ч.
МТС протестируют прямое подключение обычных смартфонов к спутникам в России 3 ч.
Китайцы готовы обогнать Tesla и Boston Dynamics в наполнении мира человекоподобными роботами 4 ч.
SanDisk выпустила внешний SSD в стиле приставки PlayStation 5 4 ч.