Сегодня 08 октября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI открыла доступ к гиперреалистичному голосу ChatGPT некоторым платным пользователям

OpenAI начала развёртывать голосовой интерфейс Advanced Voice Mode для сервиса ChatGPT — доступ к гиперреалистичным диалогам с GPT-4o получило небольшое число подписчиков ChatGPT Plus. Разработчик пообещал, что к осени новой функцией смогут пользоваться все обладатели платной подписки.

 Источник изображения: Mariia Shalabaieva / unsplash.com

Источник изображения: Mariia Shalabaieva / unsplash.com

Впервые OpenAI продемонстрировала голосовой формат GPT-4o в мае — тогда эта функция поразила аудиторию не только способностью давать быстрые ответы, но и сходством одного из голосов с голосом Скарлетт Йоханссон (Scarlett Johansson). Актриса заявила, что отказала главе компании Сэму Альтману (Sam Altman) в праве использовать её голос для этих целей; после чего ей пришлось обратиться к юристам для защиты своих интересов, и в OpenAI отказались от своих намерений, чтобы не доводить дело до конфликта. В июне компания сообщила, что отложит выпуск голосового интерфейса, чтобы завершить разработку мер безопасности.

Анонсированные ранее функции ИИ-помощника, такие как поддержка видео и демонстрация экрана, на этапе альфа-тестирования доступны не будут, а появятся «позже». Пока пользователям придётся ограничиться голосовым взаимодействием. Ранее для реализации этой функции OpenAI подключала три модели ИИ: одну для преобразования голоса в текст, вторую (GPT-4) для собственно обработки запросов, а третью для преобразования текстового ответа ChatGPT в голос. Обновлённая GPT-4o является мультимодальной — она решает все эти задачи самостоятельно, обеспечивая минимальную задержку. Модель также способна распознавать в голосе пользователя эмоциональные интонации, определяя, например, грусть или волнение, она также знает, когда человек поёт.

 Источник изображения: Growtika / unsplash.com

Источник изображения: Growtika / unsplash.com

OpenAI будет развёртывать голосовой интерфейс ChatGPT постепенно, чтобы внимательно следить, как он используется в действительности. Включённые в группу альфа-тестирования пользователи получат уведомление через приложение ChatGPT, за которым последует письмо с инструкциями по работе с новыми функциями. К настоящему моменту голосовые возможности GPT-4o протестированы более чем сотней членов закрытой команды тестирования Red Team, говорящих на 45 языках.

Голосовой режим ChatGPT будет ограничен четырьмя голосами: Juniper, Breeze, Cove и Ember, которые были созданы при участии актёров. Голос Sky, который сравнивали с голосом Скарлетт Йоханссон, компания исключила. OpenAI также сообщила, что установила фильтры для блокировки запросов на создание музыки и других материалов, которые могут быть защищены авторским правом — для стартапов Suno и Udio это закончилось судебными исками от крупных музыкальных издателей.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Apple высмеяла Windows 11 в 8-минутном рекламном ролике про «синий экран смерти» 4 мин.
Activision отметит релиз Battlefield 6 неделей бесплатного доступа к Call of Duty: Black Ops 6 39 мин.
Страховые компании отказались работать с OpenAI и Anthropic — риски от внедрения ИИ не поддаются оценке 2 ч.
Claude Sonnet 4.5 научилась понимать намерения людей и «подгоняет» ответы в тестах 2 ч.
С начала года северокорейские хакеры украли криптовалюты на $2 млрд — это рекорд 4 ч.
Vampire Survivors получит большое обновление с онлайн-кооперативом и ответом на «животрепещущий вопрос, который нам задавали тысячи раз» 5 ч.
Atari уберёт классическую версию System Shock 2 из продажи в Steam, оставив только более дорогой ремастер 6 ч.
«Увидимся на поле боя, господа»: взрывной релизный трейлер Battlefield 6 готовит игроков к тотальной войне 6 ч.
Steam и Riot Games отключили миллионы игроков из-за мощнейшей DDoS-атаки 8 ч.
Google представила модель Gemini, которая заполняет в браузере формы и играет в 2048 8 ч.
Техногиганты США приостановили развитие ЦОД в Индии, хотя ранее обещали вложить в них миллиарды долларов 14 мин.
Ловкость рук и никакого мошенничества: мегасделки OpenAI на $1 трлн сводятся к передаче денег по кругу 22 мин.
Шведский консорциум изучит создание первых в стране ЦОД с питанием от SMR 29 мин.
Завтра Intel расскажет о процессорах Panther Lake, выпускаемых по технологии 18A 2 ч.
На Китай приходится более половины мировых инвестиций в полупроводниковые стартапы 2 ч.
Слухи о дороговизне 2-нм чипов, выпускаемых TSMC, оказались сильно преувеличены 2 ч.
До 16 ядер Zen 5 в AM5: AMD представила чипы Ryzen Embedded 9000 3 ч.
Вышел одноплатный компьютер Arduino UNO Q на платформе Qualcomm для роботов и IoT-устройств 3 ч.
Мультимедийное будущее наступило: как современные проекторы захватили гостиные 3 ч.
Китай продолжает закупать импортное оборудование для производства чипов на десятки миллиардов долларов 4 ч.