Сегодня 18 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI открыла доступ к гиперреалистичному голосу ChatGPT некоторым платным пользователям

OpenAI начала развёртывать голосовой интерфейс Advanced Voice Mode для сервиса ChatGPT — доступ к гиперреалистичным диалогам с GPT-4o получило небольшое число подписчиков ChatGPT Plus. Разработчик пообещал, что к осени новой функцией смогут пользоваться все обладатели платной подписки.

 Источник изображения: Mariia Shalabaieva / unsplash.com

Источник изображения: Mariia Shalabaieva / unsplash.com

Впервые OpenAI продемонстрировала голосовой формат GPT-4o в мае — тогда эта функция поразила аудиторию не только способностью давать быстрые ответы, но и сходством одного из голосов с голосом Скарлетт Йоханссон (Scarlett Johansson). Актриса заявила, что отказала главе компании Сэму Альтману (Sam Altman) в праве использовать её голос для этих целей; после чего ей пришлось обратиться к юристам для защиты своих интересов, и в OpenAI отказались от своих намерений, чтобы не доводить дело до конфликта. В июне компания сообщила, что отложит выпуск голосового интерфейса, чтобы завершить разработку мер безопасности.

Анонсированные ранее функции ИИ-помощника, такие как поддержка видео и демонстрация экрана, на этапе альфа-тестирования доступны не будут, а появятся «позже». Пока пользователям придётся ограничиться голосовым взаимодействием. Ранее для реализации этой функции OpenAI подключала три модели ИИ: одну для преобразования голоса в текст, вторую (GPT-4) для собственно обработки запросов, а третью для преобразования текстового ответа ChatGPT в голос. Обновлённая GPT-4o является мультимодальной — она решает все эти задачи самостоятельно, обеспечивая минимальную задержку. Модель также способна распознавать в голосе пользователя эмоциональные интонации, определяя, например, грусть или волнение, она также знает, когда человек поёт.

 Источник изображения: Growtika / unsplash.com

Источник изображения: Growtika / unsplash.com

OpenAI будет развёртывать голосовой интерфейс ChatGPT постепенно, чтобы внимательно следить, как он используется в действительности. Включённые в группу альфа-тестирования пользователи получат уведомление через приложение ChatGPT, за которым последует письмо с инструкциями по работе с новыми функциями. К настоящему моменту голосовые возможности GPT-4o протестированы более чем сотней членов закрытой команды тестирования Red Team, говорящих на 45 языках.

Голосовой режим ChatGPT будет ограничен четырьмя голосами: Juniper, Breeze, Cove и Ember, которые были созданы при участии актёров. Голос Sky, который сравнивали с голосом Скарлетт Йоханссон, компания исключила. OpenAI также сообщила, что установила фильтры для блокировки запросов на создание музыки и других материалов, которые могут быть защищены авторским правом — для стартапов Suno и Udio это закончилось судебными исками от крупных музыкальных издателей.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Lenovo обвинили в массовой передаче данных американцев в Китай 5 ч.
Меньше галлюцинаций и миллионный контекст: Anthropic представила Sonnet 4.6 и она уже доступна бесплатно в Claude 7 ч.
Activision подтвердила дату смерти Call of Duty: Warzone Mobile — игру закроют спустя всего два года после запуска 8 ч.
Unity пообещала ИИ, который позволит создавать игры по текстовому описанию — вообще без программирования 10 ч.
Хакеры применили поддельные страницы CAPTCHA для распространения вирусов для Windows 10 ч.
Российский бизнес распробовал ИИ от Яндекса — потребление токенов за год выросло всемеро 10 ч.
Microsoft подтвердила релиз Kingdom Come: Deliverance 2 в Game Pass, а скоро в подписку добавят полное издание The Witcher 3: Wild Hunt 11 ч.
Microsoft обвинили в незаконном сборе голосовых данных в Teams в течение пяти лет 11 ч.
В ChatGPT появился «Режим блокировки» и маркировка повышенного риска для защиты важных данных 11 ч.
Resident Evil Requiem попала в руки первых игроков за десять дней до релиза — фанаты приготовились к утечкам 12 ч.
Apple готовится представить видеодомофон с Face ID и интеграцией с умным замком 3 мин.
Meta закупит миллионы ИИ-чипов у Nvidia, включая центральные процессоры 22 мин.
Новая статья: Обзор блока питания Formula V Line FV-1000PM 4 ч.
Следующая Google I/O пройдёт 19–20 мая — ожидаются анонсы, связанные с Gemini, Android и не только 5 ч.
Что-то на богатом: Dreame показала роскошный смартфон Aurora в золоте и драгоценных камнях 5 ч.
Новая статья: Обзор сервера iRU Rock G2212IG6 на базе Intel Xeon 6 6 ч.
Siri научат «видеть» мир: Apple форсирует разработку очков, кулона и AirPods со встроенными камерами 6 ч.
Tecno представила смартфоны Camon 50 и 50 Pro с чипами Helio G200, 50-Мп камерами и батареями на 6150 мА⋅ч 6 ч.
Китай вывел гуманоидных роботов на сцену главного новогоднего шоу страны — они показали своё кунг-фу 9 ч.
SK hynix предложила неоригинальный костыль для ускорения ИИ-моделей — гибридную архитектуру памяти HBM/HBF 10 ч.