Сегодня 22 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI открыла доступ к гиперреалистичному голосу ChatGPT некоторым платным пользователям

OpenAI начала развёртывать голосовой интерфейс Advanced Voice Mode для сервиса ChatGPT — доступ к гиперреалистичным диалогам с GPT-4o получило небольшое число подписчиков ChatGPT Plus. Разработчик пообещал, что к осени новой функцией смогут пользоваться все обладатели платной подписки.

 Источник изображения: Mariia Shalabaieva / unsplash.com

Источник изображения: Mariia Shalabaieva / unsplash.com

Впервые OpenAI продемонстрировала голосовой формат GPT-4o в мае — тогда эта функция поразила аудиторию не только способностью давать быстрые ответы, но и сходством одного из голосов с голосом Скарлетт Йоханссон (Scarlett Johansson). Актриса заявила, что отказала главе компании Сэму Альтману (Sam Altman) в праве использовать её голос для этих целей; после чего ей пришлось обратиться к юристам для защиты своих интересов, и в OpenAI отказались от своих намерений, чтобы не доводить дело до конфликта. В июне компания сообщила, что отложит выпуск голосового интерфейса, чтобы завершить разработку мер безопасности.

Анонсированные ранее функции ИИ-помощника, такие как поддержка видео и демонстрация экрана, на этапе альфа-тестирования доступны не будут, а появятся «позже». Пока пользователям придётся ограничиться голосовым взаимодействием. Ранее для реализации этой функции OpenAI подключала три модели ИИ: одну для преобразования голоса в текст, вторую (GPT-4) для собственно обработки запросов, а третью для преобразования текстового ответа ChatGPT в голос. Обновлённая GPT-4o является мультимодальной — она решает все эти задачи самостоятельно, обеспечивая минимальную задержку. Модель также способна распознавать в голосе пользователя эмоциональные интонации, определяя, например, грусть или волнение, она также знает, когда человек поёт.

 Источник изображения: Growtika / unsplash.com

Источник изображения: Growtika / unsplash.com

OpenAI будет развёртывать голосовой интерфейс ChatGPT постепенно, чтобы внимательно следить, как он используется в действительности. Включённые в группу альфа-тестирования пользователи получат уведомление через приложение ChatGPT, за которым последует письмо с инструкциями по работе с новыми функциями. К настоящему моменту голосовые возможности GPT-4o протестированы более чем сотней членов закрытой команды тестирования Red Team, говорящих на 45 языках.

Голосовой режим ChatGPT будет ограничен четырьмя голосами: Juniper, Breeze, Cove и Ember, которые были созданы при участии актёров. Голос Sky, который сравнивали с голосом Скарлетт Йоханссон, компания исключила. OpenAI также сообщила, что установила фильтры для блокировки запросов на создание музыки и других материалов, которые могут быть защищены авторским правом — для стартапов Suno и Udio это закончилось судебными исками от крупных музыкальных издателей.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Госдума окончательно запретила россиянам искать экстремистские материалы в интернете 20 мин.
Один из самых драматичных сюжетных поворотов Clair Obscur: Expedition 33 появился в игре благодаря шутке 2 ч.
Сериал по Mass Effect в надёжных руках: производством шоу займётся команда «Фоллаут» 3 ч.
«Нейроаналитик» «Яндекса» ускорит анализ и визуализацию данных 4 ч.
«Т-Банк» выпустил ИИ-модель распознавания речи с открытым исходным кодом — T-one 4 ч.
Copilot+PC на чипах AMD и Intel наконец получили новые ИИ-функции — на три месяца позже, чем Snapdragon X 6 ч.
Electronic Arts анонсировала открытую «бету» Battlefield 6, а в приложении EA App засветились её подробности 6 ч.
Плохо прогнозируемый эффект от применения ИИ — один из основных барьеров, сдерживающих его использование в промышленности 7 ч.
ИИ-модель Google Gemini получила золотую медаль Международной математической олимпиады 8 ч.
OpenAI раскрыла масштабы популярности ChatGPT: каждый день бот получает 2,5 млрд запросов 17 ч.
Два миллиона GPU и 4,5 ГВт: Oracle и OpenAI договорились построить в США дата-центры для ИИ 30 мин.
Galax GeForce RTX 5080 NOX OC Black Edition получила зеркальную панель и магнитный кожух 37 мин.
Устройства Google Home и Nest перестали понимать команды — и никто не знает почему 40 мин.
Учёные впервые увидели звезду-компаньона у Бетельгейзе — жить ей осталось недолго 44 мин.
Samsung Display оснастит флагманские Mercedes-Maybach огромными OLED-дисплеями 49 мин.
«Яндекс» начал продажи умной колонки «Станции Мини 3 Про» с модульной конструкцией и ценой 12 тыс. рублей 3 ч.
AAEON выпустила индустриальный одноплатный компьютер PICO-TWL4 на базе Intel Twin Lake 3 ч.
Nokia попытается ещё раз вернуться на рынок смартфонов с новым производителем 4 ч.
Tesla отпраздновала выпуск 3 миллионов Model 3 — по одной машине каждые 90 секунд 4 ч.
В NASA рассказали, как спасли камеру зонда «Юнона» в окрестностях Юпитера 4 ч.