Сегодня 02 октября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI открыла речевой ИИ из ChatGPT для сторонних разработчиков — ждём вала говорящих приложений

Компания OpenAI представила новые возможности для упрощения процесса создания приложений на основе искусственного интеллекта. Теперь разработчики могут задействовать работающий в режиме онлайн инструмент для создания голосовых программных решений на базе ИИ, используя единый набор инструкций.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Большую часть дохода OpenAI получает от предприятий, которые используют нейросети компании для создания собственных ИИ-приложений. Поэтому расширение возможностей по созданию таких продуктов является вполне оправданным шагом на фоне обостряющейся борьбы в сфере ИИ с такими компаниями, как Google, которая внедряет в свои продукты алгоритмы, способные обрабатывать разные типы информации, включая текст, изображения и видео.

Процесс создания голосовых помощников требует от разработчиков прохождения как минимум трёх этапов: преобразование аудио в текст, обработка запроса и генерация текстового ответа на него, а также преобразование полученного ответа в аудио. В рамках внедрения новых возможностей по созданию голосовых ИИ-приложений OpenAI представила инструмент тонкой настройки больших языковых моделей после завершения этапа обучения. Такой подход позволит повысить качество ответов, которые генерируют создаваемые разработчиками алгоритмы в ответы на запросы в текстовом формате и с использованием изображений. Этап точной настройки может сопровождаться обратной связью от людей, которые проводят оценку того, насколько качественные ответы даёт алгоритм.

В OpenAI считают, что использование изображений для точной настройки моделей даст разработчикам более широкие возможности для повышения качества понимания ИИ-алгоритмами того, что демонстрируется на изображениях. Созданные таким образом приложения могут выступать, например, в качестве расширенного поиска по визуальным элементам. В дополнение к этому OpenAI представила инструмент, который позволит меньшим ИИ-моделям учиться на более крупных моделях, а также «Быстрое кэширование», которое существенно сократит затраты на разработку благодаря повторному использованию фрагментов текста, ранее уже обработанных алгоритмом. Все представленные нововведения уже тестируются с привлечением ограниченного числа клиентов OpenAI.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Сэма Альтмана поймали за руку при попытке украсть видеокарту — это самое популярное ИИ-видео в Sora 31 мин.
YouTube тестирует новый интерфейс мобильного приложения — реакция пользователей ожидаемо негативная 47 мин.
Суд США разрешил прокуратуре взломать Telegram, но у неё не получилось 3 ч.
Павел Дуров открыл в Казахстане лабораторию ИИ и пообещал новые проекты 3 ч.
ГК Softline приобрела контрольную долю в BeringPro, чтобы усилить консалтинговое направление 3 ч.
Konami отобрала у покупателей Silent Hill f в Steam бонусы, которые случайно им подарила — фанаты требуют починить оптимизацию 4 ч.
Bethesda анонсировала самое крупное обновление для Fallout 76 с 2020 года — в Burning Springs появится звезда сериала «Фоллаут» 4 ч.
Instagram не подслушивает пользователей через смартфоны, заверил глава соцсети 5 ч.
«К сожалению, олдскульного Painkiller здесь нет»: игроки раскритиковали очередной трейлер кооперативного перезапуска культовой серии шутеров 6 ч.
«Выживательное» приключение The Last Caretaker о спасающем человечество роботе получило дату релиза в раннем доступе 8 ч.
Дата-центр радиотелескопа Square Kilometre Array (SKA) «засадили» сразу в две клетки Фарадея для защиты сверхчувствительных антенн от радиопомех 2 ч.
В Гарварде создали систему для «вечной» работы квантового компьютера 2 ч.
$1,5 млрд за неделю: Nscale получила ещё $443 млн инвестиций, едва закрыв прошлый раунд финансирования на $1,1 млрд 2 ч.
Meta приобрела Rivos, разработчика RISC-V-ускорителей Rivos, совместимых с CUDA 4 ч.
Dell представила сервер PowerEdge XR8720t для инфраструктур Cloud RAN 5 ч.
Китай ограничил использование оборудования Nokia и Ericsson в сетях связи 5 ч.
Anker скупает у пользователей камер Eufy видео краж и угонов — инсценировки тоже подходят 5 ч.
Илон Маск стал первым человеком с состоянием в $500 млрд — столько же стоит OpenAI 5 ч.
Google показала умную колонку Home со свежим дизайном и поддержкой Gemini AI по цене $99 5 ч.
Google столкнулась с рекордным ростом акций за 20 лет благодаря ИИ — плюс 38 % за квартал 6 ч.