Сегодня 14 октября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI открыла речевой ИИ из ChatGPT для сторонних разработчиков — ждём вала говорящих приложений

Компания OpenAI представила новые возможности для упрощения процесса создания приложений на основе искусственного интеллекта. Теперь разработчики могут задействовать работающий в режиме онлайн инструмент для создания голосовых программных решений на базе ИИ, используя единый набор инструкций.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Большую часть дохода OpenAI получает от предприятий, которые используют нейросети компании для создания собственных ИИ-приложений. Поэтому расширение возможностей по созданию таких продуктов является вполне оправданным шагом на фоне обостряющейся борьбы в сфере ИИ с такими компаниями, как Google, которая внедряет в свои продукты алгоритмы, способные обрабатывать разные типы информации, включая текст, изображения и видео.

Процесс создания голосовых помощников требует от разработчиков прохождения как минимум трёх этапов: преобразование аудио в текст, обработка запроса и генерация текстового ответа на него, а также преобразование полученного ответа в аудио. В рамках внедрения новых возможностей по созданию голосовых ИИ-приложений OpenAI представила инструмент тонкой настройки больших языковых моделей после завершения этапа обучения. Такой подход позволит повысить качество ответов, которые генерируют создаваемые разработчиками алгоритмы в ответы на запросы в текстовом формате и с использованием изображений. Этап точной настройки может сопровождаться обратной связью от людей, которые проводят оценку того, насколько качественные ответы даёт алгоритм.

В OpenAI считают, что использование изображений для точной настройки моделей даст разработчикам более широкие возможности для повышения качества понимания ИИ-алгоритмами того, что демонстрируется на изображениях. Созданные таким образом приложения могут выступать, например, в качестве расширенного поиска по визуальным элементам. В дополнение к этому OpenAI представила инструмент, который позволит меньшим ИИ-моделям учиться на более крупных моделях, а также «Быстрое кэширование», которое существенно сократит затраты на разработку благодаря повторному использованию фрагментов текста, ранее уже обработанных алгоритмом. Все представленные нововведения уже тестируются с привлечением ограниченного числа клиентов OpenAI.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Microsoft представила первый ИИ-генератор изображений собственной разработки — MAI-Image-1 18 мин.
«Базис» и MIND Software представляют первое в России коробочное HCI-решение для ускорения цифровой трансформации бизнеса 2 ч.
«Базис» и MIND Software представляют первое в России коробочное HCI-решение для ускорения цифровой трансформации бизнеса 2 ч.
Devolver объявила дату выхода Forestrike — тактического кунг-фу-экшена, где каждая смерть приближает к победе в бою, который ещё не начался 3 ч.
В популярнейшем архиваторе 7-Zip обнаружены две уязвимости, позволяющие удалённо взламывать ПК 12 ч.
Microsoft затруднит доступ к режиму Internet Explorer в Edge из-за атак хакеров — уязвимости останутся без патчей 13 ч.
Painkiller, «Герои Меча и Магии», новый «Мор» и многое другое: в Steam стартовал фестиваль «Играм быть» с тысячами демоверсий 14 ч.
В поиске Google теперь можно скрывать рекламу — но посмотреть её всё равно придётся 14 ч.
Apple TV+ превратился в просто Apple TV — стриминговый сервис ждёт «яркая новая идентичность» 14 ч.
Новый геймплейный трейлер раскрыл дату релиза Pathologic 3 — в 2025 году игра всё-таки не выйдет 15 ч.