Сегодня 07 марта 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI открыла речевой ИИ из ChatGPT для сторонних разработчиков — ждём вала говорящих приложений

Компания OpenAI представила новые возможности для упрощения процесса создания приложений на основе искусственного интеллекта. Теперь разработчики могут задействовать работающий в режиме онлайн инструмент для создания голосовых программных решений на базе ИИ, используя единый набор инструкций.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Большую часть дохода OpenAI получает от предприятий, которые используют нейросети компании для создания собственных ИИ-приложений. Поэтому расширение возможностей по созданию таких продуктов является вполне оправданным шагом на фоне обостряющейся борьбы в сфере ИИ с такими компаниями, как Google, которая внедряет в свои продукты алгоритмы, способные обрабатывать разные типы информации, включая текст, изображения и видео.

Процесс создания голосовых помощников требует от разработчиков прохождения как минимум трёх этапов: преобразование аудио в текст, обработка запроса и генерация текстового ответа на него, а также преобразование полученного ответа в аудио. В рамках внедрения новых возможностей по созданию голосовых ИИ-приложений OpenAI представила инструмент тонкой настройки больших языковых моделей после завершения этапа обучения. Такой подход позволит повысить качество ответов, которые генерируют создаваемые разработчиками алгоритмы в ответы на запросы в текстовом формате и с использованием изображений. Этап точной настройки может сопровождаться обратной связью от людей, которые проводят оценку того, насколько качественные ответы даёт алгоритм.

В OpenAI считают, что использование изображений для точной настройки моделей даст разработчикам более широкие возможности для повышения качества понимания ИИ-алгоритмами того, что демонстрируется на изображениях. Созданные таким образом приложения могут выступать, например, в качестве расширенного поиска по визуальным элементам. В дополнение к этому OpenAI представила инструмент, который позволит меньшим ИИ-моделям учиться на более крупных моделях, а также «Быстрое кэширование», которое существенно сократит затраты на разработку благодаря повторному использованию фрагментов текста, ранее уже обработанных алгоритмом. Все представленные нововведения уже тестируются с привлечением ограниченного числа клиентов OpenAI.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Anthropic запустила платформу по продаже приложений, построенных на базе её моделей — по образцу Amazon 2 ч.
OpenAI представила ИИ-агента Codex Security, который сам находит и закрывает «дыры» в ПО 2 ч.
Новая статья: Resident Evil Requiem — два шага вперёд, три назад. Рецензия 8 ч.
Nintendo подала в суд на правительство США и потребовала возместить ущерб от пошлин Трампа — «с процентами» 10 ч.
Брутфорс уходит в прошлое: Cloudflare назвала ИИ и дипфейки главной проблемой года 10 ч.
Спецслужбы США и Европола накрыли LeakBase — один из крупнейших хакерских форумов в мире с 142 000 участников 11 ч.
«Получилось немного обиднее, чем задумывалось»: авторы Slay the Spire 2 представить не могли, что обгонят Marathon по пиковому онлайну в Steam 12 ч.
Вышла новая демоверсия Fallout: The New West — фанатского ремейка отменённой Fallout 3 на движке Fallout: New Vegas 13 ч.
Google назвала лучшие ИИ-модели для создания Android-приложений — лидером оказалась Gemini 14 ч.
Гендиректор Microsoft назвал Intel и Apple важными составляющими успеха рэдмондского гиганта 14 ч.
Власти США запретят закупку отдельных китайских полупроводниковых изделий для государственных нужд 12 мин.
За ближайшие три года глава Google сможет заработать $692 млн, если бизнес беспилотных такси Waymo пойдёт в гору 35 мин.
Samsung собирается предложить пользователям смартфонов Galaxy инструмент для вайб-кодинга 2 ч.
Термодинамику научили вычислять — энергоэффективность улетела в космос 8 ч.
Китайцы учат роботов «думать» со скоростью света — кремниевая фотоника набирает обороты 10 ч.
Samsung до конца года выпустит умные очки с камерой и ИИ, которые будут понимать, куда смотрит пользователь 11 ч.
Акции Marvell подскочили после отчёта о росте продаж чипов для ИИ ЦОД 15 ч.
Инференс-нагрузки Perplexity прописались в облаке CoreWeave 15 ч.
256 Гбайт памяти в Mini-ITX — ASRock наделила поддержкой CQDIMM DDR5-7400 плату Z890I Nova WiFi R2.0 16 ч.
LG разработала модульные ИИ ЦОД AI Box, из которых соберёт 60-МВт дата-центр в Пусане 16 ч.