Сегодня 21 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI открыла речевой ИИ из ChatGPT для сторонних разработчиков — ждём вала говорящих приложений

Компания OpenAI представила новые возможности для упрощения процесса создания приложений на основе искусственного интеллекта. Теперь разработчики могут задействовать работающий в режиме онлайн инструмент для создания голосовых программных решений на базе ИИ, используя единый набор инструкций.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Большую часть дохода OpenAI получает от предприятий, которые используют нейросети компании для создания собственных ИИ-приложений. Поэтому расширение возможностей по созданию таких продуктов является вполне оправданным шагом на фоне обостряющейся борьбы в сфере ИИ с такими компаниями, как Google, которая внедряет в свои продукты алгоритмы, способные обрабатывать разные типы информации, включая текст, изображения и видео.

Процесс создания голосовых помощников требует от разработчиков прохождения как минимум трёх этапов: преобразование аудио в текст, обработка запроса и генерация текстового ответа на него, а также преобразование полученного ответа в аудио. В рамках внедрения новых возможностей по созданию голосовых ИИ-приложений OpenAI представила инструмент тонкой настройки больших языковых моделей после завершения этапа обучения. Такой подход позволит повысить качество ответов, которые генерируют создаваемые разработчиками алгоритмы в ответы на запросы в текстовом формате и с использованием изображений. Этап точной настройки может сопровождаться обратной связью от людей, которые проводят оценку того, насколько качественные ответы даёт алгоритм.

В OpenAI считают, что использование изображений для точной настройки моделей даст разработчикам более широкие возможности для повышения качества понимания ИИ-алгоритмами того, что демонстрируется на изображениях. Созданные таким образом приложения могут выступать, например, в качестве расширенного поиска по визуальным элементам. В дополнение к этому OpenAI представила инструмент, который позволит меньшим ИИ-моделям учиться на более крупных моделях, а также «Быстрое кэширование», которое существенно сократит затраты на разработку благодаря повторному использованию фрагментов текста, ранее уже обработанных алгоритмом. Все представленные нововведения уже тестируются с привлечением ограниченного числа клиентов OpenAI.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
В Екатеринбурге прошло PG BootCamp Russia — четвёртое официальное мероприятие российского сообщества PostgreSQL 2 ч.
Бета-версия футбольного экшена Rematch от создателей Sifu стала хитом — тестирование привлекло более миллиона игроков 3 ч.
Дуров раскрыл, что может его заставить закрыть Telegram 3 ч.
ОАЭ первой в мире привлечёт ИИ к написанию законов 3 ч.
Instagram начнёт выявлять аккаунты подростков с помощью ИИ — обмануть систему не получится 5 ч.
Valorant выйдет на мобильных устройствах, но пока только в Китае 5 ч.
OpenAI заподозрили в манипуляциях с тестами мощной ИИ-модели o3 7 ч.
Cyberpunk 2077 стала первой подтверждённой игрой для Switch 2 с поддержкой DLSS, но есть нюанс 7 ч.
Олдскульная стратегия Tempest Rising в духе Command & Conquer из-за ошибки вышла на неделю раньше запланированного — издатель смирился с этим 8 ч.
Европейский регулятор случайно раскрыл планы Ubisoft на Assassin’s Creed Shadows для Nintendo Switch 2 9 ч.
Thermaltake выпустила доступные кулеры UX400 для процессоров с TDP до 240 Вт 12 мин.
В 2024 году дата-центры Apple потребили 2,5 ТВт∙ч «зелёного» электричества, но есть нюанс 38 мин.
Nothing рассекретила дизайн смартфона CMF Phone 2 Pro в преддверии анонса 44 мин.
«Голосовое протезирование с ИИ» превратит мозговые волны немых людей в беглую речь 46 мин.
Смартфоны получат этикетки с данными об автономности и не только — ЕС вводит экомаркировку 2 ч.
Для российских исследователей будут созданы суперкомпьютерный центр и роботизированные лаборатории 3 ч.
«АвтоВАЗ» взял на работу поющего робота-тележку «Антонину» 3 ч.
Deloitte: АЭС смогут обеспечить 10 % будущего спроса ЦОД США на электроэнергию, но строить их придётся быстрее 3 ч.
Oppo представила недорогой смартфон Oppo K13 со Snapdragon 6 Gen 4, 50-Мп камерой и батарей на 7000 мА·ч 3 ч.
«Чудо-долина» для ИИ — в Канаде построят крупнейший в мире 7,5-ГВт ЦОД с питанием от природного газа 3 ч.