Сегодня 28 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI открыла речевой ИИ из ChatGPT для сторонних разработчиков — ждём вала говорящих приложений

Компания OpenAI представила новые возможности для упрощения процесса создания приложений на основе искусственного интеллекта. Теперь разработчики могут задействовать работающий в режиме онлайн инструмент для создания голосовых программных решений на базе ИИ, используя единый набор инструкций.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Большую часть дохода OpenAI получает от предприятий, которые используют нейросети компании для создания собственных ИИ-приложений. Поэтому расширение возможностей по созданию таких продуктов является вполне оправданным шагом на фоне обостряющейся борьбы в сфере ИИ с такими компаниями, как Google, которая внедряет в свои продукты алгоритмы, способные обрабатывать разные типы информации, включая текст, изображения и видео.

Процесс создания голосовых помощников требует от разработчиков прохождения как минимум трёх этапов: преобразование аудио в текст, обработка запроса и генерация текстового ответа на него, а также преобразование полученного ответа в аудио. В рамках внедрения новых возможностей по созданию голосовых ИИ-приложений OpenAI представила инструмент тонкой настройки больших языковых моделей после завершения этапа обучения. Такой подход позволит повысить качество ответов, которые генерируют создаваемые разработчиками алгоритмы в ответы на запросы в текстовом формате и с использованием изображений. Этап точной настройки может сопровождаться обратной связью от людей, которые проводят оценку того, насколько качественные ответы даёт алгоритм.

В OpenAI считают, что использование изображений для точной настройки моделей даст разработчикам более широкие возможности для повышения качества понимания ИИ-алгоритмами того, что демонстрируется на изображениях. Созданные таким образом приложения могут выступать, например, в качестве расширенного поиска по визуальным элементам. В дополнение к этому OpenAI представила инструмент, который позволит меньшим ИИ-моделям учиться на более крупных моделях, а также «Быстрое кэширование», которое существенно сократит затраты на разработку благодаря повторному использованию фрагментов текста, ранее уже обработанных алгоритмом. Все представленные нововведения уже тестируются с привлечением ограниченного числа клиентов OpenAI.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
YouTube научился собирать персональную ленту видео по описанию 4 ч.
Google и CrowdStrike обезвредили ботнет Glassworm, два года атаковавший разработчиков открытого ПО 4 ч.
«Удивит и впечатлит людей»: инсайдеры раскрыли название, место анонса и дату выхода ремейка Rayman Legends 5 ч.
Avanpost открыла публичное тестирование облачного сервиса Avanpost Identity Cloud 5 ч.
Telegram в России оштрафовали в третий раз за месяц 7 ч.
Robinhood выпустила кредитку для ИИ-агентов, чтобы те могли оплачивать покупки за пользователей 7 ч.
Кодзима наконец покорил космос, но лишь в ИИ-рекламе для Prada 8 ч.
Спустя пять лет после анонса разработка новой Dragon Quest стартовала с нуля — первый трейлер и подробности Dragon Quest XII: Beyond Dreams 9 ч.
YouTube научился автоматически помечать видео, созданные с помощью ИИ 10 ч.
Большая игра в компактном формате: критики вынесли вердикт олдскульному приключению Mina the Hollower от создателей Shovel Knight 10 ч.
Valve возобновила продажи Steam Deck, но цена взлетела на сотни долларов 4 ч.
Китайский производитель памяти CXMT готовит крупнейшее за последние годы IPO, чтобы бросить вызов Samsung и Micron 5 ч.
Американский стартап в 1000 раз ускорил протипирование печатных плат — жидкий металл меняет разводку печатных плат почти мгновенно 7 ч.
Будущие смартфоны Huawei Mate 90 получат процессор Kirin на аналоге 3-нм техпроцесса 7 ч.
«Это не было запланировано»: Motorola признала скрытую подмену ссылок Amazon на своих смартфонах 7 ч.
Из-за ИИ-бума TSMC повысит цены на 3-нм чипы на 15 % в этом году и ещё на 10 % — в следующем 7 ч.
$800 млрд под угрозой: половине запланированных в США ЦОД угрожают стихийные бедствия 9 ч.
MediaTek представила чип Dimensity 8550 для мощных смартфонов среднего уровня — он поддерживает Gemini Nano v3 9 ч.
В очередь за холодом: Modine получила предзаказ на системы охлаждения для ЦОД на $4 млрд 10 ч.
Apple повысила выплаты за старые iPhone и MacBook по программе трейд-ин 10 ч.