Сегодня 02 октября 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI открыла речевой ИИ из ChatGPT для сторонних разработчиков — ждём вала говорящих приложений

Компания OpenAI представила новые возможности для упрощения процесса создания приложений на основе искусственного интеллекта. Теперь разработчики могут задействовать работающий в режиме онлайн инструмент для создания голосовых программных решений на базе ИИ, используя единый набор инструкций.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Большую часть дохода OpenAI получает от предприятий, которые используют нейросети компании для создания собственных ИИ-приложений. Поэтому расширение возможностей по созданию таких продуктов является вполне оправданным шагом на фоне обостряющейся борьбы в сфере ИИ с такими компаниями, как Google, которая внедряет в свои продукты алгоритмы, способные обрабатывать разные типы информации, включая текст, изображения и видео.

Процесс создания голосовых помощников требует от разработчиков прохождения как минимум трёх этапов: преобразование аудио в текст, обработка запроса и генерация текстового ответа на него, а также преобразование полученного ответа в аудио. В рамках внедрения новых возможностей по созданию голосовых ИИ-приложений OpenAI представила инструмент тонкой настройки больших языковых моделей после завершения этапа обучения. Такой подход позволит повысить качество ответов, которые генерируют создаваемые разработчиками алгоритмы в ответы на запросы в текстовом формате и с использованием изображений. Этап точной настройки может сопровождаться обратной связью от людей, которые проводят оценку того, насколько качественные ответы даёт алгоритм.

В OpenAI считают, что использование изображений для точной настройки моделей даст разработчикам более широкие возможности для повышения качества понимания ИИ-алгоритмами того, что демонстрируется на изображениях. Созданные таким образом приложения могут выступать, например, в качестве расширенного поиска по визуальным элементам. В дополнение к этому OpenAI представила инструмент, который позволит меньшим ИИ-моделям учиться на более крупных моделях, а также «Быстрое кэширование», которое существенно сократит затраты на разработку благодаря повторному использованию фрагментов текста, ранее уже обработанных алгоритмом. Все представленные нововведения уже тестируются с привлечением ограниченного числа клиентов OpenAI.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
СК завёл уголовное дело на создателей криптобиржи Cryptex: 96 задержанных, 148 обысков 15 мин.
Представлено российское решение Astra Infrastructure Cloud для построения защищённых частных облаков 16 мин.
Adobe выпустила Photoshop и Premiere Elements 2025 с продвинутыми ИИ-функциями и ценой по $90 22 мин.
Nvidia выпустила мультимодальную модель ИИ с открытым исходным кодом, и она не уступает GPT-4 34 мин.
Банк России займётся «обследованием» криптовалютных платежей россиян 48 мин.
CI Games раскрыла, когда ждать анонс Lords of the Fallen 2 — новые детали будущего эксклюзива Epic Games Store на ПК 2 ч.
Telegram раскрывал властям IP-адреса и телефоны «преступников» с 2018 года, признался Павел Дуров 3 ч.
OpenAI открыла речевой ИИ из ChatGPT для сторонних разработчиков — ждём вала говорящих приложений 3 ч.
В приложении YouTube TV для Android и iOS появилась поддержка фонового воспроизведения 6 ч.
Microsoft прокачала Copilot: человеческий голос, сёрфинг с пользователем и глубокие размышления 6 ч.
Lian Li представила компактный, но вместительный корпус Lancool 207 6 мин.
В России стартовали продажи ноутбука Honor MagicBook Art 14 со съёмной ИИ-камерой, сенсорным OLED-экраном и процессором Intel Ultra 54 мин.
BT получит £105 млн от продажи медных кабелей — пока их не украли охотники за цветным металлом 2 ч.
Philips выпустила 27- и 31,5-дюймовые изогнутые игровые мониторы серии Evnia 5000 с QHD и 180 Гц 3 ч.
Google заменила на хромбуках кнопку Caps Lock на Quick Insert для быстрого доступа к ИИ-функциям 3 ч.
США впервые выделили средства на перезапуск остановленной АЭС и покупку её энергии 4 ч.
В Бразилии появился новый оператор ЦОД 247 Data Centers, ориентированный на гиперскейлеров 4 ч.
Материнские платы Asus Z890 для процессоров Intel Core Ultra 200K показались на изображениях 5 ч.
Себестоимость Apple iPhone 16 Pro Max — $485, его оснащение лишь на $32 богаче предшественника 5 ч.
Настольные процессоры Arrow Lake вместе с LGA 1851-платами появятся в продаже 24 октября 6 ч.