Сегодня 06 мая 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Anthropic научила ИИ улучшать запросы к самому себе

В минувшем году одной из популярных новых профессий в области искусственного интеллекта стала должность инженера по составлению запросов к моделям ИИ. Теперь компания Anthropic решила автоматизировать эту задачу, поручив её самому ИИ.

 Источник изображения: anthropic.com

Источник изображения: anthropic.com

Большие языковые модели во многих случаях дают адекватные ответы даже на непрофессиональные запросы пользователей, но иногда даже небольшое изменение формулировки способно значительно повысить его качество. Обычно для этого приходится самостоятельно перебирать различные формулировки или прибегать к услугам инженера, но предложенная Anthropic новая функция способна упростить задачу. В панели управления Anthropic Console, предназначенной для разработки сторонних приложений на базе модели ИИ Claude, появилась новая вкладка Evaluate, связанная со встроенным генератором запросов. Этот генератор получает на вводе краткое описание запроса и генерирует на его основе гораздо более длинный и конкретный. Едва ли данный инструмент оставит инженеров без работы, но он может сэкономить им время и помочь рядовым пользователям.

В разделе Evaluate разработчики сторонних приложений могут проверить, насколько эффективны генерируемые их приложениями подсказки в различных сценариях. Можно, например, загрузить действительный пример в тестовый набор или попросить Claude сгенерировать такие тестовые запросы самостоятельно, чтобы сравнить их эффективность и оценить ответы по пятибалльной шкале. В приведённом Anthropic примере разработчик установил, что его приложение выдаёт в нескольких тестовых случаях слишком короткие ответы — одна из строк в запросе помогла сделать их длиннее, после чего эту схему применили ко всем тестовым сценариям.

Ранее соучредитель и гендиректор Anthropic Дарио Амодеи (Dario Amodei) отметил, что составление запроса является одним из важнейших аспектов для широкого внедрения генеративного ИИ. «Кажется, что это просто, но за 30 минут инженер по запросам часто может заставить приложение работать, если раньше оно не работало», — заявил Амодеи.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Журналисты показали 13 минут из сюжетного дополнения RoboCop: Rogue City — Unfinished Business, включая первый геймплей за Алекса Мёрфи 35 мин.
Хакеры взломали одну из функций протокола IPv6 и перехватывают обновления ПО 60 мин.
Взломан защищённый мессенджер TeleMessage — им пользовались в правительстве США 3 ч.
Google представила план оздоровления рынка интернет-рекламы без развала своего бизнеса 3 ч.
Clair Obscur: Expedition 33 продаётся быстрее Kingdom Come: Deliverance 2 — разработчики похвастались новыми успехами игры 4 ч.
«Билайн» готовит российский сервис ИИ-инференса на отечественном оборудовании 4 ч.
Виталик Бутерин предложил сделать Ethereum «простым как биткоин», но это займёт время 6 ч.
Состоялся релиз отечественной «Ред ОС» 8 для Arm-платформ 6 ч.
В «М.Видео-Эльдорадо» рассказали, за какими играми россияне проводят майские праздники 7 ч.
Google по ошибке рассекретила будущее дизайна Android 8 ч.
Microsoft представила ответ старым MacBook Air — Surface Laptop на чипе Snapdragon X Plus. А ещё вышел планшет Surface Pro 26 мин.
Эксперты: репрессии Трампа в отношении «зелёной» энергетики навредят США в гонке за ИИ-лидерство 39 мин.
Южнокорейский сотовый оператор SK Telecom заменит 25 млн SIM-карт из-за кибератаки 45 мин.
Apple уже работает над преемником iPhone 17 Air с увеличенным экраном 48 мин.
«Рассчитываем на понимание»: в Москве предупредили об ограничениях в работе мобильного интернета с 7 по 9 мая 52 мин.
Philips представила киберспортивный монитор Evnia 25M2N5200U: 24,5 дюйма, 1080p и 390 Гц за $440 56 мин.
Китайскому «супероружию» против подводных кабелей на поверку оказалось не меньше сотни лет 2 ч.
Габаритная Radeon RX 9060 XT с 16 Гбайт видеопамяти появилась в бразильском магазине 3 ч.
ЦОД «Авантаж» сертифицирован по УЗ-1 3 ч.
Khazna из ОАЭ намерена захватить четверть рынка ЦОД Саудовской Аравии 3 ч.