Сегодня 24 января 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Anthropic научила ИИ улучшать запросы к самому себе

В минувшем году одной из популярных новых профессий в области искусственного интеллекта стала должность инженера по составлению запросов к моделям ИИ. Теперь компания Anthropic решила автоматизировать эту задачу, поручив её самому ИИ.

 Источник изображения: anthropic.com

Источник изображения: anthropic.com

Большие языковые модели во многих случаях дают адекватные ответы даже на непрофессиональные запросы пользователей, но иногда даже небольшое изменение формулировки способно значительно повысить его качество. Обычно для этого приходится самостоятельно перебирать различные формулировки или прибегать к услугам инженера, но предложенная Anthropic новая функция способна упростить задачу. В панели управления Anthropic Console, предназначенной для разработки сторонних приложений на базе модели ИИ Claude, появилась новая вкладка Evaluate, связанная со встроенным генератором запросов. Этот генератор получает на вводе краткое описание запроса и генерирует на его основе гораздо более длинный и конкретный. Едва ли данный инструмент оставит инженеров без работы, но он может сэкономить им время и помочь рядовым пользователям.

В разделе Evaluate разработчики сторонних приложений могут проверить, насколько эффективны генерируемые их приложениями подсказки в различных сценариях. Можно, например, загрузить действительный пример в тестовый набор или попросить Claude сгенерировать такие тестовые запросы самостоятельно, чтобы сравнить их эффективность и оценить ответы по пятибалльной шкале. В приведённом Anthropic примере разработчик установил, что его приложение выдаёт в нескольких тестовых случаях слишком короткие ответы — одна из строк в запросе помогла сделать их длиннее, после чего эту схему применили ко всем тестовым сценариям.

Ранее соучредитель и гендиректор Anthropic Дарио Амодеи (Dario Amodei) отметил, что составление запроса является одним из важнейших аспектов для широкого внедрения генеративного ИИ. «Кажется, что это просто, но за 30 минут инженер по запросам часто может заставить приложение работать, если раньше оно не работало», — заявил Амодеи.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Google запускает защиту аккаунтов через сканер отпечатков на Android 2 ч.
«Хлебные крошки» в адресе сайтов исчезнут из результатов мобильного поиска Google 3 ч.
OpenAI выпустила ИИ-агента Operator, который будет сидеть в интернете за пользователя 8 ч.
Bethesda подтвердила дату выхода Doom: The Dark Ages — геймплей и системные требования «самой амбициозной игры» id Software 10 ч.
Альтман пообещал доступ к думающей ИИ-модели o3-mini в бесплатной версии ChatGPT 10 ч.
Koei Tecmo анонсировала Ninja Gaiden 4 от PlatinumGames и выпустила ремейк Ninja Gaiden 2 на Unreal Engine 5 11 ч.
Ubisoft показала сюжетный трейлер Assassin's Creed Shadows и подтвердила дополнение Claws of Awaji 11 ч.
Стартап Render, готовый бросить вызов традиционным облакам, привлёк $80 млн на развитие своей платформы для разработчиков 12 ч.
Over the Hill отправит в золотой век бездорожья исследовать дикую природу — трейлер и детали новой игры от создателей Art of Rally 12 ч.
Сертифицированная ФСТЭК России ОС «Альт СП» получила крупное обновление и поддержку процессоров «Эльбрус» 13 ч.
Dasung выпустила компактный 10,3-дюймовый монитор с матрицей на электронных чернилах и частотой обновления 60 Гц 48 мин.
Новый указ Трампа предусматривает создание национального криптовалютного резерва США 50 мин.
Nvidia убрала мониторинг Hot Spot у видеокарт серии GeForce RTX 50 2 ч.
Fitbit заплатит штраф $12 млн за ожоги от смарт-часов Ionic у 78 человек 2 ч.
Крупный американский ретейлер сообщил дату старта продаж видеокарт AMD серии Radeon RX 9070 3 ч.
Microsoft готовит компактные версии Surface Pro и Surface Laptop на чипе Snapdragon X 3 ч.
В IV квартале 2024 года SK hynix получила самую большую операционную прибыль в Южной Корее, опередив Samsung 6 ч.
Новая статья: Обзор игрового QD-OLED 4K-монитора Digma Pro Vision L: взгляд свысока 8 ч.
Galaxy S25 получили спутниковую связь Snapdragon Satellite, но Samsung забыла об этом рассказать 9 ч.
SoftBank и OpenAI намерены выделить по $19 млрд на ИИ-проект Stargate, но Маск уверен что на это нет денег 10 ч.