Сегодня 25 марта 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Anthropic научила ИИ улучшать запросы к самому себе

В минувшем году одной из популярных новых профессий в области искусственного интеллекта стала должность инженера по составлению запросов к моделям ИИ. Теперь компания Anthropic решила автоматизировать эту задачу, поручив её самому ИИ.

 Источник изображения: anthropic.com

Источник изображения: anthropic.com

Большие языковые модели во многих случаях дают адекватные ответы даже на непрофессиональные запросы пользователей, но иногда даже небольшое изменение формулировки способно значительно повысить его качество. Обычно для этого приходится самостоятельно перебирать различные формулировки или прибегать к услугам инженера, но предложенная Anthropic новая функция способна упростить задачу. В панели управления Anthropic Console, предназначенной для разработки сторонних приложений на базе модели ИИ Claude, появилась новая вкладка Evaluate, связанная со встроенным генератором запросов. Этот генератор получает на вводе краткое описание запроса и генерирует на его основе гораздо более длинный и конкретный. Едва ли данный инструмент оставит инженеров без работы, но он может сэкономить им время и помочь рядовым пользователям.

В разделе Evaluate разработчики сторонних приложений могут проверить, насколько эффективны генерируемые их приложениями подсказки в различных сценариях. Можно, например, загрузить действительный пример в тестовый набор или попросить Claude сгенерировать такие тестовые запросы самостоятельно, чтобы сравнить их эффективность и оценить ответы по пятибалльной шкале. В приведённом Anthropic примере разработчик установил, что его приложение выдаёт в нескольких тестовых случаях слишком короткие ответы — одна из строк в запросе помогла сделать их длиннее, после чего эту схему применили ко всем тестовым сценариям.

Ранее соучредитель и гендиректор Anthropic Дарио Амодеи (Dario Amodei) отметил, что составление запроса является одним из важнейших аспектов для широкого внедрения генеративного ИИ. «Кажется, что это просто, но за 30 минут инженер по запросам часто может заставить приложение работать, если раньше оно не работало», — заявил Амодеи.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Инсайдер раскрыл план выпуска игр для Nintendo Switch 2 — консоль выйдет в июне 2 ч.
ЕС намерен «обуздать хищническую монетизацию» игр и запретить продажу внутриигровой валюты детям 3 ч.
Vampire: The Masquerade — Bloodlines 2 не выйдет в первой половине 2025 года, но есть и хорошая новость 3 ч.
«Проводник» в Windows 11 получит умный поиск — Microsoft готовит ворох новых ИИ-инструментов 3 ч.
«Мы пытаемся не попасть в зону удара»: крупные издатели приготовились переносить свои игры, чтобы избежать конкуренции с GTA VI 4 ч.
Приложение «Фотографии» в Windows 11 получит большое обновление, основанное на ИИ 5 ч.
Минцифры РФ: уровень использования госкомпаниями отечественного ПО превышает 80 % 5 ч.
Бывший директор Valve по маркетингу рассказала, как студия подстегнула продажи Half-Life с помощью одного простого трюка 5 ч.
Apple намерена избежать штрафа в ЕС из-за стандартного браузера iPhone 5 ч.
OpenAI: ИИ бесполезно наказывать за ложь — он начинает хитрить ещё больше 6 ч.
Из-за проблем с ИИ Apple резко поменяла курс и решила потратить $1 млрд на суперускорители NVIDIA GB300 NVL72 2 ч.
Vivo показала AR-гарнитуру Vivo Vision с аккумулятором на верёвочке 2 ч.
Apple объявила даты конференции WWDC 2025, где представит совершенно новую iOS и не только 2 ч.
Учёные впервые запустили модель Вселенной на уровне теории квантового поля — вышло примитивно, но похоже 3 ч.
Аналитики опровергли миф о том, что выпускать чипы в США намного дороже, чем на Тайване 4 ч.
Ещё один партнёр Nvidia поднял цены на GeForce RTX 5090 — самая дешёвая теперь стоит $2700, но купить её невозможно 5 ч.
PQ.Hosting запускает новую локацию в Лихтенштейне со скидкой 45 % на предзаказ серверов 6 ч.
Керамические накопители Cerabyte заинтересовали In-Q-Tel, инвестирующую в перспективные технологии в интересах ЦРУ и др. 6 ч.
Из пушки на Луну — в Китае построят электромагнитную катапульту для космических запусков 6 ч.
В России началась разработка проекта плавучих дата-центров 6 ч.