Сегодня 08 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ с «глазами» оказался в разы дороже обычного API — агенты сжигают бюджеты, ходя по сайтам

Компании, которые используют агентов искусственного интеллекта, могут потратить значительно больше денег, если эти агенты оперируют визуальными данными, имитируя человеческое зрение.

 Источник изображения: reflex.dev

Источник изображения: reflex.dev

Специалисты платформы корпоративных приложений Reflex сравнили визуальных ИИ-агентов с теми, что осуществляют доступ к внешним ресурсам через API. Обоими агентами управляла нейросеть Anthropic Claude Sonnet: в первом случае она контролировала Python-фреймворк browser-use 0.12 для автоматизированной работы с браузером; во втором — обращалась к тем же веб-приложениям по API. При обращении по API агент вызывал те же механизмы обработки, что при работе с пользовательским интерфейсом, но получал в ответ структурированные данные, а не скриншот веб-страницы, который требовалось дополнительно анализировать.

Обоим агентам организаторы эксперимента дали задание: «Клиент по имени Смит пожаловался на недавний заказ. Найди Смита с наибольшим количеством заказов, прими все его отзывы на модерации и отметь последний как доставленный». ИИ-агент с обращением по API выполнил задачу за восемь запросов к ИИ-модели; визуальный вариант нашёл только один из четырёх ожидающих отзывов — остальные три он пропустил, потому что не догадался прокрутить страницу. Когда условия задачи упростили в угоду визуальному ИИ-агенту, тот выполнял её около 17 минут; вариант с обращением по API добился результата за 20 секунд и израсходовал в 45 раз меньше токенов модели ИИ.

По оценкам Anthropic, обработка изображения размером 1000 × 1000 пикселей с помощью модели Claude Sonnet 4.6 расходует около 1334 токенов. Визуальный ИИ-агент израсходовал на выполнение задачи около 500 000 входных и около 38 000 выходных токенов; обращавшийся по API агент потратил около 12 150 входных и 934 выходных токенов. Авторы эксперимента сделали такой вывод: агентов с машинным зрением следует использовать только для работы с приложениями, которые пользователь не контролирует; внутренние процессы должны обрабатываться по API.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Selectel запускает программу поддержки AI-проектов с грантом до 2 млн рублей на IT-инфраструктуру 14 мин.
Восемь лет назад Microsoft считала OpenAI бесперспективной — а потом вырастила себе конкурента 40 мин.
Кибератаки пошли вразнос: число новых вредоносов выросло в 18 раз за год 49 мин.
Инструменты войны: разработчики Warhammer 40,000: Dawn of War 4 показали, как сражаются техножрецы из Адептус Механикус 57 мин.
«У меня есть версия для Steam, но я куплю и эту»: мрачный экшен Hell is Us выйдет на Nintendo Switch 2 2 ч.
Cloudflare уволит сотни сотрудников из-за внедрения ИИ 2 ч.
До 60 % паролей взламываются из MD5-хеша с помощью всего одной GeForce RTX 5090 менее чем за час 2 ч.
Новый трейлер психоделической ролевой игры Zero Parades: For Dead Spies в духе Disco Elysium показал тяготы и лишения шпионской жизни 3 ч.
Twitch ужесточит борьбу с накрутками просмотров 3 ч.
OpenAI выпустила GPT-Realtime-2 и ещё две голосовые модели, но доступны они лишь через API 3 ч.