Сегодня 16 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ с «глазами» оказался в разы дороже обычного API — агенты сжигают бюджеты, ходя по сайтам

Компании, которые используют агентов искусственного интеллекта, могут потратить значительно больше денег, если эти агенты оперируют визуальными данными, имитируя человеческое зрение.

 Источник изображения: reflex.dev

Источник изображения: reflex.dev

Специалисты платформы корпоративных приложений Reflex сравнили визуальных ИИ-агентов с теми, что осуществляют доступ к внешним ресурсам через API. Обоими агентами управляла нейросеть Anthropic Claude Sonnet: в первом случае она контролировала Python-фреймворк browser-use 0.12 для автоматизированной работы с браузером; во втором — обращалась к тем же веб-приложениям по API. При обращении по API агент вызывал те же механизмы обработки, что при работе с пользовательским интерфейсом, но получал в ответ структурированные данные, а не скриншот веб-страницы, который требовалось дополнительно анализировать.

Обоим агентам организаторы эксперимента дали задание: «Клиент по имени Смит пожаловался на недавний заказ. Найди Смита с наибольшим количеством заказов, прими все его отзывы на модерации и отметь последний как доставленный». ИИ-агент с обращением по API выполнил задачу за восемь запросов к ИИ-модели; визуальный вариант нашёл только один из четырёх ожидающих отзывов — остальные три он пропустил, потому что не догадался прокрутить страницу. Когда условия задачи упростили в угоду визуальному ИИ-агенту, тот выполнял её около 17 минут; вариант с обращением по API добился результата за 20 секунд и израсходовал в 45 раз меньше токенов модели ИИ.

По оценкам Anthropic, обработка изображения размером 1000 × 1000 пикселей с помощью модели Claude Sonnet 4.6 расходует около 1334 токенов. Визуальный ИИ-агент израсходовал на выполнение задачи около 500 000 входных и около 38 000 выходных токенов; обращавшийся по API агент потратил около 12 150 входных и 934 выходных токенов. Авторы эксперимента сделали такой вывод: агентов с машинным зрением следует использовать только для работы с приложениями, которые пользователь не контролирует; внутренние процессы должны обрабатываться по API.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Хардкорный ролевой боевик Outward 2 лишился даты выхода в раннем доступе — разработчики не хотят разочаровать игроков 44 мин.
Ядро Linux лишилось поддержки Intel 486 и других «пережитков прошлого» 2 ч.
Жертвы киберпреступлений в США потеряли почти $21 млрд за прошлый год 2 ч.
Call of Duty: Vanguard и EA Sports FC 26 возглавили вторую волну июньских новинок Game Pass, а Tomb Raider и Slay the Spire подписку скоро покинут 3 ч.
Евросоюз не станет обязывать издателей спасать видеоигры, но у Stop Killing Games есть план 4 ч.
Соцсеть Threads почти догнала X по месячной аудитории — она достигла полумиллиарда пользователей 5 ч.
ИИ-сводки в Gmail стали доступны всем — их можно отключить, но со всеми ИИ-функциями сразу 5 ч.
Импортозамещение СЗИ: почему менеджер паролей стал критически важным элементом инфраструктуры (и причём здесь ФСТЭК России) 5 ч.
Совсем скоро в Heroes of Might & Magic: Olden Era появится «Таинственный остров» — одна из самых популярных карт для «Героев Меча и Магии III» 6 ч.
«Расширитель» памяти Mext был продан AMD 6 ч.