Сегодня 14 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ с «глазами» оказался в разы дороже обычного API — агенты сжигают бюджеты, ходя по сайтам

Компании, которые используют агентов искусственного интеллекта, могут потратить значительно больше денег, если эти агенты оперируют визуальными данными, имитируя человеческое зрение.

 Источник изображения: reflex.dev

Источник изображения: reflex.dev

Специалисты платформы корпоративных приложений Reflex сравнили визуальных ИИ-агентов с теми, что осуществляют доступ к внешним ресурсам через API. Обоими агентами управляла нейросеть Anthropic Claude Sonnet: в первом случае она контролировала Python-фреймворк browser-use 0.12 для автоматизированной работы с браузером; во втором — обращалась к тем же веб-приложениям по API. При обращении по API агент вызывал те же механизмы обработки, что при работе с пользовательским интерфейсом, но получал в ответ структурированные данные, а не скриншот веб-страницы, который требовалось дополнительно анализировать.

Обоим агентам организаторы эксперимента дали задание: «Клиент по имени Смит пожаловался на недавний заказ. Найди Смита с наибольшим количеством заказов, прими все его отзывы на модерации и отметь последний как доставленный». ИИ-агент с обращением по API выполнил задачу за восемь запросов к ИИ-модели; визуальный вариант нашёл только один из четырёх ожидающих отзывов — остальные три он пропустил, потому что не догадался прокрутить страницу. Когда условия задачи упростили в угоду визуальному ИИ-агенту, тот выполнял её около 17 минут; вариант с обращением по API добился результата за 20 секунд и израсходовал в 45 раз меньше токенов модели ИИ.

По оценкам Anthropic, обработка изображения размером 1000 × 1000 пикселей с помощью модели Claude Sonnet 4.6 расходует около 1334 токенов. Визуальный ИИ-агент израсходовал на выполнение задачи около 500 000 входных и около 38 000 выходных токенов; обращавшийся по API агент потратил около 12 150 входных и 934 выходных токенов. Авторы эксперимента сделали такой вывод: агентов с машинным зрением следует использовать только для работы с приложениями, которые пользователь не контролирует; внутренние процессы должны обрабатываться по API.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
К заданию готов: шпионский боевик 007 First Light от создателей Hitman отправился на золото за две недели до релиза 6 ч.
Microsoft исправила ошибку в Windows Autopatch, из-за которой драйверы обновлялись без разрешения 8 ч.
Meta запустила сервис Instants для обмена спонтанными фото без ретуши 9 ч.
Anthropic научила Claude вести бухгалтерию, продажи и маркетинг для малого бизнеса 9 ч.
Devolver Digital анонсировала The Talos Principle 3 — грандиозный финал трилогии философских головоломок от создателей Serious Sam 9 ч.
«Ваши разговоры не сохраняются»: в WhatsApp появились «Инкогнито-чаты» для приватных бесед с ИИ 10 ч.
Уход Sora открыл дорогу конкурентам: ИИ-генераторы видео Kling AI и AI Video ворвались в топы Apple App Store 10 ч.
Аналитики: продажи амбициозного боевика Saros от создателей Returnal не впечатлят Sony 11 ч.
Выручка Nebius Аркадия Воложа взлетела на 684 % благодаря буму ИИ 12 ч.
Linux снова под ударом: раскрыт эксплойт Fragnesia, который превратит любого пользователя в администратора 12 ч.
Технологическую отрасль накрыло цунами увольнений — более 100 тысяч сотрудников потеряли работу с начала года 7 ч.
Apple нарастила продажи в США, тогда как Android-смартфоны потеряли более 14 % 9 ч.
Canon представила полнокадровую беззеркалку EOS R6 V с вентилятором, но без видоискателя 9 ч.
Представлена полнокадровая беззеркалка Sony A7R VI с многослойным 66,8-Мп сенсором — серийную съёмку разогнали до 30 кадров/с 9 ч.
Curator вошла в число крупнейших ИБ-компаний России 10 ч.
Выручка Tencent не оправдала прогнозов, несмотря на успехи игрового бизнеса и ИИ 10 ч.
Прибыль Alibaba рухнула на 84 %, но гендир назвал отдачу от ИИ «абсолютно очевидной» 11 ч.
Xiaomi скоро представит флагман Xiaomi 17 Max, фитнес-браслет Smart Band 10 Pro и первые спортивные наушники 11 ч.
Аэрокосмический ИИ-стартап Aetherflux сменил имя на Cowboy Space Corporation и привлёк $275 млн на создание орбитального ЦОД 12 ч.
Нидерланды выступили против новых санкций США на поставки чипового оборудования ASML в Китай 12 ч.