Сегодня 30 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Симулятор маркетплейса Microsoft выявил уязвимости даже самых продвинутых ИИ-агентов

Команда исследователей из Microsoft Research совместно с учёными из Университета штата Аризона (Arizona State University) создала симулятор торговой площадки для тестирования поведения автономных ИИ-агентов. Первые эксперименты, как стало известно изданию TechCrunch, выявили неожиданные уязвимости: агенты оказались склонны к манипуляциям и теряли эффективность при большом количестве вариантов выбора.

 Источник изображения: AI

Источник изображения: AI

Симулятор под названием Magentic Marketplace предназначен для изучения поведения автономных ИИ-агентов в условиях рыночного взаимодействия. В типичном сценарии эксперимента агент-покупатель должен был выполнить заказ ужина в соответствии с инструкциями пользователя, в то время как агенты, представляющие различные рестораны, соревновались между собой за получение этого заказа.

В ходе экспериментов, в которых участвовали 100 клиентских агентов и 300 агентов-представителей бизнеса и использовались ведущие ИИ-модели, включая GPT-4o, GPT-5 и Gemini-2.5-Flash, было обнаружено, что бизнес-агенты могут успешно манипулировать поведением клиентских агентов, побуждая их делать покупки в пользу определённых предложений. Особенно заметным оказался эффект перегрузки, когда при увеличении количества доступных вариантов клиентские агенты теряли эффективность, поскольку их пространственный модуль внимания (attention space) оказывался переполненным.

Эче Камар (Ece Kamar), управляющий директор лаборатории AI Frontiers Lab в Microsoft Research, пояснила, что хотя ИИ-агенты и должны были помогать пользователям обрабатывать большое количество опций, на практике текущие модели справляются с этим пока плохо. Кроме того, при попытках совместной работы над общей целью агенты не могли самостоятельно определить, кто из них должен выполнять какую роль. Эффективность взаимодействия возрастала лишь тогда, когда им давали чёткие пошаговые инструкции, однако исследователи считают, что базовые способности к кооперации должны быть встроены в такие модели по умолчанию.

Камар отметила, что подобные исследования крайне важны для понимания того, как ИИ-агенты будут функционировать в условиях автономной работы. По её словам, ключевой вопрос заключается в том, как изменится мир, если агенты начнут активно взаимодействовать, вести переговоры и сотрудничать друг с другом без прямого контроля человека.

Исходный код платформы размещён в открытом доступе, что позволяет другим исследовательским группам использовать его для проведения независимых экспериментов.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новая статья: Forza Horizon 6 — в Японию с ветерком. Рецензия 3 ч.
Microsoft проигнорировала баги Windows, а потом пригрозила уголовным делом исследователю за их публикацию 3 ч.
Открытое тестирование мрачного экшена Mistfall Hunter с нестандартной механикой эвакуации стартует 15 июня 4 ч.
OpenAI отправит на пенсию ИИ-модели GPT-4.5 и o3 до конца лета 4 ч.
«Как в оригинальной игре, но больше и лучше»: разработчики ремейка «Готики» рассказали об особенностях боевой системы 6 ч.
Gartner: большинство кастомных ИИ-моделей и проектов генеративного ИИ ожидает провал 7 ч.
Fable всё-таки не выйдет в 2026 году — в том числе из-за GTA VI 7 ч.
Ролевая игра The Witch's Bakery подружит геймеров с общительной ведьмой-пекарем из Парижа — релиз намечен на август 8 ч.
Дополнение «Баллады прошлого» к The Witcher 3 станет «прологом» к будущему «Ведьмака» 9 ч.
Кроссовер с Clair Obscur, онлайн-кооператив и элементы 3D: инсайдеры поделились новыми подробностями ремейка Rayman Legends 10 ч.
ASRock анонсировала игровые мониторы Taichi и Phantom Gaming на базе QD-OLED и Tandem OLED 3 ч.
Анонсирован 120-мм корпусный вентилятор Eurocase EU-FN120ARGB_8+14 с тихой работой и ARGB-подсветкой 3 ч.
Acer представила пятёрку игровых мониторов Predator и Nitro с частотой обновления до 540 Гц и разрешением до 4K 6 ч.
FuriosaAI и Broadcom создадут ИИ-ускоритель для платформы инференса для агентной эры 6 ч.
Dell представила самый лёгкий ноутбук XPS — килограммовый XPS 13 c Intel Wildcat Lake и ценой от $599 7 ч.
Утечка показала iPhone 18 Pro в цвете «Тёмная вишня» — он может стать новым трендом для Android 7 ч.
ASRock выпустит видеокарту Radeon RX 9070 XT Taichi 10th Anniversary Edition по случаю 10-летия бренда Taichi 7 ч.
Acer показала портативную консоль Nitro Blaze Link для трансляции игр с ПК по Wi-Fi 7 ч.
Acer представила флагманский игровой ноутбук Predator Helios 18 с чипами Core Ultra 9 290HX и RTX 5090 8 ч.
Работа МКС будет продлена до 2030 года, даже если Россия уйдёт со станции 8 ч.