Сегодня 24 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Симулятор маркетплейса Microsoft выявил уязвимости даже самых продвинутых ИИ-агентов

Команда исследователей из Microsoft Research совместно с учёными из Университета штата Аризона (Arizona State University) создала симулятор торговой площадки для тестирования поведения автономных ИИ-агентов. Первые эксперименты, как стало известно изданию TechCrunch, выявили неожиданные уязвимости: агенты оказались склонны к манипуляциям и теряли эффективность при большом количестве вариантов выбора.

 Источник изображения: AI

Источник изображения: AI

Симулятор под названием Magentic Marketplace предназначен для изучения поведения автономных ИИ-агентов в условиях рыночного взаимодействия. В типичном сценарии эксперимента агент-покупатель должен был выполнить заказ ужина в соответствии с инструкциями пользователя, в то время как агенты, представляющие различные рестораны, соревновались между собой за получение этого заказа.

В ходе экспериментов, в которых участвовали 100 клиентских агентов и 300 агентов-представителей бизнеса и использовались ведущие ИИ-модели, включая GPT-4o, GPT-5 и Gemini-2.5-Flash, было обнаружено, что бизнес-агенты могут успешно манипулировать поведением клиентских агентов, побуждая их делать покупки в пользу определённых предложений. Особенно заметным оказался эффект перегрузки, когда при увеличении количества доступных вариантов клиентские агенты теряли эффективность, поскольку их пространственный модуль внимания (attention space) оказывался переполненным.

Эче Камар (Ece Kamar), управляющий директор лаборатории AI Frontiers Lab в Microsoft Research, пояснила, что хотя ИИ-агенты и должны были помогать пользователям обрабатывать большое количество опций, на практике текущие модели справляются с этим пока плохо. Кроме того, при попытках совместной работы над общей целью агенты не могли самостоятельно определить, кто из них должен выполнять какую роль. Эффективность взаимодействия возрастала лишь тогда, когда им давали чёткие пошаговые инструкции, однако исследователи считают, что базовые способности к кооперации должны быть встроены в такие модели по умолчанию.

Камар отметила, что подобные исследования крайне важны для понимания того, как ИИ-агенты будут функционировать в условиях автономной работы. По её словам, ключевой вопрос заключается в том, как изменится мир, если агенты начнут активно взаимодействовать, вести переговоры и сотрудничать друг с другом без прямого контроля человека.

Исходный код платформы размещён в открытом доступе, что позволяет другим исследовательским группам использовать его для проведения независимых экспериментов.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
ИИ пересказал «Гарри Поттера» и другие книги почти дословно — миф о добросовестном использовании под вопросом 31 мин.
Календарь релизов — с 23 февраля до 1 марта: Resident Evil Requiem и Reigns: The Witcher 3 ч.
В Steam стартовал праздник будущих хитов — фестиваль «Играм быть» с тысячами демоверсий 3 ч.
Ubisoft поставила у руля Assassin’s Creed ветеранов разработки Assassin’s Creed IV: Black Flag и Assassin’s Creed Origins 5 ч.
Вовремя сбежавший в Исландию вице-президент NetApp отвертелся от суда в США 5 ч.
Режиссёр Resident Evil 2 проклял авторов утечек Resident Evil Requiem и обрёк их «умереть тысячей смертей» 7 ч.
Более миллиона пользователей Steam добавили Windrose в список желаемого — это кооперативный пиратский экшен от разработчиков из Узбекистана 8 ч.
В Steam вышла демоверсия грандиозной шпионской ролевой игры Zero Parades: For Dead Spies от студии-разработчика Disco Elysium 8 ч.
«Я был плохим студентом»: автор покерного инди-хита Balatro рассказал о своей учёбе и подтвердил работу над патчем 1.1 9 ч.
«Даже местные разработчики ничего подобного не делали»: трейлер Forza Horizon 6 с живописными видами Японии впечатлил геймеров 11 ч.
ИИ Gemini сломал поиск на смарт-телевизорах с Google TV 20 мин.
Немецкий сайт Asus ожил — доступ к драйверам и BIOS вернулся, но не для ноутбуков и ПК 23 мин.
ASML разогнала EUV до киловатта — производительность сканеров вырастет на 50 % через несколько лет 42 мин.
Новая статья: Система жидкостного охлаждения SAMA L70: сила красоты 2 ч.
Astera Labs по-тихому купила Pliops 3 ч.
Автопром готов предложить машины, где за рулём можно не следить за дорогой — это обостряет вопросы безопасности и ответственности 3 ч.
Чипы AMD прожорливы, NVIDIA — дороги, а Intel — ненадёжны: Ericsson остаётся верна кастомным ASIC 3 ч.
Жёлтый сигнал тревоги: кабели MSI 12V-2x6 иногда самопроизвольно вылезают из разъёма, пожаловались пользователи 3 ч.
Сотрудники узнали из СМИ: как Microsoft внезапно поменяла руководство Xbox 4 ч.
Intel может отказаться от E- и P-ядер в пользу единой архитектуры — но переход займёт годы 7 ч.