Сегодня 29 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Симулятор маркетплейса Microsoft выявил уязвимости даже самых продвинутых ИИ-агентов

Команда исследователей из Microsoft Research совместно с учёными из Университета штата Аризона (Arizona State University) создала симулятор торговой площадки для тестирования поведения автономных ИИ-агентов. Первые эксперименты, как стало известно изданию TechCrunch, выявили неожиданные уязвимости: агенты оказались склонны к манипуляциям и теряли эффективность при большом количестве вариантов выбора.

 Источник изображения: AI

Источник изображения: AI

Симулятор под названием Magentic Marketplace предназначен для изучения поведения автономных ИИ-агентов в условиях рыночного взаимодействия. В типичном сценарии эксперимента агент-покупатель должен был выполнить заказ ужина в соответствии с инструкциями пользователя, в то время как агенты, представляющие различные рестораны, соревновались между собой за получение этого заказа.

В ходе экспериментов, в которых участвовали 100 клиентских агентов и 300 агентов-представителей бизнеса и использовались ведущие ИИ-модели, включая GPT-4o, GPT-5 и Gemini-2.5-Flash, было обнаружено, что бизнес-агенты могут успешно манипулировать поведением клиентских агентов, побуждая их делать покупки в пользу определённых предложений. Особенно заметным оказался эффект перегрузки, когда при увеличении количества доступных вариантов клиентские агенты теряли эффективность, поскольку их пространственный модуль внимания (attention space) оказывался переполненным.

Эче Камар (Ece Kamar), управляющий директор лаборатории AI Frontiers Lab в Microsoft Research, пояснила, что хотя ИИ-агенты и должны были помогать пользователям обрабатывать большое количество опций, на практике текущие модели справляются с этим пока плохо. Кроме того, при попытках совместной работы над общей целью агенты не могли самостоятельно определить, кто из них должен выполнять какую роль. Эффективность взаимодействия возрастала лишь тогда, когда им давали чёткие пошаговые инструкции, однако исследователи считают, что базовые способности к кооперации должны быть встроены в такие модели по умолчанию.

Камар отметила, что подобные исследования крайне важны для понимания того, как ИИ-агенты будут функционировать в условиях автономной работы. По её словам, ключевой вопрос заключается в том, как изменится мир, если агенты начнут активно взаимодействовать, вести переговоры и сотрудничать друг с другом без прямого контроля человека.

Исходный код платформы размещён в открытом доступе, что позволяет другим исследовательским группам использовать его для проведения независимых экспериментов.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Разработчики Greedfall и Steelrising подтвердили закрытие студии — DLC для Greedfall: The Dying World выпустит Nacon, «а потом всё» 2 ч.
Microsoft встроит ИИ в «Часы» в Windows 11 — и превратит их в приложение для повышения концентрации 4 ч.
«Один из лучших месяцев в истории»: Sony приятно удивила фанатов майской подборкой игр PS Plus 4 ч.
Новый трейлер подтвердил дату выхода Phonopolis — авангардной головоломки от создателей Samorost и Machinarium 5 ч.
Google TV получит новые ИИ-функции, а на главном экране появятся YouTube Shorts 5 ч.
Во время майских праздников в Москве могут отключить мобильный интернет 5 ч.
Microsoft опубликовала исходники 86-DOS и PC-DOS 1.00 с дополнительными материалами — распечатки пылились в гараже больше 45 лет 6 ч.
Представлен десктопный ИИ-агент Amazon Quick — он выполняет часовые задачи за минуты 6 ч.
Спустя почти два года пираты всё-таки взломали Denuvo в Black Myth: Wukong — гипервизор не требуется 6 ч.
GitHub похвалился, что устранил критическую уязвимость менее чем за шесть часов 7 ч.
ИИ ЦОД Project Jupiter для OpenAI запитают от топливных элементов Bloom Energy мощностью 2,45 ГВт 2 ч.
Китайские учёные преуспели в превращении углекислого газа в керосин — к этому подтолкнул иранский кризис 2 ч.
Motorola представила смартфон Moto G87 c Dimensity 6400 и 200-Мп камерой за €399 2 ч.
Ozon разрабатывает собственный WAF 3 ч.
Motorola выпустила глобальную версию Razr 70 Plus со Snapdragon 8s Gen 3, парой 50-Мп камер и батареей на 4500 мА·ч 3 ч.
Motorola представила смартфоны-раскладушки Razr 70 и Razr 70 Ultra — изменений мало, но цены выше 3 ч.
Мониторы Philips Evnia получили функцию AmbiScape для синхронизации умных светильников с играми 4 ч.
Поставки кремниевых пластин в первом квартале 2026 года выросли на 13 % благодаря буму ИИ 4 ч.
Китай пригрозил ответными мерами в случае запрета в ЕС оборудования Huawei 5 ч.
Caviar представила четвёрку розовых iPhone 17 Pro и Pro Max, украшенных золотом и бриллиантами 5 ч.