Сегодня 26 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Симулятор маркетплейса Microsoft выявил уязвимости даже самых продвинутых ИИ-агентов

Команда исследователей из Microsoft Research совместно с учёными из Университета штата Аризона (Arizona State University) создала симулятор торговой площадки для тестирования поведения автономных ИИ-агентов. Первые эксперименты, как стало известно изданию TechCrunch, выявили неожиданные уязвимости: агенты оказались склонны к манипуляциям и теряли эффективность при большом количестве вариантов выбора.

 Источник изображения: AI

Источник изображения: AI

Симулятор под названием Magentic Marketplace предназначен для изучения поведения автономных ИИ-агентов в условиях рыночного взаимодействия. В типичном сценарии эксперимента агент-покупатель должен был выполнить заказ ужина в соответствии с инструкциями пользователя, в то время как агенты, представляющие различные рестораны, соревновались между собой за получение этого заказа.

В ходе экспериментов, в которых участвовали 100 клиентских агентов и 300 агентов-представителей бизнеса и использовались ведущие ИИ-модели, включая GPT-4o, GPT-5 и Gemini-2.5-Flash, было обнаружено, что бизнес-агенты могут успешно манипулировать поведением клиентских агентов, побуждая их делать покупки в пользу определённых предложений. Особенно заметным оказался эффект перегрузки, когда при увеличении количества доступных вариантов клиентские агенты теряли эффективность, поскольку их пространственный модуль внимания (attention space) оказывался переполненным.

Эче Камар (Ece Kamar), управляющий директор лаборатории AI Frontiers Lab в Microsoft Research, пояснила, что хотя ИИ-агенты и должны были помогать пользователям обрабатывать большое количество опций, на практике текущие модели справляются с этим пока плохо. Кроме того, при попытках совместной работы над общей целью агенты не могли самостоятельно определить, кто из них должен выполнять какую роль. Эффективность взаимодействия возрастала лишь тогда, когда им давали чёткие пошаговые инструкции, однако исследователи считают, что базовые способности к кооперации должны быть встроены в такие модели по умолчанию.

Камар отметила, что подобные исследования крайне важны для понимания того, как ИИ-агенты будут функционировать в условиях автономной работы. По её словам, ключевой вопрос заключается в том, как изменится мир, если агенты начнут активно взаимодействовать, вести переговоры и сотрудничать друг с другом без прямого контроля человека.

Исходный код платформы размещён в открытом доступе, что позволяет другим исследовательским группам использовать его для проведения независимых экспериментов.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Фанаты выдают желаемое за действительное: авторитетное издание опровергло слухи о планах Rockstar на выпуск дискового издания GTA VI 12 мин.
«Рискуют разочаровать фанатов»: ветеран Bethesda предостерёг Xbox насчёт ускорения разработки The Elder Scrolls VI и Fallout 5 20 мин.
Альтернативный клиент Telega объявил о закрытии с 1 июля 4 ч.
На платформе ClawHub обнаружены вредоносные навыки для ИИ-агента OpenClaw 5 ч.
«Глоток свежего воздуха»: игроков впечатлил час геймплея гоночного экшена Clutch от бывших разработчиков Forza Horizon 5 ч.
Meccha Chameleon обогнала все хиты 2026 года по скорости продаж — 10 миллионов за две с половиной недели 6 ч.
Google Gemini 3.5 Flash научилась полностью управлять компьютерами 6 ч.
Windows 11 наконец научилась откатывать неудачные обновления 6 ч.
Сотрудники OpenAI стали переходить от использования чат-ботов к ИИ-агентам 8 ч.
Космический шутер Wildgate от ветеранов Blizzard не проживёт и года — разработчики объяснили, что произошло 8 ч.
Valve отказалась от громких обещаний по поводу производительности Steam Machine 11 мин.
Из-за ИИ ноутбуки и смартфоны подорожают ещё сильнее, а потом могут стать дефицитом 12 мин.
Американские учёные разработали электронный «нос», способный вынюхивать опасные продукты 40 мин.
Внеземная АЭС и не только: власти России раскрыли планы по освоению Луны и изучению Венеры 46 мин.
Apple начала продавать восстановленные MacBook Neo — по недавней цене новых 47 мин.
Под Сергиевым Посадом началось строительство ЦОД для «Авито» 2 ч.
Британская больница Queen Alexandra объявила о критическом инциденте — чиллеры её ЦОД отказали на фоне рекордной жары 2 ч.
Японский электролёт SkyDrive SD-05 разогнали до 100 км/ч во время тестов 2 ч.
Горизонт событий чёрной дыры перестал быть лишь математической абстракцией — учёные впервые «увидели» его следы 2 ч.
Представлен складной смартфон Vivo X Fold6 с чипом Dimensity 9500, камерами Zeiss и батареей на 7000 мА·ч 3 ч.