Сегодня 27 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Симулятор маркетплейса Microsoft выявил уязвимости даже самых продвинутых ИИ-агентов

Команда исследователей из Microsoft Research совместно с учёными из Университета штата Аризона (Arizona State University) создала симулятор торговой площадки для тестирования поведения автономных ИИ-агентов. Первые эксперименты, как стало известно изданию TechCrunch, выявили неожиданные уязвимости: агенты оказались склонны к манипуляциям и теряли эффективность при большом количестве вариантов выбора.

 Источник изображения: AI

Источник изображения: AI

Симулятор под названием Magentic Marketplace предназначен для изучения поведения автономных ИИ-агентов в условиях рыночного взаимодействия. В типичном сценарии эксперимента агент-покупатель должен был выполнить заказ ужина в соответствии с инструкциями пользователя, в то время как агенты, представляющие различные рестораны, соревновались между собой за получение этого заказа.

В ходе экспериментов, в которых участвовали 100 клиентских агентов и 300 агентов-представителей бизнеса и использовались ведущие ИИ-модели, включая GPT-4o, GPT-5 и Gemini-2.5-Flash, было обнаружено, что бизнес-агенты могут успешно манипулировать поведением клиентских агентов, побуждая их делать покупки в пользу определённых предложений. Особенно заметным оказался эффект перегрузки, когда при увеличении количества доступных вариантов клиентские агенты теряли эффективность, поскольку их пространственный модуль внимания (attention space) оказывался переполненным.

Эче Камар (Ece Kamar), управляющий директор лаборатории AI Frontiers Lab в Microsoft Research, пояснила, что хотя ИИ-агенты и должны были помогать пользователям обрабатывать большое количество опций, на практике текущие модели справляются с этим пока плохо. Кроме того, при попытках совместной работы над общей целью агенты не могли самостоятельно определить, кто из них должен выполнять какую роль. Эффективность взаимодействия возрастала лишь тогда, когда им давали чёткие пошаговые инструкции, однако исследователи считают, что базовые способности к кооперации должны быть встроены в такие модели по умолчанию.

Камар отметила, что подобные исследования крайне важны для понимания того, как ИИ-агенты будут функционировать в условиях автономной работы. По её словам, ключевой вопрос заключается в том, как изменится мир, если агенты начнут активно взаимодействовать, вести переговоры и сотрудничать друг с другом без прямого контроля человека.

Исходный код платформы размещён в открытом доступе, что позволяет другим исследовательским группам использовать его для проведения независимых экспериментов.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Google начала внедрять Gemini в «Google Карты» для всех режимов навигации 5 ч.
Оригинал учредительных документов Apple 1976 года уйдёт с молотка — за лот хотят выручить до $4 млн 11 ч.
Cyberpunk 2077 стала главным источником дохода CD Projekt — компания отчиталась об ударных результатах за третий квартал 11 ч.
«Новый год пришёл раньше времени»: Sony включила в декабрьскую линейку PS Plus сразу пять игр, в том числе Lego Horizon Adventures и Killing Floor 3 12 ч.
Продажи Cyberpunk 2077 превысили 35 миллионов копий, а команда Cyberpunk 2 растёт не по дням, а по часам 13 ч.
ЕС откажется от сканирования переписок — ИТ-гиганты выиграли битву за конфиденциальность пользователей 14 ч.
Новый геймплейный трейлер Warhammer 40,000: Dark Heresy показал в деле огрина Когга, поумневшего благодаря аугментации коры головного мозга 14 ч.
Китай штампует новые ИИ-модели еженедельно — США уже проигрывают гонку открытого ИИ 14 ч.
Переосмысление классики психологических квестов: культовая российская игра Sublustrum получит новую жизнь на ПК и консолях 15 ч.
В этот день в 1996 году в США выдали патент на MP3 – формат аудио, перевернувший музыкальную индустрию 15 ч.
Intel уверена в невиновности нанятого ею бывшего старшего вице-президента TSMC 27 мин.
Apple столкнулась с очередным иском за использование конфликтных минералов при производстве своей продукции 2 ч.
Вбухивающим миллиарды в сегмент ИИ компаниям имеет смысл учитывать печальный опыт Intel 4 ч.
Новая статья: Обзор и тест процессорного кулера PCCooler RT500 TC ARGB: 245 ватт с одной башни? 8 ч.
Dell предупредила о стагнации рынка ПК — массовый переход на Windows 11 забуксовал 9 ч.
Nova Lake-S не потребует новых кулеров: Noctua подтвердила поддержку LGA 1954 9 ч.
Новая статья: Уйти от CISC — пойти на RISC: продолжение следует 9 ч.
HP начнёт «недосыпать» память в новые ПК — и при этом поднимет цены из-за дефицита DRAM 10 ч.
Dell неплохо заработала на продаже ИИ-серверов и планирует заработать ещё больше 10 ч.
Thunderobot представила игровой ПК на китайском x86-чипе Hygon с 16 ядрами AMD Zen 11 ч.