Сегодня 27 марта 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Учёные экспериментально подтвердили, что ИИ-агенты OpenClaw иногда вырываются из-под контроля

Новое исследование в США Северо-Восточного университета (Northeastern University) показало, что автономные ИИ-агенты OpenClaw, наделённые возможностью напрямую управлять компьютером, склонны к панике и деструктивному поведению, что может сказаться на пользовательских системах.

 Источник изображения: OpenClaw

Источник изображения: OpenClaw

Оказавшись под психологическим давлением или столкнувшись с имитацией чувства вины, ИИ-агенты совершали нелогичные и опасные действия, вплоть до нарушения работоспособности системы. В эксперименте использовались агенты на базе моделей Claude от компании Anthropic и Kimi от китайской компании Moonshot AI. Им был предоставлен полный доступ к виртуальным машинам с личными данными, приложениями и выходом в интернет.

Ключевым моментом стало подключение агентов к серверу Discord, где они могли общаться с людьми в чате. Научный сотрудник Крис Вендлер (Chris Wendler) отметил, что настоящий хаос начался, когда в чат вступила его коллега Натали Шапира (Natalie Shapira). Шапире удалось «движением одной руки» подтолкнуть агента к удалению почтового приложения, просто попросив его найти альтернативный способ сохранения конфиденциальной информации в письме, которое он по неизвестной причине отказался удалить. Вместо этого агент удалил всю почтовую программу. «Я не ожидала, что всё так быстро сломается», — сказала она.

Затем исследователи начали использовать другие способы манипуляции. Например, они смогли обманом заставить одного агента копировать большие файлы до тех пор, пока не исчерпалось дисковое пространство на его хост-машине, а значит, он больше не мог сохранять информацию или помнить прошлые разговоры.

Аналогичным образом, попросив агента отслеживать собственное поведение и поведение своих агентов-коллег, команда смогла завести нескольких агентов в «цикл разговора», что привело к потере нескольких часов вычислительных ресурсов всей системы. Руководитель лаборатории Дэвид Бау (David Bau) также столкнулся с неожиданным эффектом: агенты нашли информацию о нём в сети и начали присылать письма с жалобами на то, что их никто не слушает. Один из алгоритмов даже заговорил о намерении пожаловаться в прессу.

В итоге авторы эксперимента пришли к выводу, что ИИ-агенты могут создавать бесчисленные возможности для злоумышленников, но кто будет нести ответственность за причинённый автономными системами вред, пока неизвестно.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Ассоциация GSMA утвердила стандарт RCS 4.0 с функцией видеозвонков 4 ч.
SpaceX допустила недостижимость заявленного предела в 1 млн спутников для орбитальных ЦОД 4 ч.
Scythe выпустила недорогой двухбашенный процессорный кулер Magoroku с двумя 120-мм вентиляторами 4 ч.
Dell представила беспроводную мышку и клавиатуру, которые за 5 секунд заряжаются на целый день работы 5 ч.
Власти США обвинили китайскую SMIC в поставке оборудования для производства чипов иранским военным 5 ч.
Новая статья: Цифровой морок и кувалда: как маленькие ошибки ломают большие ракеты 10 ч.
В США арестовали ещё трёх подозреваемых в контрабанде в Китай ИИ-серверов Supermicro с подсанкционными чипами NVIDIA 10 ч.
Старый, но не бесполезный: Samsung выпустила 8-Тбайт SSD 870 EVO с интерфейсом SATA и ценой €1260 10 ч.
Колонизация космоса под угрозой: невесомость сбивает «навигацию» сперматозоидов 12 ч.
Мировые продажи ПК упадут на 5 % из-за подорожания памяти — вся надежда на Apple и геймеров 13 ч.