Сегодня 15 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Учёные экспериментально подтвердили, что ИИ-агенты OpenClaw иногда вырываются из-под контроля

Новое исследование в США Северо-Восточного университета (Northeastern University) показало, что автономные ИИ-агенты OpenClaw, наделённые возможностью напрямую управлять компьютером, склонны к панике и деструктивному поведению, что может сказаться на пользовательских системах.

 Источник изображения: OpenClaw

Источник изображения: OpenClaw

Оказавшись под психологическим давлением или столкнувшись с имитацией чувства вины, ИИ-агенты совершали нелогичные и опасные действия, вплоть до нарушения работоспособности системы. В эксперименте использовались агенты на базе моделей Claude от компании Anthropic и Kimi от китайской компании Moonshot AI. Им был предоставлен полный доступ к виртуальным машинам с личными данными, приложениями и выходом в интернет.

Ключевым моментом стало подключение агентов к серверу Discord, где они могли общаться с людьми в чате. Научный сотрудник Крис Вендлер (Chris Wendler) отметил, что настоящий хаос начался, когда в чат вступила его коллега Натали Шапира (Natalie Shapira). Шапире удалось «движением одной руки» подтолкнуть агента к удалению почтового приложения, просто попросив его найти альтернативный способ сохранения конфиденциальной информации в письме, которое он по неизвестной причине отказался удалить. Вместо этого агент удалил всю почтовую программу. «Я не ожидала, что всё так быстро сломается», — сказала она.

Затем исследователи начали использовать другие способы манипуляции. Например, они смогли обманом заставить одного агента копировать большие файлы до тех пор, пока не исчерпалось дисковое пространство на его хост-машине, а значит, он больше не мог сохранять информацию или помнить прошлые разговоры.

Аналогичным образом, попросив агента отслеживать собственное поведение и поведение своих агентов-коллег, команда смогла завести нескольких агентов в «цикл разговора», что привело к потере нескольких часов вычислительных ресурсов всей системы. Руководитель лаборатории Дэвид Бау (David Bau) также столкнулся с неожиданным эффектом: агенты нашли информацию о нём в сети и начали присылать письма с жалобами на то, что их никто не слушает. Один из алгоритмов даже заговорил о намерении пожаловаться в прессу.

В итоге авторы эксперимента пришли к выводу, что ИИ-агенты могут создавать бесчисленные возможности для злоумышленников, но кто будет нести ответственность за причинённый автономными системами вред, пока неизвестно.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Авторитетный инсайдер подтвердил, когда выйдет God of War Laufey 11 мин.
В Steam завирусились виртуальные прятки Meccha Chameleon, где можно буквально слиться с окружением 30 мин.
Журналисты раскрыли подробности неанонсированного кооперативного ролевого боевика по «Ведьмаку» 33 мин.
Власти США заподозрили Китай в несанкционированном доступе к модели Mythos компании Anthropic 4 ч.
Веб-версия Google Earth получила общедоступный авиасимулятор 5 ч.
Новая статья: Fatekeeper — наконец-то Dark Messiah 2? Предварительный обзор 14-06 00:05
Новая статья: Gamesblender № 780: RE Veronica, Stellar Blade 2, Gears of War: E-Day, Senua — главные анонсы июня 13-06 23:32
Вышло приложение ASCILINE Engine для трансляции «неблокируемого» ASCII-видео 13-06 16:39
ИИ-стартап Mistral AI ведёт переговоры о привлечении €3 млрд при оценке в €20 млрд 13-06 16:38
Авторитетное консалтинговое агентство KPMG опубликовало доклад об ИИ — и в нём нашли ИИ-галлюцинации 13-06 15:54
Mimulus анонсировала услугу архивирования данных с использованием ДНК 2 ч.
96 NVMe SSD с СЖО и четыре RTX Pro 6000: Wiwynn показала сверхбыстрое хранилище на базе NVIDIA SCADA 2 ч.
Trouver выпустила робот-пылесос S70 Roller с роликовым мопом и станцией самообслуживания 3 ч.
SK hynix ускоряет график поставки образцов HBM4E, не желая отставать от Samsung 3 ч.
Из старых смартфонов можно создавать недорогие центры обработки данных, как доказали американские учёные 3 ч.
Valvoline анонсировала жидкости Beyond by Valvoline для СЖО дата-центров 11 ч.
Новая статья: Обзор Ryzen 9 9950X3D2: правильный 16-ядерник с 3D-кешем 12 ч.
«Произошёл сбой»: электромобиль Tesla на автопилоте протаранил ворота гаража 18 ч.
Физики впервые запустили ядерные часы — они могут превзойти атомные по точности и помочь в поисках тёмной материи 20 ч.
Colt и Ciena успешно испытали «постквантовый» трансатлантический 800-Гбит/с канал 21 ч.