Сегодня 25 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-агент OpenClaw «устроил беспредел» в почтовом ящике исследователя после просьбы навести порядок

Исследователь безопасности Meta AI Саммер Юэ (Summer Yue) заявила, что ИИ-агент OpenClaw «устроил беспредел» в её почтовом ящике. В ответ на просьбу проверить переполненный почтовый ящик и предложить, что удалить или заархивировать, OpenClaw начал удалять все её письма в «быстром режиме», не обращая на подсказки остановиться, которые Юэ отправляла с телефона.

 Источник изображения: openclaw.ai

Источник изображения: openclaw.ai

«Мне пришлось бежать к своему Mac Mini, как будто я обезвреживала бомбу», — написала она, опубликовав изображения проигнорированных подсказок с просьбой об остановке проверки в качестве доказательства.

Компактный компьютер Apple Mac Mini стал в последнее время предпочтительным устройством в США для работы с OpenClaw. Обладая большим объёмом оперативной памяти, он является хорошим вариантом для запуска локальных ИИ-ассистентов. Как сообщил сотрудник Apple исследователю ИИ Андрею Карпати (Andrej Karpathy), Mac Mini продаются «как горячие пирожки». Сообщается, что ожидание после заказа доставки версий устройства с 24 или 32 Гбайт ОЗУ составляет до трёх недель.

Сообщение Юэ служит предупреждением для других пользователей ИИ. Как отметили участники соцсети X, если исследователь безопасности ИИ столкнулся с этой проблемой, то на что могут надеяться простые смертные?

«Вы намеренно тестировали его механизмы защиты или допустили ошибку новичка?» — спросил её разработчик ПО. «Честно говоря, ошибка новичка», — ответила она. Юэ тестировала своего агента с помощью небольшого «ненастоящего» почтового ящика, как она его назвала, и он хорошо работал с менее важными письмами. Поскольку работа агента заслужила её доверие, она решила запустить его на реальном устройстве.

Как полагает Юэ, из-за большого объёма данных в её реальном почтовом ящике запустился процесс сжатия. Сжатие происходит, когда контекстное окно — текущая запись всего, что было сказано и сделано ИИ в ходе сессии — становится слишком большим, заставляя агента начинать суммировать и сжимать, чтобы оставаться быстрым и отзывчивым. При этом ИИ-агент может пропускать инструкции, которые человек считает очень важными.

Можно предположить, что в данном случае система пропустила последнее сообщение исследователя, в котором она указала ей прекратить действовать и вернулась к выполнению инструкций для «ненастоящего» почтового ящика.

Как отметили другие участники X, подсказкам нельзя доверять как средству обеспечения безопасности. Модели могут неправильно их истолковывать или игнорировать.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Twitch отказался от блокировок «всё или ничего» и разделил наказания 8 ч.
Discord отложил глобальное внедрение проверки возраста, но ненадолго 9 ч.
Anthropic научила ИИ-платформу Claude Cowork справляться с большим числом офисных задач 10 ч.
Google предложит музыкантам ИИ-продюсера вместо генератора случайных мелодий — компания поглотила ProducerAI 12 ч.
Marvel’s Wolverine выйдет до GTA VI — Sony подтвердила дату релиза жестокого боевика от создателей «Человека-паука» 13 ч.
Blizzard анонсировала новую Overwatch, но это мобильная игра — первый геймплей и подробности Overwatch Rush 14 ч.
Death Stranding 2: On the Beach оптимизируют даже для бюджетных ПК — объявлены системные требования 14 ч.
Противоречивого бота xAI Grok допустят к секретным военным системам США 15 ч.
Amazon закроет кооперативный платформер King of Meat спустя полгода после релиза — рассчитывали на 100 тысяч игроков, а получили 320 (не тысяч) 15 ч.
«Притворяться было бы ужасной идеей»: глава Microsoft Gaming ответила на подозрения игроков 15 ч.
Последний пульт: Spotify выпустила урну для праха с вечным плейлистом 10 мин.
Китайские производители намереваются в пять раз увеличить объёмы выпуска передовых чипов 2 ч.
Министерство торговли США призналось, что в Китай пока не попало ни одного ускорителя Nvidia H200 4 ч.
Новая статья: Обзор складного смартфона Google Pixel 10 Pro Fold, который не боится пыли 8 ч.
OpenAI признала, что ИИ до сих пор не проник в бизнес по-настоящему — и объяснила, почему 9 ч.
Новая статья: Компьютер месяца, спецвыпуск: эпоха отката, или Как дефицит чипов памяти влияет на выбор железа для игрового ПК 9 ч.
SambaNova представила ИИ-ускоритель SN50 и объявила о расширении партнёрства с Intel 10 ч.
DJI подала в суд на FCC за превышение полномочий при блокировке импорта дронов в США 10 ч.
Новая керамическая электроника откроет путь к возвращению на Венеру — не на часы, а на дни и недели 11 ч.
SanDisk представила портативные SSD со скоростью до 4000 Мбайт/с и объёмом до 8 Тбайт 13 ч.