Сегодня 24 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-агент OpenClaw «устроил беспредел» в почтовом ящике исследователя после просьбы навести порядок

Исследователь безопасности Meta AI Саммер Юэ (Summer Yue) заявила, что ИИ-агент OpenClaw «устроил беспредел» в её почтовом ящике. В ответ на просьбу проверить переполненный почтовый ящик и предложить, что удалить или заархивировать, OpenClaw начал удалять все её письма в «быстром режиме», не обращая на подсказки остановиться, которые Юэ отправляла с телефона.

 Источник изображения: openclaw.ai

Источник изображения: openclaw.ai

«Мне пришлось бежать к своему Mac Mini, как будто я обезвреживала бомбу», — написала она, опубликовав изображения проигнорированных подсказок с просьбой об остановке проверки в качестве доказательства.

Компактный компьютер Apple Mac Mini стал в последнее время предпочтительным устройством в США для работы с OpenClaw. Обладая большим объёмом оперативной памяти, он является хорошим вариантом для запуска локальных ИИ-ассистентов. Как сообщил сотрудник Apple исследователю ИИ Андрею Карпати (Andrej Karpathy), Mac Mini продаются «как горячие пирожки». Сообщается, что ожидание после заказа доставки версий устройства с 24 или 32 Гбайт ОЗУ составляет до трёх недель.

Сообщение Юэ служит предупреждением для других пользователей ИИ. Как отметили участники соцсети X, если исследователь безопасности ИИ столкнулся с этой проблемой, то на что могут надеяться простые смертные?

«Вы намеренно тестировали его механизмы защиты или допустили ошибку новичка?» — спросил её разработчик ПО. «Честно говоря, ошибка новичка», — ответила она. Юэ тестировала своего агента с помощью небольшого «ненастоящего» почтового ящика, как она его назвала, и он хорошо работал с менее важными письмами. Поскольку работа агента заслужила её доверие, она решила запустить его на реальном устройстве.

Как полагает Юэ, из-за большого объёма данных в её реальном почтовом ящике запустился процесс сжатия. Сжатие происходит, когда контекстное окно — текущая запись всего, что было сказано и сделано ИИ в ходе сессии — становится слишком большим, заставляя агента начинать суммировать и сжимать, чтобы оставаться быстрым и отзывчивым. При этом ИИ-агент может пропускать инструкции, которые человек считает очень важными.

Можно предположить, что в данном случае система пропустила последнее сообщение исследователя, в котором она указала ей прекратить действовать и вернулась к выполнению инструкций для «ненастоящего» почтового ящика.

Как отметили другие участники X, подсказкам нельзя доверять как средству обеспечения безопасности. Модели могут неправильно их истолковывать или игнорировать.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Создатель Kingdom Come: Deliverance променял разработку игр на кино по Kingdom Come: Deliverance 25 мин.
«Молюсь, чтобы ты ошибался»: инсайдер раскрыл главную игру мартовской подборки PS Plus, и фанаты не рады 2 ч.
ИИ-агент OpenClaw «устроил беспредел» в почтовом ящике исследователя после просьбы навести порядок 2 ч.
Нуарный ретрошутер Mouse: P.I. For Hire не выйдет 19 марта — объявлена новая дата релиза 5 ч.
Google и Apple тестируют шифрование RCS-сообщений между Android и iOS 6 ч.
Акции кибербезопасников летят вниз второй день подряд — новая модель Anthropic напугала инвесторов 7 ч.
WhatsApp работает над функцией отложенных сообщений 7 ч.
ИИ пересказал «Гарри Поттера» и другие книги почти дословно — миф о добросовестном использовании под вопросом 13 ч.
Календарь релизов — с 23 февраля до 1 марта: Resident Evil Requiem и Reigns: The Witcher 15 ч.
В Steam стартовал праздник будущих хитов — фестиваль «Играм быть» с тысячами демоверсий 15 ч.
В Японии больше не производят телевизоры — Panasonic тоже делегировала производство китайцам 22 мин.
Anthropic научила ИИ языку Cobol и вызвала рекордное обрушение акций IBM 35 мин.
Видео: летающее такси SkyDrive поднялось в небо Токио — коммерческие рейсы запустят в 2028 году 2 ч.
Lenovo представила индустриальные мини-компьютеры ThinkEdge на платформе Intel для ИИ-задач 2 ч.
Углеволокно научили заживлять трещины: новый метаматериал выдержал 1000 циклов восстановления и сможет служить столетиями 2 ч.
Taara представила фотонную платформу для лазерной связи со скоростью до 25 Гбит/с 2 ч.
«Xbox мягко усыпят»: отец Xbox предрёк конец игровому подразделению Microsoft 3 ч.
В России запущено уголовное расследование в отношении Павла Дурова 3 ч.
Корпоративные закупки «чистой» энергии впервые упали в 2025 году после почти 10 лет роста 4 ч.
Mac Mini с шильдиком «Сделано в США» появятся до конца года, но вряд ли их будет много 4 ч.