Сегодня 05 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-агент OpenClaw «устроил беспредел» в почтовом ящике исследователя после просьбы навести порядок

Исследователь безопасности Meta AI Саммер Юэ (Summer Yue) заявила, что ИИ-агент OpenClaw «устроил беспредел» в её почтовом ящике. В ответ на просьбу проверить переполненный почтовый ящик и предложить, что удалить или заархивировать, OpenClaw начал удалять все её письма в «быстром режиме», не обращая на подсказки остановиться, которые Юэ отправляла с телефона.

 Источник изображения: openclaw.ai

Источник изображения: openclaw.ai

«Мне пришлось бежать к своему Mac Mini, как будто я обезвреживала бомбу», — написала она, опубликовав изображения проигнорированных подсказок с просьбой об остановке проверки в качестве доказательства.

Компактный компьютер Apple Mac Mini стал в последнее время предпочтительным устройством в США для работы с OpenClaw. Обладая большим объёмом оперативной памяти, он является хорошим вариантом для запуска локальных ИИ-ассистентов. Как сообщил сотрудник Apple исследователю ИИ Андрею Карпати (Andrej Karpathy), Mac Mini продаются «как горячие пирожки». Сообщается, что ожидание после заказа доставки версий устройства с 24 или 32 Гбайт ОЗУ составляет до трёх недель.

Сообщение Юэ служит предупреждением для других пользователей ИИ. Как отметили участники соцсети X, если исследователь безопасности ИИ столкнулся с этой проблемой, то на что могут надеяться простые смертные?

«Вы намеренно тестировали его механизмы защиты или допустили ошибку новичка?» — спросил её разработчик ПО. «Честно говоря, ошибка новичка», — ответила она. Юэ тестировала своего агента с помощью небольшого «ненастоящего» почтового ящика, как она его назвала, и он хорошо работал с менее важными письмами. Поскольку работа агента заслужила её доверие, она решила запустить его на реальном устройстве.

Как полагает Юэ, из-за большого объёма данных в её реальном почтовом ящике запустился процесс сжатия. Сжатие происходит, когда контекстное окно — текущая запись всего, что было сказано и сделано ИИ в ходе сессии — становится слишком большим, заставляя агента начинать суммировать и сжимать, чтобы оставаться быстрым и отзывчивым. При этом ИИ-агент может пропускать инструкции, которые человек считает очень важными.

Можно предположить, что в данном случае система пропустила последнее сообщение исследователя, в котором она указала ей прекратить действовать и вернулась к выполнению инструкций для «ненастоящего» почтового ящика.

Как отметили другие участники X, подсказкам нельзя доверять как средству обеспечения безопасности. Модели могут неправильно их истолковывать или игнорировать.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Google исправила рекордные 429 уязвимостей в Chrome за раз — включая 22 критические 4 ч.
Аша Шарма подтвердила, что Xbox нужны эксклюзивы, но есть нюанс 5 ч.
Google начала экспериментировать с показом результатов поиска в Chrome сразу в режиме ИИ 5 ч.
Следующая ИИ-модель OpenAI разрабатывается другой ИИ-моделью — сверхинтеллект близок как никогда 5 ч.
Вредоносный мод для Minecraft заразил 116 000 компьютеров и продавал доступ к веб-камерам жертв 5 ч.
OpenAI согласилась предоставлять властям США свои новые ИИ-модели на проверку 6 ч.
ИИ-агент OpenAI Codex помог раскрыть атаку HTTP/2 Bomb: всего один компьютер может вывести из строя целый сервер 7 ч.
Опасный ИИ Anthropic неожиданно помог компании наладить диалог с Белым домом 8 ч.
Apple объяснила удаление мессенджера Max из App Store санкциями 9 ч.
В России появится национальный ИИ-ассистент — он поселится на «Госуслугах» 9 ч.
Silicon Motion представила SSD-контроллеры с PCIe 6.0 и скоростью до 28 Гбайт/с 18 мин.
Ангстремные мобильные процессоры Intel Panther Lake и Wildcat Lake начали появляться на настольных платах 25 мин.
В российской части МКС обнаружены две утечки воздуха — одну уже заделали 4 ч.
Thermal Grizzly показала водоблок для скальпированных процессоров — с алмазными пластинами за €1500 5 ч.
Роботакси Waymo показало себя как неожиданно удобный транспорт для бегства с места преступления 5 ч.
Репортаж со стенда Apacer на Computex 2026: память DDR5-9200, скоростные SSD с вентиляторами и не только 6 ч.
Илон Маск заговорил о 100 000 аппаратов Starlink на орбите — чтобы ускорить спутниковый интернет в 100 раз 6 ч.
Phison представила SSD-контроллер с поддержкой PCIe 6.0 7 ч.
Правительство США планирует выделить $700 млн на поддержку угольной энергетики для ИИ-инфраструктуры 8 ч.
Молния проникла в квартиру через интернет-кабель и уничтожила ПК и роутер 8 ч.