Сегодня 16 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-агент OpenClaw «устроил беспредел» в почтовом ящике исследователя после просьбы навести порядок

Исследователь безопасности Meta AI Саммер Юэ (Summer Yue) заявила, что ИИ-агент OpenClaw «устроил беспредел» в её почтовом ящике. В ответ на просьбу проверить переполненный почтовый ящик и предложить, что удалить или заархивировать, OpenClaw начал удалять все её письма в «быстром режиме», не обращая на подсказки остановиться, которые Юэ отправляла с телефона.

 Источник изображения: openclaw.ai

Источник изображения: openclaw.ai

«Мне пришлось бежать к своему Mac Mini, как будто я обезвреживала бомбу», — написала она, опубликовав изображения проигнорированных подсказок с просьбой об остановке проверки в качестве доказательства.

Компактный компьютер Apple Mac Mini стал в последнее время предпочтительным устройством в США для работы с OpenClaw. Обладая большим объёмом оперативной памяти, он является хорошим вариантом для запуска локальных ИИ-ассистентов. Как сообщил сотрудник Apple исследователю ИИ Андрею Карпати (Andrej Karpathy), Mac Mini продаются «как горячие пирожки». Сообщается, что ожидание после заказа доставки версий устройства с 24 или 32 Гбайт ОЗУ составляет до трёх недель.

Сообщение Юэ служит предупреждением для других пользователей ИИ. Как отметили участники соцсети X, если исследователь безопасности ИИ столкнулся с этой проблемой, то на что могут надеяться простые смертные?

«Вы намеренно тестировали его механизмы защиты или допустили ошибку новичка?» — спросил её разработчик ПО. «Честно говоря, ошибка новичка», — ответила она. Юэ тестировала своего агента с помощью небольшого «ненастоящего» почтового ящика, как она его назвала, и он хорошо работал с менее важными письмами. Поскольку работа агента заслужила её доверие, она решила запустить его на реальном устройстве.

Как полагает Юэ, из-за большого объёма данных в её реальном почтовом ящике запустился процесс сжатия. Сжатие происходит, когда контекстное окно — текущая запись всего, что было сказано и сделано ИИ в ходе сессии — становится слишком большим, заставляя агента начинать суммировать и сжимать, чтобы оставаться быстрым и отзывчивым. При этом ИИ-агент может пропускать инструкции, которые человек считает очень важными.

Можно предположить, что в данном случае система пропустила последнее сообщение исследователя, в котором она указала ей прекратить действовать и вернулась к выполнению инструкций для «ненастоящего» почтового ящика.

Как отметили другие участники X, подсказкам нельзя доверять как средству обеспечения безопасности. Модели могут неправильно их истолковывать или игнорировать.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
ZA/UM показала 12 минут геймплея Zero Parades: For Dead Spies — психоделической шпионской RPG в духе Disco Elysium 4 ч.
Новая статья: Mixtape — воспоминания никто не отнимет. Рецензия 16 ч.
Google начнёт наказывать сайты за накрутку попаданий в ИИ-ответы 16 ч.
Спринт, торговля и продолжение сюжета: разработчики Subnautica 2 раскрыли план улучшения игры на ближайшие месяцы 20 ч.
ChatGPT получит прямой доступ к банковским счетам пользователей — для анализа расходов и финансовых советов 20 ч.
Трамп и Си Цзиньпин обсудили ограничения слишком умного ИИ и зависшие поставки Nvidia H200 21 ч.
Microsoft намерена избавить Windows 11 от главной причины «синих экранов» 21 ч.
Доминирование ChatGPT пошатнулось — Gemini и Perplexity быстро набирают обороты 21 ч.
Pragmata стала новой жертвой пиратов — игру взломали без гипервизора 21 ч.
YouTube Shorts набрали популярность на смарт-телевизорах — 2 млрд часов просмотра за месяц 23 ч.
XBOX, а не Xbox: Microsoft решила писать имя игрового подразделения капслоком 5 мин.
Солнечная энергетика страдает от угольных ТЭС, установили учёные 8 мин.
Apple тестирует производство чипов для iPhone на мощностях Intel 5 ч.
Китайские ИТ-гиганты ускорили переход на отечественные ИИ-ускорители, несмотря на возможное возвращение Nvidia 5 ч.
Дженсен Хуанг стал героем китайских соцсетей, перекусив лапшой и мороженым прямо на пекинской улице 6 ч.
Tesla сняла гриф секретности с отчётов о ДТП с участием своих роботакси 8 ч.
ArXiv запретила учёным загружать статьи, сгенерированные нейросетями — за это предусмотрен бан на один год 8 ч.
DJI анонсировала в Каннах карманную кинокамеру Osmo Pocket 4P 15 ч.
OpenAI перестраивается вокруг ИИ-агентов в рамках подготовки к IPO — ChatGPT и Codex объединят в единую платформу 15 ч.
Зонд Mars Express показал «хаос и кратеры», образовавшиеся в результате древних наводнений на Марсе 15 ч.