Сегодня 26 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Anthropic признала уязвимость Claude Cowork и переложила риски на пользователей

Компания Anthropic, представившая на этой неделе в качестве предварительной версии для исследований новый режим ИИ-помощника Claude под названием Claude Cowork, продолжает игнорировать уязвимость продукта к атакам промпт-инъекций (Prompt Injection), о которой хорошо осведомлена, пишет The Register.

 Источник изображения: Steve Johnson/unsplash.com

Источник изображения: Steve Johnson/unsplash.com

Для запуска атаки пользователю достаточно подключить Cowork к локальной папке, содержащей конфиденциальную информацию, загрузить документ со скрытой промпт-инъекцией, и, когда Cowork проанализирует эти файлы, сработает внедрённая подсказка, ведущая к созданию вредоносного контента, несанкционированному доступу к личным данным или нарушению установленных ограничений.

Данная уязвимость существует в самом Claude, о чём компания PromptArmor, специализирующаяся на обнаружении уязвимостей в ИИ, предупредила Anthropic ещё в октябре прошлого года. Тогда Anthropic в итоге признала, что атаку промпт-инъекцией можно использовать для того, чтобы обманом заставить её API эксфильтровать данные, поэтому пользователям следует быть осторожными с тем, какие источники они подключают к ИИ-боту.

Вместе с тем, когда исследователи спросили, собирается ли Anthropic предпринять какие-либо действия — например, внедрить проверки API, чтобы убедиться, что конфиденциальные файлы пользователя не передаются на другой аккаунт через API, — компания попросту не ответила.

Anthropic утверждает, что разработала сложные средства защиты от промпт-инъекций, однако безопасность агентов — то есть задача обеспечения безопасности реальных действий Claude — «по-прежнему является активной областью развития в отрасли».

«Эти риски не новы для Cowork, но, возможно, вы впервые используете более продвинутый инструмент, выходящий за рамки простого диалога», — сообщила компания, отмечая, что Cowork имеет гораздо более широкий круг пользователей, чем анонсированные ранее инструменты.

В связи с этим Anthropic призвала пользователей избегать подключения Cowork к конфиденциальным документам, ограничивать использование расширения Chrome доверенными сайтами и отслеживать «подозрительные действия, которые могут указывать на промпт-инъекцию».

Как отметил разработчик и специалист по проблемам внедрения SQL-запросов Саймон Уиллисон (Simon Willison) в своём обзоре Cowork, требовать от людей, не являющихся программистами, отслеживать «подозрительные действия, которые могут указывать на внедрение SQL-запросов», попросту нереалистично.

В ответ на запрос The Register о том, какие меры принимаются для решения проблемы внедрения запросов через API, которая теперь присутствует уже в двух продуктах компании, Anthropic заявила, что внедрение запросов — это проблема, затрагивающая всю отрасль, и над её решением работают все участники ИИ-рынка.

Всё это свидетельствует о том, что Anthropic рассматривает риски использования Cowork как ответственность самих пользователей.

Вместе с тем представитель Anthropic сообщил, что компания также работает над способами минимизации внедрения запросов в своих продуктах, в том числе с помощью виртуальной машины в Cowork, предназначенной для ограничения доступа платформы к конфиденциальным файлам и каталогам. Anthropic заявила, что планирует выпустить обновление для виртуальной машины Cowork с целью улучшения её взаимодействия с уязвимым API, а также что в будущем будут внесены и другие изменения для повышения безопасности при использовании нового инструмента.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Россияне снова пожаловались на массовую заморозку аккаунтов в «Госуслугах» 30 мин.
AMD выпустила драйвер с поддержкой Resident Evil Requiem и Marathon 36 мин.
Nvidia выпустила драйвер с поддержкой Resident Evil Requiem 2 ч.
Жертвы перестали платить хакерам: уровень выплат упал до исторического минимума, хотя атак стало намного больше 2 ч.
Хорошего понемногу: надёжный инсайдер заявил, что Sony перестанет портировать эксклюзивы PlayStation на ПК 2 ч.
Google представила Nano Banana 2 — обновлённый генератор изображений работает быстрее и качественнее, и доступен бесплатно 2 ч.
Новый трейлер амбициозного пиратского выживания Windrose разочаровал фанатов отсутствием даты выхода — разработчики отреагировали 3 ч.
Instagram будет оповещать родителей, если подросток ищет контент о суициде и членовредительстве 4 ч.
Технодесантник, новая операция и платные голоса: разработчики Warhammer 40,000: Space Marine 2 выпустили крупное обновление 12.0 4 ч.
Новый трейлер подтвердил дату выхода в раннем доступе Steam ролевой песочницы Valorborn с живым миром и полной свободой действий 5 ч.
Первый в мире трансатлантический оптоволоконный кабель TAT-8 демонтируют через 37 лет после прокладки 4 ч.
«Большая неделя впереди»: Apple пообещала порадовать фанатов чередой анонсов 4 ч.
Энтузиаст приспособил льдогенератор для охлаждения процессора — и добился 40 °C под нагрузкой 4 ч.
Разворот научных потоков: открывший графен Андрей Гейм продолжит научную карьеру в Гонконге после 20 лет в Манчестере 4 ч.
Иттрий подорожал в 69 раз за год — дефицит редкоземов в США усиливается даже после перемирия с Китаем 5 ч.
Мировые продажи DRAM взлетели на 29 % за прошлый квартал: цены подскочили на 50 %, а Samsung снова на первом месте 5 ч.
Positive Technologies выпустила межсетевой экран PT NGFW 3050 с производительностью до 400 Гбит/с 5 ч.
Huawei представила умные часы Watch GT Runner 2 и другие новинки 6 ч.
Uber поднимается в небо: аэротакси Joby станут доступны через обычное приложение в Дубае 6 ч.
SK hynix и SanDisk запустили стандартизацию High Bandwidth Flash — новой памяти между HBM и SSD 6 ч.