Сегодня 05 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI признала: у ИИ-браузеров есть уязвимость к инъекциям, которую невозможно полностью устранить

OpenAI стремится усилить безопасность своего браузера с искусственным интеллектом Atlas, но в компании поняли, что полностью исключить угрозу внедрения запросов (prompt injections) не получится. Внедрением запросов называется тип атаки, при котором агент ИИ выполняет скрытые инструкции в невидимых областях веб-страниц или писем электронной почты.

 Источник изображения: Dima Solomin / unsplash.com

Источник изображения: Dima Solomin / unsplash.com

Атаки с внедрением запросов едва ли получится изжить полностью так же, как мошеннические схемы и методы социальной инженерии, считают в OpenAI, а «режим агента» в браузере «расширяет поверхность угроз безопасности». OpenAI выпустила Atlas в октябре, и вскоре исследователи в области кибербезопасности начали демонстрировать, что поведением браузера можно манипулировать, например, написав несколько слов в Google Docs. Разработчики Brave подтвердили, что непрямое внедрение запросов представляет собой системную проблему для ИИ-браузеров, в том числе для Perplexity Comet. О невозможности полностью исключить подобные атаки недавно заявили в Национальном центре кибербезопасности Великобритании и порекомендовали экспертам не пытаться их «остановить», а смягчить возможные последствия. А Google и Anthropic решили сделать ставку на многоуровневую защиту и постоянное стресс-тестирование систем.

В OpenAI решили пойти своим путём и создали «автоматизированного злоумышленника на основе большой языковой модели». Это бот, который прошёл обучение с подкреплением и принял на себя роль хакера, постоянно пытающегося незаметно отправить ИИ-агенту вредоносные инструкции. Бот тестирует свои атаки в симуляциях, демонстрируя, как в тех или иных условиях рассуждает и действует целевой ИИ. Он изучает реакцию, корректирует схему атаки и повторяет свои попытки снова и снова. У посторонних доступ к настолько глубокому пониманию механизмов внутреннего мышления целевого ИИ отсутствует, поэтому в теории бот OpenAI должен находить уязвимости быстрее, чем реальные злоумышленники.

 Источник изображения: Mariia Shalabaieva / unsplash.com

Источник изображения: Mariia Shalabaieva / unsplash.com

В одной из демонстраций бот подбросил в почтовый ящик пользователя «отравленное» электронное письмо. ИИ просканировал корреспонденцию, открыл это письмо, проследовал скрытым в нём инструкциям и отправил от имени пользователя заявление об увольнении вместо автоматического ответа о его отсутствии на рабочем месте. После обновления безопасности ИИ-агент, однако, успешно обнаружил попытку внедрения запроса и сообщил о ней пользователю. Если надёжной и полной защиты от таких атак не существует, отметили в компании, то приходится полагаться на масштабное тестирование и ускорять циклы обновления. О фактических успехах по сокращению числа реакций на внедрения запросов в OpenAI не сообщили, но отметили, что работа в этом направлении при участии сторонних специалистов началась ещё до выхода Atlas.

Угроза от ИИ-агентов может быть серьёзной: они обладают некоторой автономностью при наличии высокого уровня доступа, указывают опрошенные TechCrunch эксперты. Поэтому одних только методов обучения с подкреплением недостаточно — необходимо учитывать и указанные аспекты: ограничивать действия, которые ИИ-агент способен осуществлять от имени учётной записи пользователя, в которую произведён вход, а также запрашивать подтверждения перед тем, как сделать нечто важное. На эти аспекты указывают и рекомендации OpenAI для пользователей: Atlas запрашивает подтверждение перед отправкой сообщений или перед совершением платежей. Пользователям также рекомендовали давать ИИ-агентам конкретные инструкции, а не, например, открывать доступ к почте и разрешать «делать, всё что потребуется». «Даже при наличии мер защиты широкая свобода действий облегчает скрытому или вредоносному контенту воздействие на агента», — предупредили в OpenAI.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Опасный ИИ Anthropic неожиданно помог компании наладить диалог с Белым домом 10 мин.
Apple объяснила удаление мессенджера Max из App Store санкциями 2 ч.
В России появится национальный ИИ-ассистент — он поселится на «Госуслугах» 2 ч.
Американские ИТ-компании стали выбирать ИИ DeepSeek — он дешевле 2 ч.
Фрэнк Азор из AMD опроверг слухи о том, что консольная графика RDNA 3.5 не получит поддержку FSR 4.1 2 ч.
Steam растёт вширь — Valve обновила дизайн главной страницы магазина 3 ч.
Полёты на вивернах, пинбол и переработка блокад: для Crimson Desert вышло крупное обновление 1.10.00 5 ч.
Интернет не для людей — автоматизированный трафик ботов в сети впервые в истории превысил человеческий 5 ч.
Reddit захлестнул спам с сомнительными медицинскими процедурами, который транслируется в ИИ-поиск Google 6 ч.
У биткоина выдалась худшая неделя с февраля — средства инвесторов перетекают в другие активы 7 ч.
Молния проникла в квартиру через интернет-кабель и уничтожила ПК и роутер 4 мин.
Google научила смартфоны следить за пульсом человека через фронтальную камеру 10 мин.
NASA упростит разработку ядерного корабля для полёта к Марсу, чтобы успеть к запуску в 2028 году 12 мин.
AMD заявила, что ИИ-агенты разогрели спрос на многоядерные процессоры 18 мин.
Утечка раскрыла цвета и характеристики Microsoft Surface Laptop 8 на чипах Snapdragon X2 21 мин.
В Китае придумали плавучий остров с АЭС, ВИЭ и производством водорода — для судоходства будущего 24 мин.
CoolIT разработала водоблок для чипов мощностью до 15 кВт 26 мин.
InWin показала корпус GX-285 со встроенной ретро-приставкой с 10-дюймовым экраном 54 мин.
Все три крупнейших поставщика памяти получили одобрение Nvidia на поставки HBM4 2 ч.
TSMC пойдёт по стопам Intel: компания уже купила литографы High-NA EUV, но для массового выпуска чипов использовать их пока не будет 2 ч.