Сегодня 03 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI признала: у ИИ-браузеров есть уязвимость к инъекциям, которую невозможно полностью устранить

OpenAI стремится усилить безопасность своего браузера с искусственным интеллектом Atlas, но в компании поняли, что полностью исключить угрозу внедрения запросов (prompt injections) не получится. Внедрением запросов называется тип атаки, при котором агент ИИ выполняет скрытые инструкции в невидимых областях веб-страниц или писем электронной почты.

 Источник изображения: Dima Solomin / unsplash.com

Источник изображения: Dima Solomin / unsplash.com

Атаки с внедрением запросов едва ли получится изжить полностью так же, как мошеннические схемы и методы социальной инженерии, считают в OpenAI, а «режим агента» в браузере «расширяет поверхность угроз безопасности». OpenAI выпустила Atlas в октябре, и вскоре исследователи в области кибербезопасности начали демонстрировать, что поведением браузера можно манипулировать, например, написав несколько слов в Google Docs. Разработчики Brave подтвердили, что непрямое внедрение запросов представляет собой системную проблему для ИИ-браузеров, в том числе для Perplexity Comet. О невозможности полностью исключить подобные атаки недавно заявили в Национальном центре кибербезопасности Великобритании и порекомендовали экспертам не пытаться их «остановить», а смягчить возможные последствия. А Google и Anthropic решили сделать ставку на многоуровневую защиту и постоянное стресс-тестирование систем.

В OpenAI решили пойти своим путём и создали «автоматизированного злоумышленника на основе большой языковой модели». Это бот, который прошёл обучение с подкреплением и принял на себя роль хакера, постоянно пытающегося незаметно отправить ИИ-агенту вредоносные инструкции. Бот тестирует свои атаки в симуляциях, демонстрируя, как в тех или иных условиях рассуждает и действует целевой ИИ. Он изучает реакцию, корректирует схему атаки и повторяет свои попытки снова и снова. У посторонних доступ к настолько глубокому пониманию механизмов внутреннего мышления целевого ИИ отсутствует, поэтому в теории бот OpenAI должен находить уязвимости быстрее, чем реальные злоумышленники.

 Источник изображения: Mariia Shalabaieva / unsplash.com

Источник изображения: Mariia Shalabaieva / unsplash.com

В одной из демонстраций бот подбросил в почтовый ящик пользователя «отравленное» электронное письмо. ИИ просканировал корреспонденцию, открыл это письмо, проследовал скрытым в нём инструкциям и отправил от имени пользователя заявление об увольнении вместо автоматического ответа о его отсутствии на рабочем месте. После обновления безопасности ИИ-агент, однако, успешно обнаружил попытку внедрения запроса и сообщил о ней пользователю. Если надёжной и полной защиты от таких атак не существует, отметили в компании, то приходится полагаться на масштабное тестирование и ускорять циклы обновления. О фактических успехах по сокращению числа реакций на внедрения запросов в OpenAI не сообщили, но отметили, что работа в этом направлении при участии сторонних специалистов началась ещё до выхода Atlas.

Угроза от ИИ-агентов может быть серьёзной: они обладают некоторой автономностью при наличии высокого уровня доступа, указывают опрошенные TechCrunch эксперты. Поэтому одних только методов обучения с подкреплением недостаточно — необходимо учитывать и указанные аспекты: ограничивать действия, которые ИИ-агент способен осуществлять от имени учётной записи пользователя, в которую произведён вход, а также запрашивать подтверждения перед тем, как сделать нечто важное. На эти аспекты указывают и рекомендации OpenAI для пользователей: Atlas запрашивает подтверждение перед отправкой сообщений или перед совершением платежей. Пользователям также рекомендовали давать ИИ-агентам конкретные инструкции, а не, например, открывать доступ к почте и разрешать «делать, всё что потребуется». «Даже при наличии мер защиты широкая свобода действий облегчает скрытому или вредоносному контенту воздействие на агента», — предупредили в OpenAI.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
xAI выпустила Grok Imagine 1.0 с поддержкой создания 10-секундных видео в улучшенном разрешении 50 мин.
В Firefox появится выключатель всех ИИ-функций разом 6 ч.
Суровое альпинистское приключение Cairn от создателей Furi покорило вершину в 200 тысяч проданных копий всего за три дня 8 ч.
«Лучше большинства фильмов по RE»: трагичная короткометражка по мотивам Resident Evil Requiem впечатлила фанатов 10 ч.
За саундтрек можно не переживать: композитор «Ведьмака 3» напишет музыку для The Witcher 4 11 ч.
Firefly без ограничений: Adobe сняла лимиты на ИИ-генерацию изображений и видео, но не навсегда 12 ч.
Google добавит в Gemini инструмент для переноса диалогов из ChatGPT и других ИИ-ботов 13 ч.
Nioh 3 впервые в серии выйдет за пределами PC и PlayStation — Sony раскрыла сроки консольной эксклюзивности 14 ч.
Microsoft вернула на экран блокировки Windows 11 значок входа по паролю, пропавший в августе 14 ч.
Редкие в прошлом экстренные патчи Microsoft стали ужасающе обыденными 14 ч.
ASUS и HiFiMAN выпустили игровую гарнитуру ROG Kithara открытого типа с аудиофильским звуком 47 мин.
Arm сделала бесплатным доступ к своим архитектурам для более зажиточных стартапов 3 ч.
Новая статья: Обзор материнской платы MSI MAG X870E Tomahawk WIFI PZ: плата для эстетов-оверклокеров 6 ч.
Новая статья: ИИтоги января 2026 г.: будет триллион! 7 ч.
Экология в приоритете: проект энергоэффективного ЦОД МТС получил прописку в федеральном реестре углеродных единиц 8 ч.
В 2025 году в России значительно выросли затраты на закупки серверов и СХД на фоне их удорожания 9 ч.
Маск подтвердил переговоры о слиянии SpaceX и xAI — ИИ оказался слишком прожорлив 9 ч.
Windows 10 и процессоры Intel неожиданно прибавили популярности у геймеров — статистика Steam за январь 11 ч.
Surface без Microsoft: Meta представила виртуальные клавиатуру и тачпад для Quest 3 12 ч.
Продажи российских серверов и СХД почти удвоились в 2025 году 16 ч.