Сегодня 10 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI представила ИИ-агента Aardvark для поиска и устранения уязвимостей в ПО

Компания OpenAI представила Aardvark — исследовательского ИИ-агента на базе GPT‑5 для поиска уязвимостей в программном обеспечении.

 Источник изображений: OpenAI

Источник изображений: OpenAI

OpenAI отмечает, что каждый год в корпоративных и открытых кодовых базах обнаруживаются десятки тысяч новых уязвимостей. Эксперты сталкиваются с непростой задачей поиска и устранения уязвимостей раньше, чем это сделают злоумышленники. Aardvark представляет собой прорыв в исследованиях ИИ и безопасности. Это автономный агент, который может помочь разработчикам и командам безопасности обнаруживать и устранять уязвимости безопасности в больших масштабах.

Aardvark постоянно анализирует репозитории исходного кода для выявления уязвимостей, оценки возможности их эксплуатации, определения степени серьёзности и предложения целевых исправлений. Он отслеживает коммиты и изменения в кодовых базах, выявляет уязвимости, определяет, как они могут быть использованы, и предлагает решения. Aardvark не использует традиционные методы анализа программ, такие как фаззинг или анализ композиции программного обеспечения. Вместо этого он использует рассуждения на основе LLM, а также инструменты для понимания поведения кода и выявления уязвимостей. Aardvark ищет ошибки так же, как это делает исследователь безопасности: читая код, анализируя его, создавая и запуская тесты, используя инструменты и многое другое.

Aardvark использует многоступенчатый конвейер для выявления, объяснения и устранения уязвимостей:

  • Анализ : Aardvark начинает с анализа всего репозитория для создания модели угроз, отражающей понимание целей безопасности и архитектуры проекта.
  • Сканирование коммитов : Aardvark сканирует уязвимости, проверяя изменения на уровне коммитов во всем репозитории и модели угроз по мере добавления нового кода. При первом подключении к репозиторию Aardvark сканирует его историю для выявления существующих проблем. Aardvark пошагово объясняет обнаруженные уязвимости, аннотируя код для проверки человеком.
  • Валидация : После того, как Aardvark обнаружил потенциальную уязвимость, он попытается запустить её в изолированной среде, чтобы подтвердить возможность её эксплуатации. Aardvark описывает шаги, предпринимаемые для обеспечения точной, высококачественной и малой доли ложноположительных результатов.
  • Установка исправлений: Aardvark интегрируется с OpenAI Codex для исправления обнаруженных уязвимостей. К каждой находке он прикрепляет сгенерированный Codex и отсканированный Aardvark патч для проверки человеком и эффективного применения исправлений одним щелчком мыши.

Хотя Aardvark создан для обеспечения безопасности, OpenAI в ходе тестирования обнаружила, что агентный ИИ также может выявлять выявлять логические ошибки, неполные исправления и проблемы с конфиденциальностью. Aardvark уже несколько месяцев непрерывно работает с внутренними кодовыми базами OpenAI и кодовыми базами внешних партнёров. В OpenAI он выявил серьёзные уязвимости и внёс вклад в повышение безопасности ПО. В ходе бенчмарк-тестирования на «золотых» репозиториях Aardvark выявил 92 % известных и искусственно созданных уязвимостей, продемонстрировав высокую полноту и эффективность в реальных условиях.

Aardvark также применялся к проектам с открытым исходным кодом, где он обнаружил многочисленные уязвимости, десяти из которых были присвоены идентификаторы Common Vulnerabilities and Exposures (CVE). OpenAI отмечает, что собирается предлагать бесплатное сканирование избранных некоммерческих репозиториев с открытым исходным кодом, чтобы внести свой вклад в безопасность экосистемы программного обеспечения с открытым исходным кодом и цепочки поставок. Недавно компания обновила свою политику скоординированного раскрытия информации, которая ориентирована на разработчиков, сотрудничество и масштабируемость воздействия, а не на жёсткие сроки раскрытия информации, которые могут оказывать давление на разработчиков.

Сейчас Aardvark доступен в закрытой бета-версии для проверки и улучшения своих возможностей в реальных условиях. OpenAI приглашает избранных партнёров присоединиться для получения раннего доступа и совместной работе напрямую с командой OpenAI над улучшением точности обнаружения, рабочих процессов валидации и качества отчётности.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Экс-продюсер GTA Лесли Бензис «временно» покинул основанную им Build a Rocket Boy, а руководство MindsEye надеется повторить путь Cyberpunk 2077 7 ч.
Календарь релизов 9–15 февраля: Reanimal, Mewgenics, Romeo is a Dead Man и Disciples: Domination 8 ч.
Зрелищный ретрофутуристический боевик Replaced порадовал журналистов и скоро получит демоверсию в Steam 10 ч.
Успех на грани разочарования: критики оценили Yakuza Kiwami 3 хуже классической Yakuza 3 11 ч.
Десятки тысяч ИИ-агентов OpenClaw оказались уязвимы для взлома из-за ошибок в настройках 11 ч.
ChatGPT начнёт массово показывать рекламу уже на этой неделе — а пока Альтман похвалился активным ростом аудитории 12 ч.
«Жёсткое, но единственно правильное решение»: после критики фанатов авторы «Зайчика» объявили о полной переработке игры 12 ч.
Google спрятала тексты песен в YouTube Music от бесплатных пользователей 12 ч.
Sony подтвердила самый масштабный выпуск State of Play в истории — больше 60 минут анонсов от студий по всему миру 13 ч.
В январе «VK Видео» стал самым популярным видеосервисом в России — через полтора года после замедления YouTube 14 ч.
Власти США готовятся поднять пошлины на импорт чипов, но гиперскейлеры из числа клиентов TSMC получат льготы 2 ч.
Новая статья: Обзор игровых системных блоков ASUS ROG G700 и ASUS TUF Gaming T500: бессмертная классика и необычный гибрид 6 ч.
Dreame показала дебютную тройку смартфонов — флагман Dreame RS1 получил нетривиальный дизайн и Snapdragon 8 Elite Gen 5 7 ч.
Alphabet возьмёт в долг $20 млрд на 100 лет, чтобы вложиться в ИИ 7 ч.
NASA и SpaceX отложили запуск миссии Crew-12 с россиянином к МКС из-за непогоды 7 ч.
Snapdragon X2 Elite оказался быстрее Apple M5 в синтетических тестах, но уступил Ryzen AI 9 и Core Ultra X9 в играх 10 ч.
Google собралась одолжить $15 млрд на строительство дата-центров для ненасытного ИИ 12 ч.
Intel тихо похоронила идею активации функций процессоров за доплату 13 ч.
Какие ваши доказательства: Nvidia отринула обвинения в обучении ИИ на пиратских книгах 14 ч.
Nokia и Ericsson вытеснили с китайского рынка — не за горами «раскол» 6G на западный и китайский варианты 14 ч.