Сегодня 28 июня 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Anthropic заплатит до $15 000 хакерам, которые найдут уязвимости в её ИИ-системах

Компания Anthropic объявила о запуске расширенной программы поиска уязвимостей, предлагая сторонним специалистам по кибербезопасности вознаграждение до 15 000 долларов за выявление критических проблем в своих системах искусственного интеллекта.

 Источник изображения: Copilot

Источник изображения: Copilot

Инициатива направлена на поиск «универсальных методов обхода», то есть способов взлома, которые могли бы последовательно обходить меры безопасности ИИ в таких областях высокого риска, как химические, биологические, радиологические и ядерные угрозы, а также в области киберпространства. Как сообщает ресурс VentureBeat, компания Anthropic пригласит этичных хакеров для проверки своей системы ещё до её публичного запуска, чтобы сразу предотвратить потенциальные эксплойты, которые могут привести к злоупотреблению её ИИ-системами.

Интересно, что данный подход отличается от стратегий других крупных игроков в области ИИ. Так, OpenAI и Google имеют программы вознаграждений, но они больше сосредоточены на традиционных уязвимостях программного обеспечения, а не на специфических для ИИ-индустрии эксплойтах. Кроме того, компания Meta недавно подверглась критике за относительно завуалированную позицию в области исследований безопасности ИИ. Напротив, явная нацеленность Anthropic на открытость устанавливает новый стандарт прозрачности в этом вопросе.

Однако эффективность программ поиска уязвимостей в решении всего спектра проблем безопасности ИИ остаётся спорной. Эксперты отмечают, что может потребоваться более комплексный подход, включающий обширное тестирование, улучшенную интерпретируемость и, возможно, новые структуры управления, необходимые для обеспечения глобального соответствия систем искусственного интеллекта человеческим ценностям.

Программа стартует как инициатива по приглашению (закрытое тестирование) в партнёрстве с известной платформой HackerOne, но в будущем Anthropic планирует расширить программу, сделав её открытой и создав отдельную независимую модель для отраслевого сотрудничества в области безопасности ИИ.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Alibaba представила ИИ-модель Qwen VLo, которая умеет редактировать картинки 22 мин.
В миллионах принтеров Brother обнаружены уязвимости безопасности — некоторые невозможно исправить 34 мин.
Runway готовит платформу для создания игр с помощью ИИ 46 мин.
ЕС пригрозил Meta ежедневными штрафами — бизнес-модель «плати или соглашайся» не прошла проверку 6 ч.
Новая статья: FBC: Firebreak — контроль потерян. Рецензия 7 ч.
Кодзима спрятал в Death Stranding 2: On the Beach отсылки к самому себе — они могут вызвать «сильный кринж» 8 ч.
Сердце пустыни склонно к измене: создатели Dune: Awakening устроили передел PvP и PvE в эндгейме после жалоб игроков 9 ч.
Microsoft добавила в браузер Edge поиск по истории с ИИ и новые функции Copilot 11 ч.
«Погоня за безопасными идеями — смертный приговор»: разработчик Rematch разбил надежды фанатов на Sifu 2 12 ч.
Мир охватила эпидемия ИИ-зависимости — от нездорового общения с ботами лечатся, как от наркомании 13 ч.
Intel отправила в отставку директора по стратегии 4 мин.
Мозговой имплант N1 компании Neuralink получили уже семь пациентов с опорно-двигательными проблемами 25 мин.
Xiaomi выпустила контроллер Redmi GamePad за $70 со стиками с эффектом Холла для мобильных устройств 32 мин.
Экс-руководитель печально известной Cruise перешел в Tesla для работы над роботакси 39 мин.
Intel скоро «догонит» AMD по доле рынка серверных процессоров 8 ч.
Intel смогла снизить долю на рынке серверных процессоров до 62 %, но доля AMD всё равно меньше 8 ч.
Учёные заставили цифровой контроллер работать почти при абсолютном нуле — это прорыв для квантовых компьютеров 9 ч.
Над США взорвался пылающий метеорит массой более тонны — осколки пробили жилой дом 12 ч.
Геймерские OLED-мониторы станут ярче — LG Display запустила массовое производство суперярких панелей с частотой 280 Гц 12 ч.
Deloitte: прожорливость ИИ ЦОД может привести к перегрузке энергетической инфраструктуры США 14 ч.