Сегодня 05 июня 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Anthropic заплатит до $15 000 хакерам, которые найдут уязвимости в её ИИ-системах

Компания Anthropic объявила о запуске расширенной программы поиска уязвимостей, предлагая сторонним специалистам по кибербезопасности вознаграждение до 15 000 долларов за выявление критических проблем в своих системах искусственного интеллекта.

 Источник изображения: Copilot

Источник изображения: Copilot

Инициатива направлена на поиск «универсальных методов обхода», то есть способов взлома, которые могли бы последовательно обходить меры безопасности ИИ в таких областях высокого риска, как химические, биологические, радиологические и ядерные угрозы, а также в области киберпространства. Как сообщает ресурс VentureBeat, компания Anthropic пригласит этичных хакеров для проверки своей системы ещё до её публичного запуска, чтобы сразу предотвратить потенциальные эксплойты, которые могут привести к злоупотреблению её ИИ-системами.

Интересно, что данный подход отличается от стратегий других крупных игроков в области ИИ. Так, OpenAI и Google имеют программы вознаграждений, но они больше сосредоточены на традиционных уязвимостях программного обеспечения, а не на специфических для ИИ-индустрии эксплойтах. Кроме того, компания Meta недавно подверглась критике за относительно завуалированную позицию в области исследований безопасности ИИ. Напротив, явная нацеленность Anthropic на открытость устанавливает новый стандарт прозрачности в этом вопросе.

Однако эффективность программ поиска уязвимостей в решении всего спектра проблем безопасности ИИ остаётся спорной. Эксперты отмечают, что может потребоваться более комплексный подход, включающий обширное тестирование, улучшенную интерпретируемость и, возможно, новые структуры управления, необходимые для обеспечения глобального соответствия систем искусственного интеллекта человеческим ценностям.

Программа стартует как инициатива по приглашению (закрытое тестирование) в партнёрстве с известной платформой HackerOne, но в будущем Anthropic планирует расширить программу, сделав её открытой и создав отдельную независимую модель для отраслевого сотрудничества в области безопасности ИИ.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
В России заработала система блокировки мошеннических сайтов и приложений 2 ч.
«Последний патч не был последним»: CD Projekt Red подтвердила ещё одно крупное обновление для Cyberpunk 2077 2 ч.
AMD выпустила драйвер с поддержкой видеокарт Radeon RX 9060 XT и Radeon AI Pro R9700 2 ч.
Классические Baldur’s Gate, EA Sports FC 25 и четыре новых релиза: Microsoft раскрыла, чем порадует подписчиков Game Pass в начале июня 3 ч.
Живописное приключение Sword of the Sea от создателей Abzu и The Pathless выглядит как наследник Journey — новый трейлер и дата выхода 5 ч.
Американский Институт безопасности ИИ больше не сосредоточен на безопасности ИИ 5 ч.
Perplexity анонсировала заменитель Google Chrome — ИИ-браузер Comet 6 ч.
Reddit решила засудить Anthropic за чрезмерную активность ИИ-краулеров 6 ч.
Авторы No More Heroes и Lollipop Chainsaw анонсировали Romeo is a Dead Man — безумный экшен с гротескным насилием и чёрным юмором 7 ч.
Для The Elder Scrolls IV: Oblivion Remastered в Steam вышла бета-версия первого патча, но улучшений производительности придётся подождать 8 ч.
Основатель DeviantArt представил «холст» для цифрового искусства за $22 000 2 ч.
Nothing представит 1 июля дебютные накладные наушники Headphone (1) 3 ч.
Ремонт Nintendo Switch 2 в некоторых случаях обойдется почти вдвое дороже, чем оригинальной Switch 3 ч.
Sony представила лучший контроллер для файтингов — Project Defiant со сверхнизкой задержкой 4 ч.
Защищённые смартфоны IIIF150 Raptor 5G, Air3 и B2 Pro поступят в глобальную продажу 16 июня 4 ч.
Radeon RX 9060 XT поступила в продажу по цене от $299 — или от 44 000 рублей в России 5 ч.
Kioxia рассказала, когда создаст SSD с производительностью выше 10 миллионов IOPS 5 ч.
1 Тбит/с на 4,7 тыс. км: Nokia протестировала сверхбыструю квантово-защищённую сеть для ИИ-суперкомпьютеров 5 ч.
Представлен вертикальный пылесос Dreame H15 Pro Heat с искусственным интеллектом, горячей водой и автоматизацией 5 ч.
ASRock объявила о поддержке «процессоров AMD следующего поколения» платами с AM5 — но никто не знает каких 6 ч.