Сегодня 13 мая 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → ядерное оружие

Anthropic и правительство США проверяют искусственный интеллект на утечку ядерных секретов

Компания Anthropic, специализирующаяся на разработке искусственного интеллекта, совместно с Министерством энергетики США проводит уникальные испытания своей модели Claude 3 Sonnet. Целью эксперимента является проверка способности ИИ «не делиться» потенциально опасной информацией, связанной с ядерной энергетикой, в частности, с созданием оружия.

 Источник изображения: Copilot

Источник изображения: Copilot

Как стало известно изданию Axios, специалисты из Национального управления ядерной безопасности (NNSA) при Министерстве энергетики США с апреля этого года проверяют модель Claude 3 Sonnet, чтобы убедиться, что она не может быть использована для создания атомного оружия. В ходе «красных запросов» эксперты манипулируют системой, пытаясь её «сломать».

По словам Anthropic, подобные тесты, проходящие в совершенно секретной среде, являются первыми в своём роде и могут открыть путь для аналогичных взаимоотношений с другими государственными структурами. «В то время как американская промышленность лидирует в разработке передовых ИИ-моделей, федеральное правительство приобретает уникальный опыт, необходимый для оценки систем искусственного интеллектана предмет определенных рисков для национальной безопасности», — заявила руководитель отдела политики национальной безопасности Anthropic Марина Фаваро (Marina Favaro).

Представители NNSA также подчеркнули важность работы в этом направлении. Вендэн Смит (Wendin Smith), заместитель администратора NNSA, заявила, что ИИ является «одной из ключевых технологий, которая требует постоянного внимания в контексте национальной безопасности».

Anthropic планирует и дальше продолжить сотрудничество с правительством, чтобы разработать более надёжные меры безопасности для своих систем. Пилотная программа, в рамках которой тестируется также более новая модель Claude 3.5 Sonnet, продлится до февраля 2024 года. Компания обещает поделиться результатами тестирования с научными лабораториями и другими организациями.


window-new
Soft
Hard
Тренды 🔥
Привет из прошлого: фанаты обнаружили черновой трейлер ранней версии Clair Obscur: Expedition 33 в антураже стимпанковой Англии 14 мин.
Рассуждающий ИИ скоро замедлится в развитии, выяснили эксперты 2 ч.
«Игра года, не иначе»: шутер Doom: The Dark Ages стартовал в расширенном доступе Steam с «очень положительными» отзывами 2 ч.
Криптобиржа впервые попала в индекс S&P 500 — этому помог рост биткоина 2 ч.
Apple представила новый режим чтения и другие функции для пользователей с ограниченными возможностями 2 ч.
Не совсем Game Ready: id Software подтвердила «постоянные сбои» в DOOM: The Dark Ages из-за драйвера GeForce 576.40 2 ч.
Экшен Marvel 1943: Rise of Hydra от команды бывшей сценаристки Uncharted не выйдет в 2025 году — объявлены новые сроки релиза 3 ч.
Microsoft пообещала поддержку Office в устаревшей Windows 10 до 2028 года 4 ч.
Система оценки совместимости игр для Steam Deck станет актуальной для всех устройств на базе SteamOS 5 ч.
ClickHouse готовится к новому раунду финансирования — оценка капитализации компании выросла до $6 млрд 5 ч.