Сегодня 06 июня 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → ядерное оружие

Anthropic и правительство США проверяют искусственный интеллект на утечку ядерных секретов

Компания Anthropic, специализирующаяся на разработке искусственного интеллекта, совместно с Министерством энергетики США проводит уникальные испытания своей модели Claude 3 Sonnet. Целью эксперимента является проверка способности ИИ «не делиться» потенциально опасной информацией, связанной с ядерной энергетикой, в частности, с созданием оружия.

 Источник изображения: Copilot

Источник изображения: Copilot

Как стало известно изданию Axios, специалисты из Национального управления ядерной безопасности (NNSA) при Министерстве энергетики США с апреля этого года проверяют модель Claude 3 Sonnet, чтобы убедиться, что она не может быть использована для создания атомного оружия. В ходе «красных запросов» эксперты манипулируют системой, пытаясь её «сломать».

По словам Anthropic, подобные тесты, проходящие в совершенно секретной среде, являются первыми в своём роде и могут открыть путь для аналогичных взаимоотношений с другими государственными структурами. «В то время как американская промышленность лидирует в разработке передовых ИИ-моделей, федеральное правительство приобретает уникальный опыт, необходимый для оценки систем искусственного интеллектана предмет определенных рисков для национальной безопасности», — заявила руководитель отдела политики национальной безопасности Anthropic Марина Фаваро (Marina Favaro).

Представители NNSA также подчеркнули важность работы в этом направлении. Вендэн Смит (Wendin Smith), заместитель администратора NNSA, заявила, что ИИ является «одной из ключевых технологий, которая требует постоянного внимания в контексте национальной безопасности».

Anthropic планирует и дальше продолжить сотрудничество с правительством, чтобы разработать более надёжные меры безопасности для своих систем. Пилотная программа, в рамках которой тестируется также более новая модель Claude 3.5 Sonnet, продлится до февраля 2024 года. Компания обещает поделиться результатами тестирования с научными лабораториями и другими организациями.


window-new
Soft
Hard
Тренды 🔥
Apple представила данные о $1,3 трлн оборота App Store перед WWDC25 6 ч.
В России заработала система блокировки мошеннических сайтов и приложений 11 ч.
AMD выпустила драйвер с поддержкой видеокарт Radeon RX 9060 XT и Radeon AI Pro R9700 11 ч.
Классические Baldur’s Gate, EA Sports FC 25 и четыре новых релиза: Microsoft раскрыла, чем порадует подписчиков Game Pass в начале июня 12 ч.
Живописное приключение Sword of the Sea от создателей Abzu и The Pathless выглядит как наследник Journey — новый трейлер и дата выхода 13 ч.
Американский Институт безопасности ИИ больше не сосредоточен на безопасности ИИ 14 ч.
Perplexity анонсировала заменитель Google Chrome — ИИ-браузер Comet 14 ч.
Reddit решила засудить Anthropic за чрезмерную активность ИИ-краулеров 15 ч.
Авторы No More Heroes и Lollipop Chainsaw анонсировали Romeo is a Dead Man — безумный экшен с гротескным насилием и чёрным юмором 16 ч.
Для The Elder Scrolls IV: Oblivion Remastered в Steam вышла бета-версия первого патча, но улучшений производительности придётся подождать 17 ч.