Сегодня 22 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Anthropic и правительство США проверяют искусственный интеллект на утечку ядерных секретов

Компания Anthropic, специализирующаяся на разработке искусственного интеллекта, совместно с Министерством энергетики США проводит уникальные испытания своей модели Claude 3 Sonnet. Целью эксперимента является проверка способности ИИ «не делиться» потенциально опасной информацией, связанной с ядерной энергетикой, в частности, с созданием оружия.

 Источник изображения: Copilot

Источник изображения: Copilot

Как стало известно изданию Axios, специалисты из Национального управления ядерной безопасности (NNSA) при Министерстве энергетики США с апреля этого года проверяют модель Claude 3 Sonnet, чтобы убедиться, что она не может быть использована для создания атомного оружия. В ходе «красных запросов» эксперты манипулируют системой, пытаясь её «сломать».

По словам Anthropic, подобные тесты, проходящие в совершенно секретной среде, являются первыми в своём роде и могут открыть путь для аналогичных взаимоотношений с другими государственными структурами. «В то время как американская промышленность лидирует в разработке передовых ИИ-моделей, федеральное правительство приобретает уникальный опыт, необходимый для оценки систем искусственного интеллектана предмет определенных рисков для национальной безопасности», — заявила руководитель отдела политики национальной безопасности Anthropic Марина Фаваро (Marina Favaro).

Представители NNSA также подчеркнули важность работы в этом направлении. Вендэн Смит (Wendin Smith), заместитель администратора NNSA, заявила, что ИИ является «одной из ключевых технологий, которая требует постоянного внимания в контексте национальной безопасности».

Anthropic планирует и дальше продолжить сотрудничество с правительством, чтобы разработать более надёжные меры безопасности для своих систем. Пилотная программа, в рамках которой тестируется также более новая модель Claude 3.5 Sonnet, продлится до февраля 2024 года. Компания обещает поделиться результатами тестирования с научными лабораториями и другими организациями.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новая статья: Reanimal — мастер-класс, но не без изъянов. Рецензия 10 ч.
Не только Cyberpunk 2077: на мощных Android-устройствах заработали AAA-игры для ПК, но с ограничениями 17 ч.
Apple создаёт локального ИИ-агента для iPhone, который сможет управлять приложениями за пользователя 20 ч.
Roblox обеспечила больше роста игровой индустрии, чем Steam, PlayStation и Fortnite вместе взятые 20 ч.
Платные подписчики YouTube Music начали слышать рекламу — Google пообещала разобраться 21 ч.
Microsoft: смена руководства в Xbox не повлечёт сокращений и закрытия студий 23 ч.
WhatsApp научится скрывать сообщения под спойлеры — прямо как другой популярный мессенджер 23 ч.
Фил Спенсер и президент Xbox Сара Бонд ушли из Microsoft — Microsoft Gaming возглавила специалист по ИИ 21-02 01:39
Новая статья: Mewgenics — девяти жизней может не хватить. Рецензия 21-02 00:04
«Гонка вооружений» в сфере ИИ бессмысленна — США и Китай преследуют совершенно разные цели 20-02 23:37
Phison E28 добрался до MSI: компания представила SSD с защитой от потери данных 2 ч.
Google готова помогать деньгами тем облачным провайдерам, которые используют её ускорители 2 ч.
Мартовский старт лунной миссии Artemis II оказался под угрозой срыва из-за обнаруженной технической проблемы 2 ч.
Игровая консоль Steam Deck оказалась в дефиците по всему миру 3 ч.
AMD подстрахует Crusoe, продаст ей свои чипы и сама же арендует их, если что-то пойдёт не так 10 ч.
Тайна «снеговиков» на краю Солнечной системы раскрыта спустя шесть лет 11 ч.
G42 из ОАЭ и Cerebras построят в Индии национальный ИИ-суперкомпьютер с царь-ускорителями WSE-3 19 ч.
Nautilus представила универсальный 4-МВт CDU 19 ч.
SpaceX создала систему мониторинга спутников ради безопасности орбиты — бесплатную для всех, но при одном условии 21 ч.
Anthropic обвалила акции CrowdStrike и Cloudflare, представив ИИ-багхантера Claude Code Security 24 ч.