Сегодня 13 мая 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Anthropic и правительство США проверяют искусственный интеллект на утечку ядерных секретов

Компания Anthropic, специализирующаяся на разработке искусственного интеллекта, совместно с Министерством энергетики США проводит уникальные испытания своей модели Claude 3 Sonnet. Целью эксперимента является проверка способности ИИ «не делиться» потенциально опасной информацией, связанной с ядерной энергетикой, в частности, с созданием оружия.

 Источник изображения: Copilot

Источник изображения: Copilot

Как стало известно изданию Axios, специалисты из Национального управления ядерной безопасности (NNSA) при Министерстве энергетики США с апреля этого года проверяют модель Claude 3 Sonnet, чтобы убедиться, что она не может быть использована для создания атомного оружия. В ходе «красных запросов» эксперты манипулируют системой, пытаясь её «сломать».

По словам Anthropic, подобные тесты, проходящие в совершенно секретной среде, являются первыми в своём роде и могут открыть путь для аналогичных взаимоотношений с другими государственными структурами. «В то время как американская промышленность лидирует в разработке передовых ИИ-моделей, федеральное правительство приобретает уникальный опыт, необходимый для оценки систем искусственного интеллектана предмет определенных рисков для национальной безопасности», — заявила руководитель отдела политики национальной безопасности Anthropic Марина Фаваро (Marina Favaro).

Представители NNSA также подчеркнули важность работы в этом направлении. Вендэн Смит (Wendin Smith), заместитель администратора NNSA, заявила, что ИИ является «одной из ключевых технологий, которая требует постоянного внимания в контексте национальной безопасности».

Anthropic планирует и дальше продолжить сотрудничество с правительством, чтобы разработать более надёжные меры безопасности для своих систем. Пилотная программа, в рамках которой тестируется также более новая модель Claude 3.5 Sonnet, продлится до февраля 2024 года. Компания обещает поделиться результатами тестирования с научными лабораториями и другими организациями.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Захватывающие анонсы, мировые премьеры и секретные разработки: игровая презентация Warhammer Skulls 2025 пройдёт на следующей неделе 15 мин.
Nintendo Switch 2 получит режим ограничения заряда аккумулятора, который продлит срок его службы 21 мин.
Microsoft уволит около 7000 управленцев по всему миру ради оптимизации 41 мин.
Гарнитура Apple Vision Pro поможет людям лучше видеть 44 мин.
Привет из прошлого: фанаты обнаружили черновой трейлер ранней версии Clair Obscur: Expedition 33 в антураже стимпанковой Англии 2 ч.
Рассуждающий ИИ скоро замедлится в развитии, выяснили эксперты 3 ч.
«Игра года, не иначе»: шутер Doom: The Dark Ages стартовал в расширенном доступе Steam с «очень положительными» отзывами 3 ч.
Криптобиржа впервые попала в индекс S&P 500 — этому помог рост биткоина 3 ч.
Apple представила новый режим чтения и другие функции для пользователей с ограниченными возможностями 3 ч.
Не совсем Game Ready: id Software подтвердила «постоянные сбои» в DOOM: The Dark Ages из-за драйвера GeForce 576.40 3 ч.