Сегодня 16 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → ядерное оружие

Anthropic и правительство США проверяют искусственный интеллект на утечку ядерных секретов

Компания Anthropic, специализирующаяся на разработке искусственного интеллекта, совместно с Министерством энергетики США проводит уникальные испытания своей модели Claude 3 Sonnet. Целью эксперимента является проверка способности ИИ «не делиться» потенциально опасной информацией, связанной с ядерной энергетикой, в частности, с созданием оружия.

 Источник изображения: Copilot

Источник изображения: Copilot

Как стало известно изданию Axios, специалисты из Национального управления ядерной безопасности (NNSA) при Министерстве энергетики США с апреля этого года проверяют модель Claude 3 Sonnet, чтобы убедиться, что она не может быть использована для создания атомного оружия. В ходе «красных запросов» эксперты манипулируют системой, пытаясь её «сломать».

По словам Anthropic, подобные тесты, проходящие в совершенно секретной среде, являются первыми в своём роде и могут открыть путь для аналогичных взаимоотношений с другими государственными структурами. «В то время как американская промышленность лидирует в разработке передовых ИИ-моделей, федеральное правительство приобретает уникальный опыт, необходимый для оценки систем искусственного интеллектана предмет определенных рисков для национальной безопасности», — заявила руководитель отдела политики национальной безопасности Anthropic Марина Фаваро (Marina Favaro).

Представители NNSA также подчеркнули важность работы в этом направлении. Вендэн Смит (Wendin Smith), заместитель администратора NNSA, заявила, что ИИ является «одной из ключевых технологий, которая требует постоянного внимания в контексте национальной безопасности».

Anthropic планирует и дальше продолжить сотрудничество с правительством, чтобы разработать более надёжные меры безопасности для своих систем. Пилотная программа, в рамках которой тестируется также более новая модель Claude 3.5 Sonnet, продлится до февраля 2024 года. Компания обещает поделиться результатами тестирования с научными лабораториями и другими организациями.


window-new
Soft
Hard
Тренды 🔥
Rockstar начала отключать функции Social Club — студия может готовить новую платформу к релизу GTA VI 6 мин.
ИИ-помощники программистов начали перемещаться в интерфейс командной строки 16 мин.
«Игра сломана сильнее, чем мои ожидания»: долгожданная Neverwinter Nights 2: Enhanced Edition разочаровала пользователей Steam 56 мин.
Аналог VMware Tanzu, мониторинг, управление инсталляциями: в zVirt 4.4 появились модули для комплексного управления ИТ-инфраструктурой 2 ч.
Valve удалила олдскульную гоночную аркаду Old School Rally из Steam за нарушение авторских прав: что ждёт игру дальше 3 ч.
В Китае запустили систему обезличенной аутентификации пользователей в интернете, которая таковой не является 3 ч.
Microsoft расширила возможности Copilot Vision — теперь ИИ видит всё, что показано на экране 3 ч.
Сегодня российские пользователи столкнулись со сбоем Steam 4 ч.
Облачный стриминг Microsoft добрался до приложения Xbox на ПК — поиграть можно даже в консольные эксклюзивы 4 ч.
«Просто омерзительно»: Microsoft заменит уволенных разработчиков Candy Crush ИИ-инструментами, которые те помогли создать 6 ч.
Восстановление поставок ИИ-ускорителей Nvidia H20 в Китай займёт до девяти месяцев 2 ч.
Тарифы Трампа навредили ASML не так сильно, как ожидалось — но то ли ещё будет 2 ч.
Гравитационно-волновые детекторы засекли самое масштабное столкновение чёрных дыр в истории наблюдений 2 ч.
Starlink начнёт запускать спутники третьего поколения на Starship в 2026 году — они обеспечат скорость выше 1 Тбит/с 2 ч.
AMD сообщила о грядущем возобновлении поставок MI308 в Китай 2 ч.
Пенсильвания получит более $90 млрд инвестиций на развитие ИИ, ЦОД и энергетики 3 ч.
Пока Tesla пытается наладить выпуск роботов Optimus, китайские конкуренты захватили внимание всего мира 3 ч.
HMD представила кнопочные телефоны с поддержкой DeepSeek 3 ч.
Broadcom представила 51,2-Тбит/с чип-коммутатор Tomahawk Ultra — альтернативу NVIDIA InfiniBand и NVLink 3 ч.
Белорусский «Горизонт» начнёт выпускать «ТВ Станции» для «Яндекса» в Минске 3 ч.