Сегодня 23 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → ядерное оружие

Anthropic и правительство США проверяют искусственный интеллект на утечку ядерных секретов

Компания Anthropic, специализирующаяся на разработке искусственного интеллекта, совместно с Министерством энергетики США проводит уникальные испытания своей модели Claude 3 Sonnet. Целью эксперимента является проверка способности ИИ «не делиться» потенциально опасной информацией, связанной с ядерной энергетикой, в частности, с созданием оружия.

 Источник изображения: Copilot

Источник изображения: Copilot

Как стало известно изданию Axios, специалисты из Национального управления ядерной безопасности (NNSA) при Министерстве энергетики США с апреля этого года проверяют модель Claude 3 Sonnet, чтобы убедиться, что она не может быть использована для создания атомного оружия. В ходе «красных запросов» эксперты манипулируют системой, пытаясь её «сломать».

По словам Anthropic, подобные тесты, проходящие в совершенно секретной среде, являются первыми в своём роде и могут открыть путь для аналогичных взаимоотношений с другими государственными структурами. «В то время как американская промышленность лидирует в разработке передовых ИИ-моделей, федеральное правительство приобретает уникальный опыт, необходимый для оценки систем искусственного интеллектана предмет определенных рисков для национальной безопасности», — заявила руководитель отдела политики национальной безопасности Anthropic Марина Фаваро (Marina Favaro).

Представители NNSA также подчеркнули важность работы в этом направлении. Вендэн Смит (Wendin Smith), заместитель администратора NNSA, заявила, что ИИ является «одной из ключевых технологий, которая требует постоянного внимания в контексте национальной безопасности».

Anthropic планирует и дальше продолжить сотрудничество с правительством, чтобы разработать более надёжные меры безопасности для своих систем. Пилотная программа, в рамках которой тестируется также более новая модель Claude 3.5 Sonnet, продлится до февраля 2024 года. Компания обещает поделиться результатами тестирования с научными лабораториями и другими организациями.


window-new
Soft
Hard
Тренды 🔥
Роскомнадзор призвал бизнес признаться в утечках персональных данных и сэкономить на штрафах 10 мин.
Bethesda подарила копии The Elder Scrolls IV: Oblivion Remastered всем разработчикам Skyblivion и пообещала не закрывать проект 2 ч.
«Базис» представляет обновленный Basis Dynamix Cloud Control для комплексного управления облачной инфраструктурой 2 ч.
Локализаторы Starfield перевели The Elder Scrolls IV: Oblivion Remastered на русский язык — русификатор уже доступен 3 ч.
Grok научился «видеть» окружающий мир 3 ч.
Meta может потерять $7 млрд из-за новых пошлин Трампа против Китая 7 ч.
OpenAI готова купить браузер Chrome, если Google обяжут его продать 9 ч.
Новые правила «Оскара» разрешили применение ИИ в кино, но с оговоркой 12 ч.
Google бросила попытки искоренить сторонние cookies — они останутся в браузере Chrome 12 ч.
«Однозначно стоит своих денег»: хоррор Post Trauma в духе первых Silent Hill и Resident Evil вышел в российском Steam 14 ч.
Новая AUDI представила электромобиль E5 Sportback — до 787 л.с., запас хода до 770 км и быстрая зарядка 7 мин.
Илон Маск признался, что торговая война навредит производству человекоподобных роботов Optimus 2 ч.
Нашумевший ИИ-бот DeepSeek будет интегрирован в некоторые автомобили BMW 2 ч.
Представлен смартфон Huawei Enjoy 80 с аккумулятором на 6620 мА·ч и ценой от $165 2 ч.
Плата Banana Pi BPI-RV2 для компактных маршрутизаторов оснащена чипом RISC-V 2 ч.
Toshiba представила HDD N300 (Pro) вместимостью 24 Тбайт для NAS 2 ч.
Илон Маск пообещал уделять меньше внимания DOGE ради спасения Tesla 3 ч.
Гендир Тан вот-вот объявит об увольнении более 20 тыс. сотрудников Intel 3 ч.
Глава NVIDIA призвал премьера Японии к увеличению производства электроэнергии для развития ИИ-индустрии 4 ч.
Китайские техногиганты успели заказать у Nvidia ускорителей H20 на миллиарды долларов до введения запрета на их поставку 4 ч.