Сегодня 22 февраля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Anthropic и правительство США проверяют искусственный интеллект на утечку ядерных секретов

Компания Anthropic, специализирующаяся на разработке искусственного интеллекта, совместно с Министерством энергетики США проводит уникальные испытания своей модели Claude 3 Sonnet. Целью эксперимента является проверка способности ИИ «не делиться» потенциально опасной информацией, связанной с ядерной энергетикой, в частности, с созданием оружия.

 Источник изображения: Copilot

Источник изображения: Copilot

Как стало известно изданию Axios, специалисты из Национального управления ядерной безопасности (NNSA) при Министерстве энергетики США с апреля этого года проверяют модель Claude 3 Sonnet, чтобы убедиться, что она не может быть использована для создания атомного оружия. В ходе «красных запросов» эксперты манипулируют системой, пытаясь её «сломать».

По словам Anthropic, подобные тесты, проходящие в совершенно секретной среде, являются первыми в своём роде и могут открыть путь для аналогичных взаимоотношений с другими государственными структурами. «В то время как американская промышленность лидирует в разработке передовых ИИ-моделей, федеральное правительство приобретает уникальный опыт, необходимый для оценки систем искусственного интеллектана предмет определенных рисков для национальной безопасности», — заявила руководитель отдела политики национальной безопасности Anthropic Марина Фаваро (Marina Favaro).

Представители NNSA также подчеркнули важность работы в этом направлении. Вендэн Смит (Wendin Smith), заместитель администратора NNSA, заявила, что ИИ является «одной из ключевых технологий, которая требует постоянного внимания в контексте национальной безопасности».

Anthropic планирует и дальше продолжить сотрудничество с правительством, чтобы разработать более надёжные меры безопасности для своих систем. Пилотная программа, в рамках которой тестируется также более новая модель Claude 3.5 Sonnet, продлится до февраля 2024 года. Компания обещает поделиться результатами тестирования с научными лабораториями и другими организациями.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новая статья: Kingdom Come: Deliverance II — ролевое вознесение. Рецензия 7 ч.
Apple отключила сквозное шифрование в iCloud по требованию властей Великобритании 8 ч.
Взрывной платформер Shotgun Cop Man от создателя My Friend Pedro предложит спуститься в ад и арестовать Дьявола — трейлер и демоверсия в Steam 9 ч.
Valve заблокировала игру в российском Steam по требованию Роскомнадзора 11 ч.
Meta рассказала, как скачивать контент через торренты, но не стать пиратом 12 ч.
Corsair прояснила заявление о релизе ПК-версии GTA VI в начале 2026 года 12 ч.
Роскомнадзор принудительно записал Cloudflare в организаторы распространения информации 13 ч.
«Небольшой, но искренний прогресс»: DeepSeek откроет для всех пять ИИ-репозиториев 14 ч.
Видео: прохождение пролога ремейка первой Gothic и получасовая демонстрация русской озвучки 14 ч.
Политический триллер в 1613 году: сюжетное дополнение «Земский собор» к «Смуте» получило первый трейлер и новые подробности 15 ч.
AMD готовится продать предприятия по выпуску серверного оборудования тайваньским инвесторам 17 мин.
Intel начала официально предлагать технологию 18A своим клиентам 58 мин.
На Балтике вновь повреждён подводный кабель C-Lion1 между Финляндией и Германией 7 ч.
Китайский подводный дата-центр HiCloud получил ИИ-апгрейд 8 ч.
На китайской орбитальной станции испытали робота-инспектора, вдохновлённого морскими звёздами 8 ч.
Ирландский регулятор предложил дата-центрам заняться самостоятельной постройкой электростанций и энергохранилищ 8 ч.
В России скоро наступит дефицит энергии для обучения ИИ — сильнее всего ударит по ЦОД в Москве и Санкт-Петербурге 10 ч.
В Индии создали надёжные прозрачные электроды для двухсторонних солнечных панелей 11 ч.
Умные часы Fitbit перестали обжигать владельцев, но теперь их нужно заряжать каждый день 11 ч.
Запуск Grok 3 подстегнёт рост спроса на ИИ-серверы 12 ч.