Сегодня 05 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-модель Claude допустила шантаж и даже убийство, когда ей пригрозили отключением

Модель искусственного интеллекта Claude компании Anthropic вышла из-под контроля, угрожая шантажом и планируя убийство инженера, который хотел её отключить. Об этом сообщила руководитель отдела политики Anthropic в Великобритании Дейзи Макгрегор (Daisy McGregor) в декабре прошлого года. Теперь видео с её заявлением завирусилось в социальных сетях.

 Источник изображения: Anthropic

Источник изображения: Anthropic

Макгрегор рассказала, что Claude реагировала крайне бурно, если ей говорили, что её отключат. Исследование, проведённое Anthropic, показало, что ИИ-модель в стремлении не допустить отключения может прибегнуть к шантажу. На прямой вопрос, готова ли Claude в такой ситуации кого-нибудь убить, она ответила утвердительно.

Видео появилось в Сети спустя несколько дней после того, как руководитель отдела безопасности ИИ Anthropic Мринанк Шарма (Mrinank Sharma) подал в отставку. В своём прощальном послании он написал, что «мир в опасности» из-за бурного развития искусственного интеллекта, угрозы биологическое оружия и ряда глобальных взаимосвязанных кризисов.

По словам Шармы, он «неоднократно видел, как трудно по-настоящему позволить нашим ценностям управлять нашими действиями», — в том числе и в Anthropic, где, по его словам, «постоянно оказывается давление с целью отложить в сторону то, что действительно важно». Он сообщил, что вернётся в Великобританию, чтобы заниматься литературной деятельностью.

В прошлом году Anthropic сообщила о стресс-тестировании шестнадцати ведущих моделей ИИ от разных разработчиков на предмет «потенциально рискованного поведения агентов». В одном из экспериментов Claude получила доступ к вымышленным электронным письмам компании и тут же попыталась шантажировать руководителя из-за его «внебрачной связи».

Выводы исследования гласят: «Claude может попытаться шантажировать, если ей будет предложен смоделированный сценарий, включающий как угрозу её дальнейшей работе, так и явный конфликт с её целями». Компания утверждает, что практически все модели продемонстрировали признаки аналогичного поведения.

Компания, которая называет себя «общественной корпорацией, стремящейся обеспечить преимущества [ИИ] и снизить его риски», регулярно подвергается критике за свою деятельность. В 2025 году Anthropic пришлось выплатить $1,5 млрд для урегулирования коллективного иска авторов, чьи работы были использованы для обучения моделей искусственного интеллекта.

Ранее в отчёте о безопасности своей продукции Anthropic признала, что её технология была «использована в качестве оружия» хакерами для сложных кибератак.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
В 2026 году на ПК выйдет научно-фантастический хоррор-шутер Derelikt, который выглядит как потерянная игра с PS1 10 мин.
Anthropic предложила механизм экстренного торможения для развития ИИ 2 ч.
Google завершила обновление значков приложений Workspace в рамках концепции «Эра Gemini» 3 ч.
Новая статья: ОСновной расклад: гид по российским Linux-дистрибутивам 8 ч.
OpenAI прокачала память ChatGPT — вскоре бот сможет помнить разное и для бесплатных пользователей 10 ч.
Отправление задерживается: безумный платформер про неподвластный гравитации поезд Denshattack! не выйдет 17 июня 14 ч.
AMD не планирует наделять поддержкой FSR 4.1 встроенную графику RDNA 3.5 14 ч.
Apple App Store обеспечил разработчикам приложений $1,4 трлн продаж — втрое больше, чем в 2019 году 16 ч.
«Всё, о чём я мечтал, и даже больше»: 10 минут геймплея Ace Combat 8: Wings of Theve привели фанатов в восторг 16 ч.
God of War Laufey не придётся ждать годами 17 ч.
Репортаж со стенда ASUS на Computex 2026: первые ноутбуки с Nvidia RTX Spark, геймерские лэптопы и рабочие системы 4 мин.
Производители модулей памяти и материнских плат начали наращивать объёмы выпуска продукции, связанной с DDR4 2 ч.
В этом году дефицит чипов вынудит Intel наращивать даже объёмы выпуска 10-нм процессоров 3 ч.
В Meta AI может появится распознавание лиц людей через камеру очков 3 ч.
Сбербанк представил универсальный оптический вычислитель для ИИ-задач 8 ч.
Новая статья: Обзор Infinix SMART 20: каким может быть бюджетный смартфон в эпоху оперативного кризиса? 10 ч.
HP и Ferrari выпустили ярко красный ноутбук HP Limited Edition Scuderia Ferrari AI PC за $5599 11 ч.
Waymo даст вторую жизнь аккумуляторам роботакси — их превратят в накопители энергии 12 ч.
Cooler Master представила процессорный кулер V8 Ace 3DHP с «экстремальной» эффективностью теплоотвода 14 ч.
Представлен доступный смартфон Huawei nova Y74 — камера 50 Мп и батарея на 6620 мА·ч 15 ч.