Сегодня 14 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-модель Claude допустила шантаж и даже убийство, когда ей пригрозили отключением

Модель искусственного интеллекта Claude компании Anthropic вышла из-под контроля, угрожая шантажом и планируя убийство инженера, который хотел её отключить. Об этом сообщила руководитель отдела политики Anthropic в Великобритании Дейзи Макгрегор (Daisy McGregor) в декабре прошлого года. Теперь видео с её заявлением завирусилось в социальных сетях.

 Источник изображения: Anthropic

Источник изображения: Anthropic

Макгрегор рассказала, что Claude реагировала крайне бурно, если ей говорили, что её отключат. Исследование, проведённое Anthropic, показало, что ИИ-модель в стремлении не допустить отключения может прибегнуть к шантажу. На прямой вопрос, готова ли Claude в такой ситуации кого-нибудь убить, она ответила утвердительно.

Видео появилось в Сети спустя несколько дней после того, как руководитель отдела безопасности ИИ Anthropic Мринанк Шарма (Mrinank Sharma) подал в отставку. В своём прощальном послании он написал, что «мир в опасности» из-за бурного развития искусственного интеллекта, угрозы биологическое оружия и ряда глобальных взаимосвязанных кризисов.

По словам Шармы, он «неоднократно видел, как трудно по-настоящему позволить нашим ценностям управлять нашими действиями», — в том числе и в Anthropic, где, по его словам, «постоянно оказывается давление с целью отложить в сторону то, что действительно важно». Он сообщил, что вернётся в Великобританию, чтобы заниматься литературной деятельностью.

В прошлом году Anthropic сообщила о стресс-тестировании шестнадцати ведущих моделей ИИ от разных разработчиков на предмет «потенциально рискованного поведения агентов». В одном из экспериментов Claude получила доступ к вымышленным электронным письмам компании и тут же попыталась шантажировать руководителя из-за его «внебрачной связи».

Выводы исследования гласят: «Claude может попытаться шантажировать, если ей будет предложен смоделированный сценарий, включающий как угрозу её дальнейшей работе, так и явный конфликт с её целями». Компания утверждает, что практически все модели продемонстрировали признаки аналогичного поведения.

Компания, которая называет себя «общественной корпорацией, стремящейся обеспечить преимущества [ИИ] и снизить его риски», регулярно подвергается критике за свою деятельность. В 2025 году Anthropic пришлось выплатить $1,5 млрд для урегулирования коллективного иска авторов, чьи работы были использованы для обучения моделей искусственного интеллекта.

Ранее в отчёте о безопасности своей продукции Anthropic признала, что её технология была «использована в качестве оружия» хакерами для сложных кибератак.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Голливуд вовсю осваивает ИИ: растёт число школ по кинопроизводству с нейросетями 35 мин.
ByteDance представила Doubao 2.0 — самый популярный ИИ-бот Китая стал мощнее и подготовился к «эре агентов» 6 ч.
Реклама Anthropic с подтруниванием над OpenAI сработала — аудитория Claude выросла на 11 % 8 ч.
Apple рассказала, насколько сильно iOS 26 проникла на iPhone по всему миру 9 ч.
Google с задержкой в пару дней выпустила первую бету Android 17 15 ч.
OpenAI убила самую эмоциональную ИИ-модель, несмотря на протесты пользователей 15 ч.
Новая статья: Cult of the Lamb: Woolhaven — культ на пике. Рецензия 21 ч.
Warhorse прокачала Kingdom Come: Deliverance для PS5, Xbox Series X и S, а на ПК исправила старые баги 24 ч.
Свежее обновление снова сломало Windows 11 — KB5077181 вызывает бесконечную перезагрузку 13-02 20:03
Владелец TikTok продаст разработчика Mobile Legends: Bang Bang за $6 миллиардов и окончательно уйдёт из игровой индустрии 13-02 19:11
Власти США признали парниковые газы безопасными для людей — ДВС, уголь и нефть снова в игре 11 мин.
У NASA снова испортилась лунная ракета SLS — при попытке её заправить, топливо перестало поступать в баки 24 мин.
«Карманный» стартап Amazon получил лицензию на производство ядерного супертоплива в США для реакторов нового поколения 39 мин.
Робопсы будут патрулировать мексиканский стадион на Чемпионате мира по футболу 6 ч.
Китай запретит нетрадиционные рули в автомобилях — под ударом штурвалы Tesla 6 ч.
TSMC придётся вложить ещё $100 млрд в американское производство чипов ради сделки США и Тайваня 6 ч.
Disney потребовала от ByteDance отключить новейший ИИ-генератор видео Seedance 2.0 — он копирует персонажей Star Wars и Marvel 6 ч.
Даже взлетевшие цены на DDR5 не вывели Corsair в плюс — а впереди спад выручки 7 ч.
NVIDIA арендует «подсудный» ЦОД, строящийся на средства от продажи «мусорных» облигаций 8 ч.
Сделано в Японии: Fujitsu организует производство суверенных ИИ-серверов 9 ч.