Сегодня 21 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Чат-бот Claude AI станет прекращать «вредоносные или оскорбительные диалоги с пользователями»

Anthropic научила свой чат-бот Claude AI прекращать общение, которое он сочтёт «вредоносным или оскорбительным». Эта возможность уже доступна в моделях Opus 4 и 4.1. Она позволит чат-боту завершать разговоры в качестве крайней меры после неоднократных попыток пользователя сгенерировать вредоносный или оскорбительный контент. Anthropic хочет добиться «потенциального благополучия» моделей ИИ, прекращая беседы, в которых Claude испытывает «явный дискомфорт».

 Источник изображения: Anthropic

Источник изображения: Anthropic

После прекращения диалога со стороны Claude, пользователь не сможет отправлять новые сообщения в этом чате, но создание новых чатов будет по-прежнему доступно. Anthropic отметила, что разговоры, вызывающие подобную реакцию, являются «крайними случаями», добавляя, что большинство пользователей не столкнутся с этим препятствием даже при обсуждении спорных тем.

В ходе тестирования Claude Opus 4 у чат-бота было отмечено «стойкое и последовательное отвращение к причинению вреда», в том числе к созданию сексуального контента с участием несовершеннолетних, насильственным действиям и терроризму. В этих случаях, по данным Anthropic, Claude демонстрировал «явную тревожность» и «тенденцию прекращать вредоносные разговоры, когда предоставлялась такая возможность».

Claude получил прямое указание не завершать разговоры, если пользователь проявляет признаки желания причинить «неминуемый вред» себе или другим. В таких случаях Anthropic привлекает онлайн-сервис кризисной поддержки Throughline, чтобы помочь разработать ответы на запросы, связанные с самоповреждением и психическим здоровьем.

На прошлой неделе Anthropic обновила политику использования своего чат-бота, поскольку быстро развивающиеся модели ИИ вызывают всё больше опасений по поводу безопасности. Теперь компания запрещает использовать Claude для разработки биологического, ядерного, химического или радиологического оружия, а также для разработки вредоносного кода или эксплуатации уязвимостей сети.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Российские путешественники лишились доступа к «Госуслугам», банкам и другим отечественным сервисам из-за борьбы с VPN 3 ч.
Meta тестирует WhatsApp Plus — подписку, которая добавляет косметические улучшения 3 ч.
В Steam и VK Play вышла «Былина» — грандиозная экшен-RPG в мире славянских мифов 3 ч.
Календарь релизов 20–26 апреля: Vampire Crawlers, Masters of Albion, Kiln и Tides of Tomorrow 4 ч.
Nvidia улучшила ReSTIR: трассировка путей стала в 2–3 раза быстрее и чище 4 ч.
Всё тайное становится явным: Ubisoft наконец подтвердила, когда покажет Assassin's Creed Black Flag Resynced 6 ч.
ChatGPT перестал работать у многих пользователей по всему миру — OpenAI ведёт расследование 6 ч.
ИИ стал оружием хакеров: кибератаки стали быстрее и сложнее 7 ч.
В российском Steam открылся предзаказ постапокалиптического боевика Beast of Reincarnation от создателей «Покемонов» 8 ч.
Дата выхода, актёрский состав и самый амбициозный проект A24: раскрыты новые подробности фильма по Elden Ring 8 ч.
Meta бесплатно обучит американцев работе с волоконно-оптическими сетями, чтобы побыстрее развернуть свои ИИ ЦОД 2 ч.
Новая статья: Обзор MSI MEG X870E ACE MAX: царица-мать! 2 ч.
Торнадо ударил по заводу Rivian перед началом производства внедорожника R2 — обрушилась крыша одного из цехов 4 ч.
Huawei представила колонку Sound X5 с 18-каратным золотом и 126-мм вуфером 5 ч.
AMD поможет в развитии экосистемы ИИ во Франции 6 ч.
Представлены смарт-очки Huawei AI Glasses со встроенной камерой и переводчиком за $370 6 ч.
Toshiba предложила ждать замену HDD по гарантии до года или возместить деньги по старой цене 7 ч.
Командир лунной миссии Artemis II опубликовал потрясающее видео «заката Земли», снятое на iPhone 7 ч.
Похоже, OnePlus всё же уходит из Европы — на это намекает увольнение десятков ключевых сотрудников 7 ч.
Huawei представила конкурента MacBook — MateBook 14 HarmonyOS Edition с круглыми клавишами, фирменной ОС и чипом Kirin X90 7 ч.