Сегодня 03 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Чат-бот Claude AI станет прекращать «вредоносные или оскорбительные диалоги с пользователями»

Anthropic научила свой чат-бот Claude AI прекращать общение, которое он сочтёт «вредоносным или оскорбительным». Эта возможность уже доступна в моделях Opus 4 и 4.1. Она позволит чат-боту завершать разговоры в качестве крайней меры после неоднократных попыток пользователя сгенерировать вредоносный или оскорбительный контент. Anthropic хочет добиться «потенциального благополучия» моделей ИИ, прекращая беседы, в которых Claude испытывает «явный дискомфорт».

 Источник изображения: Anthropic

Источник изображения: Anthropic

После прекращения диалога со стороны Claude, пользователь не сможет отправлять новые сообщения в этом чате, но создание новых чатов будет по-прежнему доступно. Anthropic отметила, что разговоры, вызывающие подобную реакцию, являются «крайними случаями», добавляя, что большинство пользователей не столкнутся с этим препятствием даже при обсуждении спорных тем.

В ходе тестирования Claude Opus 4 у чат-бота было отмечено «стойкое и последовательное отвращение к причинению вреда», в том числе к созданию сексуального контента с участием несовершеннолетних, насильственным действиям и терроризму. В этих случаях, по данным Anthropic, Claude демонстрировал «явную тревожность» и «тенденцию прекращать вредоносные разговоры, когда предоставлялась такая возможность».

Claude получил прямое указание не завершать разговоры, если пользователь проявляет признаки желания причинить «неминуемый вред» себе или другим. В таких случаях Anthropic привлекает онлайн-сервис кризисной поддержки Throughline, чтобы помочь разработать ответы на запросы, связанные с самоповреждением и психическим здоровьем.

На прошлой неделе Anthropic обновила политику использования своего чат-бота, поскольку быстро развивающиеся модели ИИ вызывают всё больше опасений по поводу безопасности. Теперь компания запрещает использовать Claude для разработки биологического, ядерного, химического или радиологического оружия, а также для разработки вредоносного кода или эксплуатации уязвимостей сети.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Датамайнер: Half-Life 3 станет «самой оптимизированной игрой, которую когда-либо выпускала Valve» 17 мин.
Snowflake теперь будет сотрудничать с OpenAI напрямую, минуя Microsoft 3 ч.
Правоохранители нагрянули с обыском в парижский офис соцсети X и вызвали Илона Маска на допрос 3 ч.
Adobe объявила о закрытии Animate — 2D-анимация проиграла в неравной битве ИИ 3 ч.
Главу Larian вынудили поделиться подробностями концовки новой Divinity 3 ч.
Nintendo выдала даты выхода трёх дополнений к кооперативному хоррору Reanimal от авторов Little Nightmares 5 ч.
Визуальная новелла в жанре психологического хоррора Slay the Princess достигла вершины продаж, о которой разработчики не могли и мечтать 5 ч.
Объём слитых в интернет данных россиян взлетел почти на 70 % в прошлом году 6 ч.
Онлайн-кинотеатры в России нарастили аудиторию до 75 млн зрителей и теперь думают над повышением цен 6 ч.
xAI выпустила Grok Imagine 1.0 с поддержкой создания 10-секундных видео в улучшенном разрешении 12 ч.
OpenAI не устроили чипы NVIDIA для инференса, теперь она ищет альтернативы 34 мин.
Apple захватила 69 % американского рынка смартфонов — у Samsung в пять раз меньше 2 ч.
Xiaomi выпустила на глобальный рынок 27-дюймовый 200-Гц FHD-монитор G27i 2026 за $157 3 ч.
«Шоковая заморозка» для серверов: китайские учёные научились охлаждать системы ИИ за 20 секунд без фреона 3 ч.
Сделка на триллион с четвертью: SpaceX приобрела xAI 3 ч.
«Байкал Электроникс» открыл свободный доступ к документации на серийный микроконтроллер Baikal-U 3 ч.
Спутник-платформа RuVDS для разработки космического ПО успешно выведен на орбиту 4 ч.
В Китае создали компактный твердотельный лазер для ранее недоступного VUV-диапазона — выиграют наука, космос и чипмейкеры 5 ч.
Intel при поддержке SoftBank готова начать выпуск альтернативы памяти HBM к 2029 году 5 ч.
Switch стала самой популярной Nintendo в истории — продано более 155 млн консолей 5 ч.