Сегодня 05 июля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Чат-бот Claude AI станет прекращать «вредоносные или оскорбительные диалоги с пользователями»

Anthropic научила свой чат-бот Claude AI прекращать общение, которое он сочтёт «вредоносным или оскорбительным». Эта возможность уже доступна в моделях Opus 4 и 4.1. Она позволит чат-боту завершать разговоры в качестве крайней меры после неоднократных попыток пользователя сгенерировать вредоносный или оскорбительный контент. Anthropic хочет добиться «потенциального благополучия» моделей ИИ, прекращая беседы, в которых Claude испытывает «явный дискомфорт».

 Источник изображения: Anthropic

Источник изображения: Anthropic

После прекращения диалога со стороны Claude, пользователь не сможет отправлять новые сообщения в этом чате, но создание новых чатов будет по-прежнему доступно. Anthropic отметила, что разговоры, вызывающие подобную реакцию, являются «крайними случаями», добавляя, что большинство пользователей не столкнутся с этим препятствием даже при обсуждении спорных тем.

В ходе тестирования Claude Opus 4 у чат-бота было отмечено «стойкое и последовательное отвращение к причинению вреда», в том числе к созданию сексуального контента с участием несовершеннолетних, насильственным действиям и терроризму. В этих случаях, по данным Anthropic, Claude демонстрировал «явную тревожность» и «тенденцию прекращать вредоносные разговоры, когда предоставлялась такая возможность».

Claude получил прямое указание не завершать разговоры, если пользователь проявляет признаки желания причинить «неминуемый вред» себе или другим. В таких случаях Anthropic привлекает онлайн-сервис кризисной поддержки Throughline, чтобы помочь разработать ответы на запросы, связанные с самоповреждением и психическим здоровьем.

На прошлой неделе Anthropic обновила политику использования своего чат-бота, поскольку быстро развивающиеся модели ИИ вызывают всё больше опасений по поводу безопасности. Теперь компания запрещает использовать Claude для разработки биологического, ядерного, химического или радиологического оружия, а также для разработки вредоносного кода или эксплуатации уязвимостей сети.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Crusoe рассчитывает привлечь $3 млрд при оценке в $30 млрд 13 мин.
Стартап Джима Келлера собрался поставить производство фабрик по выпуску чипов на конвейер 54 мин.
Рог изобилия ИИ продолжает разгонять Foxconn — выручка взлетела почти на 40 % во втором квартале 3 ч.
Sony разрабатывала геймпад DualShock со встроенной первой PlayStation, но проект отменили 7 ч.
Доля выпущенных в Китае электромобилей Tesla опустилась ниже 30 % мирового объёма поставок впервые с 2020 года 12 ч.
Прежде чем стать безопасными соседями для людей, роботам предстоит ещё сильно усовершенствоваться 12 ч.
TSMC получила разрешение тайваньских властей потратить ещё $20 млрд на завод в США 04-07 18:13
Вместо тысяч датчиков одна дешёвая камера — роботов научили чувствовать пальцами 04-07 17:35
В 2028 году Samsung планирует выпустить серийный смартфон с рулонным дисплеем 04-07 16:24
Портативная консоль AyaNeo Next 2 на AMD Strix Halo выйдет на мировой рынок — цена флагмана составит $5300 04-07 16:22