Сегодня 15 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Чат-бот Claude AI станет прекращать «вредоносные или оскорбительные диалоги с пользователями»

Anthropic научила свой чат-бот Claude AI прекращать общение, которое он сочтёт «вредоносным или оскорбительным». Эта возможность уже доступна в моделях Opus 4 и 4.1. Она позволит чат-боту завершать разговоры в качестве крайней меры после неоднократных попыток пользователя сгенерировать вредоносный или оскорбительный контент. Anthropic хочет добиться «потенциального благополучия» моделей ИИ, прекращая беседы, в которых Claude испытывает «явный дискомфорт».

 Источник изображения: Anthropic

Источник изображения: Anthropic

После прекращения диалога со стороны Claude, пользователь не сможет отправлять новые сообщения в этом чате, но создание новых чатов будет по-прежнему доступно. Anthropic отметила, что разговоры, вызывающие подобную реакцию, являются «крайними случаями», добавляя, что большинство пользователей не столкнутся с этим препятствием даже при обсуждении спорных тем.

В ходе тестирования Claude Opus 4 у чат-бота было отмечено «стойкое и последовательное отвращение к причинению вреда», в том числе к созданию сексуального контента с участием несовершеннолетних, насильственным действиям и терроризму. В этих случаях, по данным Anthropic, Claude демонстрировал «явную тревожность» и «тенденцию прекращать вредоносные разговоры, когда предоставлялась такая возможность».

Claude получил прямое указание не завершать разговоры, если пользователь проявляет признаки желания причинить «неминуемый вред» себе или другим. В таких случаях Anthropic привлекает онлайн-сервис кризисной поддержки Throughline, чтобы помочь разработать ответы на запросы, связанные с самоповреждением и психическим здоровьем.

На прошлой неделе Anthropic обновила политику использования своего чат-бота, поскольку быстро развивающиеся модели ИИ вызывают всё больше опасений по поводу безопасности. Теперь компания запрещает использовать Claude для разработки биологического, ядерного, химического или радиологического оружия, а также для разработки вредоносного кода или эксплуатации уязвимостей сети.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Google начала расширять персонализацию Gemini 48 мин.
Марк Цукерберг «перенёс свой рабочий стол» в лабораторию ИИ 50 мин.
Microsoft представила облегчённый ИИ-генератор изображений MAI-Image-2-Efficient 3 ч.
Anthropic готовится выпустить модель Claude Opus 4.7 и ИИ-генератор дизайнерских проектов 3 ч.
Pearl Abyss похвасталась продажами Crimson Desert — более пяти миллионов копий менее чем за месяц 4 ч.
Магазин приложений Aptoide обвинил Google в создании монополии 5 ч.
«Концентрированный кайф»: киберпанковый боевик Replaced стартовал в Steam c «очень положительными» отзывами 5 ч.
OpenAI представила GPT-5.4-Cyber — передовую ИИ-модель для защиты от киберугроз 5 ч.
Американские ведомства стали игнорировать запрет на сотрудничество с Anthropic — модель Mythos оказалась слишком хороша 5 ч.
Бесплатная раздача Graveyard Keeper обернулась для издателя игры выручкой в четверть миллиона долларов 6 ч.
Broadcom поможет Meta в создании нескольких поколений ИИ-ускорителей 24 мин.
MSI представила обновлённые ноутбуки Raider, Crosshair, Titan и Cyborg с новыми чипами Intel и графикой RTX 50-й серии 32 мин.
Жители американского городка выгнали половину муниципального совета, втихую одобрившего строительство крупного ЦОД — на очереди мэр и другие чиновники 48 мин.
В США испытали базовую станцию сотовой связи на дирижабле — она трое суток работала из стратосферы 49 мин.
Дата-центры Oracle получит топливные элементы Bloom Energy на 2,8 ГВт 2 ч.
За последние десять дней акции Nvidia взлетели в цене на 18 % 3 ч.
Xiaomi представила бюджетные Redmi R70 и R70m с процессорами Unisoc T8300, 13-Мп камерами и ёмкими батареями 3 ч.
Власти Китая планируют запретить поставки в США оборудования для производства солнечных панелей 3 ч.
Xiaomi выпустила Redmi G Pro 32U 2026 — 31,5-дюймовый игровой двухрежимный QD-Mini-LED-монитор за $470 3 ч.
Суперкомпьютеры с ИИ проиграли простым квантовым компьютерам из Китая в предсказании погоды 3 ч.