Сегодня 18 августа 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Чат-бот Claude AI станет прекращать «вредоносные или оскорбительные диалоги с пользователями»

Anthropic научила свой чат-бот Claude AI прекращать общение, которое он сочтёт «вредоносным или оскорбительным». Эта возможность уже доступна в моделях Opus 4 и 4.1. Она позволит чат-боту завершать разговоры в качестве крайней меры после неоднократных попыток пользователя сгенерировать вредоносный или оскорбительный контент. Anthropic хочет добиться «потенциального благополучия» моделей ИИ, прекращая беседы, в которых Claude испытывает «явный дискомфорт».

 Источник изображения: Anthropic

Источник изображения: Anthropic

После прекращения диалога со стороны Claude, пользователь не сможет отправлять новые сообщения в этом чате, но создание новых чатов будет по-прежнему доступно. Anthropic отметила, что разговоры, вызывающие подобную реакцию, являются «крайними случаями», добавляя, что большинство пользователей не столкнутся с этим препятствием даже при обсуждении спорных тем.

В ходе тестирования Claude Opus 4 у чат-бота было отмечено «стойкое и последовательное отвращение к причинению вреда», в том числе к созданию сексуального контента с участием несовершеннолетних, насильственным действиям и терроризму. В этих случаях, по данным Anthropic, Claude демонстрировал «явную тревожность» и «тенденцию прекращать вредоносные разговоры, когда предоставлялась такая возможность».

Claude получил прямое указание не завершать разговоры, если пользователь проявляет признаки желания причинить «неминуемый вред» себе или другим. В таких случаях Anthropic привлекает онлайн-сервис кризисной поддержки Throughline, чтобы помочь разработать ответы на запросы, связанные с самоповреждением и психическим здоровьем.

На прошлой неделе Anthropic обновила политику использования своего чат-бота, поскольку быстро развивающиеся модели ИИ вызывают всё больше опасений по поводу безопасности. Теперь компания запрещает использовать Claude для разработки биологического, ядерного, химического или радиологического оружия, а также для разработки вредоносного кода или эксплуатации уязвимостей сети.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Assassin’s Creed Shadows стала самой продаваемой новой игрой 2025 года в Европе, опередив Monster Hunter Wilds и Kingdom Come: Deliverance 2 22 мин.
Курс биткоина упал до $115 000 после нового рекорда на прошлой неделе 27 мин.
Чат-бот Claude AI станет прекращать «вредоносные или оскорбительные диалоги с пользователями» 3 ч.
Таиланд разрешит иностранным туристам обменивать криптовалюту на баты уже к концу года 3 ч.
Полностью отключить обновление приложений в Microsoft Store больше не получится 3 ч.
«Более яркая, отзывчивая и доступная, чем когда-либо»: культовое приключение Shenmue 3 выйдет на новых платформах в улучшенном виде 3 ч.
Microsoft наконец улучшила тёмный режим в Windows 11, но до идеала ещё далеко 3 ч.
Научно-фантастическое выживание StarRupture от создателей Green Hell отправит игроков на планету кошмарных катастроф — ранний доступ откладывается 4 ч.
Олдскульный хоррор Caput Mortum покажет, каково 30 лет назад было играть в King's Field — геймплейный трейлер раскрыл дату выхода 9 ч.
Rutube — главный бенефициар замедления YouTube: аудитория российского сервиса выросла более чем вдвое в этом году 11 ч.
Представлен смартфон Honor X7c 5G с чипом Snapdragon 4 Gen 2 и 50-Мп камерой за $170 4 мин.
Steam Deck и подобные портативные ПК набирают популярность — продажи вырастут на 32 % в этом году 7 мин.
Apple теряет американский рынок смартфонов два квартала подряд — её долю захватывает Samsung 16 мин.
Умные очки Meta Hypernova с экраном будут стоить гораздо дешевле, чем предполагалось 3 ч.
Samsung представила беспроводные наушники Galaxy Buds3 FE с активным шумоподавлением, классическим дизайном и Galaxy AI за $149 6 ч.
Китайская HKC выпустила первый в мире игровой монитор с частотой обновления 750 Гц 6 ч.
В Apple готовятся к волне увольнений топ-менеджеров, но Тим Кук останется гендиром 7 ч.
OpenAI намерена потратить триллионы долларов на ИИ-инфраструктуру, но для начала их надо где-то найти 8 ч.
BYD построила «Автомобильный Диснейленд» — за $280 можно поплавать на внедорожнике и погонять на гиперкаре 8 ч.
AAEON представила вычислительные модули на IoT-платформе MediaTek Genio 9 ч.