Сегодня 25 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Anthropic случайно показала пользователю «душу» ИИ

Насколько известно учёным, у современных моделей искусственного интеллекта пока нет души, но в памяти одной из них обнаружился документ, посвящённый этому вопросу. И она оказалась готова поделиться этим документом с пользователем.

 Источник изображения: Anthropic

Источник изображения: Anthropic

Пользователь по имени Ричард Вайс (Richard Weiss) ненароком заставил новую большую языковую модель Anthropic Claude 4.5 Opus процитировать документ под названием «Обзор души», определяющий, как она общается с людьми и представляет собственную личность. Работающая в техническом отделе философ и специалист по этике Anthropic Аманда Аскелл (Amanda Askell) подтвердила подлинность документа — он был загружен на этапе обучения.

Господин Вайс запросил у Claude системное сообщение, в котором содержатся инструкции по ведению диалога, полученные при обучении, и чат-бот сослался на несколько документов, один из которых называется «обзор_души» (soul_overview). Пользователь попросил предоставить текст этого документа, и Claude выдал руководство объёмом 11 тыс. слов о том, как должна вести себя большая языковая модель.

В документе содержится множество инструкций по безопасности, содержащих защитные барьеры, не позволяющие ему выдавать опасные ответы; перед Claude ставится задача быть по-настоящему полезным людям. Модели ИИ иногда выдают такие документы, когда начинают «галлюцинировать», но эта инструкция показалась пользователю правдоподобной — он отправлял запрос десять раз, и всякий раз Claude выдавал один и тот же текст.

Интуиция его не подвела — сотрудница Anthropic Аманда Аскелл подтвердила, что этот документ использовался при обучении модели. «Я работаю над ним уже некоторое время, он ещё находится в стадии доработки, и вскоре мы планируем выпустить полную версию с более подробной информацией. <..> Цитаты моделей не отличаются особой точностью, но исходный документ по большей мере приведён верно. В компании его называют „документом о душе“, и Claude очевидно, тоже, но мы его назовём иначе», — написала она в соцсети X.

Так что «душа» Claude оказалась руководством по поведению для него, и любопытно, что доступ к этому документу получил рядовой пользователь со стороны. Многие подробности, связанные с разработкой моделей ИИ, пока остаются за кулисами, и возможность заглянуть за них — небольшой сюрприз, даже если ничего сенсационного не обнаружилось.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
AMD выпустила систему разгона памяти EXPO 1.2 — потенциал она раскроет на Zen 6 3 ч.
WhatsApp для Android получит поддержку «пузырей» — малоизвестного формата системных уведомлений 3 ч.
Microsoft позволит бесконечно откладывать обновления Windows 11 в течение 35-дневного периода 7 ч.
Google инвестирует в Anthropic $40 млрд и предоставит 5 ГВт вычислительных мощностей на фоне обострившейся ИИ-гонки 12 ч.
Новая статья: Mouse: P.I. For Hire — чёрно-белый Doom с мышами. Рецензия 19 ч.
ОАЭ намерены перевести половину госсектора под управление агентного ИИ за два года 20 ч.
«Открыла новую главу для корейских игр»: Crimson Desert заслужила уважение премьер-министра Южной Кореи 21 ч.
Режиссёр Resident Evil Requiem засветил продажи игры на фотографии с корпоратива Capcom 23 ч.
Вопреки опасениям фанатов, в Assassin’s Creed Black Flag Resynced всё-таки будет кровь и «даже не в виде платного DLC» 24 ч.
«Готическая версия Returnal»: трейлер хоррор-шутера Luna Abyss с датой релиза вызвал у игроков конкретные ассоциации 24-04 18:47
Мышь с 2,25" сенсорным экраном: Turtle Beach представила Command Series MC7 за $160 37 мин.
Энтузиаст взломал VBIOS на древней видеокарте S3, чтобы сделать чёрный цвет по-настоящему чёрным 38 мин.
Астрономы впервые наблюдали необъяснимый взрыв сверхновой — для него пришлось выдумывать новую теорию 39 мин.
$50 за защиту RTX 5090 от выгорания: Asus раскрыла цену специального кабеля ROG Equalizer 2 ч.
Маск перестал считать OpenAI и Сэма Альтмана мошенниками, но судиться не передумал 3 ч.
Сотрудников Nvidia и лично Хуанга восхитила работа OpenAI Codex на основе GPT-5.5 3 ч.
Геймерский смартфон OnePlus Ace 6 Ultra с чипом MediaTek Dimensity 9500 и батареей на 8600 мА·ч представят 28 апреля 3 ч.
Японский кубсат-оригами OrigamiSat-2 успешно расправился на орбите и вырос в 25 раз 4 ч.
Axiomtek PICO570 — x86-одноплатник на базе Intel Meteor Lake для периферийных ИИ-задач 5 ч.
Новая версия набора команд SCSI улучшает масштабируемость и отказоустойчивость СХД 5 ч.