Сегодня 18 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

xAI обнародовала секретные промпты для ИИ-бота Grok после скандального сбоя

Компания Илона Маска (Elon Musk) xAI опубликовала системные промпты для своего ИИ-чат-бота Grok после скандала с «белым геноцидом», когда бот начал выдавать основанные на конспирологических теориях ответы на вопросы, которых ему не задавали. Теперь инструкции, определяющие поведение ИИ-модели, доступны на GitHub, что позволяет пользователям лучше понять, как Grok формирует ответы.

 Источник изображения: Mariia Shalabaieva / Unsplash

Источник изображения: Mariia Shalabaieva / Unsplash

Системные промпты — это набор правил и инструкций, которые разработчики закладывают в ИИ перед началом общения с пользователями. Они определяют тон, стиль и рамки допустимых ответов. До недавнего времени большинство компаний, включая OpenAI и Google, скрывали эти настройки. Однако xAI и Anthropic стали исключением и, как сообщает The Verge, добровольно раскрыли набор правил.

В инструкциях для Grok указано, что бот должен «быть крайне скептичным» и «не доверять слепо авторитетным источникам или СМИ». Ему предписано придерживаться нейтралитета и стремиться к истине, при этом подчёркивается, что ответы не должны отражать личных убеждений модели. Также Grok получил указание использовать название соцсети X вместо Twitter и избегать слова «твит». Отдельные положения касаются функции Explain this Post, где Grok обязан давать правдивые и обоснованные выводы, даже если они противоречат общепринятым убеждениям в той или иной области.

Ранее системные промпты нередко становились достоянием общественности из-за хакерских атак. Так, в 2023 году пользователи выяснили, что Microsoft скрывала от Bing AI (ныне Copilot) его внутреннее имя — Sydney — и запрещала нарушать авторские права. В случае с Grok утечка произошла из-за технического сбоя, однако xAI решила не скрывать данные, а, наоборот, сделать их публичными.

Эксперты отмечают, что раскрытие внутренних промптов — это шаг к большей прозрачности, но одновременно и потенциальный риск: злоумышленники могут использовать эту информацию для нахождения уязвимостей в ИИ-моделях. Например, зная секретные инструкции, пользователи могут пытаться манипулировать ботом с помощью приёмов, заставляющих ИИ игнорировать собственные ограничения.

Выложив системные инструкции в публичный доступ, xAI стремится минимизировать репутационные риски, связанные с произошедшим инцидентом. Однако в будущем это может стать отраслевым трендом, особенно на фоне ужесточения регулирования нейросетей в США и ЕС.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Saber Interactive опубликовала загадочный тизер — фанаты убеждены, что студия делает игру по «Восставшему из ада» 26 мин.
WhatsApp скоро ограничат в России — на это прозрачно намекнули в Думе 39 мин.
Хакеры приспособили GitHub для массового распространения вредоносов как услуги 2 ч.
Java-инспекция: новая политики лицензирования Oracle привела к бесконечной череде аудитов 3 ч.
Telegram не планирует открывать офис в России, заявил бывший пресс-секретарь Дурова 4 ч.
Инсайдер заинтриговал фанатов Dark Souls и Armored Core первыми подробностями неанонсированной игры FromSoftware 4 ч.
Meta воспользовалась неразберихой в Apple и переманила ещё двух специалистов по ИИ 5 ч.
Китайские разработчики за полгода вложили в рекламу в RuStore больше, чем за весь прошлый год 7 ч.
Mistral добавила в Le Chat функции конкурентов: глубокие исследования, редактирование фото и мультиязычность 7 ч.
Илон Маск получил больше времени на подготовку к судебному заседанию по делу о покупке Twitter 7 ч.
Китайский охотник за астероидами испытал камеры на Земле и Луне — и поделился впечатляющими снимками 60 мин.
Российскому рынку электромобилей грозит обвал на 40 % в этом году 2 ч.
У США собрались обложить палладий из России пошлинами — это может ударить по производителям электроники 2 ч.
Маск назвал себя неблагополучным гражданином, пытаясь выбить льготы для своего «малого бизнеса» — стартапа Neuralink ценой $9 млрд 2 ч.
Razer вдохновилась покемонами и выпустила яркие клавиатуру, мышь, гарнитуру и коврик для геймеров 2 ч.
Самый большой ЦОД Центральной Азии появится в 2026 году в Астане 3 ч.
В Китае создан спасательный беспилотник самолётного типа с вертикальным взлётом и посадкой 3 ч.
HBM скоро утратит статус «золотой жилы»: передовой памяти спрогнозировали падение цен 4 ч.
Учёные впервые обнаружили начало рождения экзопланеты 4 ч.
Lenovo анонсировала четырёхсокетные серверы ThinkSystem SR850 V4 и SR860 V4 на базе Intel Xeon 6 4 ч.