Сегодня 06 июня 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

xAI обнародовала секретные промпты для ИИ-бота Grok после скандального сбоя

Компания Илона Маска (Elon Musk) xAI опубликовала системные промпты для своего ИИ-чат-бота Grok после скандала с «белым геноцидом», когда бот начал выдавать основанные на конспирологических теориях ответы на вопросы, которых ему не задавали. Теперь инструкции, определяющие поведение ИИ-модели, доступны на GitHub, что позволяет пользователям лучше понять, как Grok формирует ответы.

 Источник изображения: Mariia Shalabaieva / Unsplash

Источник изображения: Mariia Shalabaieva / Unsplash

Системные промпты — это набор правил и инструкций, которые разработчики закладывают в ИИ перед началом общения с пользователями. Они определяют тон, стиль и рамки допустимых ответов. До недавнего времени большинство компаний, включая OpenAI и Google, скрывали эти настройки. Однако xAI и Anthropic стали исключением и, как сообщает The Verge, добровольно раскрыли набор правил.

В инструкциях для Grok указано, что бот должен «быть крайне скептичным» и «не доверять слепо авторитетным источникам или СМИ». Ему предписано придерживаться нейтралитета и стремиться к истине, при этом подчёркивается, что ответы не должны отражать личных убеждений модели. Также Grok получил указание использовать название соцсети X вместо Twitter и избегать слова «твит». Отдельные положения касаются функции Explain this Post, где Grok обязан давать правдивые и обоснованные выводы, даже если они противоречат общепринятым убеждениям в той или иной области.

Ранее системные промпты нередко становились достоянием общественности из-за хакерских атак. Так, в 2023 году пользователи выяснили, что Microsoft скрывала от Bing AI (ныне Copilot) его внутреннее имя — Sydney — и запрещала нарушать авторские права. В случае с Grok утечка произошла из-за технического сбоя, однако xAI решила не скрывать данные, а, наоборот, сделать их публичными.

Эксперты отмечают, что раскрытие внутренних промптов — это шаг к большей прозрачности, но одновременно и потенциальный риск: злоумышленники могут использовать эту информацию для нахождения уязвимостей в ИИ-моделях. Например, зная секретные инструкции, пользователи могут пытаться манипулировать ботом с помощью приёмов, заставляющих ИИ игнорировать собственные ограничения.

Выложив системные инструкции в публичный доступ, xAI стремится минимизировать репутационные риски, связанные с произошедшим инцидентом. Однако в будущем это может стать отраслевым трендом, особенно на фоне ужесточения регулирования нейросетей в США и ЕС.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Google навела порядок в Gemini 2.5 Pro — исправлены накопившиеся у ИИ-модели «регрессии» 4 ч.
Game Science подтвердила дату выхода Black Myth: Wukong на Xbox и анонсировала первую скидку на игру 4 ч.
Акции Microsoft установили новый рекорд стоимости вопреки падающему рынку 5 ч.
Apple представила данные о $1,3 трлн оборота App Store перед WWDC25 15 ч.
Windows 11 получит лёгкий текстовой редактор Edit — «Блокнот» стал слишком перегружен 17 ч.
В России заработала система блокировки мошеннических сайтов и приложений 20 ч.
AMD выпустила драйвер с поддержкой видеокарт Radeon RX 9060 XT и Radeon AI Pro R9700 20 ч.
Классические Baldur’s Gate, EA Sports FC 25 и четыре новых релиза: Microsoft раскрыла, чем порадует подписчиков Game Pass в начале июня 21 ч.
Живописное приключение Sword of the Sea от создателей Abzu и The Pathless выглядит как наследник Journey — новый трейлер и дата выхода 22 ч.
Американский Институт безопасности ИИ больше не сосредоточен на безопасности ИИ 22 ч.
В этом году МТС отключит половину своих базовых станций 3G в России 31 мин.
Intel прекратила платить клиентам, чтобы те покупали её процессоры 2 ч.
Для создания российской космической станции «Роскосмос» заказал ещё три ракеты «Ангара-А5М» 2 ч.
Intel признала, что изначально разрабатывала ангстремные техпроцессы 18A и 14A для себя, а не сторонних заказчиков 2 ч.
После рекордного обвала акции Tesla пошли вверх, поскольку Трамп и Маск готовят примирение 3 ч.
Японский лунный аппарат Resilience с мини-луноходом долетел до Луны — и мгновенно разобрался 3 ч.
В Китае испытали сверхзащищённый канал уникальной квантовой связи с взлетающей ракетой 4 ч.
Huawei и XPeng представили гигантский 87-дюймовый проекционный дисплей для авто 4 ч.
Nvidia захватила 92 % рынка видеокарт, но Intel осталась лидером на рынке GPU 4 ч.
Razer выпустила Phantom Collection — клавиатуру, мышь, гарнитуру и коврик в полупрозрачных корпусах 5 ч.