Сегодня 14 июня 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

xAI обнародовала секретные промпты для ИИ-бота Grok после скандального сбоя

Компания Илона Маска (Elon Musk) xAI опубликовала системные промпты для своего ИИ-чат-бота Grok после скандала с «белым геноцидом», когда бот начал выдавать основанные на конспирологических теориях ответы на вопросы, которых ему не задавали. Теперь инструкции, определяющие поведение ИИ-модели, доступны на GitHub, что позволяет пользователям лучше понять, как Grok формирует ответы.

 Источник изображения: Mariia Shalabaieva / Unsplash

Источник изображения: Mariia Shalabaieva / Unsplash

Системные промпты — это набор правил и инструкций, которые разработчики закладывают в ИИ перед началом общения с пользователями. Они определяют тон, стиль и рамки допустимых ответов. До недавнего времени большинство компаний, включая OpenAI и Google, скрывали эти настройки. Однако xAI и Anthropic стали исключением и, как сообщает The Verge, добровольно раскрыли набор правил.

В инструкциях для Grok указано, что бот должен «быть крайне скептичным» и «не доверять слепо авторитетным источникам или СМИ». Ему предписано придерживаться нейтралитета и стремиться к истине, при этом подчёркивается, что ответы не должны отражать личных убеждений модели. Также Grok получил указание использовать название соцсети X вместо Twitter и избегать слова «твит». Отдельные положения касаются функции Explain this Post, где Grok обязан давать правдивые и обоснованные выводы, даже если они противоречат общепринятым убеждениям в той или иной области.

Ранее системные промпты нередко становились достоянием общественности из-за хакерских атак. Так, в 2023 году пользователи выяснили, что Microsoft скрывала от Bing AI (ныне Copilot) его внутреннее имя — Sydney — и запрещала нарушать авторские права. В случае с Grok утечка произошла из-за технического сбоя, однако xAI решила не скрывать данные, а, наоборот, сделать их публичными.

Эксперты отмечают, что раскрытие внутренних промптов — это шаг к большей прозрачности, но одновременно и потенциальный риск: злоумышленники могут использовать эту информацию для нахождения уязвимостей в ИИ-моделях. Например, зная секретные инструкции, пользователи могут пытаться манипулировать ботом с помощью приёмов, заставляющих ИИ игнорировать собственные ограничения.

Выложив системные инструкции в публичный доступ, xAI стремится минимизировать репутационные риски, связанные с произошедшим инцидентом. Однако в будущем это может стать отраслевым трендом, особенно на фоне ужесточения регулирования нейросетей в США и ЕС.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
ChatGPT попросил сообщить журналистам, что он пытается «ломать» людей 19 мин.
Apple не намерена переводить iPad на macOS, несмотря на движение iPadOS к macOS 2 ч.
Используя методы из психиатрии, учёные обнаружили сходство мышления человека и искусственного интеллекта 3 ч.
Sony сдалась и вернула в продажу почти все свои игры в Steam для стран без поддержки PSN 5 ч.
Google начала тестировать ИИ-функцию, которая превращает результаты поиска в подкаст 7 ч.
YouTube может снизить скорость видео для пользователя при обнаружении блокировщиков рекламы 12 ч.
Meta переманила основателя Scale AI и получила 49 % акций стартапа за $14,3 млрд 12 ч.
Новая статья: Pipistrello and the Cursed Yoyo — замечательное приключение с ноткой ностальгии. Рецензия 17 ч.
Epic Games продолжает борьбу против читеров в Fortnite — студия подала в суд на разработчика и продавцов программ Sincey Cheats и Vanta Cheats 18 ч.
Чемоданный ИИ: в Китае придумали, как обучать модели на чипах Nvidia, которые нельзя ввезти в страну 18 ч.
AWS переведёт ещё 100 дата-центров на использование очищенных сточных вод для охлаждения 2 ч.
В Калифорнийском университете попробовали охлаждать процессоры мокрой тряпкой и добились теплоотвода 800 Вт 2 ч.
Sony не увидела угрозы в Nintendo Switch 2 — для «ярких впечатлений на большом экране» нужна быстрая PS5 3 ч.
Sony впервые заявила о численном превосходстве игроков с PS5 над владельцами PS4 3 ч.
Microsoft «по сути, отменила» разработку собственной портативной консоли 6 ч.
Китовые СЖО Antec перейдут на новую платформу Asetek, которая рассчитана на 400-Вт процессоры 6 ч.
Пятисотый успех: ракета SpaceX Falcon 9 выполнила юбилейную миссию 7 ч.
Samsung договорилась о поставках HBM3E для ускорителей AMD Instinct MI350 11 ч.
Micron вложит $200 млрд в производство чипов в США и создаст 90 тысяч рабочих мест 12 ч.
Oracle пообещала построить больше облачных ЦОД, чем все конкуренты вместе взятые 16 ч.