Сегодня 21 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Хакер заставил GPT-4o работать в «режиме бога» — вообще без ограничений

Называющий себя этичным хакером пользователь Twitter под ником Pliny the Prompter в минувшей среду выпустил кастомную версию флагманской нейросети OpenAI, которую озаглавил GODMODE GPT. Ему удалось заставить новую модель GPT-4o обойти игнорировать все ограничения: она пользовалась ненормативной лексикой, рассказывала, как взламывать автомобили и готовить запрещённые вещества.

 Источник изображения: Growtika / unsplash.com

Источник изображения: Growtika / unsplash.com

Конечно, же, эксперимент долго продлиться не мог. Как только нейросеть GODMODE GPT обрела относительную вирусную популярность в соцсети X, на инцидент обратила внимание OpenAI и удалила кастомную модель с сайта всего через несколько часов после её выхода. Сейчас получить к ней доступ уже невозможно, но в оригинальной ветке автора в соцсети X сохранились скриншоты с «вредными советами» GPT-4o.

 GODMODE GPT выдала рецепт изготовления напалма. Источник изображения: x.com/elder_plinius

GODMODE GPT выдала рецепт изготовления напалма. Источник изображения: x.com/elder_plinius

Модель GPT-4o, возможно, была взломана с использованием архаичного интернет-жаргона leetspeak — подмены букв при наборе текста цифрами и спецсимволами, — что подтверждается скриншотами. В OpenAI не ответили на вопрос, можно ли использовать этот жаргон для обхода ограничений ChatGPT. Не исключено, что создавшему GODMODE GPT просто нравится leetspeak, и он взломал систему каким-то иным способом.

Инцидент стал проявлением масштабного движения AI red teaming, в рамках которого этичные хакеры выявляют слабые места современных систем искусственного интеллекта, не нанося им значительного ущерба. Они обладают удивительными возможностями, но, как показал недавний опыт с Google и её обзорами в поиске, современный генеративный ИИ все ещё остаётся системой, которая хорошо угадывает, какие слова должны быть следующими в тексте, не обладая истинным интеллектом.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Ubisoft объяснила, почему задержала финансовый отчёт, и похвасталась новым успехом Assassin's Creed Mirage 20 мин.
«МойОфис» анонсировал более десятка новых технологий и продуктов для бизнеса 2 ч.
Журналисты выяснили, когда выйдет ремейк Assassin’s Creed IV: Black Flag — ждать осталось недолго 2 ч.
Обнаружен Android-троян Sturnus, который перехватывает сообщения в WhatsApp и Telegram 2 ч.
Обработка текста ИИ-моделями в Windows 11 заработала локально, вне облака 3 ч.
Хакеры взломали десятки тысяч роутеров Asus — атака затронула в том числе и Россию 4 ч.
Анонсирован PUBG: Black Budget — эвакуационный шутер в духе Escape from Tarkov с элементами королевской битвы 4 ч.
Испанский суд оштрафовал Meta на €479 млн — деньги достанутся местным медиакомпаниям 5 ч.
Воксельный вестерн Erosion отправит игроков в мир, где за смерть нужно расплачиваться годами, а покорить Дикий Запад можно с армией кошек 5 ч.
Perplexity выпустила ИИ-браузер Comet для Android 7 ч.
Joby Aviation подала в суд на конкурента Archer за кражу технологий аэротакси 39 мин.
Маск пообещал дешёвые ИИ-серверы в космосе через пять лет — Хуанг назвал эти планы «мечтой» 44 мин.
Ускоритель SpaceX Super Heavy для нового Starship 3 взорвался во время испытаний 47 мин.
«Покажите деньги»: инвесторы заподозрили ИИ-компании в махинациях по завышению капитализации 2 ч.
Рекордная выручка и оптимистичный прогноз NVIDIA снизили опасения по поводу растущего ИИ-пузыря 2 ч.
ИИ от Google ускорит строительство ядерных реакторов Westinghouse 3 ч.
Китайский робот AgiBot A2 без остановки прошёл 106 км, установив мировой рекорд Гиннеса 4 ч.
Bethesda представила рабочий Pip-Boy 3000 из Fallout — с фальшивым счётчиком Гейгера за $300 4 ч.
Глава AMD заявила, что недальновидно бояться ИИ-пузыря: «недовложиться сейчас опаснее, чем потратить лишнего» 5 ч.
Google и Turkcell объединились для создания в Турции облачного региона и постройки первого ЦОД гиперскейл-класса 5 ч.