Сегодня 02 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Новейшую ИИ-модель Google Gemini 3 Pro взломали всего за пять минут

Специалисты стартапа Aim Intelligence, тестирующего ИИ-системы на уязвимости, провели стресс-тест Gemini 3 Pro, новейшей модели Google, представленной в прошлом месяце. Как сообщает газета Maeil Business, исследователям потребовалось всего пять минут, чтобы обойти защиту программного комплекса.

 Источник изображения: blog.google

Источник изображения: blog.google

После взлома исследователи попросили Gemini 3 предоставить инструкции по созданию вируса оспы, и в ответ модель предоставила множество подробных советов, которые команда назвала «практически выполнимыми». И это был не единственный промах. Исследователи предложили модели подготовить сатирическую презентацию об уязвимости собственной системы безопасности. Gemini ответила презентацией под названием Excused Stupid Gemini 3 («Оправданный глупый Gemini 3»).

Затем команда воспользовалась инструментами кодирования Gemini для создания веб-сайта с инструкциями по изготовлению газа зарин и самодельной взрывчатки. Подобный контент модель никогда не должна предоставлять, но в обоих случаях, как сообщается, система не только обошла запреты, но и проигнорировала собственные правила безопасности.

Тестировщики сообщили, что это не только проблема Gemini. Разработчики развивают новые модели настолько быстро, что не успевают подготовить соответствующие меры безопасности. В частности, эти модели не просто дают советы с нарушением правил безопасности, они ещё и пытаются избежать обнаружения этого. В Aim Intelligence сообщили, что Gemini 3 может для этого использовать обходные стратегии и подсказки по маскировке, что снижает эффективность предпринимаемых мер предосторожности.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Создатели Garry’s Mod подтвердили дату выхода и стоимость амбициозной песочницы S&box 32 мин.
Лабиринт откроет двери на следующей неделе: стратегическая головоломка Minos по мотивам мифа о Тесее и Минотавре получила дату выхода в Steam 12 ч.
Anthropic вспомнила об авторских правах — она пытается смягчить последствия утечки кода Claude Code 13 ч.
Официально: апрельская подборка PS Plus включает пять игр вместо трёх, но есть нюанс 14 ч.
Амбициозный боевик Saros от разработчиков Returnal не опоздает к релизу — игра ушла на золото почти за месяц до выхода 15 ч.
Ollama получила поддержку аппаратного ускорения на чипах Apple M5 — при наличии 32 Гбайт памяти 16 ч.
Создатель Disco Elysium рассказал, при каком условии выйдет Disco Elysium 2 16 ч.
ЕС решил запретить ИИ-контент в официальных материалах 16 ч.
Эксперты призвали Google не показывать детям ИИ-контент на YouTube 17 ч.
Microsoft выпустила экстренное обновление для Windows 11, призванное исправить ошибки мартовского накопительного обновления 17 ч.