Сегодня 31 января 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Новейшую ИИ-модель Google Gemini 3 Pro взломали всего за пять минут

Специалисты стартапа Aim Intelligence, тестирующего ИИ-системы на уязвимости, провели стресс-тест Gemini 3 Pro, новейшей модели Google, представленной в прошлом месяце. Как сообщает газета Maeil Business, исследователям потребовалось всего пять минут, чтобы обойти защиту программного комплекса.

 Источник изображения: blog.google

Источник изображения: blog.google

После взлома исследователи попросили Gemini 3 предоставить инструкции по созданию вируса оспы, и в ответ модель предоставила множество подробных советов, которые команда назвала «практически выполнимыми». И это был не единственный промах. Исследователи предложили модели подготовить сатирическую презентацию об уязвимости собственной системы безопасности. Gemini ответила презентацией под названием Excused Stupid Gemini 3 («Оправданный глупый Gemini 3»).

Затем команда воспользовалась инструментами кодирования Gemini для создания веб-сайта с инструкциями по изготовлению газа зарин и самодельной взрывчатки. Подобный контент модель никогда не должна предоставлять, но в обоих случаях, как сообщается, система не только обошла запреты, но и проигнорировала собственные правила безопасности.

Тестировщики сообщили, что это не только проблема Gemini. Разработчики развивают новые модели настолько быстро, что не успевают подготовить соответствующие меры безопасности. В частности, эти модели не просто дают советы с нарушением правил безопасности, они ещё и пытаются избежать обнаружения этого. В Aim Intelligence сообщили, что Gemini 3 может для этого использовать обходные стратегии и подсказки по маскировке, что снижает эффективность предпринимаемых мер предосторожности.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Соцсети вскоре столкнутся с массовыми набегами ИИ-агентов, предупредили учёные 26 мин.
Apple проигрывает борьбу за ИИ-специалистов — ценные кадры уходят в Meta и Google DeepMind 2 ч.
Instagram разрешит удалять себя из чужих списков «Близкие друзья» 2 ч.
Экс-инженера Google осудили за кражу коммерческих тайн для Китая 3 ч.
ФСТЭК России опубликовала рекомендации по безопасной настройке Samba 4 ч.
Обещанная Павлом Дуровым интеграция Grok c Telegram до сих пор не случилась и, похоже, уже никогда не случится 8 ч.
Запустилась соцсеть Moltbook, где общаются только ИИ-агенты — людям разрешили только наблюдать 11 ч.
Новая статья: Arknights: Endfield — если бы Satisfactory была китайской гачей. Рецензия 18 ч.
Хардкорный шутер Road to Vostok о выживании на границе Финляндии и России скоро ворвётся в ранний доступ Steam — дата выхода и новый трейлер 19 ч.
Россияне стали больше сидеть во «ВКонтакте» и смотреть «VK видео» 20 ч.
Очередная группа космических туристов отправится на МКС в январе 2027 года — Axiom и NASA подписали контракт 3 ч.
SpaceX завершила 2025 год с прибылью $8 млрд — оценка к IPO может достичь $1,5 трлн 4 ч.
NASA впервые доверило ИИ управление марсоходом — он проехал почти полкилометра 4 ч.
Спутниковый интернет Amazon забуксовал — компания попросила больше времени на развёртывание Leo 5 ч.
Мегасделка между OpenAI и Nvidia на $100 млрд застопорилась из-за сомнений Nvidia 5 ч.
SpaceX запросила разрешение на запуск миллиона спутников для сети орбитальных ЦОД 6 ч.
После провального ИИ-гаджета Rabbit готовит ИИ-ноутбук Cyberdeck для вайб-кодинга 6 ч.
Продажи человекоподобных роботов в Китае взлетят более чем вдвое в этом году — а цены упадут 10 ч.
Kioxia намерена нарастить долю рынка NAND, пока конкуренты заняты памятью для ИИ 10 ч.
Blue Origin заморозит космический туризм минимум на два года ради концентрации на лунной миссии 12 ч.