Сегодня 31 января 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Новейшую ИИ-модель Google Gemini 3 Pro взломали всего за пять минут

Специалисты стартапа Aim Intelligence, тестирующего ИИ-системы на уязвимости, провели стресс-тест Gemini 3 Pro, новейшей модели Google, представленной в прошлом месяце. Как сообщает газета Maeil Business, исследователям потребовалось всего пять минут, чтобы обойти защиту программного комплекса.

 Источник изображения: blog.google

Источник изображения: blog.google

После взлома исследователи попросили Gemini 3 предоставить инструкции по созданию вируса оспы, и в ответ модель предоставила множество подробных советов, которые команда назвала «практически выполнимыми». И это был не единственный промах. Исследователи предложили модели подготовить сатирическую презентацию об уязвимости собственной системы безопасности. Gemini ответила презентацией под названием Excused Stupid Gemini 3 («Оправданный глупый Gemini 3»).

Затем команда воспользовалась инструментами кодирования Gemini для создания веб-сайта с инструкциями по изготовлению газа зарин и самодельной взрывчатки. Подобный контент модель никогда не должна предоставлять, но в обоих случаях, как сообщается, система не только обошла запреты, но и проигнорировала собственные правила безопасности.

Тестировщики сообщили, что это не только проблема Gemini. Разработчики развивают новые модели настолько быстро, что не успевают подготовить соответствующие меры безопасности. В частности, эти модели не просто дают советы с нарушением правил безопасности, они ещё и пытаются избежать обнаружения этого. В Aim Intelligence сообщили, что Gemini 3 может для этого использовать обходные стратегии и подсказки по маскировке, что снижает эффективность предпринимаемых мер предосторожности.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Экс-инженера Google осудили за кражу коммерческих тайн для Китая 43 мин.
ФСТЭК России опубликовала рекомендации по безопасной настройке Samba 3 ч.
Обещанная Павлом Дуровым интеграция Grok c Telegram до сих пор не случилась и, похоже, уже никогда не случится 6 ч.
Запустилась соцсеть Moltbook, где общаются только ИИ-агенты — людям разрешили только наблюдать 10 ч.
Новая статья: Arknights: Endfield — если бы Satisfactory была китайской гачей. Рецензия 16 ч.
Хардкорный шутер Road to Vostok о выживании на границе Финляндии и России скоро ворвётся в ранний доступ Steam — дата выхода и новый трейлер 17 ч.
Россияне стали больше сидеть во «ВКонтакте» и смотреть «VK видео» 18 ч.
Разработчики Yakuza Kiwami 3 пообещали исправить графику к релизу — пока ремейк местами выглядит хуже, чем игра 16-летней давности 20 ч.
Microsoft исправила сбои входа и загрузки в свежем обновлении Windows 11 21 ч.
В Китае ликвидировали одну из крупнейших в мире сетей пиратской манги 21 ч.
Очередная группа космических туристов отправится на МКС в январе 2027 года — Axiom и NASA подписали контракт 38 мин.
SpaceX завершила 2025 год с прибылью $8 млрд — оценка к IPO может достичь $1,5 трлн 3 ч.
NASA впервые доверило ИИ управление марсоходом — он проехал почти полкилометра 3 ч.
Спутниковый интернет Amazon забуксовал — компания попросила больше времени на развёртывание Leo 3 ч.
8K оказался почти никому не нужен — LG остановила выпуск телевизоров 8K OLED и 8K LCD 3 ч.
Мегасделка между OpenAI и Nvidia на $100 млрд застопорилась из-за сомнений Nvidia 4 ч.
SpaceX запросила разрешение на запуск миллиона спутников для сети орбитальных ЦОД 4 ч.
После провального ИИ-гаджета Rabbit готовит ИИ-ноутбук Cyberdeck для вайб-кодинга 5 ч.
Продажи человекоподобных роботов в Китае взлетят более чем вдвое в этом году — а цены упадут 8 ч.
Kioxia намерена нарастить долю рынка NAND, пока конкуренты заняты памятью для ИИ 8 ч.