Сегодня 21 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Новейшую ИИ-модель Google Gemini 3 Pro взломали всего за пять минут

Специалисты стартапа Aim Intelligence, тестирующего ИИ-системы на уязвимости, провели стресс-тест Gemini 3 Pro, новейшей модели Google, представленной в прошлом месяце. Как сообщает газета Maeil Business, исследователям потребовалось всего пять минут, чтобы обойти защиту программного комплекса.

 Источник изображения: blog.google

Источник изображения: blog.google

После взлома исследователи попросили Gemini 3 предоставить инструкции по созданию вируса оспы, и в ответ модель предоставила множество подробных советов, которые команда назвала «практически выполнимыми». И это был не единственный промах. Исследователи предложили модели подготовить сатирическую презентацию об уязвимости собственной системы безопасности. Gemini ответила презентацией под названием Excused Stupid Gemini 3 («Оправданный глупый Gemini 3»).

Затем команда воспользовалась инструментами кодирования Gemini для создания веб-сайта с инструкциями по изготовлению газа зарин и самодельной взрывчатки. Подобный контент модель никогда не должна предоставлять, но в обоих случаях, как сообщается, система не только обошла запреты, но и проигнорировала собственные правила безопасности.

Тестировщики сообщили, что это не только проблема Gemini. Разработчики развивают новые модели настолько быстро, что не успевают подготовить соответствующие меры безопасности. В частности, эти модели не просто дают советы с нарушением правил безопасности, они ещё и пытаются избежать обнаружения этого. В Aim Intelligence сообщили, что Gemini 3 может для этого использовать обходные стратегии и подсказки по маскировке, что снижает эффективность предпринимаемых мер предосторожности.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Гонка вооружений» в сфере ИИ бессмысленна — США и Китай преследуют совершенно разные цели 24 мин.
«Один нас подвёл. Другой отверг»: датамайнер нашёл в файлах God of War Ragnarok указания, что новая God of War отправится в Египет 3 ч.
«Блокнот» всё больше превращается в WordPad — теперь Microsoft добавила поддержку изображений 4 ч.
Ubisoft подтвердила разработку двух «очень многообещающих» Far Cry и нескольких Assassin’s Creed, включая мультиплеерные 5 ч.
USDT ожидает самое большое месячное падение со времён краха FTX 5 ч.
Почти полтора года Microsoft рекомендовала обучать ИИ на пиратских книгах о Гарри Поттере 5 ч.
Capcom отправила юристов бороться с утечками Resident Evil Requiem и призвала фанатов не распространять спойлеры 6 ч.
«Продолжение следует»: продажи Nier: Automata превысили 10 миллионов копий, а Square Enix подарила фанатам новую надежду 7 ч.
Дипфейки захватывают интернет — Microsoft предложила план спасения от подделок 8 ч.
WhatsApp перенял ещё одну функцию Telegram — отправку истории сообщений новым участникам групповых чатов 9 ч.
Не $100 млрд, а $30 млрд, и не выиграл, а переиграл — NVIDIA и OpenAI готовят новую инвестиционную сделку 2 ч.
«Москвич» запустил производство электромобилей Umo для «Яндекс Такси» — внутри у них ИИ «Яндекса» 2 ч.
Марсоход NASA Perseverance научился самостоятельно ориентироваться на Марсе — теперь его не удержать 2 ч.
Первым ИИ-гаджетом OpenAI станет умная колонка с камерой — она сможет узнавать владельца 3 ч.
NASA наконец удалось провести «мокрую» генеральную репетицию запуска лунной ракеты SLS — теперь только в путь 5 ч.
Винокурня Dewar’s завела робопса, который чует утечку паров виски 7 ч.
OpenAI и Tata договорились о строительстве 1 ГВт ИИ ЦОД в Индии 8 ч.
Узкие специалисты: Talaas, разрабатывающая оптимизированные под конкретные ИИ-модели ускорители, получила на развитие $169 млн 9 ч.
Thermal Grizzly начала продавать скальпированные процессоры Ryzen 7 9850X3D по €749 за штуку 9 ч.
Подводные интернет-кабели Google America-India Connect дважды свяжут США с Индией 9 ч.