Сегодня 04 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Новейшую ИИ-модель Google Gemini 3 Pro взломали всего за пять минут

Специалисты стартапа Aim Intelligence, тестирующего ИИ-системы на уязвимости, провели стресс-тест Gemini 3 Pro, новейшей модели Google, представленной в прошлом месяце. Как сообщает газета Maeil Business, исследователям потребовалось всего пять минут, чтобы обойти защиту программного комплекса.

 Источник изображения: blog.google

Источник изображения: blog.google

После взлома исследователи попросили Gemini 3 предоставить инструкции по созданию вируса оспы, и в ответ модель предоставила множество подробных советов, которые команда назвала «практически выполнимыми». И это был не единственный промах. Исследователи предложили модели подготовить сатирическую презентацию об уязвимости собственной системы безопасности. Gemini ответила презентацией под названием Excused Stupid Gemini 3 («Оправданный глупый Gemini 3»).

Затем команда воспользовалась инструментами кодирования Gemini для создания веб-сайта с инструкциями по изготовлению газа зарин и самодельной взрывчатки. Подобный контент модель никогда не должна предоставлять, но в обоих случаях, как сообщается, система не только обошла запреты, но и проигнорировала собственные правила безопасности.

Тестировщики сообщили, что это не только проблема Gemini. Разработчики развивают новые модели настолько быстро, что не успевают подготовить соответствующие меры безопасности. В частности, эти модели не просто дают советы с нарушением правил безопасности, они ещё и пытаются избежать обнаружения этого. В Aim Intelligence сообщили, что Gemini 3 может для этого использовать обходные стратегии и подсказки по маскировке, что снижает эффективность предпринимаемых мер предосторожности.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Продажи Heroes of Might & Magic: Olden Era превысили 500 тыс. копий менее чем за три дня после релиза 28 мин.
Аддон Lord of Hatred вернул игроков в Diablo IV — первый за полтора года новый рекорд пикового онлайна в Steam 41 мин.
OpenAI добавила в Codex анимированных ИИ-«питомцев» для напоминаний о ходе работы — пока на Windows и macOS 15 ч.
Microsoft адаптировала Azure Local для крупномасштабных суверенных облаков 21 ч.
Nebius купила стартап Eigen AI, повышающий производительность ИИ-моделей 22 ч.
Прощай, Дживс: поисковая система Ask.com закрылась спустя четверть века 03-05 08:28
Sony придётся выплатить $7,8 млн пользователям PlayStation Network по коллективному иску 03-05 07:50
xAI выпустила Grok 4.3: более дешёвую ИИ-модель с упором на агентские задачи и практическую эффективность 03-05 07:29
OpenAI превратила Codex из инструмента для программистов в универсального рабочего ИИ-агента 03-05 07:26
Новая статья: Windrose — пираты в моде при любой погоде. Предварительный обзор 03-05 00:03