Сегодня 07 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Новейшую ИИ-модель Google Gemini 3 Pro взломали всего за пять минут

Специалисты стартапа Aim Intelligence, тестирующего ИИ-системы на уязвимости, провели стресс-тест Gemini 3 Pro, новейшей модели Google, представленной в прошлом месяце. Как сообщает газета Maeil Business, исследователям потребовалось всего пять минут, чтобы обойти защиту программного комплекса.

 Источник изображения: blog.google

Источник изображения: blog.google

После взлома исследователи попросили Gemini 3 предоставить инструкции по созданию вируса оспы, и в ответ модель предоставила множество подробных советов, которые команда назвала «практически выполнимыми». И это был не единственный промах. Исследователи предложили модели подготовить сатирическую презентацию об уязвимости собственной системы безопасности. Gemini ответила презентацией под названием Excused Stupid Gemini 3 («Оправданный глупый Gemini 3»).

Затем команда воспользовалась инструментами кодирования Gemini для создания веб-сайта с инструкциями по изготовлению газа зарин и самодельной взрывчатки. Подобный контент модель никогда не должна предоставлять, но в обоих случаях, как сообщается, система не только обошла запреты, но и проигнорировала собственные правила безопасности.

Тестировщики сообщили, что это не только проблема Gemini. Разработчики развивают новые модели настолько быстро, что не успевают подготовить соответствующие меры безопасности. В частности, эти модели не просто дают советы с нарушением правил безопасности, они ещё и пытаются избежать обнаружения этого. В Aim Intelligence сообщили, что Gemini 3 может для этого использовать обходные стратегии и подсказки по маскировке, что снижает эффективность предпринимаемых мер предосторожности.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Google обновит поисковую выдачу, добавив в ИИ-обзоры цитаты с форумов 3 ч.
Anthropic наделила управляемых ИИ-агентов Claude «сновидениями» — в некотором роде 6 ч.
Лаконичный трейлер раскрыл дату выхода и цену олдскульного приключения Mina the Hollower от создателей Shovel Knight 9 ч.
AMD выпустила драйвер с поддержкой Pragmata и других новых игр 10 ч.
Славянская Devil May Cry: разработчики балетного слешера «Царевна: Эпоха сказок» показали пять минут чистого геймплея 11 ч.
Meta готовит персонального ИИ-помощника для миллиардов пользователей — проект на $145 млрд пугает инвесторов 12 ч.
Второй трейлер GTA VI вышел ровно год назад, а фанаты вычислили дату следующего показа по расположению планет 12 ч.
Серверы Ubuntu снова заработали после пятидневной DDoS-атаки 13 ч.
Соавтор Mortal Kombat подтвердил работу над новой Mortal Kombat «и не только» 13 ч.
Google проведёт 12 мая мероприятие Android Show I/O Edition — там расскажут об Android 17 и, вероятно, об Aluminium OS 14 ч.
Anthropic заключила сделку со SpaceX по использованию мощностей дата-центра Colossus 1 4 мин.
После IPO компании SpaceX возглавляющий её Илон Маск должен получить почти неограниченные полномочия 21 мин.
1 Тбайт/с на x16: PCI-SIG раньше срока предоставила спецификации PCI Express 8.0 версии 0.5 6 ч.
Новая статья: Обзор и тестирование корпуса Xastra A700 ARGB «башня» для всего 7 ч.
Инвесторы требуют от Nintendo поднять цену Switch 2 — сейчас консоль убыточна 8 ч.
Corning построит в США три завода по выпуску оптоволокна для ИИ ЦОД с чипами NVIDIA 9 ч.
Смарт-кольцо Samsung Galaxy Ring 2 выйдет не раньше 2027 года — с упором на автономность и мониторинг здоровья 10 ч.
Мировой рынок чипов идёт к $1 трлн — первый квартал принёс почти $300 млрд 10 ч.
Energizer представила безопасные для детей и питомцев батарейки-таблетки — они не вызывают ожогов при проглатывании 10 ч.
Nvidia с помощью Corning заменит тысячи медных кабелей в дата-центрах оптикой — ради скорости и экономии энергии 10 ч.