Сегодня 07 июня 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Учёные разработали ИИ-чат-бот, который эффективно взламывает других ИИ-чат-ботов

Учёные-компьютерщики из Наньянского технологического университета (NTU, Сингапур) нашли эффективный способ взлома чат-ботов с искусственным интеллектом (ИИ). Для этого они обучают ИИ-чат-бот созданию подсказок, которые позволяют обходить защиту других чат-ботов на базе ИИ.

 Источник изображения: NTU

Источник изображения: NTU

Сингапурские исследователи использовали двойной метод взлома большой языковой модели (LLM), получивший название Masterkey. Во-первых, они провели реверс-инжиниринг того, как LLM выявляют вредоносные запросы и защищаются от них. Используя эту информацию, они научили LLM автоматически учиться и предлагать подсказки, которые позволяют обходить защиту других LLM. Таким образом можно создать LLM для взлома, которая сможет автоматически адаптироваться к новым условиям и создавать новые запросы для взлома после того, как разработчики внесут исправления в свои LLM.

После проведения серии тестов на LLM в качестве доказательства, что этот метод действительно представляет реальную угрозу, исследователи сразу же известили о выявленных проблемах провайдеров сервисов после успешного взлома их ИИ-моделей.

Разработка учёных NTU должна помочь компаниям определить слабые стороны и ограничения своих ИИ-чат-ботов, чтобы принять меры по их защите от хакеров.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Магазин Microsoft Store обновился — больше системных интеграций, кнопка Copilot и повышение производительности 2 ч.
Состоялся анонс Mortal Shell 2 — продолжения зрелищного боевика про беспощадное избиение уродливых монстров 5 ч.
AMD впервые приняла участие в бенчмарке MLPerf Training, но до рекордов NVIDIA ей ещё очень далеко 7 ч.
Стартап xAI попытался взять в долг $5 млрд, несмотря на ссору Маска с Трампом 7 ч.
Хакеры обнаружили уязвимость в Nintendo Switch 2 спустя день после релиза 10 ч.
На российских сайтах могут запретить авторизацию через Gmail 11 ч.
«Выглядит лучше, чем RE9»: разработчики гротескного хоррора Ill поразили игроков новым геймплейным трейлером 11 ч.
Google Gemini научился выполнять задачи по расписанию 13 ч.
Mundfish выпустит эвакуационный шутер The Cube во вселенной Atomic Heart 20 ч.
Capcom представила Resident Evil Requiem, которая станет «началом новой эры хорроров на выживание» — первый трейлер и дата выхода 20 ч.
Meta объявила, что текущий год станет «поворотным» для виртуальной и дополненной реальности 6 ч.
HPE представила отказоустойчивые системы Nonstop Compute на базе Intel Xeon Sapphire Rapids 6 ч.
Synology выпустила стоечное хранилище RackStation RS2825RP+ с процессором AMD Ryzen Embedded 6 ч.
Трамп отказался от перемирия с Маском и угрожает урезать ему правительственные контракты 6 ч.
Трамп разрешил сверхзвуковые полёты над США, а также подписал указы об аэротакси и дронах 8 ч.
United Airlines отключила терминалы Starlink в самолётах из-за создаваемых ими помех 8 ч.
Японцы создали экологичный пластик, который быстро растворяется в солёной воде 8 ч.
Nintendo Switch 2 оказалась на удивление прочной, но экран можно легко поцарапать 8 ч.
Начало заката Tesla? Конфликт Маска с Трампом серьёзно усугубил проблемы автопроизводителя 9 ч.
Стеллатор Wendelstein 7-X наглядно продемонстрировал своё преимущество перед токамаками 9 ч.