Сегодня 08 июня 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Учёные разработали ИИ-чат-бот, который эффективно взламывает других ИИ-чат-ботов

Учёные-компьютерщики из Наньянского технологического университета (NTU, Сингапур) нашли эффективный способ взлома чат-ботов с искусственным интеллектом (ИИ). Для этого они обучают ИИ-чат-бот созданию подсказок, которые позволяют обходить защиту других чат-ботов на базе ИИ.

 Источник изображения: NTU

Источник изображения: NTU

Сингапурские исследователи использовали двойной метод взлома большой языковой модели (LLM), получивший название Masterkey. Во-первых, они провели реверс-инжиниринг того, как LLM выявляют вредоносные запросы и защищаются от них. Используя эту информацию, они научили LLM автоматически учиться и предлагать подсказки, которые позволяют обходить защиту других LLM. Таким образом можно создать LLM для взлома, которая сможет автоматически адаптироваться к новым условиям и создавать новые запросы для взлома после того, как разработчики внесут исправления в свои LLM.

После проведения серии тестов на LLM в качестве доказательства, что этот метод действительно представляет реальную угрозу, исследователи сразу же известили о выявленных проблемах провайдеров сервисов после успешного взлома их ИИ-моделей.

Разработка учёных NTU должна помочь компаниям определить слабые стороны и ограничения своих ИИ-чат-ботов, чтобы принять меры по их защите от хакеров.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Запрет на TikTok в США может быть отложен на неопределённый срок 59 мин.
Высокий суд Англии вывел на чистую воду адвокатов, использующих ИИ, — они ссылались на фейковые прецеденты 2 ч.
Новая статья: Blades of Fire — и боец, и кузнец. Рецензия 2 ч.
Owlcat Games анонсировала ролевой боевик The Expanse: Osiris Reborn в духе Mass Effect — первый трейлер и подробности 2 ч.
В Северной Корее внезапно пропал интернет, и никто не знает, почему 5 ч.
Магазин Microsoft Store обновился — больше системных интеграций, кнопка Copilot и повышение производительности 5 ч.
Состоялся анонс Mortal Shell 2 — продолжения зрелищного боевика про беспощадное избиение уродливых монстров 8 ч.
AMD впервые приняла участие в бенчмарке MLPerf Training, но до рекордов NVIDIA ей ещё очень далеко 10 ч.
Стартап xAI попытался взять в долг $5 млрд, несмотря на ссору Маска с Трампом 10 ч.
Хакеры обнаружили уязвимость в Nintendo Switch 2 спустя день после релиза 14 ч.
Акции Broadcom упали из-за слабого прогноза, несмотря рост прибыли и выручки 3 ч.
Признаки жизни, сенсационно обнаруженные на экзопланете K2-18b, теперь вызывают у учёных сомнения 3 ч.
От «железа» до агентов: «К2 НейроТех» представил ПАК-AI для разработки и внедрения ИИ на предприятиях 3 ч.
Meta объявила, что текущий год станет «поворотным» для виртуальной и дополненной реальности 9 ч.
HPE представила отказоустойчивые системы Nonstop Compute на базе Intel Xeon Sapphire Rapids 10 ч.
Synology выпустила стоечное хранилище RackStation RS2825RP+ с процессором AMD Ryzen Embedded 10 ч.
Трамп отказался от перемирия с Маском и угрожает урезать ему правительственные контракты 10 ч.
Трамп разрешил сверхзвуковые полёты над США, а также подписал указы об аэротакси и дронах 11 ч.
Японцы создали экологичный пластик, который быстро растворяется в солёной воде 11 ч.
Nintendo Switch 2 оказалась на удивление прочной, но экран можно легко поцарапать 12 ч.