Сегодня 13 октября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Учёные разработали ИИ-чат-бот, который эффективно взламывает других ИИ-чат-ботов

Учёные-компьютерщики из Наньянского технологического университета (NTU, Сингапур) нашли эффективный способ взлома чат-ботов с искусственным интеллектом (ИИ). Для этого они обучают ИИ-чат-бот созданию подсказок, которые позволяют обходить защиту других чат-ботов на базе ИИ.

 Источник изображения: NTU

Источник изображения: NTU

Сингапурские исследователи использовали двойной метод взлома большой языковой модели (LLM), получивший название Masterkey. Во-первых, они провели реверс-инжиниринг того, как LLM выявляют вредоносные запросы и защищаются от них. Используя эту информацию, они научили LLM автоматически учиться и предлагать подсказки, которые позволяют обходить защиту других LLM. Таким образом можно создать LLM для взлома, которая сможет автоматически адаптироваться к новым условиям и создавать новые запросы для взлома после того, как разработчики внесут исправления в свои LLM.

После проведения серии тестов на LLM в качестве доказательства, что этот метод действительно представляет реальную угрозу, исследователи сразу же известили о выявленных проблемах провайдеров сервисов после успешного взлома их ИИ-моделей.

Разработка учёных NTU должна помочь компаниям определить слабые стороны и ограничения своих ИИ-чат-ботов, чтобы принять меры по их защите от хакеров.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Пользователи ChatGPT снова могут удалять свои чаты безвозвратно 17 ч.
Арт-директор Halo покинул студию после 17 лет работы и намекнул на проблемы в команде разработчиков 18 ч.
Один из основателей ИИ-стартапа Thinking Machines переметнулся к Марку Цукербергу 21 ч.
Apple завершила поддержку своего бесплатного видеоредактора Clips 22 ч.
Новая статья: CloverPit — добро пожаловать в яму. Рецензия 12-10 00:07
Chrome сам будет блокировать уведомления с сайтов, которые пользователь игнорирует 11-10 14:40
ChatGPT прошёл стресс-тест на политическую предвзятость, но не безупречно 11-10 14:24
Telegram получил большое обновление: переписки в групповых звонках, комментарии к профилям и другие нововведения 11-10 11:57
Apple купит технологии компьютерного зрения и специалистов стартапа Prompt AI за «некоторую сумму» 11-10 11:01
На Apple подали в суд за обучение ИИ на пиратских копиях книг 11-10 08:06
Новая статья: Обзор материнской платы MSI MPG B850I Edge Ti WiFi: не называй меня малышкой 5 ч.
Арест за арестом: причиной возгорания в правительственном ЦОД Южной Кореи могло стать не отключенное вовремя резервное питание 14 ч.
Graphcore, спасённая SoftBank, воспрянула духом — штат в Великобритании удвоится, а в разработку в Индии инвестируют $1 млрд 14 ч.
В наши дни все высокопроизводительные вычисления связаны с ИИ, как считает глава AMD Лиза Су 21 ч.
Производство чипов в наши дни требует атомарной точности, как утверждает Applied Materials 22 ч.
Xiaomi выпустила эргономичную беспроводную мышь Wireless Mouse 3 с тихими клавишами за $15 22 ч.
Обострение между США и Китаем грозит серьёзным ударом по мировой индустрии чипов 23 ч.
Кембриджский университет запустил проект по спасению данных со старых дискет 12-10 00:31
Китай грозит отправить США в рецессию — новые санкции на редкоземельные металлы ударят по ИИ 11-10 23:34
Акции китайских чипмейкеров взлетели, но инвесторы опасаются перегрева рынка 11-10 23:20