Сегодня 15 мая 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Учёные разработали ИИ-чат-бот, который эффективно взламывает других ИИ-чат-ботов

Учёные-компьютерщики из Наньянского технологического университета (NTU, Сингапур) нашли эффективный способ взлома чат-ботов с искусственным интеллектом (ИИ). Для этого они обучают ИИ-чат-бот созданию подсказок, которые позволяют обходить защиту других чат-ботов на базе ИИ.

 Источник изображения: NTU

Источник изображения: NTU

Сингапурские исследователи использовали двойной метод взлома большой языковой модели (LLM), получивший название Masterkey. Во-первых, они провели реверс-инжиниринг того, как LLM выявляют вредоносные запросы и защищаются от них. Используя эту информацию, они научили LLM автоматически учиться и предлагать подсказки, которые позволяют обходить защиту других LLM. Таким образом можно создать LLM для взлома, которая сможет автоматически адаптироваться к новым условиям и создавать новые запросы для взлома после того, как разработчики внесут исправления в свои LLM.

После проведения серии тестов на LLM в качестве доказательства, что этот метод действительно представляет реальную угрозу, исследователи сразу же известили о выявленных проблемах провайдеров сервисов после успешного взлома их ИИ-моделей.

Разработка учёных NTU должна помочь компаниям определить слабые стороны и ограничения своих ИИ-чат-ботов, чтобы принять меры по их защите от хакеров.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
В России могут ввести штрафы до 5 миллионов рублей за запрещённый и антироссийский контент в играх 42 мин.
Правительство РФ снова взялось за цифровизацию государственного документооборота 49 мин.
Samsung рассказала, когда смартфоны Galaxy начнут получать One UI 8 на базе Android 16 3 ч.
ИИ в поиске нового Пеле: нейросети подключили к отбору талантливых футболистов в Бразилии 3 ч.
«Аквариус» предложил президенту распространить на весь ИТ-сектор меры поддержки выхода на фондовый рынок 4 ч.
Объём российского рынка СУБД к 2031 году превысит 251 млрд рублей 4 ч.
Российский суд запретил Google Ireland мешать банкротству «Гугл» в суде США 4 ч.
Успех Assassin’s Creed Shadows подтолкнул Ubisoft тратить больше времени на разработку — сразу несколько «наиболее крупных» игр перенесены 4 ч.
«Выпускайте Палача»: спустя пять лет после Doom Eternal на ПК и консолях вышла Doom: The Dark Ages 5 ч.
«Hey, Copilot!»: Microsoft начала тестировать голосовой запуск ИИ в Windows 5 ч.
Qualcomm представила процессор Snapdragon 7 Gen 4 для мощных «середнячков» 36 мин.
Qualcomm готовит мощное возвращение в сегмент серверных процессоров — теперь с фокусом на ИИ 49 мин.
Samsung купила за €1,5 млрд поставщика систем охлаждения для ЦОД и предприятий FläktGroup 57 мин.
Музыкальный привет из 80-х: We Are Rewind представила кассетный бумбокс с пространственным звуком и Bluetooth 60 мин.
Российские 193-нм литографы появятся через пару лет, и будут работать по старинке 2 ч.
Потенциал импортозамещения почти исчерпан: АРПЭ выпустила отчёт о состоянии российского рынка серверного оборудования 2 ч.
Asus представила белую видеокарту TUF RTX 5070 Ti BTF с альтернативным съёмным разъёмом питания 3 ч.
Спрос на AMD Instinct MI325X со стороны крупных компаний оказался ниже ожиданий из-за ограниченных возможностей масштабирования 3 ч.
Китайские автопроизводители запустили гонку по созданию электрических летательных аппаратов 4 ч.
Учёные США массово ищут работу за границей — этим воспользуются Китай и Европа 4 ч.