Сегодня 21 мая 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Учёные разработали ИИ-чат-бот, который эффективно взламывает других ИИ-чат-ботов

Учёные-компьютерщики из Наньянского технологического университета (NTU, Сингапур) нашли эффективный способ взлома чат-ботов с искусственным интеллектом (ИИ). Для этого они обучают ИИ-чат-бот созданию подсказок, которые позволяют обходить защиту других чат-ботов на базе ИИ.

 Источник изображения: NTU

Источник изображения: NTU

Сингапурские исследователи использовали двойной метод взлома большой языковой модели (LLM), получивший название Masterkey. Во-первых, они провели реверс-инжиниринг того, как LLM выявляют вредоносные запросы и защищаются от них. Используя эту информацию, они научили LLM автоматически учиться и предлагать подсказки, которые позволяют обходить защиту других LLM. Таким образом можно создать LLM для взлома, которая сможет автоматически адаптироваться к новым условиям и создавать новые запросы для взлома после того, как разработчики внесут исправления в свои LLM.

После проведения серии тестов на LLM в качестве доказательства, что этот метод действительно представляет реальную угрозу, исследователи сразу же известили о выявленных проблемах провайдеров сервисов после успешного взлома их ИИ-моделей.

Разработка учёных NTU должна помочь компаниям определить слабые стороны и ограничения своих ИИ-чат-ботов, чтобы принять меры по их защите от хакеров.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Авторы Norco выпустят «микроприключение» Silenus про андроида на населённом ИИ заводе — в Steam вышло необычное демо 1 мин.
Ethereum взлетел более чем на 20 % и продолжает расти на фоне слухов об одобрении спотовых Ethereum-ETF 20 мин.
Senua's Saga: Hellblade II не оставила критиков равнодушными — первые оценки одного из главных эксклюзивов Xbox в 2024 году 60 мин.
Скарлетт Йоханссон запретила использовать свой голос для ChatGPT — OpenAI не послушалась и пытается договориться 2 ч.
ИИ-помощник Copilot появится в Minecraft, а следом и в других играх на Xbox 4 ч.
Календарь релизов — 20–26 мая: Senua’s Saga: Hellblade II, Song of Conquest и Ships At Sea 4 ч.
Epic Games Store продолжает терять эксклюзивы — игры серии Kingdom Hearts всё-таки выйдут в Steam, причём совсем скоро 4 ч.
Apple исправила баг, из-за которого на iPhone появлялись давно удалённые фото 6 ч.
Paradox перенесла на неопределённый срок симулятор жизни Life by You от команды ветерана The Sims, но игроки даже рады 15 ч.
Кибершпионаж на дне океана: США заподозрили Китай в краже данных через морские интернет-кабели 16 ч.
HP перестанет выпускать компьютеры Spectre, Envy и Pavilion — их заменят Omni и Elite 28 мин.
Операционный директор Apple провёл тайные переговоры с TSMC по поводу выпуска ИИ-чипов 34 мин.
Neuralink разрешили вживить мозговой имплант в мозг второму пациенту 2 ч.
Samsung представила Arm-ноутбуки Galaxy Book4 Edge — их покупателям подарят 50" 4К-телевизоры 2 ч.
Google рассчитывает потратить €1 млрд на расширение основного ЦОД в Финляндии, который заодно обогреет дома местных жителей 2 ч.
ASML и TSMC могут вывести из строя оборудование для выпуска передовых чипов, если Китай вторгнется на Тайвань 3 ч.
Volvo представила тягач с полным автопилотом — он готов к массовому производству 3 ч.
SpaceX провела генеральную репетицию заправки Starship перед четвёртым тестовым запуском 3 ч.
LG не сработалась с Meta и ищет нового партнёра в сфере XR-гарнитур — им может стать Amazon 3 ч.
Samsung показала первый в мире дисплей QD-LED и другие инновационные панели 4 ч.