Сегодня 15 октября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → flowise

Серверы с большими языковыми моделями ИИ могут сливать в интернет конфиденциальные данные

Сотни серверов с большими языковыми моделями с открытым кодом и десятки — с векторными базами данных способны передавать в открытый интернет информацию с высокой степенью конфиденциальности, гласят результаты исследования, проведённого специализирующейся на вопросах кибербезопасности компанией Legit.

 Источник изображений: Pete Linforth / unsplash.com

Источник изображений: Pete Linforth / unsplash.com

В рамках исследования эксперт Legit Нафтали Дойч (Naphtali Deutsch) провёл сканирование двух видов потенциально уязвимых служб с искусственным интеллектом: векторных баз данных, в которых хранится информация для инструментов ИИ, а также конструкторов приложений на основе больших языковых моделей, в частности, открытой программы Flowise. По результатам исследования было выявлено множество конфиденциальных персональных и корпоративных данных, которые неосознанно раскрывают организации, стремящиеся поставить себе на службу инструменты с генеративным ИИ.

Flowise — программа с открытым кодом, предназначенная для создания приложений всех видов, основанных на больших языковых моделях. Это могут быть чат-боты для поддержки клиентов или средства для генерации программного кода, и все они, как правило, имеют доступ к большим объёмам данных и управляют ими, поэтому большинство серверов Flowise защищается паролями. Но пароль — недостаточно надёжный механизм защиты: ранее индийский исследователь обнаружил во Flowise 1.6.2 и более ранних версиях уязвимость, позволяющую обходить аутентификацию, просто набирая заглавные буквы в обращениях к программе через API. Уязвимость отслеживается под номером CVE-2024-31621 и имеет «высокий» рейтинг в 7,6 балла из 10.

Эксплуатируя уязвимость, эксперт Дойч взломал 438 серверов Flowise. Он получил доступ к токенам доступа API GitHub, ключам API OpenAI, паролям Flowise, прочим ключам API в открытом виде, данным конфигурации и запросам, связанным с приложениями Flowise, а также многим другим данным. Токен API GitHub открывает доступ к закрытым репозиториям, пояснил исследователь; были также обнаружены ключи API и для других векторных баз данных, включая Pinecone — популярную SaaS-платформу. Потенциальный злоумышленник мог воспользоваться ими, чтобы войти в базу данных и выгрузить всю найденную информацию, в том числе конфиденциальную.

Используя инструменты сканирования, Дойч обнаружил около 30 серверов с векторными базами данных в открытом интернете без каких-либо средств аутентификации, и в них была конфиденциальная информация: электронные письма от поставщика инженерных услуг; документы, полученные от специализирующейся на моде компании; персональные данные клиентов и финансовую информацию от поставщика промышленного оборудования; а также многое другое. В других базах были данные об объектах недвижимости, документация, технические паспорта товаров и даже используемая медицинским чат-ботом информация о пациентах.

Утечка векторной базы данных опаснее, чем утечка данных от конструктора с большой языковой моделью, поскольку несанкционированный доступ к базе может остаться незамеченным для пользователя. Потенциальный злоумышленник может не только похитить информацию из векторной базы данных, но также удалить или изменить информацию в ней и даже внедрить в неё вредоносное ПО, которое заразит большую языковую модель. Чтобы снизить подобные риски, Дойч рекомендует организациям ограничивать доступ к службам ИИ, отслеживать и регистрировать связанную с ними активность, принимать меры для защиты конфиденциальных данных, которые передаются большими языковыми моделями, а также по возможности обновлять связанное с этими средствами ПО.


window-new
Soft
Hard
Тренды 🔥
В Firefox появился ИИ-поиск Perplexity — теперь он доступен всем пользователям по всему миру 9 ч.
Вертикальный роглайк Death by Scrolling от создателя Monkey Island предложит перехитрить саму смерть — дата выхода и новый трейлер 11 ч.
Павел Дуров: ЕС едва не обязал Telegram и другие мессенджеры сканировать все переписки пользователей 12 ч.
YouTube научится синхронизировать автоматический дубляж с губами спикера 12 ч.
Франшиза Assassin's Creed осталась без руководителя — Марк-Алексис Коте покинул Ubisoft после 20 лет работы 12 ч.
Discord нашла виноватого в утечке данных пользователей — подрядчик заявил, что его не взламывали 13 ч.
Google Meet теперь умеет накладывать виртуальный макияж с помощью ИИ 14 ч.
Разработчики No, I’m not a Human похвастались продажами и посоветовали приготовиться к встрече новых гостей 14 ч.
Microsoft ответит в суде за слишком дорогую подписку ChatGPT 14 ч.
Instagram защитит подростков от ИИ и «взрослого» контента — фильтр PG-13 теперь включён по умолчанию 14 ч.
Brookfield потратит до $5 млрд на поддержку внедрения твердооксидных топливных элементов Bloom Energy в ИИ ЦОД 17 мин.
США и Китай посылают общественности сигналы о готовности не допустить эскалации торгового конфликта 43 мин.
Благосостояние богатейших представителей технологической отрасли на этой неделе выросло на $60 млрд 2 ч.
Новые виды устройств Apple для умного дома BYD будет производить во Вьетнаме 4 ч.
Новая статья: Обзор MSI GeForce RTX 5070 Ti 16G GAMING TRIO OC PLUS: универсальная видеокарта для всех игровых платформ 8 ч.
Новая статья: Обзор нововведений в ALD Pro 3.0.0: всем каталогам каталог 9 ч.
Apple намекнула на скорый анонс MacBook Pro на чипе M5 — его могут представить уже завтра 11 ч.
Intel представила Crescent Island — GPU для ИИ на архитектуре Xe3P и со 160 Гбайт LPDDR5X 12 ч.
Oracle анонсировала крупнейший в мире зеттафлопсный ИИ-кластер OCI Zettascale10: до 800 тыс. ускорителей NVIDIA в нескольких ЦОД 13 ч.
Oracle купит 50 000 ИИ-ускорителей AMD — альтернатива Nvidia набирает обороты 13 ч.