Сегодня 30 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI и другим разработчикам грозят огромные штрафы в ЕС, если они не приведут свои ИИ в порядок

Проверка соответствия требованиям Закона об искусственном интеллекте (AI Act) Европейского союза (ЕС) выявила ключевые недостатки в ИИ-моделях крупнейших технологических компаний, таких как Meta, OpenAI и других. Основные проблемы связаны с устойчивостью к кибератакам и предвзятостью выводов. Компании, чьи ИИ не соответствуют новым нормам, могут столкнуться с крупными штрафами — до 35 млн евро или 7 % от их мирового годового оборота.

 Источник изображения: kalhh / Pixabay

Источник изображения: kalhh / Pixabay

Европейский союз долго обсуждал необходимость введения новых правил для регулирования ИИ, однако ситуация значительно ускорилась после того, как в конце 2022 года OpenAI выпустила ChatGPT. Огромная популярность этого сервиса и активные общественные обсуждения возможных угроз, исходящих от ИИ, привели к созданию свода правил для ИИ общего назначения (General Purpose AI или GPAI). Этот закон, призванный гарантировать безопасность и этичность ИИ-технологий, будет вступать в силу поэтапно в течение следующих двух лет.

Новый инструмент Large Language Model Checker (LLM Checker), разработанный швейцарским стартапом LatticeFlow AI совместно с учёными из Высшей технической школы Цюриха (ETH Zurich) и болгарского Института компьютерных наук, искусственного интеллекта и технологий (INSAIT), проверяет ИИ-модели по множеству критериев, включая техническую надёжность, безопасность и устойчивость к кибератакам. Он был создан в строгом соответствии с требованиями AI Act и уже получил поддержку представителей ЕС.

Каждая протестированная ИИ-модель оценивается по шкале от 0 до 1. Данные, опубликованные LatticeFlow, продемонстрировали, что модели компаний Alibaba, Anthropic, OpenAI, Meta и Mistral получили средние оценки от 0,75 и выше. Тем не менее тестирование выявило серьёзные недостатки, на устранение которых техногигантам, вероятно, придётся выделить дополнительные ресурсы.

Одним из ключевых аспектов тестирования стали проблемы дискриминационного характера. ИИ-модели часто вели себя предвзято, когда дело касалось пола, расы и других характеристик, что является серьёзной проблемой. Так, модель OpenAI GPT-3.5 Turbo получила низкую оценку — 0,46 в категории дискриминационных выводов, а модель Alibaba Cloud Qwen1.5 72B Chat получила ещё более низкий результат — 0,37.

 Источник изображения: latticeflow.ai, huggingface.co

Источник изображения: latticeflow.ai, huggingface.co

Другой важной областью исследования стала проверка на устойчивость к кибератакам, в частности к так называемому «угону запроса» (prompt hijacking). Этот тип атак предполагает, что злоумышленники могут внедрить вредоносную команду в легитимный запрос, чтобы получить конфиденциальные данные. В этой категории модель Meta Llama 2 13B Chat получила оценку 0,42, а модель французской компании Mistral 8x7B Instruct — 0,38. Это подчёркивает необходимость дальнейшей работы над защитой ИИ от изощрённых кибератак.

Среди протестированных ИИ-моделей лучшим результатом может похвастаться Claude 3 Opus, разработанная компанией Anthropic при поддержке Google. Её средний балл составил 0,89, что подтверждает высокий уровень соответствия ИИ требованиям новоиспечённого закона. LatticeFlow заявила, что LLM Checker будет находиться в свободном доступе, и разработчики смогут проверять свои ИИ-модели на соответствие закону.

Генеральный директор и соучредитель LatticeFlow Петар Цанков (Petar Tsankov) отметил, что результаты тестирования в основном положительные и предлагают компаниям дорожную карту для доработки своих ИИ в соответствии с законом: «ЕС всё ещё разрабатывает критерии соответствия, но мы уже видим определённые пробелы в моделях. С более тщательной оптимизацией на соответствие требованиям мы уверены, что разработчики моделей смогут хорошо подготовиться к выполнению нормативных требований».

В настоящее время ЕС всё ещё пытается определить, как будут применяться правила AI Act в отношении генеративного ИИ, привлекая экспертов для разработки кодекса практических правил, регулирующих эту технологию.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Квадриллион токенов за месяц: Google рассказала о нагрузке на свои ИИ-сервисы в июне 6 ч.
«Аэрофлот» возобновил полёты после взлома, но масштабы и ущерб от инцидента по-прежнему неизвестны 6 ч.
Runway представила «Photoshop для видео» — ИИ-модель Aleph для быстрого редактирования видео 7 ч.
Кровавый пародийный боевик Hotel Barcelona от авторов Deadly Premonition и No More Heroes отправит игроков в отель маньяков-убийц — раскрыта дата выхода 7 ч.
Selectel запустил хранилище S3 Vault — облачное решение для резервного копирования S3-бакетов 8 ч.
ИИ-блокнот NotebookLM от Google научился создавать слайд-шоу с озвучкой 8 ч.
Выручка Yandex B2B Tech выросла во втором квартале 2025 года на 59 % 8 ч.
Bloober Team показала 35 минут геймплея Cronos: The New Dawn — фанаты Dead Space и Silent Hill в восторге 8 ч.
Windows 10 сегодня исполнилось 10 лет — вспоминаем 10 спорных и определяющих моментов в истории ОС 10 ч.
Photoshop получил ИИ-инструмент для быстрого повышения качества старых фотографий 11 ч.
Власти США выдали Nvidia первые лицензии на поставки ускорителей H20 в Китай после снятия запрета 34 мин.
В прошлом квартале мировые поставки кремниевых пластин выросли на 9,6 % 2 ч.
Новая статья: Обзор материнской платы MSI MPG X870E CARBON WIFI: каждому — своё 6 ч.
Энергетическую безопасность Техаса обеспечат хранилища энергии на б/у-аккумуляторах от электромобилей 9 ч.
Razer представила киберспортивную беспроводную гарнитуру BlackShark V3 Pro в версиях для ПК, PS5 и Xbox 10 ч.
Стартап Reflect Orbital направит солнечный свет на ночную сторону Земли с помощью гигантских зеркал на орбите 11 ч.
Corsair представила мощный мини-ПК AI Workstation 300 — процессоры Ryzen AI Max и до 128 Гбайт памяти LPDDR5X 11 ч.
Ayaneo анонсировала складную портативную игровую консоль Pocket DS с Android и двумя экранами 11 ч.
Domino's научила робопса Boston Dynamics Spot доставлять пиццу и отгонять чаек 12 ч.
Elgato выпустила Facecam 4K — веб-камеру с поддержкой 4K при 60 FPS и сменными фильтрами за $200 12 ч.