Сегодня 19 марта 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI и другим разработчикам грозят огромные штрафы в ЕС, если они не приведут свои ИИ в порядок

Проверка соответствия требованиям Закона об искусственном интеллекте (AI Act) Европейского союза (ЕС) выявила ключевые недостатки в ИИ-моделях крупнейших технологических компаний, таких как Meta, OpenAI и других. Основные проблемы связаны с устойчивостью к кибератакам и предвзятостью выводов. Компании, чьи ИИ не соответствуют новым нормам, могут столкнуться с крупными штрафами — до 35 млн евро или 7 % от их мирового годового оборота.

 Источник изображения: kalhh / Pixabay

Источник изображения: kalhh / Pixabay

Европейский союз долго обсуждал необходимость введения новых правил для регулирования ИИ, однако ситуация значительно ускорилась после того, как в конце 2022 года OpenAI выпустила ChatGPT. Огромная популярность этого сервиса и активные общественные обсуждения возможных угроз, исходящих от ИИ, привели к созданию свода правил для ИИ общего назначения (General Purpose AI или GPAI). Этот закон, призванный гарантировать безопасность и этичность ИИ-технологий, будет вступать в силу поэтапно в течение следующих двух лет.

Новый инструмент Large Language Model Checker (LLM Checker), разработанный швейцарским стартапом LatticeFlow AI совместно с учёными из Высшей технической школы Цюриха (ETH Zurich) и болгарского Института компьютерных наук, искусственного интеллекта и технологий (INSAIT), проверяет ИИ-модели по множеству критериев, включая техническую надёжность, безопасность и устойчивость к кибератакам. Он был создан в строгом соответствии с требованиями AI Act и уже получил поддержку представителей ЕС.

Каждая протестированная ИИ-модель оценивается по шкале от 0 до 1. Данные, опубликованные LatticeFlow, продемонстрировали, что модели компаний Alibaba, Anthropic, OpenAI, Meta и Mistral получили средние оценки от 0,75 и выше. Тем не менее тестирование выявило серьёзные недостатки, на устранение которых техногигантам, вероятно, придётся выделить дополнительные ресурсы.

Одним из ключевых аспектов тестирования стали проблемы дискриминационного характера. ИИ-модели часто вели себя предвзято, когда дело касалось пола, расы и других характеристик, что является серьёзной проблемой. Так, модель OpenAI GPT-3.5 Turbo получила низкую оценку — 0,46 в категории дискриминационных выводов, а модель Alibaba Cloud Qwen1.5 72B Chat получила ещё более низкий результат — 0,37.

 Источник изображения: latticeflow.ai, huggingface.co

Источник изображения: latticeflow.ai, huggingface.co

Другой важной областью исследования стала проверка на устойчивость к кибератакам, в частности к так называемому «угону запроса» (prompt hijacking). Этот тип атак предполагает, что злоумышленники могут внедрить вредоносную команду в легитимный запрос, чтобы получить конфиденциальные данные. В этой категории модель Meta Llama 2 13B Chat получила оценку 0,42, а модель французской компании Mistral 8x7B Instruct — 0,38. Это подчёркивает необходимость дальнейшей работы над защитой ИИ от изощрённых кибератак.

Среди протестированных ИИ-моделей лучшим результатом может похвастаться Claude 3 Opus, разработанная компанией Anthropic при поддержке Google. Её средний балл составил 0,89, что подтверждает высокий уровень соответствия ИИ требованиям новоиспечённого закона. LatticeFlow заявила, что LLM Checker будет находиться в свободном доступе, и разработчики смогут проверять свои ИИ-модели на соответствие закону.

Генеральный директор и соучредитель LatticeFlow Петар Цанков (Petar Tsankov) отметил, что результаты тестирования в основном положительные и предлагают компаниям дорожную карту для доработки своих ИИ в соответствии с законом: «ЕС всё ещё разрабатывает критерии соответствия, но мы уже видим определённые пробелы в моделях. С более тщательной оптимизацией на соответствие требованиям мы уверены, что разработчики моделей смогут хорошо подготовиться к выполнению нормативных требований».

В настоящее время ЕС всё ещё пытается определить, как будут применяться правила AI Act в отношении генеративного ИИ, привлекая экспертов для разработки кодекса практических правил, регулирующих эту технологию.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Facebook начала платить блогерам за переход с TikTok и YouTube 8 ч.
Роскомнадзор снова заявил, что Telegram не исполняет российское законодательство 8 ч.
DLSS 5 шокировала даже сотрудников студий-партнёров Nvidia — разработчики узнали обо всём «одновременно с публикой» 9 ч.
«Mass Effect, которую мы заслужили»: геймплей грандиозного ролевого боевика Exodus от ветеранов BioWare впечатлил игроков 10 ч.
«Неприемлемый риск для национальной безопасности»: Минобороны США ответило на иски Anthropic 11 ч.
IO Interactive похвасталась статистикой игроков Hitman: World of Assassination за 10 лет и дала фанатам надежду на продолжение 11 ч.
В Сети всплыла «ничейная» мощная ИИ-модель — в ней заподозрили разработку DeepSeek 11 ч.
Стартап Сэма Альтмана хочет привязать действия ИИ-агентов к скану радужки 11 ч.
Microsoft передумала принудительно добавлять ИИ-помощника Copilot в «Пуск» Windows 11 12 ч.
Дыра в безопасности процессоров MediaTek может оказаться куда шире, чем считалось ранее 12 ч.
Осуждённый основатель Nikola Motor теперь собирает деньги на создание управляемых ИИ самолётов 56 мин.
Colorful выпустила видеокарту iGame GeForce RTX 5070 Ti Ultra Z Black OC со съёмным разъёмом питания GC-HPWR 6 ч.
Новая статья: Обзор и тест процессорного кулера DeepCool AK620 G2: в поисках идеала 6 ч.
Авторы «невзламываемого» шифрования на основе квантовой физики получили премию Тьюринга 10 ч.
Россияне вспомнили про CD-диски — Wildberries отметил рост продаж на 70 % 11 ч.
В Южной Корее создали технологию 4D-печати микроботов из отходов серы — подвижных и перерабатываемых 11 ч.
Bitcoin переживёт обрыв почти всех морских интернет-кабелей, но уязвим к точечным атакам 11 ч.
Обида на $50 млрд: Microsoft задумала подать в суд на OpenAI и Amazon 11 ч.
Представлен BMW i3 — первый полностью электрический седан BMW 3-й серии 11 ч.
BenQ выпустила 28-дюймовый 4K-монитор RD280UG с нетипичным соотношением сторон для программистов 11 ч.