В этом году Роскомнадзор планирует начать использовать ИИ для формирования и ведения реестра запрещённой информации, пишет «Коммерсантъ» со ссылкой на новую версию паспорта программы цифровой трансформации ведомства. Как ожидается, это позволит сократить издержки и устанавливать «неочевидные связи». Согласно документу, через два года регулятор также намерен задействовать ИИ для ведения реестра операторов персональных данных.
О планах регулятора начать активно использовать ИИ указано в описании работ, касающихся единой информационной системы Роскомнадзора (ЕИС, также объединяет реестры лицензий, СМИ, разрешений) и информационной системы мониторинга интернет-ресурсов (ИС МИР). Согласно тендерной документации от 2021 года, ИС МИР предназначена для отслеживания текстов с запрещённой информацией, их классификации по характеру (нейтральное, негативное или позитивное мнение автора) и поиска перепечаток. В прошлом году был объявлен тендер на интеграцию ИС МИР с другими системами, в том числе с ИС «Окулус», предназначенной для поиска изображений и символов.
В документе отмечено, что в 2023 году на выявление незаконного контента в интернете Роскомнадзору требовалось три часа с момента его публикации, в 2024 году ведомство планирует сократить это время до двух часов, а в 2026 году — до одного часа. Также предполагается снизить показатель ошибочно выявленных признаков нарушений в СМИ с 20 % в 2023 году до 10 % в 2026 году.
По мнению менеджера продуктов Innostage Евгения Суркова, применение ИИ вместо заданных алгоритмов обработки текстов позволит сократить объём использования человеческих ресурсов. Менеджер продукта Just AI Алексей Борщов отметил, что ИИ также позволит «выявлять сложные контекстуальные связи между текстовыми фрагментами, находить скрытые закономерности и ассоциации», и его можно использовать для структурирования баз данных.
Что касается использования ИИ для пополнения реестра операторов персональных данных, то аналитик профильного Telegram-канала abloud62 Алексей Бойко полагает, что выявлять их в автоматическом режиме можно по открытой информации, хотя и есть риск, что на первых порах ИИ будет выдавать ложные обнаружения.
В свою очередь, гендиректор разработчика систем анализа данных «Социальная лаборатория» Наталия Тылевич считает, что выявление операторов с помощью ИИ сопряжено с проблемами: «Даже если оператор опубликовал юридические документы в виде, удобном для автоматического извлечения, их чтение требует глубокого семантического анализа». Эти данные интернет-магазин может отображать только в ходе регистрации пользователя или оформления заказа. А для этого необходимо найти способ автоматической регистрации на сайтах, что обычно блокируется сайтами, резюмирует эксперт.