Сегодня 05 октября 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Cloudflare запустила инструмент для борьбы с ботами, собирающими данные для ИИ

Компания Cloudflare запустила новый бесплатный инструмент для защиты веб-сайтов от ботов, которые извлекают данные для обучения моделей искусственного интеллекта без согласия владельцев сайтов.

 Источник изображения: Cloudflare

Источник изображения: Cloudflare

Cloudflare, поставщик облачных услуг по предоставлению DNS и защиты от DDoS-атак, представила новое решение для борьбы с ботами искусственного интеллекта, которые несанкционированно занимаются сбором данных с веб-сайтов. Новый бесплатный инструмент защитит сайты, размещённые на платформе Cloudflare, от извлечения их контента для обучения ИИ-моделей.

Хотя некоторые крупные игроки в сфере ИИ, такие как Google, OpenAI и Apple, позволяют владельцам сайтов блокировать ботов через специальный файл robots.txt, далеко не все владельцы подобных ботов соблюдают эти правила. Cloudflare отмечает, что некоторые компании ИИ намеренно обходят ограничения доступа к контенту, постоянно адаптируясь и меняя свои алгоритмы, чтобы избежать обнаружения.

Чтобы решить эту проблему, Cloudflare проанализировала трафик краулеров и разработала автоматические модели их обнаружения, которые учитывают различные факторы, в том числе включая попытки ботов имитировать действия человека, использующего веб-браузер. Также создана специальная форма, позволяющая сообщать о подозрительных ботах и сканерах. На основе полученных данных Cloudflare будет вручную заносить ботов ИИ в черный список.

Проблема сбора данных ботами ИИ стала особенно актуальной на фоне бума генеративного ИИ. Многие сайты опасаются, что поставщики ИИ будут использовать их контент без разрешения и какой-либо компенсации. Согласно исследованию, около 26 % из 100 крупнейших новостных сайтов заблокировали бота OpenAI и 242 сайта из 1000 наиболее популярных также в настоящее время блокируют GPTBot. Другое исследование показало, что уже более 600 крупных новостных издателей заблокировали различных ботов.

Так как многие ИИ-боты игнорируют правила, прописанные в robots.txt, то приходится искать новые методы решения вопроса. Инструменты, подобные разработке Cloudflare, могут помочь в борьбе с несанкционированным сбором данных. Но насколько это окажется эффективным покажет время.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Samsung ускоряет подготовку к выпуску чипов по техпроцессам тоньше 2 нм 26 мин.
Жёсткие диски объёмом 60 Тбайт появятся уже через четыре года благодаря внедрению HAMR 7 ч.
Elecom анонсировала кабели USB4 2.0 — скорость до 80 Гбит/с плюс до 240 Вт питания 8 ч.
Смарт-часы Huawei Watch D2 с функцией измерения артериального давления поступили в продажу в России 8 ч.
Arctic подтвердила совместимость своих систем охлаждения с процессорами Arrow Lake-S 8 ч.
Rivian катится к закату: в 2024 году компания выпустит меньше электромобилей, чем в 2023-м 9 ч.
Суперкомпьютеры по талонам: Минцифры намерено выделять гранты на HPC/ИИ-вычисления 15 ч.
Российские покупатели iPhone 16 сбежали из магазинов в маркетплейсы 15 ч.
Lava Mobiles представила смартфон Agni 3 с 1,74-дюймовым сенсорным AMOLED-дисплеем на задней панели 16 ч.
Роверы «Яндекса» забросят в тундру: в заснеженном Новом Уренгое пройдут испытания рободоставки 16 ч.