Сегодня 06 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Cloudflare запустила инструмент для борьбы с ботами, собирающими данные для ИИ

Компания Cloudflare запустила новый бесплатный инструмент для защиты веб-сайтов от ботов, которые извлекают данные для обучения моделей искусственного интеллекта без согласия владельцев сайтов.

 Источник изображения: Cloudflare

Источник изображения: Cloudflare

Cloudflare, поставщик облачных услуг по предоставлению DNS и защиты от DDoS-атак, представила новое решение для борьбы с ботами искусственного интеллекта, которые несанкционированно занимаются сбором данных с веб-сайтов. Новый бесплатный инструмент защитит сайты, размещённые на платформе Cloudflare, от извлечения их контента для обучения ИИ-моделей.

Хотя некоторые крупные игроки в сфере ИИ, такие как Google, OpenAI и Apple, позволяют владельцам сайтов блокировать ботов через специальный файл robots.txt, далеко не все владельцы подобных ботов соблюдают эти правила. Cloudflare отмечает, что некоторые компании ИИ намеренно обходят ограничения доступа к контенту, постоянно адаптируясь и меняя свои алгоритмы, чтобы избежать обнаружения.

Чтобы решить эту проблему, Cloudflare проанализировала трафик краулеров и разработала автоматические модели их обнаружения, которые учитывают различные факторы, в том числе включая попытки ботов имитировать действия человека, использующего веб-браузер. Также создана специальная форма, позволяющая сообщать о подозрительных ботах и сканерах. На основе полученных данных Cloudflare будет вручную заносить ботов ИИ в черный список.

Проблема сбора данных ботами ИИ стала особенно актуальной на фоне бума генеративного ИИ. Многие сайты опасаются, что поставщики ИИ будут использовать их контент без разрешения и какой-либо компенсации. Согласно исследованию, около 26 % из 100 крупнейших новостных сайтов заблокировали бота OpenAI и 242 сайта из 1000 наиболее популярных также в настоящее время блокируют GPTBot. Другое исследование показало, что уже более 600 крупных новостных издателей заблокировали различных ботов.

Так как многие ИИ-боты игнорируют правила, прописанные в robots.txt, то приходится искать новые методы решения вопроса. Инструменты, подобные разработке Cloudflare, могут помочь в борьбе с несанкционированным сбором данных. Но насколько это окажется эффективным покажет время.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Блокировки отдалили Россию от «цифрового суверенитета», считает Павел Дуров 2 ч.
Создатели браузера Brave оценили в $60 возможность скрыть опции, которые ранее сами же и установили 2 ч.
Премьера геймплея и дата выхода Star Wars Zero Company — тактической стратегии от ветеранов XCOM 6 ч.
Square Enix анонсировала Final Fantasy VII Revelation — «незабываемый финал одного из самых амбициозных проектов в истории видеоигр» 7 ч.
Stellar Blade 2 получила первый трейлер и официальное название — Stellar Blade: Blood Rain 7 ч.
Новая статья: 007 First Light — успех после долгих лет подготовки. Рецензия 10 ч.
Назад в будущее и обратно: анонсирована метроидвания Tempus Vitae с путешествиями во времени 10 ч.
Google исправила рекордные 429 уязвимостей в Chrome за раз — включая 22 критические 15 ч.
Аша Шарма подтвердила, что Xbox нужны эксклюзивы, но есть нюанс 15 ч.
Google начала экспериментировать с показом результатов поиска в Chrome сразу в режиме ИИ 15 ч.
SpaceX собирается до четверти всех средств в ходе IPO привлечь от частных инвесторов 10 мин.
Meta поставила на паузу проект разработки ИИ-чипа, который должна была выпускать Samsung 40 мин.
Прототип тихого лайнера NASA X-59 впервые достиг сверхзвуковой скорости 2 ч.
Google согласовала аренду вычислительных мощностей у SpaceX для ИИ за $920 млн в месяц 2 ч.
OpenAI уже больше года ведёт переговоры о передаче доли в капитале стартапа властям США 2 ч.
Silicon Motion представила SSD-контроллеры с PCIe 6.0 и скоростью до 28 Гбайт/с 11 ч.
Ангстремные мобильные процессоры Intel Panther Lake и Wildcat Lake начали появляться на настольных платах 11 ч.
В российской части МКС обнаружены две утечки воздуха — одну уже заделали 14 ч.
Thermal Grizzly показала водоблок для скальпированных процессоров — с алмазными пластинами за €1500 15 ч.
Роботакси Waymo показало себя как неожиданно удобный транспорт для бегства с места преступления 15 ч.