Сегодня 21 марта 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Cloudflare натравила ИИ на ботов, которые собирают данные для ИИ

Cloudflare развернула систему искусственного интеллекта, предназначенную для перехвата ботов, которые сканируют общедоступные страницы и собирают данные с целью обучения других моделей ИИ.

 Источник изображения: cloudflare.com

Источник изображения: cloudflare.com

Владельцы сайтов теоретически могут попытаться отбиться от сканеров страниц при помощи файлов robots.txt с директивами для ботов, изменения настроек веб-серверов, проверок CAPTCHA и полной блокировки ботов. В действительности операторы роботов-сканеров зачастую игнорируют директивы robots.txt, обходят как тесты CAPTCHA, так и настройки серверов. В результате на ресурсах растёт объём нежелательного трафика, а данные сайтов попадают в массивы для обучения ИИ без разрешения правообладателей — однозначного ответа на вопрос о законности такой практики пока нет.

Cloudflare предложила не блокировать сканеры, а запускать их в систему, только показывать им созданный ИИ бесполезный контент, который они будут потреблять, попав в «ИИ-лабиринт». Обнаружив несанкционированное сканирование материалов, система не блокирует запрос, а выдаёт ряд ссылок на созданные ИИ страницы, достаточно убедительные, чтобы увести на них сканер. Такой контент выглядит как настоящий, но это уже не материалы, которые система пытается защитить — в результате сканер тратит время и ресурсы. Сами по себе генерируемые ИИ материалы реальны и связаны с научными фактами, потому что дезинформацию в Cloudflare плодить не намерены, а откровенно мусорный контент может навредить репутации сайта и поисковой оптимизации.

Система окажется сдерживающим фактором для сканеров веб-контента, чьи ресурсы начнут использоваться впустую, а стоимость эксплуатации вырастет. Она будет полезным инструментом для обнаружения активности ботов; человек же не станет погружаться в такой «ИИ-лабиринт» на глубину более четырёх ссылок, уверены создатели системы. Но панацеей это решение не является: такие вещи обычно порождают гонку вооружений, и в Cloudflare уже задумываются о том, что делать дальше, чтобы оставаться впереди.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Funcom объявила полные системные требования Dune: Awakening и рассказала, как будет развивать игру 2 ч.
Боевой трейлер научно-фантастического шутера Metal Eden от создателей Ruiner раскрыл дату выхода демоверсии 2 ч.
Instagram начал наполняться комментариями, написанными искусственным интеллектом 3 ч.
Стартап Nerdio, развивающий систему управления VDI в Microsoft Azure, привлёк $500 млн, а его капитализация выросла до $1 млрд 3 ч.
Российская компания Operation Zero предложила до $4 млн за эксплойты для Telegram 4 ч.
В программу сохранения классических игр GOG вошли ещё 27 хитов, включая Silent Hill 4, Deus Ex и F.E.A.R. 4 ч.
Cloudflare натравила ИИ на ботов, которые собирают данные для ИИ 5 ч.
Роскомнадзор обяжет сервисы хранить данные о переписках россиян три года 5 ч.
Кооператив на пятерых, свобода выбора и непредсказуемая погода: анонсирован шутер про выживание на острове Lost Rift от авторов Bulletstorm и Outriders 7 ч.
С Google взыскали средства для уплаты части штрафов, назначенных в России 7 ч.
Парализованный пациент обрёл способность управлять роботизированной рукой силой мысли 29 мин.
Представлен планшет Honor Pad X9a с 11,5-дюймовым дисплеем и батареей на 8300 мА·ч 2 ч.
Bigscreen представила стограммовые VR-очки Beyond 2 с опциональным отслеживанием глаз 2 ч.
Intel покинула глава разработки технологий производства чипов — перед самым дебютом Intel 18A 4 ч.
Рынок VR-гарнитур упал в прошлом году — его почти целиком захватила Meta, а у Apple продажи скатились 5 ч.
Google отказалась от услуг Samsung и разработала чип Tensor G5 для Pixel 10 почти самостоятельно 5 ч.
Оценка капитализации CoreWeave прямо перед IPO снизилась до $26 млрд 7 ч.
iPhone стали самыми популярными смартфонами в России — Xiaomi упала на второе место 7 ч.
Фантастика получила техническое обоснование — учёные рассчитали, где и как строить сферу Дайсона 7 ч.
Установлен новый рекорд разгона памяти DDR5 — всё ближе к 13 000 МГц 8 ч.