Сегодня 27 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Cloudflare обвинила Perplexity в тотальном сборе данных для ИИ в обход любых запретов

Компания Cloudflare обвинила стартап Perplexity в массовом скрапинге веб-сайтов, которые явным образом запрещают сбор данных. Согласно исследованию Cloudflare, опубликованному 4 августа, боты Perplexity игнорировали технические ограничения, установленные в файле robots.txt, и продолжали извлекать и копировать контент с десятков тысяч доменов, создавая миллионы запросов ежедневно.

 Источник изображения: Štefan Štefančík/Unsplash

Источник изображения: Štefan Štefančík/Unsplash

Как утверждает Cloudflare, Perplexity изменяла названия своих ботов в поле User-Agent и использовала разные автономные системы (ASN) для обхода блокировок, включая имитацию браузера Google Chrome на macOS. По информации TechCrunch, Cloudflare выявила эту активность после жалоб клиентов, которые уже внесли правила в robots.txt и установили дополнительные блокировки для известных ботов Perplexity. В результате Cloudflare, применив комбинацию методов машинного обучения и сетевых сигналов, исключила ботов Perplexity из своего официального списка доверенных краулеров и внедрила дополнительные механизмы их блокировки.

Представитель Perplexity Джесси Двайер (Jesse Dwyer) назвал публикацию Cloudflare маркетинговой инициативой, заявив, что представленные скриншоты не подтверждают факт доступа к контенту. В последующем письме он добавил, что упомянутый в отчёте бот не принадлежит компании. Однако Cloudflare настаивает на достоверности своих данных.

Ранее Cloudflare уже выступала с критикой агрессивного скрапинга со стороны ИИ-компаний, а глава Cloudflare Мэтью Принс (Matthew Prince) неоднократно заявлял, что массовый сбор данных подрывает экономику интернета, особенно для новостных издательств. В связи с этим компания выпустила бесплатный инструмент для защиты от копирования контента в целях обучения моделей. Также на фоне происходящего Cloudflare, как и обещала в сентябре 2024 года, запустила торговую платформу, позволяющую владельцам сайтов взимать плату с ИИ-разработчиков за доступ к данным.

Это уже не первое обвинение в адрес Perplexity. В прошлом году издания, в том числе Wired, обвиняли стартап в воспроизведении их материалов без должного указания источника. А на конференции Disrupt 2024 генеральный директор Perplexity Аравинд Сринивас (Aravind Srinivas) затруднился дать чёткое определение плагиату, когда его об этом спросил журналист TechCrunch Девин Колдеви (Devin Coldewey).

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Приземлённый боевик Samson: A Tyndalston Story от создателя Just Cause выйдет уже совсем скоро — новый трейлер и дата релиза 53 мин.
AMD инвестирует в Nutanix $250 млн и создаст совместную платформу для агентного ИИ 12 ч.
AMD выпустила драйвер с поддержкой Resident Evil Requiem и Marathon 12 ч.
Nvidia выпустила драйвер с поддержкой Resident Evil Requiem 14 ч.
Жертвы перестали платить хакерам: уровень выплат упал до исторического минимума, хотя атак стало намного больше 14 ч.
Хорошего понемногу: надёжный инсайдер заявил, что Sony перестанет портировать эксклюзивы PlayStation на ПК 14 ч.
Google представила Nano Banana 2 — обновлённый генератор изображений работает быстрее и качественнее, и доступен бесплатно 14 ч.
Новый трейлер амбициозного пиратского выживания Windrose разочаровал фанатов отсутствием даты выхода — разработчики отреагировали 15 ч.
Instagram будет оповещать родителей, если подросток ищет контент о суициде и членовредительстве 16 ч.
Технодесантник, новая операция и платные голоса: разработчики Warhammer 40,000: Space Marine 2 выпустили крупное обновление 12.0 16 ч.
Nimbus Data представила универсальную All-Flash СХД FlashMax 14 мин.
Стартап MatX, намеренный конкурировать с NVIDIA, привлёк $500 млн инвестиций 43 мин.
«Железо» вместо алюминия: американская Alcoa продаст свои металлургические заводы строителям ЦОД 44 мин.
Продажи ПК в этом году рухнут до десятилетнего минимума, а цены взлетят на 17 % — бюджетный сегмент может уже никогда не оправиться 45 мин.
Минус 13 % за год: рынок смартфонов переживёт крупнейший спад за десятилетие, сильнее всех пострадает дешёвый сегмент 2 ч.
Nvidia рискует остаться с переполненными складами — обязательства по закупкам перед TSMC выросли в шесть раз до $95 млрд 4 ч.
«Cлишком хорошо, чтобы быть правдой»: блестящий на первый взгляд отчёт привёл к падению акций Nvidia на 5 % 6 ч.
iPhone и iPad стали первыми потребительскими устройствами, допущенными к секретным данным НАТО 10 ч.
Новая статья: Биочипы и органоидный интеллект 11 ч.
Lenovo покажет на MWC 2026 концепт портативной приставки Legion Go со складным дисплеем 11 ч.