Сегодня 27 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Cloudflare обвинила Perplexity в тотальном сборе данных для ИИ в обход любых запретов

Компания Cloudflare обвинила стартап Perplexity в массовом скрапинге веб-сайтов, которые явным образом запрещают сбор данных. Согласно исследованию Cloudflare, опубликованному 4 августа, боты Perplexity игнорировали технические ограничения, установленные в файле robots.txt, и продолжали извлекать и копировать контент с десятков тысяч доменов, создавая миллионы запросов ежедневно.

 Источник изображения: Štefan Štefančík/Unsplash

Источник изображения: Štefan Štefančík/Unsplash

Как утверждает Cloudflare, Perplexity изменяла названия своих ботов в поле User-Agent и использовала разные автономные системы (ASN) для обхода блокировок, включая имитацию браузера Google Chrome на macOS. По информации TechCrunch, Cloudflare выявила эту активность после жалоб клиентов, которые уже внесли правила в robots.txt и установили дополнительные блокировки для известных ботов Perplexity. В результате Cloudflare, применив комбинацию методов машинного обучения и сетевых сигналов, исключила ботов Perplexity из своего официального списка доверенных краулеров и внедрила дополнительные механизмы их блокировки.

Представитель Perplexity Джесси Двайер (Jesse Dwyer) назвал публикацию Cloudflare маркетинговой инициативой, заявив, что представленные скриншоты не подтверждают факт доступа к контенту. В последующем письме он добавил, что упомянутый в отчёте бот не принадлежит компании. Однако Cloudflare настаивает на достоверности своих данных.

Ранее Cloudflare уже выступала с критикой агрессивного скрапинга со стороны ИИ-компаний, а глава Cloudflare Мэтью Принс (Matthew Prince) неоднократно заявлял, что массовый сбор данных подрывает экономику интернета, особенно для новостных издательств. В связи с этим компания выпустила бесплатный инструмент для защиты от копирования контента в целях обучения моделей. Также на фоне происходящего Cloudflare, как и обещала в сентябре 2024 года, запустила торговую платформу, позволяющую владельцам сайтов взимать плату с ИИ-разработчиков за доступ к данным.

Это уже не первое обвинение в адрес Perplexity. В прошлом году издания, в том числе Wired, обвиняли стартап в воспроизведении их материалов без должного указания источника. А на конференции Disrupt 2024 генеральный директор Perplexity Аравинд Сринивас (Aravind Srinivas) затруднился дать чёткое определение плагиату, когда его об этом спросил журналист TechCrunch Девин Колдеви (Devin Coldewey).

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Абеляр, лайкни это видео»: Owlcat заинтриговала фанатов Warhammer 40,000: Rogue Trader тизером аддона The Infinite Museion с Тразином Неисчислимым 22 мин.
Microsoft представила Copilot Tasks — ИИ-агента для выполнения задач в фоне 35 мин.
Глава Warner Bros. Games намекнул, когда выйдет Hogwarts Legacy 2 2 ч.
Роскомнадзор не стал отрицать сообщения о принятом в Кремле решении заблокировать Telegram с апреля 3 ч.
Resident Evil Requiem стартовала в Steam с «очень положительными» отзывами и новым рекордом для серии 3 ч.
Приземлённый боевик Samson: A Tyndalston Story от создателя Just Cause выйдет уже совсем скоро — новый трейлер и дата релиза 4 ч.
AMD инвестирует в Nutanix $250 млн и создаст совместную платформу для агентного ИИ 14 ч.
AMD выпустила драйвер с поддержкой Resident Evil Requiem и Marathon 15 ч.
Nvidia выпустила драйвер с поддержкой Resident Evil Requiem 16 ч.
Жертвы перестали платить хакерам: уровень выплат упал до исторического минимума, хотя атак стало намного больше 17 ч.
Samsung подтвердила — в подорожании смартфонов Galaxy S26 виновата память 40 мин.
ASML заявила о готовности High-NA EUV к серийному производству ангстремных чипов 44 мин.
Qualcomm переманила главу полупроводникового производства Intel Foundry 48 мин.
Samsung объяснила, почему не стала внедрять магниты в корпус Galaxy S26 2 ч.
Samsung разочаровалась в сверхтонких смартфонах после провала Galaxy S25 Edge — трёхстворчатого TriFold 2 тоже пока не будет 3 ч.
Ракетный двигатель для ракеты «Ангара» создали на лазерном 3D-принтере — быстрее и в 2,5 раза дешевле 3 ч.
Начинает сбываться пророчество о том, что из-за кризиса памяти не все производители переживут 2026 год — Meizu на грани банкротства 3 ч.
Nimbus Data представила универсальную All-Flash СХД FlashMax 4 ч.
Стартап MatX, намеренный конкурировать с NVIDIA, привлёк $500 млн инвестиций 4 ч.
«Железо» вместо алюминия: американская Alcoa продаст свои металлургические заводы строителям ЦОД 4 ч.