Сегодня 28 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Cloudflare обвинила Perplexity в тотальном сборе данных для ИИ в обход любых запретов

Компания Cloudflare обвинила стартап Perplexity в массовом скрапинге веб-сайтов, которые явным образом запрещают сбор данных. Согласно исследованию Cloudflare, опубликованному 4 августа, боты Perplexity игнорировали технические ограничения, установленные в файле robots.txt, и продолжали извлекать и копировать контент с десятков тысяч доменов, создавая миллионы запросов ежедневно.

 Источник изображения: Štefan Štefančík/Unsplash

Источник изображения: Štefan Štefančík/Unsplash

Как утверждает Cloudflare, Perplexity изменяла названия своих ботов в поле User-Agent и использовала разные автономные системы (ASN) для обхода блокировок, включая имитацию браузера Google Chrome на macOS. По информации TechCrunch, Cloudflare выявила эту активность после жалоб клиентов, которые уже внесли правила в robots.txt и установили дополнительные блокировки для известных ботов Perplexity. В результате Cloudflare, применив комбинацию методов машинного обучения и сетевых сигналов, исключила ботов Perplexity из своего официального списка доверенных краулеров и внедрила дополнительные механизмы их блокировки.

Представитель Perplexity Джесси Двайер (Jesse Dwyer) назвал публикацию Cloudflare маркетинговой инициативой, заявив, что представленные скриншоты не подтверждают факт доступа к контенту. В последующем письме он добавил, что упомянутый в отчёте бот не принадлежит компании. Однако Cloudflare настаивает на достоверности своих данных.

Ранее Cloudflare уже выступала с критикой агрессивного скрапинга со стороны ИИ-компаний, а глава Cloudflare Мэтью Принс (Matthew Prince) неоднократно заявлял, что массовый сбор данных подрывает экономику интернета, особенно для новостных издательств. В связи с этим компания выпустила бесплатный инструмент для защиты от копирования контента в целях обучения моделей. Также на фоне происходящего Cloudflare, как и обещала в сентябре 2024 года, запустила торговую платформу, позволяющую владельцам сайтов взимать плату с ИИ-разработчиков за доступ к данным.

Это уже не первое обвинение в адрес Perplexity. В прошлом году издания, в том числе Wired, обвиняли стартап в воспроизведении их материалов без должного указания источника. А на конференции Disrupt 2024 генеральный директор Perplexity Аравинд Сринивас (Aravind Srinivas) затруднился дать чёткое определение плагиату, когда его об этом спросил журналист TechCrunch Девин Колдеви (Devin Coldewey).

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Nacon закроет студию Spiders — разработчиков Greedfall и Steelrising никто не захотел купить 13 мин.
Игроки не оценили S&box — духовный наследник Garry’s Mod собирает в Steam «смешанные» отзывы 2 ч.
Режиссёр Resident Evil 2 спустя почти 30 лет раскрыл секрет происхождения имени Леона Кеннеди 2 ч.
Google «Play Маркет» начнёт помечать приложения, оптимизированные для больших экранов 2 ч.
Минцифры РФ прорабатывает введение платы за VPN-трафик 3 ч.
NEC с помощью Anthropic создаст крупнейшую в Японии команду специалистов в области ИИ, хотя сами японцы скептически относятся к ИИ 5 ч.
Решения МТС Exolve выходят за пределы России 5 ч.
Microsoft подтвердила, что уязвимость Windows позволяет красть пароли без единого клика 6 ч.
Российский ответ «Готике» становится лучше: Of Ash and Steel получила «самый масштабный и богатый на изменения» патч 6 ч.
Сюжетное дополнение Diablo IV: Lord of Hatred стартовало в Steam со «смешанными» отзывами 6 ч.
Gigabyte представила тонкий ноутбук Aero X16 с новой версией GeForce RTX 5070 для «задач ИИ нового поколения» 2 ч.
С миру по миллиарду: Oracle всё-таки насобирала $16 млрд на ИИ ЦОД OpenAI в Мичигане 2 ч.
SpaceX привязала гонорар Илона Маска к колонизации Марса и запуску орбитальных ЦОД 3 ч.
Представлена робот-рыба Bionic Arowana за $5000 — доступная альтернатива живой ароване для аквариума 3 ч.
Samsung Heavy Industries займётся строительством плавучих ЦОД совместно с американской Mousterian Corporation 3 ч.
Google и Meta теряют ИИ-таланты — те создают стартапы и привлекают миллиарды 4 ч.
Стартовали российские продажи смартфонов Tecno Camon 50 и Camon 50 Ultra 5G 4 ч.
Samsung начала продавать «первый 32-дюймовый игровой 6K-монитор» — Odyssey G8 (G80HS) за €1499 4 ч.
Авиакомпании стали чаще предлагать Wi-Fi в полёте — Starlink лидирует с большим отрывом 5 ч.
ASRock выпустила 27-дюймовый монитор Phantom Gaming PG27QFW2A с QHD и 400 Гц и представила 32-дюймовый PG32QFT с QHD и 180 Гц 5 ч.