Сегодня 17 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Cloudflare обвинила Perplexity в тотальном сборе данных для ИИ в обход любых запретов

Компания Cloudflare обвинила стартап Perplexity в массовом скрапинге веб-сайтов, которые явным образом запрещают сбор данных. Согласно исследованию Cloudflare, опубликованному 4 августа, боты Perplexity игнорировали технические ограничения, установленные в файле robots.txt, и продолжали извлекать и копировать контент с десятков тысяч доменов, создавая миллионы запросов ежедневно.

 Источник изображения: Štefan Štefančík/Unsplash

Источник изображения: Štefan Štefančík/Unsplash

Как утверждает Cloudflare, Perplexity изменяла названия своих ботов в поле User-Agent и использовала разные автономные системы (ASN) для обхода блокировок, включая имитацию браузера Google Chrome на macOS. По информации TechCrunch, Cloudflare выявила эту активность после жалоб клиентов, которые уже внесли правила в robots.txt и установили дополнительные блокировки для известных ботов Perplexity. В результате Cloudflare, применив комбинацию методов машинного обучения и сетевых сигналов, исключила ботов Perplexity из своего официального списка доверенных краулеров и внедрила дополнительные механизмы их блокировки.

Представитель Perplexity Джесси Двайер (Jesse Dwyer) назвал публикацию Cloudflare маркетинговой инициативой, заявив, что представленные скриншоты не подтверждают факт доступа к контенту. В последующем письме он добавил, что упомянутый в отчёте бот не принадлежит компании. Однако Cloudflare настаивает на достоверности своих данных.

Ранее Cloudflare уже выступала с критикой агрессивного скрапинга со стороны ИИ-компаний, а глава Cloudflare Мэтью Принс (Matthew Prince) неоднократно заявлял, что массовый сбор данных подрывает экономику интернета, особенно для новостных издательств. В связи с этим компания выпустила бесплатный инструмент для защиты от копирования контента в целях обучения моделей. Также на фоне происходящего Cloudflare, как и обещала в сентябре 2024 года, запустила торговую платформу, позволяющую владельцам сайтов взимать плату с ИИ-разработчиков за доступ к данным.

Это уже не первое обвинение в адрес Perplexity. В прошлом году издания, в том числе Wired, обвиняли стартап в воспроизведении их материалов без должного указания источника. А на конференции Disrupt 2024 генеральный директор Perplexity Аравинд Сринивас (Aravind Srinivas) затруднился дать чёткое определение плагиату, когда его об этом спросил журналист TechCrunch Девин Колдеви (Devin Coldewey).

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Google выпустит мобильную версию AI Studio для вайб-кодинга на ходу 20 мин.
Ролевой экшен Where Winds Meet в антураже фэнтезийного Китая привлёк свыше 2 млн игроков за первые сутки 2 ч.
Календарь релизов 17 – 23 ноября: Moonlighter 2, Demonschool, Forestrike и Neon Inferno 3 ч.
Новый уровень сложности, переработка механик, улучшения A-Life и многое другое: для S.T.A.L.K.E.R. 2: Heart of Chornobyl вышел крупный патч 1.7 3 ч.
Microsoft анонсировала игровую презентацию Xbox Partner Preview — на ней покажут Tides of Annihilation, 007 First Light, Reanimal и многое другое 3 ч.
Nintendo показала первые кадры из фильма по The Legend of Zelda — фанаты в восторге 4 ч.
Владелец Amazon Джефф Безос нашёл себе новую работу в сфере ИИ 5 ч.
Программный «ускоритель» Huawei обещает практически удвоить производительность дефицитных ИИ-чипов 7 ч.
Биткоин вновь упал — и обнулил весь рост с начала года 8 ч.
Разработчики Pioner «с удвоенной силой» взялись за исправление главных проблем открытой «беты» и готовят новое тестирование 10 ч.
Samsung выпустила «умную клавиатуру» с кнопкой вызова ИИ за $109 38 мин.
Sparkle представила видеокарту Arc Pro B60 Dual Passive с боковым HDMI и пассивным охлаждением 41 мин.
Oppo выпустила смартфоны Reno15 Pro и Reno15 с 200-Мп камерами и Dimensity 8450 3 ч.
Утечки об уходе Тима Кука на пенсию — это продуманная проверка реакции рынка 4 ч.
Дефицит DRAM усиливается: продавцов уже заставляют продавать планки памяти только в комплекте с матплатами 4 ч.
«Ростелеком» пробурил под Камой уникальный кабельный переход для трансроссийской интернет-магистрали TEA NEXT 4 ч.
SpaceX в пятисотый раз успешно запустила многоразовую ракету Falcon 9 4 ч.
MaxSun представила плату MS-iCraft B850 Aiga для Ryzen 9000 и не только 4 ч.
Colorful выпустила видеокарты iGame Ultra Z BTF 2.0 с «невидимым» питанием 7 ч.
Перегрузка энергосетей угрожает лидерству Нидерландов в сфере ЦОД — доступный водород продолжают игнорировать 8 ч.