Сегодня 24 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Reddit подал в суд на Perplexity за нелегальный скрапинг данных для ИИ

Платформа Reddit подала в суд на компанию Perplexity и трёх поставщиков сервисов веб-скрапинга — SerpApi, Oxylabs и AWMProxy, обвинив их в массовом несанкционированном сборе защищённых данных с сайта социальной сети для обучения искусственного интеллекта (ИИ). В иске утверждается, что Perplexity, разработчик ИИ-поисковика, использует данные, полученные через этих посредников, вместо того чтобы заключить прямое соглашение с Reddit, как это сделали некоторые другие компании, работающие в сфере ИИ.

 Источник изображения: Reddit

Источник изображения: Reddit

Согласно иску, как стало известно The Verge, в мае 2024 года Reddit направил Perplexity официальное требование о прекращении скрапинга контента, на что компания заявила, что не использует данные Reddit для обучения своих моделей и соблюдает правила, прописанные в файле robots.txt. Однако вскоре после этого количество цитирований Reddit в ответах Perplexity, по утверждению истца, возросло.

Reddit подчёркивает, что миллионы тематических постов, созданных пользователями, представляет значительную ценность для обучения ИИ и даже заключила соглашения с OpenAI и Google, а также в 2023 году ввела платный API, стремясь получать компенсацию за использование своих данных.

Бен Ли (Ben Lee), главный юридический директор Reddit, заявил, что «компании, занимающиеся разработкой искусственного интеллекта, втянуты в гонку вооружений за качественный контент, созданный людьми, и это давление привело к развитию экономики "отмывания данных" в промышленных масштабах». Он назвал литовского скрапера Oxylabs UAB, ботнет-структуру AWM Proxy и SerpAI, открыто рекламирующие методы обхода защиты, типичными представителями такой незаконной деятельности. По его словам, эти компании (ответчики по делу), не имея прямого доступа к Reddit, маскируют свои скрипты и местоположение, чтобы красть контент через поисковую выдачу Google, а Perplexity сознательно приобретает эти украденные данные, избегая легального сотрудничества.

В свою очередь, Джесси Двайер (Jesse Dwyer), руководитель отдела коммуникаций Perplexity, сообщил изданию The Verge, что компания пока не получала иск, но намерена решительно отстаивать право пользователей свободно и справедливо получать доступ к публичным знаниям. Он подчеркнул, что подход Perplexity остаётся принципиальным и ответственным, а угрозы открытости и общественным интересам компания терпеть не намерена.

Ранее Reddit также подавала в суд на Anthropic по аналогичным основаниям, утверждая, что боты Anthropic получили доступ к платформе Reddit, даже после того как Anthropic заявила, что не будет этого делать.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
США обвинили Китай в краже ИИ-технологий в «промышленных масштабах» — тот назвал это клеветой 46 мин.
«Ещё один шаг к мировому господству Housemarque»: критики вынесли вердикт амбициозному боевику Saros от создателей Returnal 2 ч.
Microsoft запускает «мягкие» сокращения: 7 % сотрудников досрочно отправят на пенсию 2 ч.
Представлена DeepSeek V4 — открытая ИИ-модель, которая потягается с лучшими решениями OpenAI и Google 2 ч.
Xiaomi представила ИИ-модели MiMo V2.5 для преобразования текста в речь и обратно 3 ч.
Пламенный двухмерный боевик Nocturnal стал временно бесплатным в Steam — раздача доступна и в России 4 ч.
Microsoft добавила в Word, Excel и PowerPoint ИИ-агента Copilot и открыла его для всех подписчиков Microsoft 365 4 ч.
Ubisoft раскрыла системные требования Assassin’s Creed Black Flag Resynced для игры с апскейлерами и трассировкой лучей 5 ч.
Meta расширила родительский контроль на общение с ИИ — родители увидят темы бесед подростков за неделю 9 ч.
Совсем без Call of Duty подписчиков Game Pass в 2026 году не оставят 15 ч.
На Солнце зафиксирована вспышка экстремального класса — вторая по мощности с начала года 41 мин.
Tesla готовит новую версию бортового компьютера для автопилота — с удвоенным объёмом памяти 44 мин.
Зарубежный трафик в российских сетях вырос на 15–20 %, вопреки прогнозам о спаде 46 мин.
В следующем десятилетии люди начнут жить и работать на Луне, пообещал глава стартапа Voyager Technologies 2 ч.
Intel заявила, что без оптимизаций игры теряют до 30 % производительности 2 ч.
Tesla развернула ИИ-кластер Cortex 2 на территории Gigafactory в Техасе 3 ч.
Гибридная СХД TrueNAS V160 обеспечивает пропускную способность до 60 Гбайт/с 3 ч.
Porsche представила электрический Cayenne с мощностью до 1139 л. с. и разгоном до сотни за 2,4 с 3 ч.
NASA утвердило состав миссии SpaceX Crew-13 с россиянином, и ускорило запуск — на это есть причины 3 ч.
Спортивный кроссовер Xiaomi YU7 GT дебютирует в мае и сможет разгоняться до 300 км/ч 3 ч.