Сегодня 04 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Reddit подал в суд на Perplexity за нелегальный скрапинг данных для ИИ

Платформа Reddit подала в суд на компанию Perplexity и трёх поставщиков сервисов веб-скрапинга — SerpApi, Oxylabs и AWMProxy, обвинив их в массовом несанкционированном сборе защищённых данных с сайта социальной сети для обучения искусственного интеллекта (ИИ). В иске утверждается, что Perplexity, разработчик ИИ-поисковика, использует данные, полученные через этих посредников, вместо того чтобы заключить прямое соглашение с Reddit, как это сделали некоторые другие компании, работающие в сфере ИИ.

 Источник изображения: Reddit

Источник изображения: Reddit

Согласно иску, как стало известно The Verge, в мае 2024 года Reddit направил Perplexity официальное требование о прекращении скрапинга контента, на что компания заявила, что не использует данные Reddit для обучения своих моделей и соблюдает правила, прописанные в файле robots.txt. Однако вскоре после этого количество цитирований Reddit в ответах Perplexity, по утверждению истца, возросло.

Reddit подчёркивает, что миллионы тематических постов, созданных пользователями, представляет значительную ценность для обучения ИИ и даже заключила соглашения с OpenAI и Google, а также в 2023 году ввела платный API, стремясь получать компенсацию за использование своих данных.

Бен Ли (Ben Lee), главный юридический директор Reddit, заявил, что «компании, занимающиеся разработкой искусственного интеллекта, втянуты в гонку вооружений за качественный контент, созданный людьми, и это давление привело к развитию экономики "отмывания данных" в промышленных масштабах». Он назвал литовского скрапера Oxylabs UAB, ботнет-структуру AWM Proxy и SerpAI, открыто рекламирующие методы обхода защиты, типичными представителями такой незаконной деятельности. По его словам, эти компании (ответчики по делу), не имея прямого доступа к Reddit, маскируют свои скрипты и местоположение, чтобы красть контент через поисковую выдачу Google, а Perplexity сознательно приобретает эти украденные данные, избегая легального сотрудничества.

В свою очередь, Джесси Двайер (Jesse Dwyer), руководитель отдела коммуникаций Perplexity, сообщил изданию The Verge, что компания пока не получала иск, но намерена решительно отстаивать право пользователей свободно и справедливо получать доступ к публичным знаниям. Он подчеркнул, что подход Perplexity остаётся принципиальным и ответственным, а угрозы открытости и общественным интересам компания терпеть не намерена.

Ранее Reddit также подавала в суд на Anthropic по аналогичным основаниям, утверждая, что боты Anthropic получили доступ к платформе Reddit, даже после того как Anthropic заявила, что не будет этого делать.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Anthropic связала склонность Claude к шантажу и жульничеству с давлением и невыполнимыми задачами 3 ч.
Поддержка ИИ-моделью DeepSeek V4 ускорителей Huawei вызвала рост спроса на них в Китае 3 ч.
Новая статья: Life is Strange: Reunion — отчаяние приводит к успеху. Рецензия 9 ч.
Креативный директор Naughty Dog заинтриговал фанатов фотографией из командировки — на снимке углядели тизер Uncharted 5 11 ч.
State of Decay 3 восстала из мёртвых и спустя шесть лет после анонса готовится к публичной «альфе» 14 ч.
ИИ-модель Claude обнаружила уязвимость и разработала рабочий эксплойт для FreeBSD 14 ч.
Китайские власти ополчились на цифровых людей 15 ч.
Google, Meta и другие бигтехи больше не смогут избегать ответственности за контент пользователей, как делали 30 лет 15 ч.
Фэнтезийная ролевая игра Songs of Glimmerwick отправит в мир, где магия рождается из музыки — новый трейлер, релиз в 2026 году и демо на подходе 15 ч.
Microsoft признала, что Copilot — для развлечений, а не профессиональных задач 15 ч.