Сегодня 19 августа 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Reddit введёт жёсткие меры против сборщиков контента для обучения ИИ

Администрация платформы Reddit заявила, что обновит исключения для роботов (файл robots.txt), которые сообщают веб-ботам о разрешении или запрете сканировать сайт и его разделы. Ресурс также примет меры для фактического ограничения доступа некоторым ботам.

 Источник изображения: redditinc.com

Источник изображения: redditinc.com

Традиционно файл robots.txt использовался для того, чтобы помочь поисковым системам правильно сканировать сайт. Но с развитием систем искусственного интеллекта появились боты, которые выкачивают контент сайтов целиком для обучения моделей без указания источника этого контента. Поэтому вместе с обновлением файла robots.txt администрация Reddit продолжит ограничивать скорость неизвестных ботов и блокировать их доступ к платформе — меры будут приниматься, если эти системы не будут соблюдать «Политику открытого контента» (Public Content Policy) на сайте.

Новый режим работы не должен повлиять на большинство пользователей и добросовестных участников ресурса, включая исследователей и некоммерческие организации вроде Internet Archive, сообщили в администрации Reddit. Меры вводятся лишь для того, чтобы не позволить другим компаниям обучать большие языковые модели ИИ на контенте платформы. Администрация ресурса опубликовала заявление после того, как стало известно, что ИИ-стартап Perplexity занимается сбором контента вопреки директивам robots.txt — гендиректор компании Аравинд Шринивас (Aravind Srinivas) заявил, что эти директивы не являются правовым обязательством.

Предстоящие изменения Reddit не затронут партнёров, которые заключили соглашения с платформой: Google и OpenAI обучают свои модели ИИ на контенте ресурса на возмездной основе. В прошлом году Reddit для защиты от неправомерного сбора контента ввела плату за доступ к API, что вызвало массовые протесты среди пользователей.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Caves of Qud заслужила престижную премию «Хьюго» — это культовый ролевой роглайк в мире далёкого будущего и глубокой симуляции 11 мин.
Valve изменила, как рассчитывается пользовательский рейтинг игр в Steam — оценки теперь зависят от языка 2 ч.
Великобритания передумала требовать от Apple бэкдор в iCloud для спецслужб 3 ч.
В ChatGPT появилась подписка дешевле $5 в месяц, но пока лишь в одной стране 3 ч.
«Выглядит лучше, чем Black Myth Wukong»: новый геймплей Phantom Blade Zero с трассировкой лучей впечатлил игроков 3 ч.
Nvidia доложила об успехах технологий ACE для генеративных ИИ-NPC и RTX Remix для ремастеров классических игр 3 ч.
Число угонов Telegram-аккаунтов взлетело на 51 % в первом полугодии 4 ч.
Хакеры, шпионы и кибербезопасники теперь во всю используют ИИ, но человека он пока не заменит 5 ч.
ИИ-бот Gemini научился озвучивать тексты из «Google Документов» 7 ч.
Ведущий Gamescom: Opening Night Live заинтриговал игроков клоунским образом — фанаты увидели в этом тизер Hollow Knight: Silksong 16 ч.
Электролёт Archer Aviation с пилотом на борту впервые пролетел 88 км за 31 минуту 4 мин.
Отечественный спутниковый интернет стал на шаг ближе — российские спутниковые операторы поделили частоты 12 мин.
Fujifilm второй раз за месяц поднимет цены на камеры и объективы в США 21 мин.
Tesla вернула рычаг указателя поворотов в Model 3 — в уже проданные электромобили его установят за $350 22 мин.
В России начались продажи Honor Pаd Х7 — компактного планшета со Snapdragon 680 и ценой от 10 990 рублей 24 мин.
Американские дата-центры Google подключат к малым модульным реакторам Kairos — начнут с 50 МВт 26 мин.
Xiaomi ворвалась в топ-10 автопроизводителей мира, но на смартфонах пока зарабатывает больше 30 мин.
Видеокарты GeForce RTX 5000 официально подешевели — но не все и только в Европе 2 ч.
Складной смартфон Honor Magic V5 поднял целый холодильник, установив рекорд Гиннесса 2 ч.
Такого никто не предвидел: учёные впервые обнаружили систему из трёх чёрных дыр 2 ч.