Сегодня 16 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Reddit введёт жёсткие меры против сборщиков контента для обучения ИИ

Администрация платформы Reddit заявила, что обновит исключения для роботов (файл robots.txt), которые сообщают веб-ботам о разрешении или запрете сканировать сайт и его разделы. Ресурс также примет меры для фактического ограничения доступа некоторым ботам.

 Источник изображения: redditinc.com

Источник изображения: redditinc.com

Традиционно файл robots.txt использовался для того, чтобы помочь поисковым системам правильно сканировать сайт. Но с развитием систем искусственного интеллекта появились боты, которые выкачивают контент сайтов целиком для обучения моделей без указания источника этого контента. Поэтому вместе с обновлением файла robots.txt администрация Reddit продолжит ограничивать скорость неизвестных ботов и блокировать их доступ к платформе — меры будут приниматься, если эти системы не будут соблюдать «Политику открытого контента» (Public Content Policy) на сайте.

Новый режим работы не должен повлиять на большинство пользователей и добросовестных участников ресурса, включая исследователей и некоммерческие организации вроде Internet Archive, сообщили в администрации Reddit. Меры вводятся лишь для того, чтобы не позволить другим компаниям обучать большие языковые модели ИИ на контенте платформы. Администрация ресурса опубликовала заявление после того, как стало известно, что ИИ-стартап Perplexity занимается сбором контента вопреки директивам robots.txt — гендиректор компании Аравинд Шринивас (Aravind Srinivas) заявил, что эти директивы не являются правовым обязательством.

Предстоящие изменения Reddit не затронут партнёров, которые заключили соглашения с платформой: Google и OpenAI обучают свои модели ИИ на контенте ресурса на возмездной основе. В прошлом году Reddit для защиты от неправомерного сбора контента ввела плату за доступ к API, что вызвало массовые протесты среди пользователей.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новая статья: Mixtape — воспоминания никто не отнимет. Рецензия 3 ч.
Google начнёт наказывать сайты за накрутку попаданий в ИИ-ответы 4 ч.
Московский суд оштрафовал владельца Deus Ex, Metro и Kingdom Come: Deliverance за отказ локализовать данные россиян 5 ч.
Спринт, торговля и продолжение сюжета: разработчики Subnautica 2 раскрыли план улучшения игры на ближайшие месяцы 7 ч.
ChatGPT получит прямой доступ к банковским счетам пользователей — для анализа расходов и финансовых советов 8 ч.
Трамп и Си Цзиньпин обсудили ограничения слишком умного ИИ и зависшие поставки Nvidia H200 8 ч.
Microsoft намерена избавить Windows 11 от главной причины «синих экранов» 8 ч.
Pragmata стала новой жертвой пиратов — игру взломали без гипервизора 9 ч.
YouTube Shorts набрали популярность на смарт-телевизорах — 2 млрд часов просмотра за месяц 10 ч.
На смарт-очках Meta Ray-Ban Display появятся сторонние приложения 10 ч.
DJI анонсировала в Каннах карманную кинокамеру Osmo Pocket 4P 3 ч.
OpenAI перестраивается вокруг ИИ-агентов в рамках подготовки к IPO — ChatGPT и Codex объединят в единую платформу 3 ч.
Зонд Mars Express показал «хаос и кратеры», образовавшиеся в результате древних наводнений на Марсе 3 ч.
Sony хотела похвастаться ИИ-камерой Xperia 1 VIII, но получила волну мемов 4 ч.
Asus и T1 выпустили лимитированные GeForce RTX для фанатов League of Legends 4 ч.
Thermal Grizzly начала продавать скальпированные Core Ultra 7 270K Plus за $525 5 ч.
Японцы создали магнитную память на квантовых эффектах — она в 25 раз быстрее DRAM, почти не греется и не изнашивается 6 ч.
Alibaba Cloud потребуется в 10 раз больше вычислительных мощностей, чем в 2022 году, а Tencent научилась обходиться малым 7 ч.
В ближайший годы четыре из пяти премиум-смартфонов нашпигуют ИИ 8 ч.
Учёные создали робота-медузу без батареи — он плавает быстрее всех аналогов и сможет лечить людей изнутри 8 ч.