Сегодня 05 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Reddit введёт жёсткие меры против сборщиков контента для обучения ИИ

Администрация платформы Reddit заявила, что обновит исключения для роботов (файл robots.txt), которые сообщают веб-ботам о разрешении или запрете сканировать сайт и его разделы. Ресурс также примет меры для фактического ограничения доступа некоторым ботам.

 Источник изображения: redditinc.com

Источник изображения: redditinc.com

Традиционно файл robots.txt использовался для того, чтобы помочь поисковым системам правильно сканировать сайт. Но с развитием систем искусственного интеллекта появились боты, которые выкачивают контент сайтов целиком для обучения моделей без указания источника этого контента. Поэтому вместе с обновлением файла robots.txt администрация Reddit продолжит ограничивать скорость неизвестных ботов и блокировать их доступ к платформе — меры будут приниматься, если эти системы не будут соблюдать «Политику открытого контента» (Public Content Policy) на сайте.

Новый режим работы не должен повлиять на большинство пользователей и добросовестных участников ресурса, включая исследователей и некоммерческие организации вроде Internet Archive, сообщили в администрации Reddit. Меры вводятся лишь для того, чтобы не позволить другим компаниям обучать большие языковые модели ИИ на контенте платформы. Администрация ресурса опубликовала заявление после того, как стало известно, что ИИ-стартап Perplexity занимается сбором контента вопреки директивам robots.txt — гендиректор компании Аравинд Шринивас (Aravind Srinivas) заявил, что эти директивы не являются правовым обязательством.

Предстоящие изменения Reddit не затронут партнёров, которые заключили соглашения с платформой: Google и OpenAI обучают свои модели ИИ на контенте ресурса на возмездной основе. В прошлом году Reddit для защиты от неправомерного сбора контента ввела плату за доступ к API, что вызвало массовые протесты среди пользователей.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Google исправила рекордные 429 уязвимостей в Chrome за раз — включая 22 критические 2 ч.
Аша Шарма подтвердила, что Xbox нужны эксклюзивы, но есть нюанс 2 ч.
Google начала экспериментировать с показом результатов поиска в Chrome сразу в режиме ИИ 2 ч.
Следующая ИИ-модель OpenAI разрабатывается другой ИИ-моделью — сверхинтеллект близок как никогда 2 ч.
Вредоносный мод для Minecraft заразил 116 000 компьютеров и продавал доступ к веб-камерам жертв 2 ч.
OpenAI согласилась предоставлять властям США свои новые ИИ-модели на проверку 4 ч.
ИИ-агент OpenAI Codex помог раскрыть атаку HTTP/2 Bomb: всего один компьютер может вывести из строя целый сервер 5 ч.
Опасный ИИ Anthropic неожиданно помог компании наладить диалог с Белым домом 5 ч.
Apple объяснила удаление мессенджера Max из App Store санкциями 7 ч.
В России появится национальный ИИ-ассистент — он поселится на «Госуслугах» 7 ч.
В российской части МКС обнаружены две утечки воздуха — одну уже заделали 2 ч.
Thermal Grizzly показала водоблок для скальпированных процессоров — с алмазными пластинами за €1500 2 ч.
Межзвёздная комета 3I/ATLAS заинтриговала астрономов выбросами большого количества метана 2 ч.
Роботакси Waymo показало себя как неожиданно удобный транспорт для бегства с места преступления 3 ч.
Репортаж со стенда Apacer на Computex 2026: память DDR5-9200, скоростные SSD с вентиляторами и не только 3 ч.
Илон Маск заговорил о 100 000 аппаратов Starlink на орбите — чтобы ускорить спутниковый интернет в 100 раз 4 ч.
Phison представила SSD-контроллер с поддержкой PCIe 6.0 5 ч.
Правительство США планирует выделить $700 млн на поддержку угольной энергетики для ИИ-инфраструктуры 5 ч.
Молния проникла в квартиру через интернет-кабель и уничтожила ПК и роутер 5 ч.
Google научила смартфоны следить за пульсом человека через фронтальную камеру 5 ч.