Сегодня 05 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Reddit введёт жёсткие меры против сборщиков контента для обучения ИИ

Администрация платформы Reddit заявила, что обновит исключения для роботов (файл robots.txt), которые сообщают веб-ботам о разрешении или запрете сканировать сайт и его разделы. Ресурс также примет меры для фактического ограничения доступа некоторым ботам.

 Источник изображения: redditinc.com

Источник изображения: redditinc.com

Традиционно файл robots.txt использовался для того, чтобы помочь поисковым системам правильно сканировать сайт. Но с развитием систем искусственного интеллекта появились боты, которые выкачивают контент сайтов целиком для обучения моделей без указания источника этого контента. Поэтому вместе с обновлением файла robots.txt администрация Reddit продолжит ограничивать скорость неизвестных ботов и блокировать их доступ к платформе — меры будут приниматься, если эти системы не будут соблюдать «Политику открытого контента» (Public Content Policy) на сайте.

Новый режим работы не должен повлиять на большинство пользователей и добросовестных участников ресурса, включая исследователей и некоммерческие организации вроде Internet Archive, сообщили в администрации Reddit. Меры вводятся лишь для того, чтобы не позволить другим компаниям обучать большие языковые модели ИИ на контенте платформы. Администрация ресурса опубликовала заявление после того, как стало известно, что ИИ-стартап Perplexity занимается сбором контента вопреки директивам robots.txt — гендиректор компании Аравинд Шринивас (Aravind Srinivas) заявил, что эти директивы не являются правовым обязательством.

Предстоящие изменения Reddit не затронут партнёров, которые заключили соглашения с платформой: Google и OpenAI обучают свои модели ИИ на контенте ресурса на возмездной основе. В прошлом году Reddit для защиты от неправомерного сбора контента ввела плату за доступ к API, что вызвало массовые протесты среди пользователей.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Магия современных веб-технологий»: энтузиасты реализовали мультиплеер классической Warсraft III: The Frozen Throne в браузере 43 мин.
OpenAI согласилась предоставлять властям США свои новые ИИ-модели на проверку 2 ч.
ИИ-агент OpenAI Codex помог раскрыть атаку HTTP/2 Bomb: всего один компьютер может вывести из строя целый сервер 3 ч.
Опасный ИИ Anthropic неожиданно помог компании наладить диалог с Белым домом 3 ч.
Apple объяснила удаление мессенджера Max из App Store санкциями 4 ч.
В России появится национальный ИИ-ассистент — он поселится на «Госуслугах» 4 ч.
Американские ИТ-компании стали выбирать ИИ DeepSeek — он дешевле 5 ч.
Фрэнк Азор из AMD опроверг слухи о том, что консольная графика RDNA 3.5 не получит поддержку FSR 4.1 5 ч.
Steam растёт вширь — Valve обновила дизайн главной страницы магазина 5 ч.
Полёты на вивернах, пинбол и переработка блокад: для Crimson Desert вышло крупное обновление 1.10.00 8 ч.
Репортаж со стенда Apacer на Computex 2026: память DDR5-9200, скоростные SSD с вентиляторами и не только 47 мин.
Илон Маск заговорил о 100 000 аппаратов Starlink на орбите — чтобы ускорить спутниковый интернет в 100 раз 60 мин.
Phison представила SSD-контроллер с поддержкой PCIe 6.0 3 ч.
Правительство США планирует выделить $700 млн на поддержку угольной энергетики для ИИ-инфраструктуры 3 ч.
Молния проникла в квартиру через интернет-кабель и уничтожила ПК и роутер 3 ч.
Google научила смартфоны следить за пульсом человека через фронтальную камеру 3 ч.
NASA упростит разработку ядерного корабля для полёта к Марсу, чтобы успеть к запуску в 2028 году 3 ч.
AMD заявила, что ИИ-агенты разогрели спрос на многоядерные процессоры 3 ч.
Утечка раскрыла цвета и характеристики Microsoft Surface Laptop 8 на чипах Snapdragon X2 3 ч.
В Китае придумали плавучий остров с АЭС, ВИЭ и производством водорода — для судоходства будущего 3 ч.