Сегодня 11 сентября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Reddit введёт жёсткие меры против сборщиков контента для обучения ИИ

Администрация платформы Reddit заявила, что обновит исключения для роботов (файл robots.txt), которые сообщают веб-ботам о разрешении или запрете сканировать сайт и его разделы. Ресурс также примет меры для фактического ограничения доступа некоторым ботам.

 Источник изображения: redditinc.com

Источник изображения: redditinc.com

Традиционно файл robots.txt использовался для того, чтобы помочь поисковым системам правильно сканировать сайт. Но с развитием систем искусственного интеллекта появились боты, которые выкачивают контент сайтов целиком для обучения моделей без указания источника этого контента. Поэтому вместе с обновлением файла robots.txt администрация Reddit продолжит ограничивать скорость неизвестных ботов и блокировать их доступ к платформе — меры будут приниматься, если эти системы не будут соблюдать «Политику открытого контента» (Public Content Policy) на сайте.

Новый режим работы не должен повлиять на большинство пользователей и добросовестных участников ресурса, включая исследователей и некоммерческие организации вроде Internet Archive, сообщили в администрации Reddit. Меры вводятся лишь для того, чтобы не позволить другим компаниям обучать большие языковые модели ИИ на контенте платформы. Администрация ресурса опубликовала заявление после того, как стало известно, что ИИ-стартап Perplexity занимается сбором контента вопреки директивам robots.txt — гендиректор компании Аравинд Шринивас (Aravind Srinivas) заявил, что эти директивы не являются правовым обязательством.

Предстоящие изменения Reddit не затронут партнёров, которые заключили соглашения с платформой: Google и OpenAI обучают свои модели ИИ на контенте ресурса на возмездной основе. В прошлом году Reddit для защиты от неправомерного сбора контента ввела плату за доступ к API, что вызвало массовые протесты среди пользователей.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Игровая выставка РЭД ЭКСПО 2025 отменена — «Леста Игры» выбрала «Игромир» и Comic Сon 2 ч.
Вышла предварительная версия Microsoft Visual Studio 2026: обновился дизайн, углубилась интеграция с ИИ 2 ч.
Счастливый финал с подвохом: с дополнением Legacy of the Forge в Kingdom Come: Deliverance 2 появилась новая секретная концовка 2 ч.
Технокомпании обучают ИИ на миллионах роликов, скаченных с YouTube, без разрешения их авторов 3 ч.
Apple заблокирует функцию онлайн-перевода в AirPods для пользователей из Европы 3 ч.
Разрушительный шутер The Finals получил поддержку русского языка спустя почти два года после выхода 4 ч.
Стартап Mistral AI привлёк на развитие €1,7 млрд при участии ASML 6 ч.
Минцифры расширит белый список интернет-сервисов в несколько этапов 6 ч.
Ролевой шутер Witchfire от бывших создателей Painkiller и Bulletstorm не выйдет из раннего доступа в 2025 году — представлен обновлённый план 7 ч.
YouTube добавил функцию ИИ-дубляжа видео на разных языках для всех авторов 7 ч.
Китайская Ant Group показала гуманоидного робота с ИИ — он умеет готовить и давать медицинские советы 12 мин.
Отключения мобильного интернета сыграли на руку операторам сотовой связи, провайдерам и продавцам роутеров 24 мин.
В облаке Astra Cloud появились выделенные серверы с процессорами Baikal-S 2 ч.
Kioxia вместе с Nvidia разрабатывают PCIe 7.0 SSD в 100 раз быстрее нынешних — его представят в 2027 году 2 ч.
Новые наушники Nothing Ear (3) получат кейс с микрофоном и кнопкой Talk — зачем они, производитель не говорит 2 ч.
Утёкшие рендеры Samsung Galaxy S26 Pro подтверждают его сходство с Galaxy S25 2 ч.
Перезагрузка кадров в высшем эшелоне должна помочь Intel в укреплении бизнеса 2 ч.
Страдают не только астрономы: аппарат Starlink помешал спутнику-шпиону сделать фото китайской военной базы 3 ч.
Караоке-вечеринка в кубе — SVEN PS-555: для друзей и детских праздников 4 ч.
SberDevices представила миниатюрную колонку SberBoom Micro с ИИ 4 ч.