Сегодня 06 ноября 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Reddit введёт жёсткие меры против сборщиков контента для обучения ИИ

Администрация платформы Reddit заявила, что обновит исключения для роботов (файл robots.txt), которые сообщают веб-ботам о разрешении или запрете сканировать сайт и его разделы. Ресурс также примет меры для фактического ограничения доступа некоторым ботам.

 Источник изображения: redditinc.com

Источник изображения: redditinc.com

Традиционно файл robots.txt использовался для того, чтобы помочь поисковым системам правильно сканировать сайт. Но с развитием систем искусственного интеллекта появились боты, которые выкачивают контент сайтов целиком для обучения моделей без указания источника этого контента. Поэтому вместе с обновлением файла robots.txt администрация Reddit продолжит ограничивать скорость неизвестных ботов и блокировать их доступ к платформе — меры будут приниматься, если эти системы не будут соблюдать «Политику открытого контента» (Public Content Policy) на сайте.

Новый режим работы не должен повлиять на большинство пользователей и добросовестных участников ресурса, включая исследователей и некоммерческие организации вроде Internet Archive, сообщили в администрации Reddit. Меры вводятся лишь для того, чтобы не позволить другим компаниям обучать большие языковые модели ИИ на контенте платформы. Администрация ресурса опубликовала заявление после того, как стало известно, что ИИ-стартап Perplexity занимается сбором контента вопреки директивам robots.txt — гендиректор компании Аравинд Шринивас (Aravind Srinivas) заявил, что эти директивы не являются правовым обязательством.

Предстоящие изменения Reddit не затронут партнёров, которые заключили соглашения с платформой: Google и OpenAI обучают свои модели ИИ на контенте ресурса на возмездной основе. В прошлом году Reddit для защиты от неправомерного сбора контента ввела плату за доступ к API, что вызвало массовые протесты среди пользователей.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Warner Bros. свяжет Hogwarts Legacy 2 с сериалом «Гарри Поттер» от HBO, а продажи первой части достигли новой вершины 15 мин.
Два героя, возвращение Umbrella и человек-козёл: блогер раскрыл возможные подробности Resident Evil 9 2 ч.
Metal Slug Tactics наконец вышла — демократичная цена в российском Steam и первые оценки 3 ч.
Подарок к юбилею: спустя пять лет после запуска Call of Duty: Mobile достигла миллиарда загрузок 5 ч.
Симулятор жизни в беззаботном постапокалипсисе I Am Future готов вырваться из раннего доступа — новый трейлер и дата выхода 5 ч.
В «Google Сообщениях» можно будет выбирать качество отправляемых изображений 5 ч.
Арестован хакер, подозреваемый во взломе Ticketmaster и десятков других клиентов Snowflake 6 ч.
Вышла вторая бета iOS 18.2 — Siri с ChatGPT Plus, улучшенный «Локатор» и другие изменения 6 ч.
«Яндекс», подвинься: VK начнёт предустанавливать свои сервисы на автомобили в России 6 ч.
Система управления уязвимостями Security Vision Vulnerability Management получила крупное обновление 6 ч.
Новая статья: Обзор ноутбука ASUS ProArt P16 (H7606WI) с процессором Ryzen AI 9 мин.
Учёные MIT разработали нанотранзисторы для мощной и экономичной электроники будущего 2 ч.
Intel отложила создание фабрик чипов в Германии на 5 лет — власти теперь не знают, что делать с субсидиями 2 ч.
SK Telecom построит гигаваттные ИИ ЦОД в Южной Корее и за её пределами 3 ч.
Vivo анонсировала выпуск в России смартфона iQoo Z9 со Snapdragon 7 Gen 3 и 144-Гц экраном 3 ч.
Спутники SpaceX Starlink обеспечили сотовой связью более 27 000 человек в районах США, пострадавших от ураганов 3 ч.
Corsair выпустила MP700 Elite — доступные SSD с PCIe 5.0 объёмом до 2 Тбайт со скоростью до 10 000 Мбайт/с 5 ч.
Klevv представила комплекты модулей памяти Urbane V RGB DDR5 — до 64 Гбайт и 8400 МТ/с 6 ч.
«Росстандарт» утвердил первые ГОСТы для ноутбуков 6 ч.
Развитие генеративного ИИ всё больше зависит от доступности качественных данных, пресной воды, электроэнергии и чистой меди 7 ч.