Сегодня 04 июля 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Reddit введёт жёсткие меры против сборщиков контента для обучения ИИ

Администрация платформы Reddit заявила, что обновит исключения для роботов (файл robots.txt), которые сообщают веб-ботам о разрешении или запрете сканировать сайт и его разделы. Ресурс также примет меры для фактического ограничения доступа некоторым ботам.

 Источник изображения: redditinc.com

Источник изображения: redditinc.com

Традиционно файл robots.txt использовался для того, чтобы помочь поисковым системам правильно сканировать сайт. Но с развитием систем искусственного интеллекта появились боты, которые выкачивают контент сайтов целиком для обучения моделей без указания источника этого контента. Поэтому вместе с обновлением файла robots.txt администрация Reddit продолжит ограничивать скорость неизвестных ботов и блокировать их доступ к платформе — меры будут приниматься, если эти системы не будут соблюдать «Политику открытого контента» (Public Content Policy) на сайте.

Новый режим работы не должен повлиять на большинство пользователей и добросовестных участников ресурса, включая исследователей и некоммерческие организации вроде Internet Archive, сообщили в администрации Reddit. Меры вводятся лишь для того, чтобы не позволить другим компаниям обучать большие языковые модели ИИ на контенте платформы. Администрация ресурса опубликовала заявление после того, как стало известно, что ИИ-стартап Perplexity занимается сбором контента вопреки директивам robots.txt — гендиректор компании Аравинд Шринивас (Aravind Srinivas) заявил, что эти директивы не являются правовым обязательством.

Предстоящие изменения Reddit не затронут партнёров, которые заключили соглашения с платформой: Google и OpenAI обучают свои модели ИИ на контенте ресурса на возмездной основе. В прошлом году Reddit для защиты от неправомерного сбора контента ввела плату за доступ к API, что вызвало массовые протесты среди пользователей.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Разработчики RoboCop: Rogue City и Terminator: Resistance взялись за «очень интересную» игру в необычном для себя жанре 27 мин.
Хакеры добрались до данных Госдепа и других федеральных агентств США через взлом Microsoft 35 мин.
«Это должно было быть в игре с самого начала»: моддер нашёл элегантный способ улучшить гравипрыжки в Starfield 3 ч.
Почти половина российских компаний уже использует ИИ для разработки и тестирования ПО 3 ч.
Разовая акция: хакеры отдали ключи для дешифровки ЦОД властям Индонезии, но пригрозили карами, если их условия не будут выполнены 5 ч.
Новый патч для Shadow of the Erdtree случайно сломал Elden Ring на ПК 5 ч.
В WhatsApp появился ИИ-генератор персонализированных аватаров, но доступен он пока не всем 6 ч.
Китай стал лидером по патентам в сфере генеративных нейросетей — больше всех у Tencent и Baidu 8 ч.
Участники индустрии рассказали об условиях появления в России качественных игр 9 ч.
Амбициозный экшен в антураже тёмного фэнтези Dungeonborne готовится к релизу — в Steam начался финальный плейтест 10 ч.
Nubia выпустила игровой монитор Red Magic Realm — 32 дюйма, изогнутый QD-OLED с 4K и 240 Гц всего за $1000 40 мин.
Palit выпустит большую и яркую видеокарту GeForce RTX 4090 GameRock White 44 мин.
Lenovo выпустила альтернативу Apple Mac Studio — компактный десктоп ThinkCentre neo Ultra на Intel и Nvidia 3 ч.
Санкции не помешают Nvidia выручить в Китае до $12 млрд на ИИ-ускорителях в этом году 4 ч.
В Европе разработают датчики для спутниковой навигации повышенной точности 4 ч.
Повышенные пошлины на китайские электромобили в Европе вступят в силу завтра — от 17,4 до 37,6 % 4 ч.
Новая надежда: Atos договорилась с кредиторами о реструктуризации долгов 4 ч.
Японские поставщики оборудования для выпуска чипов намерены увеличить выручку на 15 % к марту 4 ч.
Построены самые точные атомные часы — они сбиваются на 1 секунду за 30 миллиардов лет 4 ч.
Новый кабельный маршрут EXA Infrastructure и SOCAR Fiber свяжет Грецию, Грузию и Турцию 5 ч.