Сегодня 06 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → reddit

Reddit введёт жёсткие меры против сборщиков контента для обучения ИИ

Администрация платформы Reddit заявила, что обновит исключения для роботов (файл robots.txt), которые сообщают веб-ботам о разрешении или запрете сканировать сайт и его разделы. Ресурс также примет меры для фактического ограничения доступа некоторым ботам.

 Источник изображения: redditinc.com

Источник изображения: redditinc.com

Традиционно файл robots.txt использовался для того, чтобы помочь поисковым системам правильно сканировать сайт. Но с развитием систем искусственного интеллекта появились боты, которые выкачивают контент сайтов целиком для обучения моделей без указания источника этого контента. Поэтому вместе с обновлением файла robots.txt администрация Reddit продолжит ограничивать скорость неизвестных ботов и блокировать их доступ к платформе — меры будут приниматься, если эти системы не будут соблюдать «Политику открытого контента» (Public Content Policy) на сайте.

Новый режим работы не должен повлиять на большинство пользователей и добросовестных участников ресурса, включая исследователей и некоммерческие организации вроде Internet Archive, сообщили в администрации Reddit. Меры вводятся лишь для того, чтобы не позволить другим компаниям обучать большие языковые модели ИИ на контенте платформы. Администрация ресурса опубликовала заявление после того, как стало известно, что ИИ-стартап Perplexity занимается сбором контента вопреки директивам robots.txt — гендиректор компании Аравинд Шринивас (Aravind Srinivas) заявил, что эти директивы не являются правовым обязательством.

Предстоящие изменения Reddit не затронут партнёров, которые заключили соглашения с платформой: Google и OpenAI обучают свои модели ИИ на контенте ресурса на возмездной основе. В прошлом году Reddit для защиты от неправомерного сбора контента ввела плату за доступ к API, что вызвало массовые протесты среди пользователей.

Reddit откроет OpenAI доступ к контенту для обучения ИИ

OpenAI подписала соглашение о доступе к контенту Reddit в реальном времени через API — это значит, что компания сможет отображать обсуждения с сайта в ChatGPT и других новых продуктах. Ранее аналогичное соглашение администрация Reddit заключила с Google — тогда сделку оценили в $60 млн.

 Источник изображения: redditinc.com

Источник изображения: redditinc.com

Соглашение также поможет администрации платформы «предоставить пользователям и модераторам Reddit новые функции на основе искусственного интеллекта», а также использовать большие языковые модели OpenAI для создания приложений. OpenAI, кроме того, станет рекламным партнёром Reddit. Пользователи крупнейшего в мире форума никогда не стеснялись высказываться о том, как руководство платформы управляет ей, и неизвестно, как они отреагируют на сделку с OpenAI. В прошлом году более 7000 разделов сайта отключились в знак протеста против введения платного API. Аналогичным образом у платформы для программистов Stack Overflow после заключения сделки с OpenAI без конфликтов с пользователями не обошлось.

Reddit не раскрыла финансовых условий сделки, и ни одна из двух компаний не рассказала о наборе данных для обучения ИИ. Сообщая о сделке с Google, руководство платформы открыто говорило о «более эффективных способах обучения моделей». В случае с OpenAI всё обстоит несколько иначе: во-первых, глава компании Сэм Альтман (Sam Altman) является акционером Reddit; во-вторых, известно, что «партнерский проект возглавил главный операционный директор OpenAI с одобрения независимым советом директоров».

«Reddit стал одним из крупнейших в интернете архивов аутентичных и актуальных разговоров людей обо всём. Его включение в ChatGPT поддерживает нашу веру в интернет — это поможет людям находить, что они ищут, и поможет новой аудитории найти сообщество на Reddit», — заявил гендиректор платформы Стив Хаффман (Steve Huffman). Прежде администрация форума не всегда приветствовала сбор его данных для обучения ИИ. Она грозилась заблокировать роботам Google доступ к сайту. А OpenAI однажды заявила модераторам форума, посвящённого ChatGPT, что они нарушили авторские права компании, использовав в качестве эмблемы логотип чат-бота.

Акции Reddit резко выросли на 14 % после публикации квартального отчета

Reddit превзошёл прогнозы аналитиков по доходам и количеству активных пользователей в первом квартале 2024 года. Акции социальной платформы Reddit взметнулись на 14 % на фоне публикации компанией финансовых результатов.

 Источник изображения: Reddit

Источник изображения: Reddit

Это первые квартальные результаты компании с момента первичного публичного размещения акций (IPO) в марте текущего года. Выручка выросла на 48 % по сравнению с аналогичным периодом предыдущего года и составила $243 млн против ожиданий в $212,8 млн.

Основной рост обеспечила реклама — доходы компании увеличились на 39 % до $222,7 млн, что существенно больше, чем у основных конкурентов. Для сравнения, в первом квартале доходы от рекламы выросли на 27 % у Meta✴, на 24 % у Amazon и на 13 % у Alphabet. Такой впечатляющий рост стал возможен после того, как бренды в 2022 году пересмотрели свои рекламные бюджеты в условиях высокой инфляции. В текущем году ситуация выправилась, и компании вернулись к активным вложениям в маркетинг.

Помимо сильных финансовых показателей, Reddit продемонстрировал и качественный рост аудитории. Так, ежедневная аудитория сервиса достигла 82,7 млн человек по сравнению с 76,6 млн согласно прогнозам аналитиков. Средний доход на пользователя вырос на 8 % до $2,94.

Во втором квартале ожидается еще более впечатляющий рост выручки. Компания прогнозирует показатель в диапазоне $240-255 млн, значительно превышая ожидания аналитиков в $224 млн. По средней оценке, рост составит 32 % по сравнению с прошлым годом.

По итогам публикации отчетности акции Reddit выросли на 14 %, а затем откатились от максимумов. Тем не менее, акции компании все еще торгуются выше уровней мартовского IPO.


window-new
Soft
Hard
Тренды 🔥
В Европе создали Euro-Office — пакет офисных приложений на базе кода OnlyOffice 4 ч.
Netflix научил собственную ИИ-модель без следов удалять объекты из видео и правдоподобно перестраивать сцену 8 ч.
Microsoft инвестирует в развитие ИИ-инфраструктуры Японии $10 млрд 14 ч.
LinkedIn скрытно собирает данные о ПО, установленном на компьютерах пользователей соцсети 15 ч.
Новая статья: Grime 2 — истязание на любителя. Рецензия 05-04 00:05
Новая статья: Gamesblender № 770: релиз DLSS 4.5, Синдзи Миками и авторы Stellar Blade, почти конец Eidos Montreal 04-04 23:32
Энтузиаст установил Windows 3.1x на компьютер 2025 года — и она заработала c Ryzen 9 9900X и RTX 5060 Ti 04-04 18:58
Microsoft принудительно обновит до Windows 11 25H2 компьютеры с более старыми версиями ОС 04-04 15:10
В руководстве OpenAI провели очередные кадровые перестановки — частично вынужденные 04-04 14:05
Nvidia показала нейронное сжатие текстур: потребление видеопамяти упало почти в 7 раз 04-04 14:04
Новая статья: Обзор смартфона realme 16 Pro: поменьше амбиций, чем у «плюса», но хитовый потенциал выше 54 мин.
Разработчик ИИ-чипов Hailo хочет побыстрее выйти на биржу, чтобы поправить пошатнувшееся финансовое положение 2 ч.
Meta без лишнего шума собирает команду разработчиков аппаратных продуктов на базе ИИ 3 ч.
Новая статья: Компьютер месяца — апрель 2026 года 3 ч.
Fujitsu планирует выпуск 1,4-нм NPU для ИИ-систем 14 ч.
Американские ИИ-компании не смогут запустить в этом году более 30 % дата-центров из-за дефицита электроэнергии 19 ч.
В условиях дефицита памяти портативная игровая консоль Lenovo Legion Go 2 подорожала до полутора раз 20 ч.
В Китае введут строгий стандарт безопасности для пауэрбанков 20 ч.
NASA впервые разрешило астронавтам взять на борт iPhone в рамках лунной миссии Artemis II 21 ч.
Сразу после старта лунной миссии Трамп предложил сократить бюджет NASA на 23 % 21 ч.