Сегодня 12 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

«Наш контент бесплатный, а инфраструктура — нет»: ИИ-боты разоряют «Википедию»

«Википедия» расплачивается за бум искусственного интеллекта — онлайн-энциклопедия сталкивается с растущими расходами из-за ботов, которые копируют её статьи для обучения моделей искусственного интеллекта, что впустую расходует ресурсы и в разы увеличивает трафик и нагрузку на сайт. Только за последние три месяца трафик, генерируемый ИИ-краулерами, вырос на 50 %.

 Источник изображения: «Википедия»

Источник изображения: «Википедия»

Фонд Wikimedia (некоммерческая организация, управляющая «Википедией») заявил, что «автоматизированные запросы на наш контент выросли в геометрической прогрессии». По данным фонда, с января 2024 года пропускная способность, используемая для загрузки мультимедийного контента, выросла на 50 %. Однако трафик исходит не от людей, а от автоматизированных программ, которые постоянно загружают изображения с открытой лицензией для передачи их моделям ИИ.

«Наша инфраструктура создана для того, чтобы выдерживать внезапные всплески трафика от людей во время мероприятий с высоким интересом, но объем трафика, генерируемого ботами-скрейперами, беспрецедентен и представляет растущие риски и расходы», — сообщила «Википедия».

Боты часто собирают данные из менее популярных статей «Википедии». Специалисты «Википедии» утверждают, что по крайней мере 65 % подобного трафика, поступает от ботов, что является непропорционально большим объёмом, учитывая, что общее количество просмотров страниц ботами составляет около 35 %. Также боты проявляют интерес к «ключевым системам в инфраструктуре разработчиков, таким как наша платформа проверки кода или наш баг-трекер», что ещё больше нагружает ресурсы сайта.

«Википедия» была вынуждена ввести индивидуальные ограничения скорости для ИИ-ботов или вообще запретить доступ некоторым из них. Но для решения проблемы в долгосрочной перспективе фонд разрабатывает план «Ответственного использования инфраструктуры». План предусматривает сбор отзывов от сообщества «Википедии» о способах определения трафика от ИИ-ботов и фильтрации их доступа.

Социальная платформа Reddit столкнулась с похожей проблемой в 2023 году. Например, Microsoft без уведомления Reddit использовала данные платформы для обучения моделей ИИ, что вынудило Reddit заблокировать ботов Microsoft. После этого инцидента Reddit решила взимать плату со сторонних разработчиков за доступ к своему API. Это привело к массовым протестам разработчиков и закрытию некоторых популярных форумов Reddit.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Школьный экшен Agefield High: Rock the School в духе Bully позволит вновь почувствовать себя старшеклассником — новый трейлер и подробности 45 мин.
Российские компании начнут штрафовать за непереход на отечественное ПО 2 ч.
Orion soft представил в zVirt 4.5 папки виртуальных машин и возможность быстрого «переезда» с любых систем виртуализации 2 ч.
ByteDance запустила самого дешёвого ИИ-помощника программиста — от $1,3 в месяц 3 ч.
Все этим занимаются: глава Nexon встал на защиту использования ИИ в Arc Raiders 3 ч.
У «Google Карт» появился режим энергосбережения, но большинство смартфонов его не получит 3 ч.
Google Pixel научились распознавать мошенников в чатах и делать ИИ-сводки уведомлений 4 ч.
«Хотим стать новыми королями RPG»: разработчики Kingdom Come: Deliverance 2 раскрыли амбициозный план на следующие игры 4 ч.
Дополнение к Elden Ring Nightreign добавит в игру Арториаса из Dark Souls и не только — первый трейлер и дата выхода The Forsaken Hollows 6 ч.
Google представила приватное облако для безопасной обработки ИИ-запросов пользователей 6 ч.
«Билайн» заказал 2000 отечественных базовых станций «Иртеи» — это всего 5,45 % годовой потребности 55 мин.
Всё для победы: Пекин вмешался в производство чипов SMIC, чтобы Huawei не отстала в ИИ-гонке 2 ч.
Индия стала ближе к запуску людей в космос — парашют корабля «Гаганьяан» прошёл испытания 2 ч.
YADRO выводит на рынок высокопроизводительный ИИ-сервер для компаний, внедряющих искусственный интеллект 4 ч.
Foxconn продолжает наживаться на ИИ-буме — чистая прибыль подскочила на 17 % и продолжит расти 4 ч.
К концу десятилетия четыре ПК из десяти в мире будут на процессорах Ryzen, прогнозирует AMD 4 ч.
Переконфигурируемый ускоритель NextSilicon Maverick-2 с dataflow-архитектурой меняет подход к вычислениям 5 ч.
ZincFive представила аккумуляторную систему для ИИ ЦОД — BC 2 AI на основе никель-цинковых элементов 6 ч.
Sony представила спецверсию PlayStation 5 со сниженной на четверть ценой, но только для домашнего рынка 7 ч.
Лиза Су: мировой рынок чипов для ИИ вырастет до $1 трлн к 2030 году 9 ч.