Сегодня 03 июня 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

«Наш контент бесплатный, а инфраструктура — нет»: ИИ-боты разоряют «Википедию»

«Википедия» расплачивается за бум искусственного интеллекта — онлайн-энциклопедия сталкивается с растущими расходами из-за ботов, которые копируют её статьи для обучения моделей искусственного интеллекта, что впустую расходует ресурсы и в разы увеличивает трафик и нагрузку на сайт. Только за последние три месяца трафик, генерируемый ИИ-краулерами, вырос на 50 %.

 Источник изображения: «Википедия»

Источник изображения: «Википедия»

Фонд Wikimedia (некоммерческая организация, управляющая «Википедией») заявил, что «автоматизированные запросы на наш контент выросли в геометрической прогрессии». По данным фонда, с января 2024 года пропускная способность, используемая для загрузки мультимедийного контента, выросла на 50 %. Однако трафик исходит не от людей, а от автоматизированных программ, которые постоянно загружают изображения с открытой лицензией для передачи их моделям ИИ.

«Наша инфраструктура создана для того, чтобы выдерживать внезапные всплески трафика от людей во время мероприятий с высоким интересом, но объем трафика, генерируемого ботами-скрейперами, беспрецедентен и представляет растущие риски и расходы», — сообщила «Википедия».

Боты часто собирают данные из менее популярных статей «Википедии». Специалисты «Википедии» утверждают, что по крайней мере 65 % подобного трафика, поступает от ботов, что является непропорционально большим объёмом, учитывая, что общее количество просмотров страниц ботами составляет около 35 %. Также боты проявляют интерес к «ключевым системам в инфраструктуре разработчиков, таким как наша платформа проверки кода или наш баг-трекер», что ещё больше нагружает ресурсы сайта.

«Википедия» была вынуждена ввести индивидуальные ограничения скорости для ИИ-ботов или вообще запретить доступ некоторым из них. Но для решения проблемы в долгосрочной перспективе фонд разрабатывает план «Ответственного использования инфраструктуры». План предусматривает сбор отзывов от сообщества «Википедии» о способах определения трафика от ИИ-ботов и фильтрации их доступа.

Социальная платформа Reddit столкнулась с похожей проблемой в 2023 году. Например, Microsoft без уведомления Reddit использовала данные платформы для обучения моделей ИИ, что вынудило Reddit заблокировать ботов Microsoft. После этого инцидента Reddit решила взимать плату со сторонних разработчиков за доступ к своему API. Это привело к массовым протестам разработчиков и закрытию некоторых популярных форумов Reddit.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Скорость распространения Windows 11 замедлилась 17 мин.
На МКС заработает российский ИИ — осенью там запустят GigaChat «Сбера» 2 ч.
Разработчик-одиночка анонсировал «Знамя победы» — гибрид стратегии и экшена на полях сражений Второй мировой войны 3 ч.
Рынок российского инфраструктурного ПО достиг уровня 2021 года 3 ч.
МТС Web Services запустила собственную публичную облачную платформу 3 ч.
Windows 11 перестанет навязывать Edge в качестве браузера по умолчанию — но не для всех 4 ч.
Resident Evil 9 не заставит себя долго ждать — сразу три инсайдера подтвердили скорый анонс от Capcom 5 ч.
«Мы бесконечно признательны»: продажи Elden Ring Nightreign взяли новую высоту, а обзоры игры в Steam стали «в основном положительными» 6 ч.
Благодаря ИИ Microsoft из отстающих вышли в лидеры по темпам роста своих акций 6 ч.
Microsoft продолжила массовые увольнения, несмотря на сокращение 7000 сотрудников в мае 6 ч.
NAACP призывает закрыть ЦОД xAI в Мемфисе из-за загрязнений воздуха газовыми турбинами 2 мин.
MSI представила очень компактную GeForce RTX 5060 8G Inspire ITX — у неё всего один вентилятор 2 мин.
США отсрочили подорожание видеокарт — повышение пошлин на китайские комплектующие отложено до 31 августа 15 мин.
XFX выпустит 12 вариантов Radeon RX 9060 XT — все с одинаковым разгоном GPU 2 ч.
OpenAI и Nvidia заработают миллиарды на Ближнем Востоке — но главный выигрыш достанется США 2 ч.
Электромобильный бизнес Xiaomi станет прибыльным благодаря новому YU7, надеется основатель компании 2 ч.
Applied Digital сдаст CoreWeave 250-МВт ЦОД в Северной Дакоте на 15 лет за $7 млрд 3 ч.
iPhone 16e попал в топ-10 популярных смартфонов в Европе сразу после выхода, но iPhone SE дебютировали лучше 3 ч.
Серийное производство базовых станций 4G в России начнётся в этом году, пообещали в «Ростехе» 3 ч.
xAI Илона Маска намерена привлечь ещё $5,3 млрд инвестиций при оценке в $113 млрд 4 ч.