Сегодня 03 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → википедия

«Наш контент бесплатный, а инфраструктура — нет»: ИИ-боты разоряют «Википедию»

«Википедия» расплачивается за бум искусственного интеллекта — онлайн-энциклопедия сталкивается с растущими расходами из-за ботов, которые копируют её статьи для обучения моделей искусственного интеллекта, что впустую расходует ресурсы и в разы увеличивает трафик и нагрузку на сайт. Только за последние три месяца трафик, генерируемый ИИ-краулерами, вырос на 50 %.

 Источник изображения: «Википедия»

Источник изображения: «Википедия»

Фонд Wikimedia (некоммерческая организация, управляющая «Википедией») заявил, что «автоматизированные запросы на наш контент выросли в геометрической прогрессии». По данным фонда, с января 2024 года пропускная способность, используемая для загрузки мультимедийного контента, выросла на 50 %. Однако трафик исходит не от людей, а от автоматизированных программ, которые постоянно загружают изображения с открытой лицензией для передачи их моделям ИИ.

«Наша инфраструктура создана для того, чтобы выдерживать внезапные всплески трафика от людей во время мероприятий с высоким интересом, но объем трафика, генерируемого ботами-скрейперами, беспрецедентен и представляет растущие риски и расходы», — сообщила «Википедия».

Боты часто собирают данные из менее популярных статей «Википедии». Специалисты «Википедии» утверждают, что по крайней мере 65 % подобного трафика, поступает от ботов, что является непропорционально большим объёмом, учитывая, что общее количество просмотров страниц ботами составляет около 35 %. Также боты проявляют интерес к «ключевым системам в инфраструктуре разработчиков, таким как наша платформа проверки кода или наш баг-трекер», что ещё больше нагружает ресурсы сайта.

«Википедия» была вынуждена ввести индивидуальные ограничения скорости для ИИ-ботов или вообще запретить доступ некоторым из них. Но для решения проблемы в долгосрочной перспективе фонд разрабатывает план «Ответственного использования инфраструктуры». План предусматривает сбор отзывов от сообщества «Википедии» о способах определения трафика от ИИ-ботов и фильтрации их доступа.

Социальная платформа Reddit столкнулась с похожей проблемой в 2023 году. Например, Microsoft без уведомления Reddit использовала данные платформы для обучения моделей ИИ, что вынудило Reddit заблокировать ботов Microsoft. После этого инцидента Reddit решила взимать плату со сторонних разработчиков за доступ к своему API. Это привело к массовым протестам разработчиков и закрытию некоторых популярных форумов Reddit.

«Википедию» заполонили белиберда и фейки, сгенерированные ИИ

Wikipedia переживает кризис из-за того, что пользователи массово стали публиковать бессмысленную или непроверенную информацию, сгенерированную искусственным интеллектом с помощью чат-ботов, таких как ChatGPT и ему подобных. Однако, учитывая растущую популярность ИИ-технологий, этого можно было ожидать.

 Источник изображения: BoliviaInteligente/Unsplash

Источник изображения: BoliviaInteligente/Unsplash

Как сообщает TechSpot, для решения проблемы был создан проект под названием WikiProject AI Cleanup, представляющий из себя группу добровольцев, которая занимается поиском, редактированием и удалением ложной информации, предположительно добавленной с помощью генеративного ИИ.

Ильяс Леблю (Ilyas Lebleu), один из основателей команды по «очистке», сообщил, что о проблеме стало известно, когда редакторы и пользователи Wikipedia заметили отрывки статей, явно написанные чат-ботом. Подозрения подтвердились, когда некоторые из этих текстов удалось воссоздать с помощью ChatGPT.

«Мы обратили внимание на необычный стиль письма, который был явно написан не человеком, мы смогли воспроизвести эти фразы с помощью ChatGPT, — сказал Леблю. — Обнаружив характерные обороты и выражения, мы идентифицировали наиболее вопиющие примеры сгенерированных статей. После этого и было решено организовать проект по поиску ИИ-текста».

Один из примеров — статья о якобы существующей османской крепости под названием «Амберлисихар», построенной в 1400-х годах. В тексте объёмом около 2000 слов подробно описывалось местоположение и строительство этого объекта. Однако крепость на самом деле не существует, и вся информация о ней была полностью вымышленной, но выглядела убедительно благодаря вкраплениям реальных фактов. При этом проблема касается не только новых статей на Wikipedia. Недобросовестные пользователи вставляют ложные данные в уже существующие статьи. В одном из случаев в статью о жуке добавили раздел, посвящённый виду крабов, причём с правильными ссылками на источники.

Леблю и его коллеги признают, что до конца не понимают, почему люди это делают. Однако причины очевидны. Во-первых, это проблема самой системы Wikipedia, которая позволяет каждому стать редактором. Кстати, именно по этой причине многие университеты запрещают студентам использовать Wikipedia в качестве основного источника информации.

Во-вторых не секрет, что интернет часто становится объектом злоупотреблений, особенно сейчас, когда появился искусственный интеллект. В качестве примера может послужить печально известный бот Microsoft по имени Tay, который был отключён менее чем через 24 часа после запуска за публикацию оскорбительных и расистских твитов в X. Также ИИ используется для создания дипфейков и книг на Amazon Kindle.

В этом году «Википедия» проигнорировала 200 требований Роскомнадзора, но о блокировке пока речи нет

Интернет-энциклопедия «Википедия», принадлежащая американской организации Wikimedia Foundation, за весь текущий год удалила по запросу Роскомнадзора лишь 1 из 201 материалов. В 2023 году администрация ресурса также удалила только один материал с противоправной информацией, сообщил представитель регулятора.

 Источник изображения: Роскомнадзор

Источник изображения: Роскомнадзор

В общей сложности в 2024 году в «Википедии» было выявлено 129 материалов, связанных с фейковой информацией о ходе специальной военной операции. Остальные статьи связаны с распространением экстремистских материалов, информации о вовлечении несовершеннолетних в совершение противоправных действий, сведений об изготовлении взрывчатки, а также суицидального, пронаркотического и другого контента, распространение которого на территории России запрещено.

В Роскомнадзоре сообщили, что за неудаление запрещённой информации из «Википедии» поисковые системы будут информировать пользователей о нарушении законодательства РФ иностранным юридическим лицом. Ранее «Википедию» уже штрафовали на 4 млн за отказ удалить запрещённую к распространению в России информацию. При этом полностью заблокировать ресурс достаточно сложно, поскольку в стране на данный момент нет полноценных аналогов, которые могли бы заменить «Википедию».

В русскоязычной «Википедии» стало более 2 миллионов статей

Общее количество статей в русскоязычном разделе «Википедии» накануне превысило 2 млн. На преодоление второго миллиона у авторов ресурса ушли более 11 лет. Русскоязычный раздел является четвёртым по размерам в «Википедии».

 Источник изображения: ru.wikinews.org

Источник изображения: ru.wikinews.org

Двухмиллионная статья русской «Википедии» была зафиксирована накануне, 18 сентября 2024 года, в 16:29 мск — она оказалась посвящённой рассказу Владимира Набокова «Музыка», а добавил её википедист и журналист из Омска Николай Эйхвальд. Миллионная статья в русскоязычном разделе онлайн-энциклопедии появилась 11 мая 2013 года.

Формально русская «Википедия» является седьмой по числу материалов. Но в этом списке некоторые разделы относятся к «ботопедиям» — они либо полностью (себуанская, варайская), либо в значительной мере (нидерландская, шведская) состоят из автоматических заливок. Если же учитывать лишь «честно» написанные материалы, то русскоязычный раздел «Википедии» занимает уже четвёртое место в мире, уступая английскому, немецкому и французскому.

В «Википедии» появилась тёмная тема

Около пяти лет назад сформировался стабильный запрос пользователей на тёмную тему или тёмный режим для приложений, который меньше напрягает глаза в тёмное время суток — тогда же появилась соответствующая системная настройка в Android и iOS с командой для сторонних приложений. Тёмные темы появились и у других систем, сайтов и цифровых инструментов — за исключением «Википедии».

 Источник изображения: wikipedia.org

Источник изображения: wikipedia.org

У популярнейшей в мире онлайн-энциклопедии до настоящего момента не было штатных способов переключить цветовое оформление страниц, но под давлением сообщества эти изменения всё-таки были внесены — тёмный режим (тёмная опция в настройке «Цвет») стал доступен в настольной и мобильной версиях сайта.

В десктопном варианте сайта в обновлённом дизайне есть правая панель, на которой можно выбрать внешний вид страницы: размер шрифта, ширину содержимого и цветовое оформление. Если панель отсутствует, её можно вызвать, нажав на кнопку с изображением очков в правом верхнем углу страницы — она может быть выпадающей или закреплённой на странице. В разделе «Цвет» доступны три опции: «Светлый», «Тёмный» и «Автоматический» — на основании настроек системы. В мобильной версии потребуется выбрать пункт «Настройки», который появляется при выборе «кнопки-гамбургера» с тремя горизонтальными линиями в левом верхнем углу страницы.

Тёмная тема для «Википедии» по итогам 2023 года стала самой востребованной функцией сайта. Пока данная функция доступна в формате бета-версии и может давать непредсказуемые результаты. К примеру, она несовместима с браузерными расширениями, которые сами делают «Википедию» тёмной. Могут также возникать конфликты с некоторыми статьями, где некоторые цвета жёстко запрограммированы. Первый запрос на тёмную тему для «Википедии» был зарегистрирован 22 июня 2010 года, но ситуация начала меняться лишь в 2022 году. Задача была помечена как решённая 12 июля 2024 года, но многие подзадачи до сих пор значатся как невыполненные.

«Википедия» подала в суд на Роскомнадзор и Генпрокуратуру

Некоммерческая организация «Викимедия Фаундейшн», которая обеспечивает работу «Википедии», подала в Тверской районный суд Москвы три иска к первому заместителю генпрокурора Анатолию Разинкину, гласит информация в судебной картотеке.

 Источник изображения: succo / pixabay.com

Источник изображения: succo / pixabay.com

Истец просит суд признать требования Генпрокуратуры о принятии мер по ограничению доступа к ресурсам «Википедии» от 5 июля 2023 года полностью незаконными. Представители некоммерческого фонда также просят признать незаконными уведомления Роскомнадзора о нарушении порядка распространения информации — в них регулятор указал адреса страниц, которые содержат соответствующие нарушения.

Аналогичные требования «Викимедия Фаундейшн» заявила по всем трём зарегистрированным искам, сообщают «Ведомости» со ссылкой на заявление пресс-службы суда. Оператор «Википедии» регулярно получает штрафы за отказ удалить запрещённый российскими законами контент. Только за 2023 год некоммерческой организации были назначены административные наказания в виде штрафов на общую сумму более 18 млн руб.

Редакторы «Википедии» признали издание Cnet ненадёжным, поскольку на нём есть статьи, написанные ИИ

Эксперимент ресурса CNET с использованием генеративного искусственного интеллекта для написания статей привёл к плачевным результатам — редакторы «Википедии» понизили его рейтинг надёжности из-за многочисленных ошибок в публикуемом контенте и наличия плагиата.

 Источник изображения: geralt/Pixabay

Источник изображения: geralt/Pixabay

В прошлом году много споров вызвала публикация ресурса Futurism, рассказавшего, что CNET в течение нескольких месяцев «потихоньку» публиковал статьи, написанные ИИ, не привлекая особого внимания общественности и не делая официальных заявлений по этому поводу.

Статьи на финансовую тему начали появляться на сайте ресурса в ноябре 2022 года под подписью CNET Money Staff. Они были сгенерированы ИИ, о чём свидетельствует большое количество ошибок и порой дословное копирование работ других авторов. Из-за ошибок ресурсу CNET пришлось внести исправления в 41 из 77 статей, написанных с использованием ИИ.

В связи с разоблачением Futurism руководство CNET отметило, что публикация статей с использованием ИИ производилась «без особого шума», но не «тайно», но вместе с тем приостановило эксперимент. Другие сайты, тоже принадлежащие Red Ventures, как и CNET, также приостановили публикацию статей, написанных с помощью ИИ.

 Источник изображения: techspot.com

Источник изображения: techspot.com

Согласно данным «Википедии», CNET имел самый высокий рейтинг надёжности до октября 2020 года. Затем с этой даты по октябрь 2022 года не было консенсуса, что, по мнению «Википедии», было связано с ухудшением редакционных стандартов после приобретения ресурса компанией Red Ventures. А с ноября 2022 года по настоящее время CNET классифицируется «Википедией» как «в целом ненадёжный» ресурс, что связано с наличием множества ошибок в статьях, написанных ИИ.


window-new
Soft
Hard
Тренды 🔥
xAI выпустила Grok Imagine 1.0 с поддержкой создания 10-секундных видео в улучшенном разрешении 3 ч.
В Firefox появится выключатель всех ИИ-функций разом 8 ч.
Суровое альпинистское приключение Cairn от создателей Furi покорило вершину в 200 тысяч проданных копий всего за три дня 10 ч.
«Лучше большинства фильмов по RE»: трагичная короткометражка по мотивам Resident Evil Requiem впечатлила фанатов 12 ч.
За саундтрек можно не переживать: композитор «Ведьмака 3» напишет музыку для The Witcher 4 13 ч.
Firefly без ограничений: Adobe сняла лимиты на ИИ-генерацию изображений и видео, но не навсегда 14 ч.
Google добавит в Gemini инструмент для переноса диалогов из ChatGPT и других ИИ-ботов 15 ч.
Nioh 3 впервые в серии выйдет за пределами PC и PlayStation — Sony раскрыла сроки консольной эксклюзивности 16 ч.
Microsoft вернула на экран блокировки Windows 11 значок входа по паролю, пропавший в августе 16 ч.
Редкие в прошлом экстренные патчи Microsoft стали ужасающе обыденными 16 ч.
OpenAI всё активнее ищет альтернативу ускорителям Nvidia для инференса 9 мин.
VDURA предложила программу Flash Relief Program для смягчения дефицита флеш-памяти 10 мин.
Сделка на $1,25 трлн: SpaceX действительно поглотила ИИ-стартап xAI Илона Маска 2 ч.
Прогресс в частоте AMD Ryzen 7 9850X3D достигнут «заводским разгоном» процессора и ростом энергопотребления 2 ч.
ASUS и HiFiMAN выпустили игровую гарнитуру ROG Kithara открытого типа с аудиофильским звуком 3 ч.
Arm сделала бесплатным доступ к своим архитектурам для более зажиточных стартапов 4 ч.
Новая статья: Обзор материнской платы MSI MAG X870E Tomahawk WIFI PZ: плата для эстетов-оверклокеров 8 ч.
Новая статья: ИИтоги января 2026 г.: будет триллион! 9 ч.
Экология в приоритете: проект энергоэффективного ЦОД МТС получил прописку в федеральном реестре углеродных единиц 10 ч.
В 2025 году в России значительно выросли затраты на закупки серверов и СХД на фоне их удорожания 10 ч.