Сегодня 10 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Разработчики открытого ПО объявили партизанскую войну сборщикам данных для ИИ

Боты, которые массово собирают данные с веб-страниц для обучения и работы моделей искусственного интеллекта, становятся всё более ощутимой проблемой для владельцев сайтов. Некоторые разработчики начали давать отпор этим системам оригинальными способами, которые могут показаться наивными или ироничными, но во многих случаях они работают.

 Источник изображения: Ticka Kao / unsplash.com

Источник изображения: Ticka Kao / unsplash.com

Атаке веб-сканера сегодня может подвергнуться любой сайт. Иногда сайты даже теряют работоспособность, но сильнее прочих страдают разработчики ПО с открытым кодом: на сайтах таких проектов выкладываются материалы для скачивания, но ресурсов у них меньше, чем у коммерческих проектов. Проблема в том, что ИИ-боты игнорируют директивы файлов robot.txt, в которых указываются запрещённые для сканирования разделы. В январе разработчик открытого ПО Се Ясо (Xe Iaso) опубликовал в блоге «крик о помощи», рассказав о неподобающих действиях AmazonBot. Этот бот неустанно бил по Git-серверу разработчика, устраивая настоящие DDoS-атаки. Он игнорировал директивы robot.txt, менял IP-адреса, подменял значения строки User agent и прибегал к другим уловкам.

В итоге Ясо разработал программу Anubis, которая проводит проверку подключающихся к серверу Git клиентов — она блокирует ботов, но пропускает браузеры, которыми пользуются люди. Проект Anubis был опубликован на GitHub 19 марта, и всего за несколько дней он собрал 2000 звёзд, 20 участников и 39 форков. Успех программы указывает, что случай Ясо не уникален: на агрессивное поведение ИИ-ботов указал основатель и гендиректор платформы SourceHut Дрю ДеВолт (Drew DeVault), которому приходится от 20 % до 100 % рабочего времени тратить на защиту от веб-сканеров. Администратору проекта Linux Fedora Кевину Фензи (Kevin Fenzi) в какой-то момент пришлось полностью заблокировать Бразилию, а разработчик KDE Plasma Никколо Венеранди (Niccolò Venerandi) однажды временно заблокировал все китайские IP-адреса.

В январе анонимный разработчик под ником Aaron выпустил решение под названием Nepenthes в честь кувшиночника — насекомоядного растения. Система заманивает ИИ-ботов в «лабиринт» бесполезного контента, заставляя их сканировать чушь. Аналогичное решение недавно представила Cloudflare — оно получило более очевидное название AI Labyrinth. Эта система подключается, когда боты не соблюдают директиву «no crawl», — в результате они попусту тратят время и ресурсы. Дрю ДеВолт вообще призвал бойкотировать все новомодные ИИ-инструменты, в том числе большие языковые модели, генераторы изображений и GitHub Copilot. Едва ли это случится в действительности, поэтому разработчикам открытого ПО приходится подключать смекалку.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Амбициозный китайский боевик Phantom Blade Zero создавался без применения генеративного ИИ — игра вышла на финишную прямую 3 мин.
Генпрокурор Флориды начал расследование против OpenAI из-за угроз безопасности 35 мин.
Пользователи Instagram теперь могут редактировать свои комментарии, но недолго 50 мин.
OpenAI представила тариф Pro за $100 в месяц для программистов 51 мин.
Google Gemini поможет разобраться в сложных темах, генерируя визуализации 2 ч.
«Ни одну игру в жизни не ждал так же сильно»: разработчики Don't Starve взбудоражили фанатов анонсом Don’t Starve Elsewhere 2 ч.
Alibaba выпустила HappyHorse — открытый ИИ-генератор видео, который обошёл всех конкурентов 3 ч.
От смотрителя кладбища до командира армии мертвецов: Graveyard Keeper 2 выйдет в 2026 году, а первая часть стала временно бесплатной 3 ч.
Кооперативный пиратский экшен Windrose отправится в плавание по волнам раннего доступа уже совсем скоро — новый трейлер и дата выхода 4 ч.
Cloud.ru создал неооблако для работы с ИИ 4 ч.
В России начались продажи планшета Infinix XPAD 30E с 11-дюймовым дисплеем и поддержкой 4G 15 мин.
Ulefone на выставке «Связь-2026»: защищённые смартфоны с тепловизорами, проектором и другие новинки 25 мин.
ИИ-бум не сдувается — квартальная выручка TSMC выросла на 35 % 29 мин.
Норвегия заказала первый флот морских электрических «маршруток» — паромов на подводных крыльях 33 мин.
Капитализация Intel взлетела до максимума за 25 лет на новостях о сделке с Tesla и SpaceX 40 мин.
Стали известны технические характеристики смартфона CMF Phone 3 Pro от Nothing 2 ч.
Huawei представит 20 апреля градиентные флагманы Pura 90 Pro и Pura 90 Pro Max 3 ч.
Лунный корабль Orion снова включил двигатели, чтобы не пролететь мимо Земли — до приземления осталось меньше суток 3 ч.
Рынок ПК начал год уверенным ростом на 2,5 % — Asus и Apple приросли сильнее всех 3 ч.
«Ростелеком» потратит 100 млрд рублей на новый 100-МВт дата-центр 3 ч.