Сегодня 06 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-боты стали новым типом посетителей интернета и генератором трафика — блокировки им не помеха

Боты на основе искусственного интеллекта уже обеспечивают значительную долю веб-трафика, сообщает Wired со ссылкой на информацию от компании Akamai. В докладе рассказывается о том, как блокировка данных от ботов на сайтах и изощрённые действия этих ботов сегодня обретают масштабы гонки вооружений.

 Источник изображения: Igor Omilaev / unsplash.com

Источник изображения: Igor Omilaev / unsplash.com

«Это не просто проблема авторских прав — в интернете появился новый тип посетителей», — отмечают эксперты. Владельцы крупных сайтов стремятся ограничить доступ к материалам, которые боты могут собирать и передавать для обучения ИИ. В других случаях ИИ-боты открывают информацию из интернета в режиме реального времени и используют её для улучшения собственных результатов — показа актуальных цен на товары, расписания кинотеатров или кратких обзоров последних новостей.

Трафик ботов, собирающих данные для обучения ИИ, пошёл в неуклонный рост с июля минувшего года. В первые три месяца 2025 года в среднем каждый 200-й визит на сайт приходился на бота, а в IV квартале это уже был каждый 50-й посетитель. Более 13 % ботов игнорируют инструкции служебных файлов robots.txt, указывающих, каких разделов сайта следует избегать. Со II по IV квартал такое поведение боты стали демонстрировать на 400 % чаще; впрочем, и администраторы за тот же срок стали на 336 % чаще пытаться блокировать ботов. Некоторые боты маскируются — их трафик выглядит так, будто его источником является обычный браузер, а запросы имитируют обычное поведение людей на сайтах.

Появились и востребованные в этой сфере услуги. Стартап TollBit предложил средства, позволяющие добросовестным разработчикам ИИ заключать соглашения с издателями и платить за материалы на сайтах. Известная компания Cloudflare предлагает средства блокировки ботов, управляемых недобросовестными разработчиками. Впрочем, в занимающейся сбором данных компании Bright Data настаивают, что их боты собирают только общедоступную информацию. Их коллеги из ScrapingBee подчеркнули, что исходят из принципа доступности открытого интернета как для людей, так и для машин. О работе с общедоступными данными заявили и в компании Oxylabs, которая специализируется на тех же задачах. Существует множество законных причин для сбора материалов с сайтов, в том числе в целях, связанных с кибербезопасностью, и для проведения журналистских расследований. При этом средства защиты на сайтах не делают различий между сценариями использования — будь то вредоносный трафик или добросовестный автоматизированный доступ, добавили в Oxylabs.

Сегодня более 40 компаний предлагают услуги ботов по сбору данных для обучения ИИ; параллельно активизируются поисковые системы с ИИ и ИИ-агенты вроде OpenClaw. Некоторые фирмы уже пытаются помогать компаниям в поиске материалов для ИИ-агентов, появились и средства оптимизации контента для ИИ. Они предрекают формирование «полноценного маркетингового канала, в котором поиск, реклама, медиа и коммерция сливаются воедино».

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Премьера геймплея и дата выхода Star Wars Zero Company — тактической стратегии от ветеранов XCOM 2 ч.
Square Enix анонсировала Final Fantasy VII Revelation — «незабываемый финал одного из самых амбициозных проектов в истории видеоигр» 2 ч.
Stellar Blade 2 получила первый трейлер и официальное название — Stellar Blade: Blood Rain 3 ч.
Новая статья: 007 First Light — успех после долгих лет подготовки. Рецензия 5 ч.
Назад в будущее и обратно: анонсирована метроидвания Tempus Vitae с путешествиями во времени 5 ч.
Google исправила рекордные 429 уязвимостей в Chrome за раз — включая 22 критические 10 ч.
Аша Шарма подтвердила, что Xbox нужны эксклюзивы, но есть нюанс 10 ч.
Google начала экспериментировать с показом результатов поиска в Chrome сразу в режиме ИИ 11 ч.
Вредоносный мод для Minecraft заразил 116 000 компьютеров и продавал доступ к веб-камерам жертв 11 ч.
OpenAI согласилась предоставлять властям США свои новые ИИ-модели на проверку 12 ч.
Silicon Motion представила SSD-контроллеры с PCIe 6.0 и скоростью до 28 Гбайт/с 7 ч.
Ангстремные мобильные процессоры Intel Panther Lake и Wildcat Lake начали появляться на настольных платах 7 ч.
В российской части МКС обнаружены две утечки воздуха — одну уже заделали 10 ч.
Thermal Grizzly показала водоблок для скальпированных процессоров — с алмазными пластинами за €1500 11 ч.
Роботакси Waymo показало себя как неожиданно удобный транспорт для бегства с места преступления 11 ч.
Репортаж со стенда Apacer на Computex 2026: память DDR5-9200, скоростные SSD с вентиляторами и не только 12 ч.
Илон Маск заговорил о 100 000 аппаратов Starlink на орбите — чтобы ускорить спутниковый интернет в 100 раз 12 ч.
Phison представила SSD-контроллер с поддержкой PCIe 6.0 13 ч.
Правительство США планирует выделить $700 млн на поддержку угольной энергетики для ИИ-инфраструктуры 13 ч.
Молния проникла в квартиру через интернет-кабель и уничтожила ПК и роутер 14 ч.