Сегодня 06 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-боты стали новым типом посетителей интернета и генератором трафика — блокировки им не помеха

Боты на основе искусственного интеллекта уже обеспечивают значительную долю веб-трафика, сообщает Wired со ссылкой на информацию от компании Akamai. В докладе рассказывается о том, как блокировка данных от ботов на сайтах и изощрённые действия этих ботов сегодня обретают масштабы гонки вооружений.

 Источник изображения: Igor Omilaev / unsplash.com

Источник изображения: Igor Omilaev / unsplash.com

«Это не просто проблема авторских прав — в интернете появился новый тип посетителей», — отмечают эксперты. Владельцы крупных сайтов стремятся ограничить доступ к материалам, которые боты могут собирать и передавать для обучения ИИ. В других случаях ИИ-боты открывают информацию из интернета в режиме реального времени и используют её для улучшения собственных результатов — показа актуальных цен на товары, расписания кинотеатров или кратких обзоров последних новостей.

Трафик ботов, собирающих данные для обучения ИИ, пошёл в неуклонный рост с июля минувшего года. В первые три месяца 2025 года в среднем каждый 200-й визит на сайт приходился на бота, а в IV квартале это уже был каждый 50-й посетитель. Более 13 % ботов игнорируют инструкции служебных файлов robots.txt, указывающих, каких разделов сайта следует избегать. Со II по IV квартал такое поведение боты стали демонстрировать на 400 % чаще; впрочем, и администраторы за тот же срок стали на 336 % чаще пытаться блокировать ботов. Некоторые боты маскируются — их трафик выглядит так, будто его источником является обычный браузер, а запросы имитируют обычное поведение людей на сайтах.

Появились и востребованные в этой сфере услуги. Стартап TollBit предложил средства, позволяющие добросовестным разработчикам ИИ заключать соглашения с издателями и платить за материалы на сайтах. Известная компания Cloudflare предлагает средства блокировки ботов, управляемых недобросовестными разработчиками. Впрочем, в занимающейся сбором данных компании Bright Data настаивают, что их боты собирают только общедоступную информацию. Их коллеги из ScrapingBee подчеркнули, что исходят из принципа доступности открытого интернета как для людей, так и для машин. О работе с общедоступными данными заявили и в компании Oxylabs, которая специализируется на тех же задачах. Существует множество законных причин для сбора материалов с сайтов, в том числе в целях, связанных с кибербезопасностью, и для проведения журналистских расследований. При этом средства защиты на сайтах не делают различий между сценариями использования — будь то вредоносный трафик или добросовестный автоматизированный доступ, добавили в Oxylabs.

Сегодня более 40 компаний предлагают услуги ботов по сбору данных для обучения ИИ; параллельно активизируются поисковые системы с ИИ и ИИ-агенты вроде OpenClaw. Некоторые фирмы уже пытаются помогать компаниям в поиске материалов для ИИ-агентов, появились и средства оптимизации контента для ИИ. Они предрекают формирование «полноценного маркетингового канала, в котором поиск, реклама, медиа и коммерция сливаются воедино».

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Объём мирового рынка неооблаков достигнет $400 млрд к 2031 году 9 мин.
Amazon распорядилась сделать сериал Mass Effect «более привлекательным для негеймеров» 2 ч.
«До мурашек»: датамайнер заворожил фанатов восстановленной сюжетной сценой из Elden Ring 3 ч.
Слухи: в Steam появится способ оценки производительности игр до покупки 3 ч.
Число доменов-угонщиков аккаунтов в Telegram сократилось вдвое, но мошенники запустили новые схемы 3 ч.
Intel испытала нейронное сжатие текстур на Panther Lake: наборы уменьшились вплоть до 18 раз 6 ч.
В Европе создали Euro-Office — пакет офисных приложений на базе кода OnlyOffice 14 ч.
Netflix научил собственную ИИ-модель без следов удалять объекты из видео и правдоподобно перестраивать сцену 19 ч.
Microsoft инвестирует в развитие ИИ-инфраструктуры Японии $10 млрд 24 ч.
LinkedIn скрытно собирает данные о ПО, установленном на компьютерах пользователей соцсети 05-04 12:16
Xiaomi представила 300-Гц монитор за $108 — Redmi G25 300 Гц на 24,5-дюймовой матрице Fast IPS 10 мин.
Advantech готовит MIO-5356 — один из первых одноплатных компьютеров на платформе Intel Wildcat Lake 18 мин.
IDC: расходы на европейском ИИ-рынке достигнут $290 млрд к 2029 году 19 мин.
Данные миссии ESA Gaia помогли найти 87 звёздных потоков, которые ускользали от астрономов 2 ч.
OpenAI рассчитывает разогнать годовую выручку к $300 млрд уже через четыре года 2 ч.
Россияне стали покупать меньше смартфонов: первый квартал завершился падением спроса на 6 % 3 ч.
Венчурное финансирование в США достигло рекордных $267 млрд, но львиная доля пришлась на OpenAI, Anthropic и xAI 4 ч.
Обсерватория им. Веры Рубин обнаружила 11000 астероидов и расширила каталог малых тел Солнечной системы 6 ч.
ИИ помог запустить Windows на несовместимой связке процессора Intel Bartlett Lake и материнской платы Z790 6 ч.
Выручка Foxconn в первом квартале выросла на 29,7 % благодаря буму ИИ 9 ч.