Сегодня 28 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ заполоняет интернет: 35 % появившихся за последние годы сайтов были созданы нейросетями

Группа исследователей, в которую входят сотрудники Стэнфорда, учёные Имперского колледжа Лондона и энтузиасты проекта «Архив интернета», опубликовала свои выводы в статье под названием «Влияние текста, сгенерированного ИИ, на интернет». По их данным, начиная с 2022 года более трети всех сайтов создано с помощью ИИ. Исследование также показало, что контент, сгенерированный ИИ, делает интернет более позитивным и менее разнообразным.

 Источник изображений: unsplash.com

Источник изображений: unsplash.com

Вдохновлённые теорией «мёртвого интернета» — идеей о том, что большая часть интернета теперь состоит из ботов, обменивающихся сообщениями, — команда исследователей обратилась в «Архив интернета», чтобы получить образцы сайтов за 33 месяца с августа 2022 года по май 2025 года. Проект «Архив интернета» (Internet Archive) — это некоммерческая организация, которая, как и следует из названия, занимается сохранением цифрового контента Сети для будущих поколений.

«Для каждого выбранного URL-адреса мы получаем самый старый доступный архивный снимок через API сервера CDX Wayback Machine, — говорится в исследовании. — Исходный HTML-код каждого снимка загружается и сохраняется локально для последующей обработки». Исследователи использовали программное обеспечение для обнаружения ИИ Pangram v3, которое, по их данным, оказалось самым точным инструментом для определения контента, созданного нейросетью.

«Опасения вызывают распространение в интернете текста, сгенерированного и обработанного с помощью ИИ, что может привести к ухудшению семантического и стилистического разнообразия, фактической точности и другим негативным последствиям, — пишут исследователи. — Мы обнаружили, что к середине 2025 года примерно 35 % вновь опубликованных сайтов были классифицированы как сгенерированные или обработанные с помощью ИИ, по сравнению с нулевым показателем до запуска ChatGPT в конце 2022 года».

«Я считаю невероятную скорость захвата интернета искусственным интеллектом просто поразительной, — заявил исследователь ИИ из Стэнфорда и соавтор статьи Йонаш Долежал (Jonáš Doležal). — После десятилетий, в течение которых люди формировали интернет, значительная его часть всего за три года стала определяться искусственным интеллектом. На мой взгляд, мы являемся свидетелями масштабной трансформации цифрового ландшафта за гораздо меньшее время, чем потребовалось для его создания изначально».

Исследователи проверили шесть распространённых критических замечаний в адрес текста, сгенерированного ИИ:

  • Приводит ли это к сужению круга мнений?
  • Создаёт ли это больше дезинформации по мере распространения галлюцинаций?
  • Становится ли онлайн-текст более «стерильным» и жизнерадостным?
  • Сложно ли указывать источники?
  • Создаёт ли он последовательности слов с низкой семантической плотностью?
  • Приводит ли он к монокультуре и единообразию в написании текстов?

«Для каждой гипотезы мы определяем измеримый сигнал, вычисляем его для каждой ежемесячной выборки сайтов и проверяем, коррелирует ли он с совокупным показателем вероятности ИИ за месяцы», — пояснили учёные. Например, чтобы проверить, заполняет ли ИИ интернет ложной информацией, команда извлекла основанные на фактах утверждения с выбранных ими сайтов, а затем проверила их достоверность. Чтобы выяснить, ссылается ли ИИ на источники, команда вычисляла плотность исходящих ссылок в тексте, сгенерированном ИИ.

К удивлению исследователей, только две из шести проверенных ими теорий о влиянии текста, сгенерированного ИИ, оказались верными. ИИ делал интернет менее семантически разнообразным и в целом более позитивным, но он не вызывал распространения лжи и не устранял её источники.

«Самым удивительным результатом стало то, что наша гипотеза о распаде истины не подтвердилась, — отметил Долежал. — Мы целенаправленно искали увеличение количества заведомо ложных утверждений, но не обнаружили. Но всё же возможно, что ИИ незаметно увеличивает объём утверждений, которые нельзя проверить с помощью существующих инструментов и инфраструктуры проверки фактов. Или же интернет изначально не был особенно склонен к соблюдению истины».

Исследователи заявили, что продолжат изучать влияние ИИ-контента на интернет. В настоящее время они создают «непрерывный инструмент», который будет непрерывно анализировать ситуацию, а не создавать статичный «снимок» ресурсов Сети. Учёные планируют выяснить, какие типы сайтов сильнее всего наполнены нейросетевым контентом, с разбивкой по категориям и языкам, а также оценить, где наиболее ярко проявляются последствия применения ИИ.

Для Долежала подобные исследования имеют решающее значение для обеспечения полезного и продуктивного интернета. «По мере распространения контента, созданного с помощью ИИ, задача состоит в том, чтобы найти применение этим моделям, которое не приведёт просто к созданию очищенного, повторяющегося контента, — считает он. — Скорее, вместо того чтобы заставлять модели быть идеально покладистыми и уступчивыми, стоит предоставить им больше индивидуальности или конфликтности, что может помочь им выступать в качестве творческого партнёра, а не замены человеческого голоса».

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Lenovo купила разработчика, чей BIOS установлен в миллионы ПК по всему миру 31 мин.
Вампирская ролевая игра The Blood of Dawnwalker от ветеранов CD Projekt Red вышла из тени — 13 минут геймплея, дата релиза и предзаказ в России 37 мин.
ИИ заполоняет интернет: 35 % появившихся за последние годы сайтов были созданы нейросетями 2 ч.
Nvidia выпустила драйвер с поддержкой новой версии мобильной GeForce RTX 5070 2 ч.
Nacon закроет студию Spiders — разработчиков Greedfall и Steelrising никто не захотел купить 2 ч.
Игроки не оценили S&box — духовный наследник Garry’s Mod собирает в Steam «смешанные» отзывы 3 ч.
Режиссёр Resident Evil 2 спустя почти 30 лет раскрыл секрет происхождения имени Леона Кеннеди 4 ч.
Google «Play Маркет» начнёт помечать приложения, оптимизированные для больших экранов 4 ч.
Минцифры РФ прорабатывает введение платы за VPN-трафик 4 ч.
NEC с помощью Anthropic создаст крупнейшую в Японии команду специалистов в области ИИ, хотя сами японцы скептически относятся к ИИ 6 ч.
Alibaba выпустила «виртуальных сотрудников» ля малого бизнеса — ИИ-агенты займутся торговлей 11 мин.
В Китае создали первую в мире топливную ячейку на угле — она даёт электричество без дыма, пара и генераторов 2 ч.
Анонсирован игровой смартфон OnePlus Ace 6 Ultra с Dimensity 9500, батареей на 8600 мА·ч и геймпадом 2 ч.
Автопилот Super Cruise от GM преодолел 1 миллиард миль — на это ушло 9 лет 2 ч.
Nvidia представила мобильную GeForce RTX 5070 с 12 Гбайт памяти 2 ч.
Gigabyte представила тонкий ноутбук Aero X16 с новой версией GeForce RTX 5070 для «задач ИИ нового поколения» 3 ч.
С миру по миллиарду: Oracle всё-таки насобирала $16 млрд на ИИ ЦОД OpenAI в Мичигане 4 ч.
SpaceX привязала гонорар Илона Маска к колонизации Марса и запуску орбитальных ЦОД 4 ч.
Представлена робот-рыба Bionic Arowana за $5000 — доступная альтернатива живой ароване для аквариума 5 ч.
Samsung Heavy Industries займётся строительством плавучих ЦОД совместно с американской Mousterian Corporation 5 ч.