Сегодня 07 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

У ИИ-поисковиков обнаружилось пристрастие к «менее популярным» источникам

В прошлом году Google развернула в поисковой машине функцию обзоров от искусственного интеллекта — не слишком удачный поначалу эксперимент показал, насколько результаты работы этого сервиса отличаются от традиционной выдачи со ссылками, которую поисковые службы показывали десятилетиями. Поисковые системы на базе ИИ вообще склонны ссылаться на менее популярные сайты и ресурсы, которые не попали бы в первую сотню ссылок «органической» выдачи Google, установили учёные.

 Источник изображения: sarah b / unsplash.com

Источник изображения: sarah b / unsplash.com

Немецкие учёные сравнили результаты традиционного поиска Google с его же «Обзорами от ИИ» и ответами чат-бота Gemini-2.5-Flash; в качестве дополнительных источников они использовали поисковую службу OpenAI GPT-4o и дополнительный режим модели GPT-4o, при котором веб-поиск подключается лишь по необходимости, если модель не обнаруживает ответа в собственной базе знаний. Массив тестовых запросов учёные собрали из трёх источников: WildChat — запросы, которые пользователи отправляли в ChatGPT; AllSides — запросы на политические темы; а также запросы, связанные с сотней самых популярных товаров на Amazon.

В целом системы поиска на основе генеративного ИИ чаще цитировали ресурсы, которые, как правило, не появлялись в первой десятке традиционной поисковой выдачи, показала статистика рейтинга Tranco. Цитируемые ИИ источники с меньшей вероятностью, чем ресурсы из выдачи традиционного поиска Google, оказывались в первой тысяче, а то и в первом миллионе рейтинга Tranco. Среди собственных предпочтений Gemini оказалось множество непопулярных сайтов: по всем результатам медианный источник информации чат-бота не попадал в первую тысячу Tranco. Цитируемые поисковыми системами на базе ИИ источники, как правило, не появлялись даже близко к верхушке выдачи Google: 53 % источников из «обзоров от ИИ» в Google не попали в первую десятку, а 40 % — в первую сотню результатов из традиционной выдачи.

 Источник изображения: BoliviaInteligente / unsplash.com

Источник изображения: BoliviaInteligente / unsplash.com

Значительной оказалась разница в качестве источников: системы ИИ чаще обращались к корпоративным ресурсам и энциклопедиям, но почти никогда не ссылались на соцсети. Анализ ответов, который провела большая языковая модель, показал, что ИИ охватил то же количество идентифицируемых понятий, что и первая десятка ресурсов в традиционной выдаче — результаты были столь же подробными, разнообразными и актуальными. С другой стороны, ИИ проявил склонность сжимать информацию, то есть не упоминать второстепенных и неоднозначных аспектов, которые сохраняются в традиционном поиске.

Важным достоинством поисковых систем с ИИ оказалась способность объединять информацию из заложенной при обучении базой знаний с данными цитируемых сайтов. Модель GPT-4o, например, часто вообще не обращалась к внешним источникам, ограничиваясь собственными знаниями — это же оказалось и её слабым местом: иногда она запрашивала подробности у пользователя вместо того, чтобы самостоятельно обратиться к веб-поиску. Учёные не стали делать выводов о качестве работы поисковых системы с ИИ, но призвали выработать новые методы оценки качества их работы с учётом разнообразия, охвата понятий и способности моделей объединять собственные знания с данными внешних источников.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Взрывной коктейль из Metal Slug, Contra и фильмов 80-х»: ретроэкшен Huntdown: Overtime ворвался в ранний доступ Steam c 97 % положительных отзывов 36 мин.
Telegram получил большое обновление с ИИ — ботов теперь можно призвать в любой чат и другие нововведения 38 мин.
Приложение Fitbit превратилось в Google Health — и сможет собирать данные о здоровье даже из Apple Health 2 ч.
Новый стандарт жанра для вселенной «Чужих»: анонсирован амбициозный кооперативный шутер Aliens: Fireteam Elite 2 3 ч.
В Steam вышло атмосферное сюжетное приключение Will: Follow The Light о поиске смысла «даже в темноте» 4 ч.
Заряженное ностальгией музыкальное приключение Mixtape от создателей The Artful Escape очаровало критиков — игра доступна в российском Steam 5 ч.
IBM когда-то хотела отказаться от навигации с клавишей Tab — Microsoft не согласилась, сославшись на маму Билла Гейтса 6 ч.
ИИ с «глазами» оказался в разы дороже обычного API — агенты сжигают бюджеты, ходя по сайтам 6 ч.
Глава Take-Two взял вину за неудачи Sid Meier’s Civilization VII на себя, а обновление Test of Time исправит главную проблему игры 7 ч.
Доля российского ПО в госсекторе превысила 75 % 7 ч.
Южнокорейские учёные объявили «третью эпоху транзисторов» — кремниевые осцилляторы будут решать сложные задачи 2 ч.
GeIL анонсировала модули DDR5, которые работают со скоростью 8000 МТ/с без разгона 2 ч.
AMD выпустила ИИ-ускоритель Instinct MI350P с 144 Гбайт HBM3E, PCIe 5.0 x16 и потреблением 600 Вт 2 ч.
Компания Ploopy «отделила» культовый манипулятор TrackPoint от ноутбуков ThinkPad и превратила его в портативную мышь 4 ч.
Google анонсировала Fitbit Air — лёгкий фитнес-трекер без экрана за $99 с круглосуточным отслеживанием активности владельца 4 ч.
Apple закажет новую партию чипов A18 Pro из-за высокого спроса на MacBook Neo 6 ч.
Iridium анонсировала PNT-решение для безошибочного позиционирования и синхронизации времени Project Authentic 7 ч.
Hisense представила игровой 5K-монитор GX Ultra с частотой обновления 180 Гц 7 ч.
200 Тфлопс в FP64: AMD поделилась первыми подробностями об Instinct MI430X 8 ч.
OnePlus представила смартфон Nord CE6 с батареей на 8000 мА·ч за $320 и модель Nord CE6 Lite подешевле 9 ч.