Сегодня 05 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-поисковики поймали на лжи по поводу источников новостей

Восемь поисковых служб на основе моделей генеративного искусственного интеллекта продемонстрировали значительные проблемы в работе с источниками новостных материалов, гласят результаты исследования, проведённого экспертами Центра цифровой журналистики при издании Columbia Journalism Review.

 Источник изображения: Christopher Burns / unsplash.com

Источник изображения: Christopher Burns / unsplash.com

Поисковики с ИИ более чем в 60 % случаев дают неверные ответы на запросы об источниках новостей. Примерно каждый четвёртый американец теперь использует ИИ в качестве альтернативы традиционным поисковым системам, указывают авторы исследования, и значительный уровень ошибок вызывает серьёзные опасения по поводу надёжности ИИ. Разные платформы показали разную частоту ошибок: Perplexity давала неверную информацию в 37 % случаев, а служба ChatGPT Search некорректно идентифицировала 67 % запрошенных источников. Самый высокий уровень ошибок продемонстрировал чат-бот Grok 3 — 94 %.

В ходе тестирования исследователи загружали в службы ИИ фрагменты реальных новостных статей и просили каждую модель определить заголовок материала, источник статьи, первоначального издателя, дату публикации и её URL-адрес. У всех моделей обнаружилась общая особенность: не располагая надёжными сведениями, они не отказывались отвечать, а давали правдоподобно звучащие, но не соответствующие действительности ответы. Примечательно, что платные модели в некоторых отношениях показали себя ещё хуже: Perplexity Pro ($20 в месяц) и премиальный Grok 3 ($40 в месяц) с уверенностью давали неправильные ответы чаще, чем бесплатные аналоги. Они правильно отвечали на большее количество запросов, но не отказывались работать при отсутствии достоверной информации, поэтому и общее число ошибок у них оказалось выше.

 Источник изображения: cjr.org

Источник изображения: cjr.org

Исследователи также подтвердили, что некоторые ИИ-платформы игнорируют директивы, запрещающие веб-сканерам доступ к ресурсам. Так, бесплатная Perplexity правильно идентифицировала все десять фрагментов платных материалов National Geographic, хотя издание установило для данной службы явный запрет на посещение своего сайта. Ссылаясь на источники, поисковые службы с ИИ часто обращались к агрегаторам, таким как Yahoo News, а не оригинальным новостным сайтам. Это происходило даже тогда, когда у издателей и разработчиков этих систем ИИ были официальные лицензионные договоры. Более половины ссылок из чатов с Google Gemini и Grok 3 вели на выдуманные или неработающие URL-адреса — в случае с Grok таких было 154 из 200.

Указанные проблемы ставят издателей перед непростым выбором. Если заблокировать веб-сканеры, то проблемы ИИ-поисковиков только усугубятся; если же полностью открыть им свои ресурсы, то пользователи перестанут их посещать, довольствуясь ответами чат-ботов. Главный операционный директор журнала Time Марк Ховард (Mark Howard) выразил надежду, что разработчики служб ИИ при значительных инвестициях в будущем повысят качество работы сервисов. Пользователей чат-ботов он призвал не оказывать ответам ИИ чрезмерного доверия.

OpenAI и Microsoft подтвердили, что их системы могут давать такие результаты. В OpenAI пообещали поддерживать издателей, направлять посетителей на их сайты, предлагая пользователям сводки материалов, цитаты и корректные ссылки; в Microsoft заверили, что её веб-сканеры следуют указанным издателями директивам.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Календарь релизов 4–10 мая: Dead as Disco, Mixtape, Motorslice и Beyond Enemy Lines — Vietnam 3 ч.
Нереалистичная нагрузка, завышенные ожидания и «глухое» руководство: ноябрьский релиз обернулся для создателей GTA VI жёсткими переработками 5 ч.
Forza Horizon 6 не опоздает на старт — игра «укатила» на золото 7 ч.
Инсайдеры: мультиплеерная Assassin's Creed Invictus в духе Fall Guys «просто ужасна», но Ubisoft не теряет надежды 9 ч.
Meta тестирует для Instagram метку для контента, созданного с помощью ИИ 9 ч.
«Станете самыми ненавистными людьми в Америке»: Маск угрожал руководству OpenAI перед началом судебных разбирательств 9 ч.
В открытый доступ попало 10 минут геймплея Awakening — потерянного сюжетного дополнения к Quake 4 10 ч.
Biohub Марка Цукерберга взялся ускорить лечение всех болезней с помощью ИИ-моделей клеток 13 ч.
Развитие ИИ замедляется из-за переизбытка бесполезных данных — их слишком много 13 ч.
Кооперативный шутер о приключениях роботов-ковбоев на Диком Западе стал новым хитом Steam — полмиллиона проданных копий Far Far West 14 ч.
Новая статья: Обзор OnePlus Nord 6: смартфон среднего класса почти с флагманской мощью 52 мин.
Samsung, SK hynix и Micron начали разрабатывать DDR6 — первые модули ожидаются в продаже в 2028–2029 годах 2 ч.
Cerebras объявила о запуске IPO с оценкой капитализации в $26 млрд 3 ч.
Новая статья: Выбираем лучший игровой ноутбук до 100 000 рублей: сравнительное тестирование 7 интересных моделей 3 ч.
Минпромторг РФ рассказал, что ассортимент не пострадает от исключения Acer, Asus и других из списка параллельного импорта 4 ч.
В 9 из 10 умных колонок в России встроена «Яндекс Алиса» — россияне стали чаще выбирать дорогие модели 5 ч.
В Санкт-Петербурге тоже грядут отключения мобильного интернета и СМС, предупредили операторы 6 ч.
Intel переманила ветерана Qualcomm — курс на ИИ и робототехнику усиливается 7 ч.
«Поставщики с высоким риском»: Еврокомиссия порекомендовала странам ЕС убрать оборудование Huawei и ZTE из сетей 7 ч.
Nvidia теперь на 90 % зависит от азиатских поставщиков — в прошлом году было 65 % 7 ч.