Сегодня 17 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-поисковики поймали на лжи по поводу источников новостей

Восемь поисковых служб на основе моделей генеративного искусственного интеллекта продемонстрировали значительные проблемы в работе с источниками новостных материалов, гласят результаты исследования, проведённого экспертами Центра цифровой журналистики при издании Columbia Journalism Review.

 Источник изображения: Christopher Burns / unsplash.com

Источник изображения: Christopher Burns / unsplash.com

Поисковики с ИИ более чем в 60 % случаев дают неверные ответы на запросы об источниках новостей. Примерно каждый четвёртый американец теперь использует ИИ в качестве альтернативы традиционным поисковым системам, указывают авторы исследования, и значительный уровень ошибок вызывает серьёзные опасения по поводу надёжности ИИ. Разные платформы показали разную частоту ошибок: Perplexity давала неверную информацию в 37 % случаев, а служба ChatGPT Search некорректно идентифицировала 67 % запрошенных источников. Самый высокий уровень ошибок продемонстрировал чат-бот Grok 3 — 94 %.

В ходе тестирования исследователи загружали в службы ИИ фрагменты реальных новостных статей и просили каждую модель определить заголовок материала, источник статьи, первоначального издателя, дату публикации и её URL-адрес. У всех моделей обнаружилась общая особенность: не располагая надёжными сведениями, они не отказывались отвечать, а давали правдоподобно звучащие, но не соответствующие действительности ответы. Примечательно, что платные модели в некоторых отношениях показали себя ещё хуже: Perplexity Pro ($20 в месяц) и премиальный Grok 3 ($40 в месяц) с уверенностью давали неправильные ответы чаще, чем бесплатные аналоги. Они правильно отвечали на большее количество запросов, но не отказывались работать при отсутствии достоверной информации, поэтому и общее число ошибок у них оказалось выше.

 Источник изображения: cjr.org

Источник изображения: cjr.org

Исследователи также подтвердили, что некоторые ИИ-платформы игнорируют директивы, запрещающие веб-сканерам доступ к ресурсам. Так, бесплатная Perplexity правильно идентифицировала все десять фрагментов платных материалов National Geographic, хотя издание установило для данной службы явный запрет на посещение своего сайта. Ссылаясь на источники, поисковые службы с ИИ часто обращались к агрегаторам, таким как Yahoo News, а не оригинальным новостным сайтам. Это происходило даже тогда, когда у издателей и разработчиков этих систем ИИ были официальные лицензионные договоры. Более половины ссылок из чатов с Google Gemini и Grok 3 вели на выдуманные или неработающие URL-адреса — в случае с Grok таких было 154 из 200.

Указанные проблемы ставят издателей перед непростым выбором. Если заблокировать веб-сканеры, то проблемы ИИ-поисковиков только усугубятся; если же полностью открыть им свои ресурсы, то пользователи перестанут их посещать, довольствуясь ответами чат-ботов. Главный операционный директор журнала Time Марк Ховард (Mark Howard) выразил надежду, что разработчики служб ИИ при значительных инвестициях в будущем повысят качество работы сервисов. Пользователей чат-ботов он призвал не оказывать ответам ИИ чрезмерного доверия.

OpenAI и Microsoft подтвердили, что их системы могут давать такие результаты. В OpenAI пообещали поддерживать издателей, направлять посетителей на их сайты, предлагая пользователям сводки материалов, цитаты и корректные ссылки; в Microsoft заверили, что её веб-сканеры следуют указанным издателями директивам.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Википедия» выпустила набор данных для обучения ИИ, чтобы боты не перегружали её серверы скрейпингом 54 мин.
«Яндекс» выкупил права на платформу для игрового облачного сервиса «Плюс Гейминг» 4 ч.
CD Projekt Red держит в тайне, выйдет ли The Witcher 3: Wild Hunt на Nintendo Switch 2 5 ч.
«Нанёс непоправимый ущерб индустрии»: глава New Blood Interactive раскритиковал влияние Escape from Tarkov на FromSoftware и игры в целом 5 ч.
Grok научился запоминать предпочтения пользователя 6 ч.
ИИ-помощник Gemini «прозрел» у бесплатных пользователей на Android 6 ч.
«Группа Астра» с партнёрами создала СП для развития и продвижения отечественной open source среды разработки OpenIDE 7 ч.
Доказательства скорой премьеры The Elder Scrolls IV: Oblivion Remastered обнаружили на сайте самой Bethesda 7 ч.
«Почти тотальное доминирование» поисковика Google может обойтись компании в £5 млрд 7 ч.
Microsoft научила бесплатный Copilot «подсматривать» за тем, что пользователь делает в браузере Edge 7 ч.
Tesla ответит в суде за махинации с показаниями одометров для ускоренного истечения гарантии 23 мин.
Seagate утверждает, что HDD гораздо экологичнее SSD с точки зрения углеродных выбросов 28 мин.
Motorola представила свой первый ноутбук — компактный Moto Book 60 с OLED, Intel Core и Wi-Fi 7 57 мин.
GeForce RTX 5060 Ti увернулась от дефицита — видеокарты не смели с полок сразу после старта продаж 2 ч.
Всем прокатным электросамокатам в России запретили ездить быстрее 20 км/ч 2 ч.
Robokos представила в России умных беспроводных роботов-газонокосилок RoboUP T600, RV600bi и RoboUP T1200 2 ч.
Масса космического мусора на околоземной орбите превысила 6600 тонн 3 ч.
Европа намерена добывать биотопливо для авиации и судоходства с помощью ГМО-микробов 3 ч.
Китай запретил использовать термины «автономное вождение» и «умное вождение» в рекламе автомобилей 4 ч.
Представлена электронная книга, максимально похожая на настоящую — у неё складывающийся экран 4 ч.