Сегодня 27 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ChatGPT и другие ИИ-боты оказались ужасными пересказчиками новостей, показало исследование BBC

Четыре самых популярных в мире чат-бота с искусственным интеллектом допускают слишком много ошибок при подготовке сводок новостных материалов, показало исследование BBC. Неточности отмечены более чем в половине случаев.

 Источник изображения: Growtika / unsplash.com

Источник изображения: Growtika / unsplash.com

Журналисты BBC поставили эксперимент — они попросили чат-боты OpenAI ChatGPT, Microsoft Copilot, Google Gemini и Perplexity составить сводки по сотне новостных сюжетов агентства, а затем оценили ответы систем и определили, насколько точными они были. По итогам исследования «51 % всех ответов ИИ на связанные с новостями вопросы получили оценки как имеющие существенные проблемы в той или иной форме». Кроме того, «19 % ответов ИИ со ссылками на материалы BBC содержали фактические ошибки, такие как неверные фактические утверждения, числа и даты».

Чат-бот Google Gemini, в частности, радикально исказил заявление Национальной службы здравоохранения Великобритании, а ChatGPT и Copilot продолжали считать действующими вышедших в отставку политиков. Небрежное обращение ИИ с информацией носит системный характер, указывают британские журналисты: он «с трудом различал мнения и факты, разглагольствовал и зачастую пропускал существенный контекст». Ранее стало известно, что в iOS 18.3 была временно отключена входящая в пакет Apple Intelligence функция подготовки сводок по новостным материалам. Не все системы ИИ в ходе исследования показали себя одинаково: «у Microsoft Copilot и Google Gemini есть более существенные проблемы, чем у OpenAI ChatGPT и Perplexity», сделали вывод в BBC.

Эксперимент в очередной раз показал, что воспринимать информацию от чат-ботов с ИИ следует с долей скепсиса. ИИ развивается бурно, большие языковые модели выпускаются почти каждую неделю и ошибки в таком объёме данных неизбежны. С другой стороны, «галлюцинации», то есть заведомо неверные ответы у передовых систем теперь встречаются реже, чем раньше. ИИ прогрессирует быстрее, чем предполагает закон Мура, рассказал недавно в личном блоге глава OpenAI Сэм Альтман (Sam Altman). Но на данный момент излишне доверять чат-ботам всё-таки не стоит, особенно если речь идёт о новостных материалах.

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Anthropic отказала Пентагону в неограниченном военном применении ИИ, несмотря на угрозы 8 мин.
По культовому мультсериалу «Хи-Мен и властелины вселенной» скоро выйдет олдскульный боевик от авторов Terminator 2D: No Fate 41 мин.
Новая атака AirSnitch позволяет перехватывать трафик в любой сети Wi-Fi без взлома 43 мин.
«Абеляр, лайкни это видео»: Owlcat заинтриговала фанатов Warhammer 40,000: Rogue Trader тизером аддона The Infinite Museion с Тразином Неисчислимым 2 ч.
Microsoft представила Copilot Tasks — ИИ-агента для выполнения задач в фоне 2 ч.
Глава Warner Bros. Games намекнул, когда выйдет Hogwarts Legacy 2 3 ч.
Роскомнадзор не стал отрицать сообщения о принятом в Кремле решении заблокировать Telegram с апреля 4 ч.
Resident Evil Requiem стартовала в Steam с «очень положительными» отзывами и новым рекордом для серии 4 ч.
Приземлённый боевик Samson: A Tyndalston Story от создателя Just Cause выйдет уже совсем скоро — новый трейлер и дата релиза 5 ч.
AMD инвестирует в Nutanix $250 млн и создаст совместную платформу для агентного ИИ 16 ч.
Китайские поставщики подняли цену на оптоволокно для России в 2,5-4 раза 2 мин.
NK Group построит кампус из 11 ЦОД в Домодедово — «Сбер» может стать ключевым покупателем 10 мин.
Ford придумала платный багажник — франк в Mustang Mach-E стал опцией за $495 2 ч.
Samsung подтвердила — в подорожании смартфонов Galaxy S26 виновата память 2 ч.
ASML заявила о готовности High-NA EUV к серийному производству ангстремных чипов 2 ч.
Qualcomm переманила главу полупроводникового производства Intel Foundry 2 ч.
Samsung разочаровалась в сверхтонких смартфонах после провала Galaxy S25 Edge — трёхстворчатого TriFold 2 тоже пока не будет 4 ч.
Ракетный двигатель для ракеты «Ангара» создали на лазерном 3D-принтере — быстрее и в 2,5 раза дешевле 4 ч.
Начинает сбываться пророчество о том, что из-за кризиса памяти не все производители переживут 2026 год — Meizu на грани банкротства 4 ч.
Nimbus Data представила универсальную All-Flash СХД FlashMax 5 ч.