Сегодня 20 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ChatGPT и другие ИИ-боты оказались ужасными пересказчиками новостей, показало исследование BBC

Четыре самых популярных в мире чат-бота с искусственным интеллектом допускают слишком много ошибок при подготовке сводок новостных материалов, показало исследование BBC. Неточности отмечены более чем в половине случаев.

 Источник изображения: Growtika / unsplash.com

Источник изображения: Growtika / unsplash.com

Журналисты BBC поставили эксперимент — они попросили чат-боты OpenAI ChatGPT, Microsoft Copilot, Google Gemini и Perplexity составить сводки по сотне новостных сюжетов агентства, а затем оценили ответы систем и определили, насколько точными они были. По итогам исследования «51 % всех ответов ИИ на связанные с новостями вопросы получили оценки как имеющие существенные проблемы в той или иной форме». Кроме того, «19 % ответов ИИ со ссылками на материалы BBC содержали фактические ошибки, такие как неверные фактические утверждения, числа и даты».

Чат-бот Google Gemini, в частности, радикально исказил заявление Национальной службы здравоохранения Великобритании, а ChatGPT и Copilot продолжали считать действующими вышедших в отставку политиков. Небрежное обращение ИИ с информацией носит системный характер, указывают британские журналисты: он «с трудом различал мнения и факты, разглагольствовал и зачастую пропускал существенный контекст». Ранее стало известно, что в iOS 18.3 была временно отключена входящая в пакет Apple Intelligence функция подготовки сводок по новостным материалам. Не все системы ИИ в ходе исследования показали себя одинаково: «у Microsoft Copilot и Google Gemini есть более существенные проблемы, чем у OpenAI ChatGPT и Perplexity», сделали вывод в BBC.

Эксперимент в очередной раз показал, что воспринимать информацию от чат-ботов с ИИ следует с долей скепсиса. ИИ развивается бурно, большие языковые модели выпускаются почти каждую неделю и ошибки в таком объёме данных неизбежны. С другой стороны, «галлюцинации», то есть заведомо неверные ответы у передовых систем теперь встречаются реже, чем раньше. ИИ прогрессирует быстрее, чем предполагает закон Мура, рассказал недавно в личном блоге глава OpenAI Сэм Альтман (Sam Altman). Но на данный момент излишне доверять чат-ботам всё-таки не стоит, особенно если речь идёт о новостных материалах.

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
В YouTube появился ИИ-поиск по роликам и генератор Shorts на базе Gemini Omni 6 ч.
Google выпустила Gemini Omni — ИИ для генерации видео из текста, фото, аудио и любых других данных 6 ч.
Microsoft отказывается от двухфакторной аутентификации по SMS в пользу ключей доступа 9 ч.
Google представила Gemini 3.5 Flash — сверхбыстрая ИИ-модель уже доступна бесплатно 9 ч.
Forza Horizon 6 только вышла, а уже обогнала по пиковому онлайну в Steam все другие игры Xbox 10 ч.
Anthropic переманила сооснователя OpenAI — Андрей Карпатый будет обучать Claude 11 ч.
Запустится даже на картошке: хардкорный ролевой боевик Outward 2 получил дату выхода в раннем доступе Steam и системные требования 11 ч.
Apple представила ИИ-функции для инвалидов — включая управление коляской взглядом 12 ч.
VMware представила превью гипервизора ESXi-Arm Fling для Arm-серверов 13 ч.
Perplexity урезала лимиты для некоторых пользователей из-за злоупотреблений с промокодами 13 ч.
NASA испытает первые космические «заправки» для полётов к Луне и Марсу 6 ч.
Sony выпустила юбилейные наушники WH-1000X The ColleXion за $650 с шумоподавлением и урезанной автономностью 6 ч.
Новая статья: Обзор игрового ноутбука MSI Stealth 16 AI+ B3W: не размениваться на мелочи 6 ч.
До 84 ядер и 384 Мбайт L3-кеша: AMD опубликовала подробности о телеком-процессорах EPYC 8005 (Sorano) 8 ч.
Samsung объявила о старте продаж новых мониторов Odyssey и ViewFinity — вплоть до 6K 9 ч.
«Обезгугленные» TPU: Blackstone и Google развернут 500-МВт облако с фирменными ИИ-ускорителями Google без участия Google Cloud 9 ч.
Учёные решили головоломную задачу полётов ко множеству астероидов с минимальным расходом топлива 9 ч.
Microsoft представила очень дорогие планшеты Surface Pro 12 и ноутбуки Surface Laptop 8 на процессорах Intel Panther Lake 9 ч.
YADRO представила российский 2U-сервер Vegman R215 G4 на базе AMD EPYC Turin 10 ч.
AWS скупила дефицитные Mac Studio и теперь сдаёт их в аренду через облако 11 ч.