Сегодня 05 мая 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ChatGPT и другие ИИ-боты оказались ужасными пересказчиками новостей, показало исследование BBC

Четыре самых популярных в мире чат-бота с искусственным интеллектом допускают слишком много ошибок при подготовке сводок новостных материалов, показало исследование BBC. Неточности отмечены более чем в половине случаев.

 Источник изображения: Growtika / unsplash.com

Источник изображения: Growtika / unsplash.com

Журналисты BBC поставили эксперимент — они попросили чат-боты OpenAI ChatGPT, Microsoft Copilot, Google Gemini и Perplexity составить сводки по сотне новостных сюжетов агентства, а затем оценили ответы систем и определили, насколько точными они были. По итогам исследования «51 % всех ответов ИИ на связанные с новостями вопросы получили оценки как имеющие существенные проблемы в той или иной форме». Кроме того, «19 % ответов ИИ со ссылками на материалы BBC содержали фактические ошибки, такие как неверные фактические утверждения, числа и даты».

Чат-бот Google Gemini, в частности, радикально исказил заявление Национальной службы здравоохранения Великобритании, а ChatGPT и Copilot продолжали считать действующими вышедших в отставку политиков. Небрежное обращение ИИ с информацией носит системный характер, указывают британские журналисты: он «с трудом различал мнения и факты, разглагольствовал и зачастую пропускал существенный контекст». Ранее стало известно, что в iOS 18.3 была временно отключена входящая в пакет Apple Intelligence функция подготовки сводок по новостным материалам. Не все системы ИИ в ходе исследования показали себя одинаково: «у Microsoft Copilot и Google Gemini есть более существенные проблемы, чем у OpenAI ChatGPT и Perplexity», сделали вывод в BBC.

Эксперимент в очередной раз показал, что воспринимать информацию от чат-ботов с ИИ следует с долей скепсиса. ИИ развивается бурно, большие языковые модели выпускаются почти каждую неделю и ошибки в таком объёме данных неизбежны. С другой стороны, «галлюцинации», то есть заведомо неверные ответы у передовых систем теперь встречаются реже, чем раньше. ИИ прогрессирует быстрее, чем предполагает закон Мура, рассказал недавно в личном блоге глава OpenAI Сэм Альтман (Sam Altman). Но на данный момент излишне доверять чат-ботам всё-таки не стоит, особенно если речь идёт о новостных материалах.

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Microsoft начала принудительно обновлять Windows 11 до версии 24H2 — остановить это невозможно 5 мин.
Город зверей, оккультный заговор и личное проклятие: анонсирован нуарный экшен The Shadow Syndicate с элементами L.A. Noire и Max Payne 38 мин.
Терабитное облако: Backblaze запустила S3-хранилище B2 Overdrive для рабочих нагрузок ИИ и HPC 50 мин.
В России взлетел спрос на системы защиты от утечек данных 2 ч.
«Выглядит как игра, в которую играет Джимми из GTA V»: геймплей шпионского боевика MindsEye от студии экс-президента Rockstar не впечатлил фанатов 2 ч.
Две большие RPG и три ремейка за шесть лет: инсайдер рассекретил планы Ubisoft на Assassin’s Creed 3 ч.
Warhorse похвасталась продажами Kingdom Come: Deliverance 2 и раскрыла статистику игроков — Индржих оказался «смертоноснее чумы» 5 ч.
Дональд Трамп заявил, что готов продлить отсрочку на запрет TikTok в США, если сделка не будет заключена к 19 июня 6 ч.
«Росатом сервис» заменил SharePoint на Цитрос Цифровая Платформа» 14 ч.
Со следующего года в школах и детских садах ОАЭ всех детей начнут готовить к ИИ-будущему 16 ч.
GigaIO и d-Matrix предоставят инференс-платформу для масштабных ИИ-развёртываний 8 мин.
Массовый выпуск чипов для сторонних клиентов Intel начнёт только в 2028 году, спрогнозировали аналитики Morgan Stanley 55 мин.
Тарифы Трампа привели к росту апрельской выручки Foxconn на 26 % 56 мин.
McKinsey: инвестиции в ИИ ЦОД к 2030 году превысят $5 трлн 59 мин.
Vivo представила беспроводные наушники iQOO Buds 1i с ценой $21 и автономностью до 50 часов 3 ч.
Nvidia показала GeForce RTX 5090 в стилях «Звёздных войн» и «Звёздного пути», но продавать их не будет 3 ч.
«Билайн» внедрил облачную платформу для виртуализации сетевых функций 3 ч.
Intel показала новую СЖО для отвода тепла от чипов с TDP до 1000 Вт 4 ч.
«Фрикулинг» с СЖО: JetCool представила CDU для охлаждения 300-кВт стоек горячей водой 5 ч.
Hyundai автоматизирует до 40 % автосборочных операций к концу года на своём предприятии в США при помощи роботов Boston Dynamics 5 ч.