Сегодня 14 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ChatGPT и другие ИИ-боты оказались ужасными пересказчиками новостей, показало исследование BBC

Четыре самых популярных в мире чат-бота с искусственным интеллектом допускают слишком много ошибок при подготовке сводок новостных материалов, показало исследование BBC. Неточности отмечены более чем в половине случаев.

 Источник изображения: Growtika / unsplash.com

Источник изображения: Growtika / unsplash.com

Журналисты BBC поставили эксперимент — они попросили чат-боты OpenAI ChatGPT, Microsoft Copilot, Google Gemini и Perplexity составить сводки по сотне новостных сюжетов агентства, а затем оценили ответы систем и определили, насколько точными они были. По итогам исследования «51 % всех ответов ИИ на связанные с новостями вопросы получили оценки как имеющие существенные проблемы в той или иной форме». Кроме того, «19 % ответов ИИ со ссылками на материалы BBC содержали фактические ошибки, такие как неверные фактические утверждения, числа и даты».

Чат-бот Google Gemini, в частности, радикально исказил заявление Национальной службы здравоохранения Великобритании, а ChatGPT и Copilot продолжали считать действующими вышедших в отставку политиков. Небрежное обращение ИИ с информацией носит системный характер, указывают британские журналисты: он «с трудом различал мнения и факты, разглагольствовал и зачастую пропускал существенный контекст». Ранее стало известно, что в iOS 18.3 была временно отключена входящая в пакет Apple Intelligence функция подготовки сводок по новостным материалам. Не все системы ИИ в ходе исследования показали себя одинаково: «у Microsoft Copilot и Google Gemini есть более существенные проблемы, чем у OpenAI ChatGPT и Perplexity», сделали вывод в BBC.

Эксперимент в очередной раз показал, что воспринимать информацию от чат-ботов с ИИ следует с долей скепсиса. ИИ развивается бурно, большие языковые модели выпускаются почти каждую неделю и ошибки в таком объёме данных неизбежны. С другой стороны, «галлюцинации», то есть заведомо неверные ответы у передовых систем теперь встречаются реже, чем раньше. ИИ прогрессирует быстрее, чем предполагает закон Мура, рассказал недавно в личном блоге глава OpenAI Сэм Альтман (Sam Altman). Но на данный момент излишне доверять чат-ботам всё-таки не стоит, особенно если речь идёт о новостных материалах.

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Electronic Arts анонсировала Star Wars Zero Company — тактическую стратегию по «Звёздным войнам» от бывших разработчиков XCOM 26 мин.
Лучше GPT-4o «почти по всем параметрам»: OpenAI представила флагманскую ИИ-модель GPT-4.1 35 мин.
Календарь релизов — 14–20 апреля: Mandragora: Whispers of the Witch Tree и Stygian: Outer Gods 2 ч.
Новый геймплейный трейлер подтвердил дату выхода взрывного платформера Shotgun Cop Man от создателя My Friend Pedro 2 ч.
Google создала ИИ-модель DolphinGemma для общения с дельфинами 4 ч.
«Вы не можете спланировать фильм такого масштаба по Zoom»: режиссёр «Бордерлендс» объяснил провал экранизации 4 ч.
Начался процесс, который грозит Meta потерей Instagram и WhatsApp, а также многомиллиардными убытками 5 ч.
Google устранила уязвимость в Chrome, существовавшую 23 года 7 ч.
Аудитория ChatGPT приблизилась к миллиарду пользователей благодаря аниме-картинкам 9 ч.
Почти половина любителей мобильных игр играет в них в рабочее время 9 ч.
Новая российская система RockITNet поможет компаниям повысить эффективность управления сетью 26 мин.
E Ink представила огромный 75-дюймовый дисплей на цветных электронных чернилах 2 ч.
Глава Alphabet подтвердил намерение компании потратить $75 млрд на ИИ ЦОД 2 ч.
Женский экипаж во главе с Кэти Перри слетал на границу космоса на ракете Blue Origin 3 ч.
Apple предложила отметить десятилетие смарт-часов Watch закрытием всех «Колец активности» — за это дадут значки 3 ч.
Раскрыты характеристики Radeon RX 9060 XT: 2048 потоковых процессоров и 3,2 ГГц 3 ч.
NVIDIA будет производить часть ИИ-ускорителей и платформ в США 3 ч.
Intel продала контролирующую долю в Altera частной инвестиционной компании Silver Lake 4 ч.
Nvidia запустила выпуск ИИ-чипов «Made in USA» и пообещала развивать американское производство 4 ч.
Неопределённость хуже полного запрета: тарифная политика США вряд ли поможет рынку ЦОД 5 ч.