Сегодня 12 февраля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ChatGPT и другие ИИ-боты оказались ужасными пересказчиками новостей, показало исследование BBC

Четыре самых популярных в мире чат-бота с искусственным интеллектом допускают слишком много ошибок при подготовке сводок новостных материалов, показало исследование BBC. Неточности отмечены более чем в половине случаев.

 Источник изображения: Growtika / unsplash.com

Источник изображения: Growtika / unsplash.com

Журналисты BBC поставили эксперимент — они попросили чат-боты OpenAI ChatGPT, Microsoft Copilot, Google Gemini и Perplexity составить сводки по сотне новостных сюжетов агентства, а затем оценили ответы систем и определили, насколько точными они были. По итогам исследования «51 % всех ответов ИИ на связанные с новостями вопросы получили оценки как имеющие существенные проблемы в той или иной форме». Кроме того, «19 % ответов ИИ со ссылками на материалы BBC содержали фактические ошибки, такие как неверные фактические утверждения, числа и даты».

Чат-бот Google Gemini, в частности, радикально исказил заявление Национальной службы здравоохранения Великобритании, а ChatGPT и Copilot продолжали считать действующими вышедших в отставку политиков. Небрежное обращение ИИ с информацией носит системный характер, указывают британские журналисты: он «с трудом различал мнения и факты, разглагольствовал и зачастую пропускал существенный контекст». Ранее стало известно, что в iOS 18.3 была временно отключена входящая в пакет Apple Intelligence функция подготовки сводок по новостным материалам. Не все системы ИИ в ходе исследования показали себя одинаково: «у Microsoft Copilot и Google Gemini есть более существенные проблемы, чем у OpenAI ChatGPT и Perplexity», сделали вывод в BBC.

Эксперимент в очередной раз показал, что воспринимать информацию от чат-ботов с ИИ следует с долей скепсиса. ИИ развивается бурно, большие языковые модели выпускаются почти каждую неделю и ошибки в таком объёме данных неизбежны. С другой стороны, «галлюцинации», то есть заведомо неверные ответы у передовых систем теперь встречаются реже, чем раньше. ИИ прогрессирует быстрее, чем предполагает закон Мура, рассказал недавно в личном блоге глава OpenAI Сэм Альтман (Sam Altman). Но на данный момент излишне доверять чат-ботам всё-таки, особенно если речь идёт о новостных материалах.

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Совет директоров OpenAI так и не получил официального предложения о покупке от Илона Маска 9 мин.
Жутковатое приключение Centum сотрёт границу между реальностью и вымыслом уже совсем скоро — дата выхода и новый трейлер 2 ч.
ChatGPT и другие ИИ-боты оказались ужасными пересказчиками новостей, показало исследование BBC 3 ч.
PlayStation и Kojima Productions проведут специальную презентацию Death Stranding 2: On The Beach 4 ч.
AMD выпустила бету графического драйвера с поддержкой Civilization VII, Avowed, Monster Hunter Wilds и Like a Dragon: Pirate Yakuza in Hawaii 5 ч.
Google раскрыла дату проведения мероприятия I/O 2025 через игру-головоломку 9 ч.
Microsoft исправила 55 уязвимостей, включая две критические нулевого дня 9 ч.
Meta возобновила волну увольнений сотрудников из-за «несоответствия ожиданиям» 9 ч.
«Сварить, выпить, повторить»: симулятор пивоварни в средневековом монастыре Ale Abbey откроет двери раннего доступа Steam уже совсем скоро 15 ч.
Разработчики Kingdom Come: Deliverance 2 обернули слабости Xbox Series S в хорошую оптимизацию на других платформах 17 ч.
На задворках нашей галактики обнаружен гравитационный портал — идеальное Кольцо Эйнштейна 3 мин.
Надёжность жёстких дисков выросла — статистика Backblaze показала лучшие и худшие HDD за 2024 год 10 мин.
Китайские производители чипов урежут траты на закупку оборудования в этом году 33 мин.
Тарифы Трампа сработали: TSMC ускорит запуск производства 3-нм чипов в США 34 мин.
Мобильная связь подорожала в России на 4 % в прошлом году и в 2025-м «актуализация тарифов» продолжается 35 мин.
SpaceX доставит россиянина, японца и двух американок на МКС раньше, чем планировалось — это ускорит возвращение застрявших астронавтов 2 ч.
Чили изучает возможность прокладки подводного интернет-кабеля до Антарктиды 2 ч.
iXsystems представила СХД TrueNAS H30 с возможностью создания гибридных и All-Flash конфигураций 3 ч.
Tencent Cloud открыла в Саудовской Аравии свой первый облачный регион на Ближнем Востоке 3 ч.
Крупнейший производитель iPhone готов спасти Nissan, но не купить 3 ч.