Сегодня 13 февраля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ChatGPT и другие ИИ-боты оказались ужасными пересказчиками новостей, показало исследование BBC

Четыре самых популярных в мире чат-бота с искусственным интеллектом допускают слишком много ошибок при подготовке сводок новостных материалов, показало исследование BBC. Неточности отмечены более чем в половине случаев.

 Источник изображения: Growtika / unsplash.com

Источник изображения: Growtika / unsplash.com

Журналисты BBC поставили эксперимент — они попросили чат-боты OpenAI ChatGPT, Microsoft Copilot, Google Gemini и Perplexity составить сводки по сотне новостных сюжетов агентства, а затем оценили ответы систем и определили, насколько точными они были. По итогам исследования «51 % всех ответов ИИ на связанные с новостями вопросы получили оценки как имеющие существенные проблемы в той или иной форме». Кроме того, «19 % ответов ИИ со ссылками на материалы BBC содержали фактические ошибки, такие как неверные фактические утверждения, числа и даты».

Чат-бот Google Gemini, в частности, радикально исказил заявление Национальной службы здравоохранения Великобритании, а ChatGPT и Copilot продолжали считать действующими вышедших в отставку политиков. Небрежное обращение ИИ с информацией носит системный характер, указывают британские журналисты: он «с трудом различал мнения и факты, разглагольствовал и зачастую пропускал существенный контекст». Ранее стало известно, что в iOS 18.3 была временно отключена входящая в пакет Apple Intelligence функция подготовки сводок по новостным материалам. Не все системы ИИ в ходе исследования показали себя одинаково: «у Microsoft Copilot и Google Gemini есть более существенные проблемы, чем у OpenAI ChatGPT и Perplexity», сделали вывод в BBC.

Эксперимент в очередной раз показал, что воспринимать информацию от чат-ботов с ИИ следует с долей скепсиса. ИИ развивается бурно, большие языковые модели выпускаются почти каждую неделю и ошибки в таком объёме данных неизбежны. С другой стороны, «галлюцинации», то есть заведомо неверные ответы у передовых систем теперь встречаются реже, чем раньше. ИИ прогрессирует быстрее, чем предполагает закон Мура, рассказал недавно в личном блоге глава OpenAI Сэм Альтман (Sam Altman). Но на данный момент излишне доверять чат-ботам всё-таки не стоит, особенно если речь идёт о новостных материалах.

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Доступ к китайскому ИИ-боту Ernie Bot от Baidu станет бесплатным с 1 апреля 3 мин.
Адреналиновый шутер Metal Eden от создателей Ruiner получил геймплейный трейлер и дату релиза — это смесь Doom Eternal, Titanfall 2 и Metroid 16 мин.
CISPE: Microsoft пообещала реформировать лицензирование своего ПО, но «отклонилась от курса» 60 мин.
«Мои мечты сбылись»: экшен Stellar Blade выйдет на ПК вместе с дополнением по Goddess of Victory: Nikke 2 ч.
Konami подтвердила дату выхода и системные требования Metal Gear Solid Delta: Snake Eater 2 ч.
У половины IT-систем критической инфраструктуры России обнаружена критически слабая защита от киберугроз 2 ч.
Видео: трейлер космического хоррора Directive 8020 от создателей Until Dawn и серии The Dark Pictures Anthology 3 ч.
OpenAI обновила правила поведения для ИИ: нет подхалимству и избеганию деликатных тем 3 ч.
Разрушенный Лондон, рыцари Круглого стола и влияние Shadow of the Colossus: анонсирован зрелищный боевик Tides of Annihilation 4 ч.
«Всё, что делает Hazelight, становится хитом»: сюжетный трейлер кооперативного приключения Split Fiction ожидаемо понравился игрокам 5 ч.
Производитель сверхбыстрого полого оптоволокна Relativity Networks привлёк $4,6 млн 37 мин.
В России научились синтезировать «чернила» из керамики для печати транзисторов и не только 48 мин.
Realme выпустила смартфон GT 7 Pro Racing Edition — минус одна камера, плюс обходная зарядка и быстрая память 57 мин.
HPE представила серверы ProLiant Compute Gen12 на базе Intel Xeon 6700 2 ч.
Отчёт Sony: продажи PlayStation 5 перевалили за 75 млн, а аудитория PSN выросла до 129 млн пользователей 2 ч.
Honda и Nissan прекратили переговоры о слиянии, но не отказываются от сотрудничества 2 ч.
Samsung увеличит выпуск 4-нм чипов для себя и китайских разработчиков систем для майнинга 4 ч.
Китай впервые запустил улучшенную ракету «Чанчжэн-8А» с повышенной на 40 % грузоподъёмностью — она поможет создать конкурента Starlink 4 ч.
Слухи «отложили» анонс нового iPhone SE на следующую неделю 5 ч.
Samsung наладит выпуск 286-слойной NAND в Китае, чтобы не отставать от местной YMTC 5 ч.