Сегодня 09 октября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ChatGPT и другие ИИ-боты оказались ужасными пересказчиками новостей, показало исследование BBC

Четыре самых популярных в мире чат-бота с искусственным интеллектом допускают слишком много ошибок при подготовке сводок новостных материалов, показало исследование BBC. Неточности отмечены более чем в половине случаев.

 Источник изображения: Growtika / unsplash.com

Источник изображения: Growtika / unsplash.com

Журналисты BBC поставили эксперимент — они попросили чат-боты OpenAI ChatGPT, Microsoft Copilot, Google Gemini и Perplexity составить сводки по сотне новостных сюжетов агентства, а затем оценили ответы систем и определили, насколько точными они были. По итогам исследования «51 % всех ответов ИИ на связанные с новостями вопросы получили оценки как имеющие существенные проблемы в той или иной форме». Кроме того, «19 % ответов ИИ со ссылками на материалы BBC содержали фактические ошибки, такие как неверные фактические утверждения, числа и даты».

Чат-бот Google Gemini, в частности, радикально исказил заявление Национальной службы здравоохранения Великобритании, а ChatGPT и Copilot продолжали считать действующими вышедших в отставку политиков. Небрежное обращение ИИ с информацией носит системный характер, указывают британские журналисты: он «с трудом различал мнения и факты, разглагольствовал и зачастую пропускал существенный контекст». Ранее стало известно, что в iOS 18.3 была временно отключена входящая в пакет Apple Intelligence функция подготовки сводок по новостным материалам. Не все системы ИИ в ходе исследования показали себя одинаково: «у Microsoft Copilot и Google Gemini есть более существенные проблемы, чем у OpenAI ChatGPT и Perplexity», сделали вывод в BBC.

Эксперимент в очередной раз показал, что воспринимать информацию от чат-ботов с ИИ следует с долей скепсиса. ИИ развивается бурно, большие языковые модели выпускаются почти каждую неделю и ошибки в таком объёме данных неизбежны. С другой стороны, «галлюцинации», то есть заведомо неверные ответы у передовых систем теперь встречаются реже, чем раньше. ИИ прогрессирует быстрее, чем предполагает закон Мура, рассказал недавно в личном блоге глава OpenAI Сэм Альтман (Sam Altman). Но на данный момент излишне доверять чат-ботам всё-таки не стоит, особенно если речь идёт о новостных материалах.

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Приложение OpenAI Sora скачали 1 млн раз менее чем за пять дней 6 мин.
Heroes of Might & Magic: Olden Era всё-таки не выйдет в 2025 году, но есть и хорошая новость — в Steam доступна демоверсия 7 мин.
В Steam и на консолях вышел фэнтезийный боевик Absolum — гибрид роглайта и beat ‘em up с духом легендарных аркад прошлого 60 мин.
Российская платформа управления серверной виртуализацией VMmanager получила крупное обновление 2 ч.
Bethesda привлекла авторов фанатской энциклопедии «Древних Свитков» к созданию персонажа в The Elder Scrolls VI 3 ч.
Ремастер ролевого экшена Sacred 2: Fallen Angel с улучшенной графикой и современным интерфейсом выйдет 11 ноября 3 ч.
Человечество приняло ИИ быстрее, чем интернет 4 ч.
«Безответственный» ИИ: большинство компаний пока несут финансовые потери, связанные с внедрением ИИ 4 ч.
Доступ в интернет по выходным сохранится — Минцифры отрицает планы по отключению России от всемирной сети 4 ч.
В Сбербанке началось массовое сокращение IT-специалистов, которое объясняют внедрением ИИ 6 ч.
Valve запустила массовое производство VR-гарнитуры Steam Frame — анонс ожидается до конца года 9 мин.
Ferrari анонсировала свой первый электрокар Elettrica: четыре мотора, 1000 л.с., запас хода 530 км и усилитель рёва 18 мин.
Blue Origin готовит второй запуск тяжёлой ракеты New Glenn — компания хочет попытаться вернуть первую ступень 32 мин.
«МТС Банк» встроил банковскую карту в SIM, и теперь бесконтактная оплата работает даже в кнопочном телефоне 2 ч.
Российские цены на тонкий Apple iPhone Air упали на треть за две недели 3 ч.
Intel представила графическую архитектуру Xe3 для Panther Lake и пообещала прибавку в производительности на 50 % 3 ч.
SoftBank объявила о покупке робототехнического подразделения ABB Group 3 ч.
Intel представила апскейлер XeSS 3 и технологию мультикадровой генерации XeSS-MFG 3 ч.
Motorola готовит к выпуску радикально тонкий Moto Edge 70, который превзойдёт конкурентов аккумулятором 4 ч.
Уровень проникновения архитектуры RISC-V на рынке достиг 25 % — намного быстрее, чем все ожидали 5 ч.