Сегодня 04 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Потребительские ИИ-боты в 80 % случаев ставят неверные диагнозы, показало исследование

Универсальность популярных чат-ботов с точки зрения поиска необходимой информации, как выясняется, не делает их пригодными для постановки точных медицинских диагнозов при ограниченном наборе данных. Более чем в 80 % случаев чат-боты ставят ошибочный диагноз, что делает их непригодными для замены консультации реального специалиста в области медицины.

 Источник изображения: Unsplash, Elen Sher

Источник изображения: Unsplash, Elen Sher

Опубликованное на страницах Jama Network Open исследование, на которое ссылается Financial Times, использовало 29 описаний клинических случаев из справочной медицинской литературы для проверки качества определения диагноза популярными чат-ботами. Исследование показало, что при передаче чат-боту ограниченной информации о симптомах большие языковые модели затрудняются с выбором возможных диагнозов, и чаще всего сводят всё к единственному варианту, на который в действительности нельзя полагаться в дальнейшем лечении. Если входные данные достаточно подробные, то таких проблем с постановкой точного диагноза уже не наблюдается.

Медицинские данные в ходе эксперимента передавались чат-ботам поэтапно, включая историю болезни, результаты осмотров и лабораторных анализов. Чат-ботам задавались вопросы на тему диагностики заболеваний, измерялась точность и полнота ответов. В выборку проверяемых ИИ-моделей попали два десятка популярных чат-ботов, включая разработанные OpenAI, Anthropic, Google, xAI и DeepSeek. При отсутствии полной информации о состоянии пациента более чем в 80 % все они демонстрировали склонность к постановке некорректного диагноза. Чем полнее была информация, тем точнее были результаты. В лучших случаях точность превышала 90 %, в среднем варианте ошибочные диагнозы ставились менее чем в 40 % случаев.

Google и Anthropic заявили, что их чат-боты при попытке пользователей получить медицинские рекомендации настоятельно рекомендуют обращаться к специалистам. OpenAI указывает в правилах использования своих сервисов, что они не должны использоваться для получения медицинских рекомендаций, требующих наличия соответствующей лицензии. xAI и DeepSeek свои комментарии на этот счёт ресурсу Financial Times не предоставили. Некоторые из указанных разработчиков создают узкоспециализированные медицинские модели. Разработанная Google AMIE, например, показывает неплохие результаты, но на её заключения сложно полагаться в полной мере, как отмечают специалисты в области медицины, поскольку живой доктор в значительной степени полагается на визуальную оценку состояния пациента. При этом такие ИИ-модели имеют право на жизнь в тех регионах, где имеются проблемы с доступом к качественной медицинской помощи в классическом её понимании.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Forza Horizon 6 не опоздает на старт — игра «укатила» на золото 31 мин.
Инсайдер назвал слухи о DLC для Resident Evil Requiem «полной чушью» и уточнил, когда Capcom анонсирует ремейк Resident Evil Code: Veronica 2 ч.
Инсайдеры: мультиплеерная Assassin's Creed Invictus в духе Fall Guys «просто ужасна», но Ubisoft не теряет надежды 3 ч.
Meta тестирует для Instagram метку для контента, созданного с помощью ИИ 3 ч.
«Станете самыми ненавистными людьми в Америке»: Маск угрожал руководству OpenAI перед началом судебных разбирательств 3 ч.
В открытый доступ попало 10 минут геймплея Awakening — потерянного сюжетного дополнения к Quake 4 4 ч.
Biohub Марка Цукерберга взялся ускорить лечение всех болезней с помощью ИИ-моделей клеток 7 ч.
Развитие ИИ замедляется из-за переизбытка бесполезных данных — их слишком много 7 ч.
Кооперативный шутер о приключениях роботов-ковбоев на Диком Западе стал новым хитом Steam — полмиллиона проданных копий Far Far West 8 ч.
Долгожданное воссоединение: моддер добавил в Resident Evil Requiem торговца из ремейка Resident Evil 4 9 ч.
Intel переманила ветерана Qualcomm — курс на ИИ и робототехнику усиливается 53 мин.
«Поставщики с высоким риском»: Еврокомиссия порекомендовала странам ЕС убрать оборудование Huawei и ZTE из сетей 57 мин.
Nvidia теперь на 90 % зависит от азиатских поставщиков — в прошлом году было 65 % 2 ч.
За пылью Млечного Пути скрывался гигант: астрономы пересчитали сверхскопление Вела — оно мощнее Великого аттрактора 2 ч.
Профессиональную видеокарту Intel Arc Pro B70 протестировали в играх — на треть быстрее игровой Arc B580 и чуть похуже GeForce RTX 5060 Ti 16GB 4 ч.
Samsung загружена заказами на выпуск 4-нм чипов до конца следующего года 4 ч.
В кабеле питания Asus ROG Equalizer за $50 «нет никакого смысла», а удаление встроенного мостика улучшает баланс тока, говорит Der8auer 4 ч.
На фоне торговой войны США и Китая Huawei прогнозирует рост выручки от продажи ИИ-чипов на 60 % 7 ч.
MSI IPC выпустила 3,5″ одноплатный компьютер MS-CF27 с четырьмя портами 2.5GbE 7 ч.
Электромобили Tesla намотали 16 млрд км в автономном режиме: ранее Илон Маск обещал, что это позволит им отказаться от надзора водителя 7 ч.