Сегодня 14 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Потребительские ИИ-боты в 80 % случаев ставят неверные диагнозы, показало исследование

Универсальность популярных чат-ботов с точки зрения поиска необходимой информации, как выясняется, не делает их пригодными для постановки точных медицинских диагнозов при ограниченном наборе данных. Более чем в 80 % случаев чат-боты ставят ошибочный диагноз, что делает их непригодными для замены консультации реального специалиста в области медицины.

 Источник изображения: Unsplash, Elen Sher

Источник изображения: Unsplash, Elen Sher

Опубликованное на страницах Jama Network Open исследование, на которое ссылается Financial Times, использовало 29 описаний клинических случаев из справочной медицинской литературы для проверки качества определения диагноза популярными чат-ботами. Исследование показало, что при передаче чат-боту ограниченной информации о симптомах большие языковые модели затрудняются с выбором возможных диагнозов, и чаще всего сводят всё к единственному варианту, на который в действительности нельзя полагаться в дальнейшем лечении. Если входные данные достаточно подробные, то таких проблем с постановкой точного диагноза уже не наблюдается.

Медицинские данные в ходе эксперимента передавались чат-ботам поэтапно, включая историю болезни, результаты осмотров и лабораторных анализов. Чат-ботам задавались вопросы на тему диагностики заболеваний, измерялась точность и полнота ответов. В выборку проверяемых ИИ-моделей попали два десятка популярных чат-ботов, включая разработанные OpenAI, Anthropic, Google, xAI и DeepSeek. При отсутствии полной информации о состоянии пациента более чем в 80 % все они демонстрировали склонность к постановке некорректного диагноза. Чем полнее была информация, тем точнее были результаты. В лучших случаях точность превышала 90 %, в среднем варианте ошибочные диагнозы ставились менее чем в 40 % случаев.

Google и Anthropic заявили, что их чат-боты при попытке пользователей получить медицинские рекомендации настоятельно рекомендуют обращаться к специалистам. OpenAI указывает в правилах использования своих сервисов, что они не должны использоваться для получения медицинских рекомендаций, требующих наличия соответствующей лицензии. xAI и DeepSeek свои комментарии на этот счёт ресурсу Financial Times не предоставили. Некоторые из указанных разработчиков создают узкоспециализированные медицинские модели. Разработанная Google AMIE, например, показывает неплохие результаты, но на её заключения сложно полагаться в полной мере, как отмечают специалисты в области медицины, поскольку живой доктор в значительной степени полагается на визуальную оценку состояния пациента. При этом такие ИИ-модели имеют право на жизнь в тех регионах, где имеются проблемы с доступом к качественной медицинской помощи в классическом её понимании.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новая статья: Fatekeeper — наконец-то Dark Messiah 2? Предварительный обзор 5 ч.
Новая статья: Gamesblender № 780: RE Veronica, Stellar Blade 2, Gears of War: E-Day, Senua — главные анонсы июня 6 ч.
Вышло приложение ASCILINE Engine для трансляции «неблокируемого» ASCII-видео 13 ч.
ИИ-стартап Mistral AI ведёт переговоры о привлечении €3 млрд при оценке в €20 млрд 13 ч.
Google начала развёртывать поисковых ИИ-агентов — но пока лишь для платных пользователей 16 ч.
Водители Tesla научились обманывать автопилот игрушечной головой — чтобы листать соцсети за рулём 18 ч.
Генпрокуроры нескольких штатов США запустили проверку в отношении OpenAI 18 ч.
Anthropic отключила передовые ИИ-модели Mythos 5 и Fable 5 для всех пользователей по требованию США 21 ч.
Новая статья: Gothic Remake — в новом теле старый дух. Рецензия 13-06 00:03
Нереалистичные сроки, неумелое руководство и страх отмены: журналисты рассказали о проблемах разработки новой Ghost Recon 12-06 19:51
Удостоверяющий центр GlobalSign начал отзыв EV-сертификатов у российских компаний, находящихся под санкциями 4 ч.
Nvidia подняла рекомендованную цену RTX Pro 6000 Blackwell до $13 250 — рост на 55 % за год 11 ч.
We will VROC you: Graid Technology продолжит активное развитие купленной у Intel технологии RAID 11 ч.
Почти как в «Дюне»: в Техасе создали куртку для сбора воды из окружающего воздуха 13 ч.
Компактный ИИ-компьютер AMD Ryzen AI Halo на Windows 11 поступил в продажу за $4000 14 ч.
Учёные создали беспроводной нейростимулятор размером с рисовое зёрнышко — он легко вводится и подавляет боль 16 ч.
Netgear обвинила американскую часть TP-Link в сохранении тесных связей с Пекином 16 ч.
SpaceX построит завод Gigasat для массового выпуска космических ИИ ЦОД 18 ч.
Состоялся первый испытательный полёт Helios Horizon — электросамолёта на твердотельных батареях 18 ч.
Asus представила блок питания ROG Thor 3000W Titanium III Edition 20 за €999 — его хватит на четыре GeForce RTX 5090 19 ч.