Сегодня 03 мая 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ChatGPT был близок к сдаче экзамена на получение лицензии врача в США

Алгоритм большой языковой модели (LLM) ChatGPT компании OpenAI почти сдал экзамен на получение лицензии врача в США. Это очень сложное испытание для кандидата-человека, но ИИ-бот оказался близок к сдаче экзамена без обучения с подтверждением — на базе одного лишь поиска информации в интернете. Впрочем, лечить людей с его помощью пока никто не собирается, хотя этому помешает скорее юридическая сторона проблемы, а не практическая.

 Источник изображения: Pixabay

Источник изображения: Pixabay

Алгоритм ChatGPT уже удивил способностью писать программный код, сдачей экзамена в бизнес-школу и другими интеллектуальными штучками. Попытка сдать экзамен US Medical Licensing Exam (USMLE) стала очередным достижением машинного алгоритма. Человеку соискателю требуются от 300 до 400 часов подготовки для сдачи этого экзамена, фактически состоящего из трёх разделов. Способность ChatGPT научиться связно и по теме давать ответы на экзаменационные вопросы USMLE позволяет надеяться, что когда-нибудь ИИ сможет либо сам давать медицинские консультации, либо, что более вероятно, станет помощником врача для постановки более точных диагнозов.

«ChatGPT показал результаты на уровне или близком к порогу сдачи всех трёх экзаменов без какого-либо специального обучения или подкрепления, — пишут исследователи в опубликованной работе. — Кроме того, ChatGPT продемонстрировал высокий уровень согласованности и проницательности в своих объяснениях».

Исследование провели специалисты из стартапа Ansible Health. Предварительно было выяснено, что прямых ответов на вопросы USMLE в интернете нет. Таким образом, ChatGPT генерировал новые ответы на основе данных, полученных им по теме вопросов.

При проходном балле в районе 60 % правильных ответов на все вопросы, ChatGPT набрал от 52,4 % до 75 % по всем трём экзаменам. В 88,9 % ответов алгоритм выдавал как минимум один значимый ответ, который исследователи квалифицировали как «новый и неочевидный хотя клинически обоснованный».

«Достижение проходного балла на этом печально известном сложном экспертном экзамене, причём без какого-либо человеческого подкрепления, знаменует собой заметную веху в развитии клинического ИИ», — говорится в заявлении авторов исследования для прессы.

Более того, в точности ответов ChatGPT на 50,3 % обошёл специально обученного для ответов на такие вопросы медицинский ИИ PubMedGPT. Что же будет, если специалист-человек натаскает ChatGPT на медицинскую квалификацию?

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Хакеры украли почти все данные пользователей сервиса цифровой подписи Dropbox Sign 9 ч.
«Буду слишком занят этим, чтобы с нетерпением ждать TES VI»: видео о прогрессе разработки фанатского ремейка Morrowind на движке Skyrim воодушевило игроков 10 ч.
С новым патчем Starfield стала работать на ПК «заметно лучше», но лишь в некоторых ситуациях 11 ч.
«Базис» купила конкурента и планирует занять не менее половины российского рынка виртуализации 11 ч.
Apple освободила разработчиков бесплатных приложений от уплаты €0,5 за каждую первую установку 11 ч.
Космическая стратегия Sins of a Solar Empire II выйдет в Steam после полутора лет пребывания в EGS 13 ч.
На 20-летие российской стратегии «Периметр» в Steam выйдет переиздание со «множеством улучшений» — трейлер «Периметр: Legate Edition» 13 ч.
TikTok вновь стал доступен в России, но ненадолго 13 ч.
Winamp возродится в качестве стримингового сервиса 1 июля — обещана и новая версия классического плеера 13 ч.
Microsoft добавила поддержку ключей Passkey для всех потребительских аккаунтов 14 ч.
Удаление оборудования Huawei и ZTE из сетей связи США забуксовало из-за нехватки финансирования 20 мин.
Joby Aviation завершила программу тестирования предсерийных прототипов летающих такси 3 ч.
По мнению учёных, интенсивное расширение спутниковой сети Starlink повышает риск столкновений в космосе 4 ч.
Новость о падении выручки на 4 % компания Apple подсластила заявлением о выкупе акций на $110 млрд 5 ч.
Не прошло и года: системы на AMD Zen 2 получили прошивки, устраняющие уязвимость Zenbleed 9 ч.
Новая статья: Обзор Hyundai H-LED55QBU7500: недорогой телевизор с QLED-экраном 55" 10 ч.
Samsung планирует выпустить «новые премиальные смарт-часы» 11 ч.
Asus выпустила первые в мире двухвентиляторные Radeon RX 7900 XT и RX 7900 XTX 12 ч.
Vivo представила смартфон среднего уровня Y38 5G на чипе Snapdragon 4 Gen 2 14 ч.
BenQ выпустила профессиональный 24-дюймовый монитор SW242Q со встроенным кардридером и USB Type-C 14 ч.