Сегодня 08 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Медицинский ИИ от Google превзошёл GPT-4 и даже живых докторов

Google Research и исследовательская лаборатория Google в области искусственного интеллекта DeepMind сообщили подробности о семействе передовых больших языковых моделей Med-Gemini, разработанных для применения в сфере здравоохранения.

 Источник изображения: geralt/Pixabay

Источник изображения: geralt/Pixabay

ИИ-модели всё ещё находятся на стадии исследования, но авторы разработок утверждают, что Med-Gemini, основанные на модели Google Gemini, превосходят конкурирующие модели, такие как GPT-4 от OpenAI, обладают огромным потенциалом в клинической диагностике и превосходят отраслевые стандарты в 14 популярных профильных бенчмарках. В частности, в тесте MedQA (USMLE) модель Med-Gemini достигла точности 91,1 %, используя стратегию поиска, основанную на неопределённости, превзойдя медицинскую LLM Med-PaLM 2 компании Google на 4,5 %. Набор моделей также превзошёл людей в обобщении медицинских текстов и составлении рекомендаций, причём врачи в половине случаев оценивали ответы Med-Gemini-M 1.0 как хорошие или даже лучше, чем ответы экспертов.

Med-Gemini — это семейство больших мультимодальных моделей (LMM), каждая из которых имеет своё предназначение. В отличие от больших языковых моделей, которые «демонстрируют неоптимальные клинические рассуждения в условиях неопределённости», страдают галлюцинациями и предвзятостью, Med-Gemini дают «фактически более точные, надёжные и детальные результаты для сложных задач клинического обоснования», чем их конкуренты, включая GPT-4, утверждает Google.

По семи мультимодальным бенчмаркам, включая проверку по изображениям New England Journal of Medicine (NEJM), модель Med-Gemini показала гораздо лучшие результаты, чем GPT-4.

Чтобы проверить способность Med-Gemini понимать и рассуждать на основе длинной контекстной медицинской информации, исследователи с успехом выполнили с её помощью так называемую задачу поиска «иголки в стоге сена», используя большую общедоступную базу данных Medical Information Mart for Intensive Care (MIMIC-III), содержащую обезличенные данные о состоянии здоровья пациентов, поступивших в отделение интенсивной терапии.

Поддержка Med-Gemini эффективного поиска в базе данных электронных медицинских карт Electronic Health Record (EHR) позволит «значительно снизить когнитивную нагрузку и расширить возможности врачей за счёт эффективного извлечения и анализа важной информации из огромных объёмов данных пациентов», утверждает Google.

По словам исследователей, Med-Gemini также показывают хорошие результаты в медицинских тестах, медицинских знаниях, клинических рассуждениях, геномике, медицинской визуализации, медицинских записях и видео.

Вместе с тем Google заявила, что её модели нуждаются в большей доработке и специализации, прежде чем их можно будет использовать в здравоохранении.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
YouTube полон нелегального контента, показало исследование 36 мин.
Apple одумалась: Liquid Glass стал менее прозрачным и более читаемым в новой бете iOS 26 2 ч.
Epic Games помирилась с Samsung — за блокировку сторонних магазинов на Android теперь ответит только Google 3 ч.
Календарь релизов — 7–13 июля: Tony Hawk’s Pro Skater 3 + 4, Mycopunk и Ground of Aces 3 ч.
Capcom побоялась проводить лекцию об оптимизации Monster Hunter Wilds на фоне «крайне отрицательных» обзоров в Steam 4 ч.
В TON Foundation признали, что заморозка TON на $100 000 не гарантирует «золотую визу» ОАЭ 4 ч.
Конкурент Netflix? Трамп запустил «устойчивый к цензуре» стриминговый сервис Truth+ 4 ч.
Уволенный сооснователь Unknown Worlds заявил, что Subnautica 2 готова к выходу в ранний доступ, но Krafton с этим не согласна 5 ч.
Apple привлекла ИИ, чтобы помочь незрячим «увидеть» улицы — SceneScout покажет путь голосом 6 ч.
«Игра, от которой невозможно отказаться»: журналисты показали 9 минут геймплея Mafia: The Old Country 6 ч.
CoreWeave всё-таки купила оператора ЦОД Core Scientific, но в девять раз дороже, чем когда-то планировала 38 мин.
Новая статья: Обзор смартфона HONOR 400: реаниматор 2 ч.
Tecno показала смартфон-гармошку Phantom Ultimate G Fold, обскакав Samsung 2 ч.
Бренд Trouver дебютировал в России с роботами-пылесосами P50 Ultra и P50 Pro Ultra 6 ч.
ChatGPT справился с управлением космическим кораблём, но пока только в симуляции 7 ч.
Характеристики Galaxy Z Fold 7 и других новых складных смартфонов Samsung раскрыты в преддверии презентации 7 ч.
Российская электроника страдает от заниженных цен в госзакупках — виноваты иностранные производители 8 ч.
CoolIT за полтора года в 25 раз увеличила производство СЖО для ИИ-серверов и ЦОД 10 ч.
На TSMC подали в суд за дискриминацию «ленивых» американских сотрудников, расизм и домогательства на заводе в США 10 ч.
Пошлины США и геополитическая напряжённость притормозили рост поставок ИИ-серверов в 2025 году 10 ч.