Сегодня 20 августа 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Microsoft представила три новые малые ИИ-модели семейства Phi-4

Microsoft выпустила три новые малые языковые модели (SLM) с открытой лицензией: Phi-4-mini-reasoning, Phi-4-reasoning и Phi-4-reasoning-plus. Каждая из моделей относится к классу рассуждающих (reasoning) моделей, ориентированных на логическую верификацию решений и тщательную проработку сложных задач. Эти ИИ-модели стали продолжением инициативы Microsoft по разработке компактных ИИ-систем — семейства Phi, впервые представленного год назад как фундамент для приложений, работающих на устройствах с ограниченными вычислительными возможностями.

 Источник изображения: Jackson Sophat / Unsplash

Источник изображения: Jackson Sophat / Unsplash

Наиболее производительной из представленных является ИИ-модель Phi-4-reasoning-plus. Она представляет собой адаптацию ранее выпущенной Phi-4 под задачи логического вывода. По утверждению Microsoft, её качество ответов близко к DeepSeek R1, несмотря на существенную разницу в объёме параметров: у DeepSeek R1 — 671 млрд, тогда как у Phi-4-reasoning-plus их значительно меньше. Согласно внутреннему тестированию Microsoft, эта модель показала результаты, соответствующие ИИ-модели OpenAI o3-mini в рамках бенчмарка OmniMath, оценивающего математические способности ИИ.

 Модели Phi-4-reasoning и Phi-4-reasoning-plus (14 млрд параметров) демонстрируют превосходство над базовой Phi-4 и уверенно конкурируют с более крупными системами, включая DeepSeek-R1 Distill (70 млрд параметров) и OpenAI o3-mini, в задачах математического и логического мышления (AIME, HMMT, OmniMath, GPQA). Источник изображения: Microsoft

Модели Phi-4-reasoning и Phi-4-reasoning-plus (14 млрд параметров) демонстрируют превосходство над базовой Phi-4 и уверенно конкурируют с более крупными системами, включая DeepSeek-R1 Distill (70 млрд параметров) и OpenAI o3-mini, в задачах математического и логического мышления (AIME, HMMT, OmniMath, GPQA). Источник изображения: Microsoft

Модель Phi-4-reasoning содержит 14 млрд параметров и обучалась на основе «качественных» данных из интернета, а также на отобранных демонстрационных примерах из o3-mini. Она оптимизирована для задач в области математики, естественных наук и программирования. Таким образом, Phi-4 reasoning ориентирована на высокоточные вычисления и аналитическую интерпретацию данных, оставаясь при этом относительно компактной и доступной для использования на локальных вычислительных платформах.

 На универсальных тестах, включая FlenQA, IFEval, HumanEvalPlus, MMLUPro, ToxiGen и PhiBench, модели Phi-4-reasoning-plus демонстрируют точность, сопоставимую с GPT-4o и o3-mini, несмотря на меньший объём параметров (14 млрд параметров), особенно в задачах программирования, логики и безопасности. Источник изображения: Microsoft

На универсальных тестах, включая FlenQA, IFEval, HumanEvalPlus, MMLUPro, ToxiGen и PhiBench, модели Phi-4-reasoning-plus демонстрируют точность, сопоставимую с GPT-4o и o3-mini, несмотря на меньший объём параметров (14 млрд параметров), особенно в задачах программирования, логики и безопасности. Источник изображения: Microsoft

Phi-4-mini-reasoning — самая малогабаритная из представленных SLM. Её размер составляет около 3,8 млрд параметров. Она обучалась на основе приблизительно 1 млн синтетических математических задач, сгенерированных ИИ-моделью R1 китайского стартапа DeepSeek. Microsoft позиционирует её как ИИ-модель для образовательных сценариев, включая «встроенное обучение» на маломощных и мобильных устройствах. Благодаря компактности и точности, эта ИИ-модель может применяться в интерактивных обучающих системах, где приоритетом являются скорость отклика и ограниченность вычислительных ресурсов.

 Phi-4-mini-reasoning (3,8 млрд параметров) значительно превосходит свою базовую версию и модели с вдвое большим размером на бенчмарках AIME 24, MATH-500 и GPQA Diamond, а также сопоставима или превосходит OpenAI o1-mini по точности генерации длинных математических ответов. Источник изображения: Microsoft

Phi-4-mini-reasoning (3,8 млрд параметров) значительно превосходит свою базовую версию и модели с вдвое большим размером на бенчмарках AIME 24, MATH-500 и GPQA Diamond, а также сопоставима или превосходит OpenAI o1-mini по точности генерации длинных математических ответов. Источник изображения: Microsoft

Все три ИИ-модели доступны на платформе Hugging Face и распространяются под открытой лицензией. По словам Microsoft, при их обучении использовались дистилляция, обучение с подкреплением и высококачественные обучающие данные. Эти методы позволили сбалансировать размер SLM и их вычислительную производительность. ИИ-модели достаточно компактны, чтобы использоваться в средах с низкой задержкой, но при этом способны решать задачи, требующие строгости логического построения и достоверности результата. Ранее такие задачи были характерны лишь для гораздо более крупных ИИ.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Соболезную фанатам, которые ждали так долго»: новый трейлер Vampire: The Masquerade — Bloodlines 2 подтвердил дату релиза и разозлил игроков 4 ч.
Разработчики Black Myth: Wukong анонсировали фэнтезийный боевик Black Myth: Zhong Kui, но «путешествие на Запад ещё не окончено» 5 ч.
Новая статья: Vampire: The Masquerade — Bloodlines 2 — у крови странный привкус. Предварительный обзор 6 ч.
Авторы Ghostrunner анонсировали Valor Mortis — экшен от первого лица в стиле Dark Souls про восставшего из мёртвых солдата армии Наполеона 7 ч.
Первый геймплейный трейлер Call of Duty: Black Ops 7 подтвердил утечку даты выхода и «бесконечный» эндгейм сюжетной кампании 7 ч.
Спасать BioShock 4 из производственного ада доверили экс-руководителю Diablo 8 ч.
Phison пообещала разобраться с ломающим SSD обновлением Windows 11 24H2 8 ч.
Adobe представила Acrobat Studio — платформу на базе ИИ для работы со множеством разношёрстных файлов 8 ч.
Nvidia выпустила драйвер с поддержкой Smooth Motion и глобальными настройками DLSS Override для карт RTX 40-й серии 9 ч.
Dragon Age: The Veilguard, возвращение Persona 4 Golden и новые релизы: Microsoft раскрыла, какие игры пополнят Game Pass в конце августа 9 ч.
NVIDIA готовит для Китая урезанный ИИ-ускоритель на архитектуре Blackwell 6 ч.
Foxconn будет производить ИИ-оборудование для проекта Stargate на заводе, который она продала SoftBank 6 ч.
LG представила 49-дюймовый монитор UltraWide 49U950A-W — DWQHD, 144 Гц и зарядка на 90 Вт 6 ч.
Google почти бесплатно обогреет жителей целого города в Финляндии «мусорным» теплом дата-центра 7 ч.
Asus представила геймерские мониторы с панелями Tandem OLED и разгоном до 720 Гц 7 ч.
Xbox Ally получит всего четыре ядра Zen 2 — не ровня Xbox Ally X с восьмёркой Zen 5 7 ч.
Каждый россиянин теперь тратит на мобильную связь в среднем более 1100 рублей в месяц 8 ч.
SoftBank рассматривала поглощение Intel Foundry, но в итоге ограничилась инвестициями в $2 млрд 9 ч.
Asus представила ROG Matrix GeForce RTX 5090 30th Anniversary Limited Edition с четырьмя вентиляторами и TDP до 800 Вт 10 ч.
«Комета Дьявола» укрепила теорию о внеземном происхождении воды на Земле 11 ч.