Сегодня 17 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Microsoft представила Phi-3 Mini — самую маленькую ИИ-модель, которую учили на «детских книгах»

Компания Microsoft представила следующую версию своей модели искусственного интеллекта Phi-3 Mini. Она стала первой из трёх небольших ИИ-моделей, которые софтверный гигант планирует выпустить в свет.

 Источник изображения: geralt/Pixabay

Источник изображения: geralt/Pixabay

Phi-3 Mini с 3,8 млрд параметров обучается на наборе данных, который меньше по сравнению с массивом, используемым для обучения больших языковых моделей (LLM), таких как GPT-4. В настоящее время Phi-3 Mini доступна на облачной платформе Azure, а также в Hugging Face и Ollama. В дополнение к этому Microsoft планирует выпустить ИИ-модели Phi-3 Small с 7 млрд параметров и Phi-3 Medium с 14 млрд параметров.

В декабре прошлого года Microsoft выпустила модель Phi-2, которая работала так же хорошо, как и более крупные модели, такие как Llama 2. По словам разработчиков, Phi-3 работает лучше предыдущей версии и может давать ответы, близкие к тем, что дают модели в 10 раз больше. Корпоративный вице-президент Microsoft Azure AI Platform Эрик Бойд (Eric Boyd) заявил, что Phi-3 Mini по своим возможностям не уступает таким LLM, как GPT-3.5, и выполнена «в меньшем форм-факторе».

По сравнению с более крупными аналогами, небольшие ИИ-модели обычно дешевле в эксплуатации и лучше работают на персональных устройствах, таких как смартфоны и ноутбуки. В начале этого года СМИ писали, что Microsoft создала отдельную команду для разработки именно небольших ИИ-моделей. Наряду с Phi компания также создала модель Orca-Math, которая ориентирована на решение математических задач.

Конкуренты Microsoft занимаются разработкой небольших ИИ-моделей, многие из которых нацелены на решение более простых задач, таких как обобщение документов или помощь в написании программного кода. К примеру, модели Gemma 2B и 7B от Anthropic могут обрабатывать большие научные статьи с графиками и быстро обобщать их, а недавно выпущенная модель Llama 3 от Meta может использоваться для создания чат-ботов и помощи в написании кода.

По словам Бойда, разработчики обучали Phi-3 по «учебному плану». Они вдохновлялись тем, как дети учатся на сказках, читаемых перед сном. Это книги с более простыми словами и структурами предложений, но в то же время зачастую в них поднимаются важные темы. Поскольку существующей литературы для детей при тренировке Phi-3 не хватало, разработчики взяли список из более чем 3000 тем и попросили большие языковые модели написать дополнительные «детские книги» специально для обучения Phi-3.

Бойд добавил, что Phi-3 просто развивает дальше то, чему обучились предыдущие итерации ИИ-модели. Если Phi-1 была ориентирована на кодирование, а Phi-2 начала учиться рассуждать, то Phi-3 ещё лучше справляется с кодированием и рассуждениями. Хотя модели семейства Phi-3 обладают некоторыми общими знаниями, они не могут превзойти GPT-4 или другие LLM по широте охвата.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Capcom пообещала уберечь Resident Evil Requiem от судьбы Monster Hunter Wilds, которая даже спустя восемь месяцев страдает от проблем с оптимизацией 8 мин.
Программный «ускоритель» Huawei обещает практически удвоить производительность дефицитных ИИ-чипов 2 ч.
Разработчики Pioner «с удвоенной силой» взялись за исправление главных проблем открытой «беты» и готовят новое тестирование 5 ч.
Бегун, который так и не вышел на старт: в Techland раскрыли подробности отменённой Dying Light 6 ч.
Глава Microsoft считает, что ИИ не должен обогащать лишь кучку техногигантов 7 ч.
Новая Splinter Cell умерла из-за увлечения Ubisoft играми-сервисами 8 ч.
«Базис» представляет новую версию Basis Dynamix Enterprise с поддержкой программно-определяемых сетей и зон доступности 9 ч.
Игровой движок Unreal Engine 6 выпустят значительно раньше ожидаемого 22 ч.
Apple сократила вдвое комиссию для разработчиков мини-приложений 22 ч.
В Госдуме предлагают штрафовать российские ресурсы за авторизацию пользователей через Gmail 16-11 15:52
Colorful выпустила видеокарты iGame Ultra Z BTF 2.0 с «невидимым» питанием 2 ч.
Перегрузка энергосетей угрожает лидерству Нидерландов в сфере ЦОД — доступный водород продолжают игнорировать 2 ч.
Больше $300 млрд за пятилетку Samsung вложит в производство чипов, аккумуляторов и не только 3 ч.
Huawei представит технологию, позволяющую выжать из дефицитных ИИ-чипов максимум 3 ч.
Veir испытала сверхпроводящие кабели для ЦОД — до 3 МВт на впятеро большее расстояние, чем у обычных 5 ч.
Создатель ИИ-гаджета Rabbit R1 перестал платить зарплаты, но ожидает инвестиций на новое устройство 5 ч.
Стало известно, когда на дорогах России появятся беспилотные грузовики без людей в кабине 5 ч.
Huawei раскрыла дату анонса флагманов Mate 80 и складного Mate X7 5 ч.
Silicon Motion представила контроллер SM8388 для QLC SSD с интерфейсом PCIe 5.0 6 ч.
Nokia представила коммутаторы с пропускной способностью до 102,4 Тбит/с 6 ч.