Сегодня 16 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Компактная модель Phi-3-vision от Microsoft умеет «читать» изображения

Компания Microsoft анонсировала ИИ-модель Phi-3-vision, новую версию своей небольшой языковой модели Phi-3, способную просматривать изображения и рассказывать пользователю о том, что на них изображено. Phi-3-vision является мультимодальной ИИ-моделью, обладающей способностью читать текст и просматривать изображения, предназначенной для использования в первую очередь на мобильных устройствах.

 Источник изображения: geralt/Pixabay

Источник изображения: geralt/Pixabay

Как сообщает Microsoft, Phi-3-vision, доступная в виде предварительной версии, представляет собой модель с 4,2 млрд параметров, которая может выполнять общие задачи на визуальное мышление, включая ответы на вопросы о диаграммах или изображениях.

Phi-3-vision гораздо меньше других ИИ-моделей, ориентированных на работу с изображениями, таких как DALL-E от OpenAI или Stable Diffusion от Stability AI. В отличие от этих моделей, Phi-3-vision не генерирует изображения, хотя способна понимать, что изображено на картинке, и анализировать изображение по запросу пользователя.

Microsoft представила модель Phi-3 в апреле, выпустив Phi-3-mini, самую маленькую модель семейства Phi-3 с 3,8 млрд параметров. Семейство Phi-3 также включает модель Phi-3-small (7 млрд параметров) и Phi-3-medium (14 млрд параметров).

Разработчики начали выпуск небольших и лёгких ИИ-моделей, таких как Phi-3, в связи с ростом спроса на использование более экономичных и менее ресурсоёмких сервисов ИИ. Небольшие ИИ-модели не занимают много места в памяти и поэтому их можно использовать на телефонах и ноутбуках.

Microsoft выпустила ряд небольших моделей в дополнение к Phi-3 и её предшественнику Phi-2. Её модель Orca-Math, ориентированная на решение математических задач, как сообщается, отвечает на математические вопросы лучше, чем более крупные аналоги, такие как Gemini Pro от Google.

ИИ-модели Phi-3-mini, Phi-3-small и Phi-3-medium уже доступны для использования и присутствуют в библиотеке моделей Azure.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новая статья: Dispatch — помощь уже в пути. Рецензия 6 ч.
Новая статья: Gamesblender № 752: три «железных» анонса Valve, новый перенос GTA VI и «конечная» Halo Infinite 6 ч.
Grokipedia Илона Маска основывается на сомнительных источниках, заявили учёные 10 ч.
В соцсети X появился полноценный мессенджер с шифрованием 12 ч.
Илон Маск перенёс выпуск ИИ-модели Grok 5 на следующий год — есть вероятность, что она будет на уровне человека 13 ч.
Logitech подтвердила утечку данных со своих серверов после вымогательской атаки хакерами Clop 13 ч.
Broadcom упростила сертификацию оборудования для VCF для ускорения внедрения современных частных облаков 14 ч.
Meta начнёт оценивать сотрудников по их навыкам работы с ИИ 14 ч.
Восемь лет «беты» подошли к концу: в Steam и лаунчере Battlestate Games вышла релизная версия Escape from Tarkov 15 ч.
Grokipedia потеряла более 90 % трафика всего за несколько недель после запуска 17 ч.