Сегодня 02 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Компактная модель Phi-3-vision от Microsoft умеет «читать» изображения

Компания Microsoft анонсировала ИИ-модель Phi-3-vision, новую версию своей небольшой языковой модели Phi-3, способную просматривать изображения и рассказывать пользователю о том, что на них изображено. Phi-3-vision является мультимодальной ИИ-моделью, обладающей способностью читать текст и просматривать изображения, предназначенной для использования в первую очередь на мобильных устройствах.

 Источник изображения: geralt/Pixabay

Источник изображения: geralt/Pixabay

Как сообщает Microsoft, Phi-3-vision, доступная в виде предварительной версии, представляет собой модель с 4,2 млрд параметров, которая может выполнять общие задачи на визуальное мышление, включая ответы на вопросы о диаграммах или изображениях.

Phi-3-vision гораздо меньше других ИИ-моделей, ориентированных на работу с изображениями, таких как DALL-E от OpenAI или Stable Diffusion от Stability AI. В отличие от этих моделей, Phi-3-vision не генерирует изображения, хотя способна понимать, что изображено на картинке, и анализировать изображение по запросу пользователя.

Microsoft представила модель Phi-3 в апреле, выпустив Phi-3-mini, самую маленькую модель семейства Phi-3 с 3,8 млрд параметров. Семейство Phi-3 также включает модель Phi-3-small (7 млрд параметров) и Phi-3-medium (14 млрд параметров).

Разработчики начали выпуск небольших и лёгких ИИ-моделей, таких как Phi-3, в связи с ростом спроса на использование более экономичных и менее ресурсоёмких сервисов ИИ. Небольшие ИИ-модели не занимают много места в памяти и поэтому их можно использовать на телефонах и ноутбуках.

Microsoft выпустила ряд небольших моделей в дополнение к Phi-3 и её предшественнику Phi-2. Её модель Orca-Math, ориентированная на решение математических задач, как сообщается, отвечает на математические вопросы лучше, чем более крупные аналоги, такие как Gemini Pro от Google.

ИИ-модели Phi-3-mini, Phi-3-small и Phi-3-medium уже доступны для использования и присутствуют в библиотеке моделей Azure.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Пираты победили Denuvo: игры теперь взламывают в день релиза, но разработчик обещает новые меры 33 мин.
Microsoft AI представила три собственные ИИ-модели для генерации текста, голоса и изображений 39 мин.
Google прокачала ИИ-ассистента для умного дома: Gemini в Home стал лучше понимать сложные команды 59 мин.
Всему хорошему приходит конец: Microsoft подтвердила, когда GTA V покинет Game Pass 3 ч.
Мультиплеерный стелс-экшен Thick as Thieves от создателя Deus Ex и System Shock стал одиночной игрой с кооперативом на двоих 4 ч.
Отменённая The Last of Us Online была почти готова — ведущего разработчика «убивает, что люди не смогут поиграть в неё» 5 ч.
Ветеран Microsoft: обновления Windows не всегда ломают ПК — иногда они просто вскрывают проблемы 5 ч.
На следующей неделе «Яндекс» проведёт конференцию «День поиска» 6 ч.
Blizzard заинтриговала фанатов StarCraft новой вакансией — шутер с открытым миром на Unreal Engine 6 ч.
Игроки профинансировали русскую озвучку South Park: The Stick of Truth от GamesVoice — она выйдет «до того, как у вас закончатся запасы терпения» 7 ч.
SpaceX пожаловалась, что запуски спутников-конкурентов Amazon Leo создали риск столкновения 49 мин.
8BitDo выпустила механическую клавиатуру Retro 68 AP50 за $500 в стиле компьютера Apple II 55 мин.
К созданию спонсируемого Биллом Гейтсом нетипичного ядерного реактора подключили ИИ — процесс пойдёт живее 2 ч.
Космический сбой Microsoft: в летящем к Луне корабле «Орион» оказалось два Outlook и ни один из них не работает 2 ч.
Piter-IX поднял цены на свои услуги 5 ч.
Поставки электромобилей Tesla рухнули на 14 % за первый квартал — продано всего 358 000 штук 5 ч.
Тепло от дата-центров для ИИ начало сказываться на климате — пока лишь локально, но чувствительно для соседей 6 ч.
Представлен смартфон среднего уровня Honor X80i с чипом Dimensity 6500 Elite, 50-Мп камерой и батареей на 7000 мА·ч 6 ч.
Британские учёные выяснили, что дата-центры подогревают окрестности на километры вокруг 7 ч.
В России хотят «зачистить» рынок связи от небольших операторов — это может спровоцировать рост цен 8 ч.