Сегодня 05 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Alibaba выпустила ИИ-модель Qwen2.5-Omni-3B — её можно запустить на ПК или ноутбуке

На этой неделе китайская компания Alibaba анонсировала семейство флагманских ИИ-моделей Qwen3, использующих метод «смешения экспертов» для достижения результатов, сопоставимых с итогами работы гибридных рассуждающих моделей. Спустя всего несколько дней гигант электронной коммерции и облачных вычислений представил облегчённую модель Qwen2.5-Omni-3B на базе архитектуры предыдущего поколения, которая предназначена для автономной работы на ПК и ноутбуках потребительского уровня.

 Источник изображения: BoliviaInteligente / Unsplash

Источник изображения: BoliviaInteligente / Unsplash

Qwen2.5-Omni-3B представляет собой уменьшенный до 3 млрд параметров вариант флагманского алгоритма с 7 млрд параметров. Несмотря на уменьшенный размер, эта версия ИИ-модели сохранила более 90 % мультимодальной производительности и может обеспечить генерацию в режиме онлайн как текста, так и естественной речи.

Разработчики сумели добиться значительного повышения эффективности использования памяти графического ускорителя. Отмечается, что у Qwen2.5-Omni-3B потребление видеопамяти снижено на 50 % при обработке длинных контекстов до 25 тыс. лексем. После оптимизации настроек потребление памяти снизилось с 60,2 Гбайт у модели с 7 млрд параметров до 28,2 Гбайт у модели с 3 млрд параметров. За счёт этого алгоритм Qwen2.5-Omni-3B можно развернуть на устройстве, в котором используется графический ускоритель с 24 Гбайт видеопамяти. Такие видеокарты обычно можно встретить в ПК и ноутбуках премиального уровня.

Уже сейчас Qwen2.5-Omni-3B доступна для скачивания на Hugging Face, GitHub и ModelScope. При этом условия лицензирования позволяют задействовать алгоритм только в исследовательских целях. Это означает, что без получения лицензии Alibaba на использование семейства моделей Qwen нельзя создавать какие-либо коммерческие продукты на основе Qwen2.5-Omni-3B. Результаты тестирования алгоритма в бенчмарках указывают на то, что несмотря на уменьшение размера ИИ-модели, она остаётся вполне конкурентоспособной.

 Источник изображения: venturebeat.com

Источник изображения: venturebeat.com

Qwen2.5-Omni-3B способна обрабатывать поступающие одновременно данные разного типа, генерируя текстовые или голосовые ответы в режиме реального времени. Есть возможность выбора между женским и мужским голосами, которые используются для озвучивания ответов на пользовательские запросы. Отключение генерации звука, когда в этом нет необходимости, позволит дополнительно сократить потребление памяти. Команда разработчиков подчёркивает открытый характер проекта, предоставляя доступ к наборам сопутствующих инструментов, предварительно обученным версиям алгоритма, а также возможность использования соответствующего API и руководства по развёртыванию ИИ-модели.

Несмотря на то, что Qwen2.5-Omni-3B снижает технические и аппаратные барьеры для экспериментов с мультимодальными ИИ-моделями, необходимость получения лицензии Alibaba для коммерческого использования алгоритма сохраняет определённые ограничения. Однако корпоративные разработчики смогут задействовать алгоритм для тестирования собственных идей, оценки архитектур или принятия решения о получении лицензии для коммерческого использования. В таком контексте Qwen2.5-Omni-3B становится не столько вариантом для развёртывания, сколько инструментом стратегической оценки или способом приблизиться к использованию мультимодальной ИИ-модели, выделяя на это меньше ресурсов.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новый трейлер раскрыл дату выхода научно-фантастического приключения Planet of Lana 2: Children of the Leaf — демоверсия на подходе 2 ч.
Internet Archive взялся лечить интернет от «гниения ссылок» 3 ч.
«То есть Concord вас ничему не научила?»: Sony анонсировала кооперативный боевик Horizon Hunters Gathering, и фанаты в недоумении 3 ч.
The Elder Scrolls IV: Oblivion Remastered выйдет на Nintendo Switch 2, но фанаты радоваться не спешат 4 ч.
Дуров: Telegram ни разу не передал данные из переписок — и никогда этого не сделает 5 ч.
Bethesda подтвердила даты выхода Fallout 4: Anniversary Edition и Indiana Jones and the Great Circle на Nintendo Switch 2 5 ч.
Российский банк впервые начал выдавать кредиты под залог биткоинов 6 ч.
Осенью в Substack произошла утечка данных пользователей — обнаружили её только в феврале 6 ч.
Слухи: версия Starfield для PS5 не заставит себя долго ждать, а релиз на Switch 2 под угрозой 6 ч.
«Роботам нужно ваше тело»: сервис RentAHuman.ai позволит ИИ-агентам нанимать людей для работы в реальном мире 8 ч.
Топливо с «запахом жареной картошки»: в России успешно испытали авиационный SAF из отработанного растительного масла 2 ч.
ASRock начала проверки после новых поломок Ryzen 9000, но не объяснила, что делать пользователям 2 ч.
MSI усилила защиту RTX 5000 и RX 9000 от плавления разъёма — Afterburner получит функцию GPU Safeguard+ 2 ч.
Intel придумала интегрированные конденсаторы нового поколения — ключ к стабильному питанию ИИ-чипов будущего 4 ч.
Starlink стал золотой жилой SpaceX и скоро расширится — от спутниковых ИИ-гаджетов до контроля орбиты 4 ч.
Оперативная память и SSD подорожают почти вдвое в текущем квартале — как для ПК, так и для серверов 5 ч.
Из-за дефицита памяти у Raspberry Pi 4 появился версия со «сдвоенной» RAM, а 16-Гбайт версия Raspberry Pi 5 существенно подорожала 5 ч.
BMW признала подписку на обогрев сидений перегибом, но не откажется от разблокировки функций за доплату 5 ч.
SpaceX вопреки традициям намерена попасть в фондовые индексы сразу после IPO 6 ч.
Китайский рынок электромобилей забуксовал — продажи BYD в январе рухнули до минимума за два года 6 ч.