Сегодня 16 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Alibaba выпустила ИИ-модель Qwen2.5-Omni-3B — её можно запустить на ПК или ноутбуке

На этой неделе китайская компания Alibaba анонсировала семейство флагманских ИИ-моделей Qwen3, использующих метод «смешения экспертов» для достижения результатов, сопоставимых с итогами работы гибридных рассуждающих моделей. Спустя всего несколько дней гигант электронной коммерции и облачных вычислений представил облегчённую модель Qwen2.5-Omni-3B на базе архитектуры предыдущего поколения, которая предназначена для автономной работы на ПК и ноутбуках потребительского уровня.

 Источник изображения: BoliviaInteligente / Unsplash

Источник изображения: BoliviaInteligente / Unsplash

Qwen2.5-Omni-3B представляет собой уменьшенный до 3 млрд параметров вариант флагманского алгоритма с 7 млрд параметров. Несмотря на уменьшенный размер, эта версия ИИ-модели сохранила более 90 % мультимодальной производительности и может обеспечить генерацию в режиме онлайн как текста, так и естественной речи.

Разработчики сумели добиться значительного повышения эффективности использования памяти графического ускорителя. Отмечается, что у Qwen2.5-Omni-3B потребление видеопамяти снижено на 50 % при обработке длинных контекстов до 25 тыс. лексем. После оптимизации настроек потребление памяти снизилось с 60,2 Гбайт у модели с 7 млрд параметров до 28,2 Гбайт у модели с 3 млрд параметров. За счёт этого алгоритм Qwen2.5-Omni-3B можно развернуть на устройстве, в котором используется графический ускоритель с 24 Гбайт видеопамяти. Такие видеокарты обычно можно встретить в ПК и ноутбуках премиального уровня.

Уже сейчас Qwen2.5-Omni-3B доступна для скачивания на Hugging Face, GitHub и ModelScope. При этом условия лицензирования позволяют задействовать алгоритм только в исследовательских целях. Это означает, что без получения лицензии Alibaba на использование семейства моделей Qwen нельзя создавать какие-либо коммерческие продукты на основе Qwen2.5-Omni-3B. Результаты тестирования алгоритма в бенчмарках указывают на то, что несмотря на уменьшение размера ИИ-модели, она остаётся вполне конкурентоспособной.

 Источник изображения: venturebeat.com

Источник изображения: venturebeat.com

Qwen2.5-Omni-3B способна обрабатывать поступающие одновременно данные разного типа, генерируя текстовые или голосовые ответы в режиме реального времени. Есть возможность выбора между женским и мужским голосами, которые используются для озвучивания ответов на пользовательские запросы. Отключение генерации звука, когда в этом нет необходимости, позволит дополнительно сократить потребление памяти. Команда разработчиков подчёркивает открытый характер проекта, предоставляя доступ к наборам сопутствующих инструментов, предварительно обученным версиям алгоритма, а также возможность использования соответствующего API и руководства по развёртыванию ИИ-модели.

Несмотря на то, что Qwen2.5-Omni-3B снижает технические и аппаратные барьеры для экспериментов с мультимодальными ИИ-моделями, необходимость получения лицензии Alibaba для коммерческого использования алгоритма сохраняет определённые ограничения. Однако корпоративные разработчики смогут задействовать алгоритм для тестирования собственных идей, оценки архитектур или принятия решения о получении лицензии для коммерческого использования. В таком контексте Qwen2.5-Omni-3B становится не столько вариантом для развёртывания, сколько инструментом стратегической оценки или способом приблизиться к использованию мультимодальной ИИ-модели, выделяя на это меньше ресурсов.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Кошачий роглайк Mewgenics от автора The Binding of Isaac опередил Hades 2 по пиковому онлайну в Steam и взял курс на консоли 55 мин.
Alibaba, ByteDance и Kuaishou представили ряд новых ИИ-моделей — от роботов до киношного видео 3 ч.
Инсайдеры: следующая большая игра режиссёра God of War выйдет в 2027 году, а анонс уже не за горами 3 ч.
«Базис» переходит на импортонезависимую платформу «Диво» от экосистемы «Лукоморье» 3 ч.
Apple оптимизирует код и интерфейс iOS 27 для улучшения автономности устройств 13 ч.
В эвакуационном шутере Marathon не будет системы подбора рейдов из Arc Raiders, разделяющей агрессивных и мирных игроков 16 ч.
Анонсирована Layers of Fear 3 — новая часть серии психологических хорроров о выживших из ума творческих личностях 19 ч.
Новая статья: Code Vein 2 — от отличного к странному. Рецензия 15-02 00:04
Новая статья: Gamesblender № 763: ремейк God of War, «Джон Уик», новая Silent Hill — анонсы State of Play 14-02 23:31
Хоррор Cronos: The New Dawn от авторов ремейка Silent Hill 2 получил лёгкий режим — для любителей сюжета 14-02 22:09
Европа доказала, что может создать собственный серверный CPU — на архитектуре RISC-V и техпроцессе Intel 3 43 мин.
Китайская Montage Technology выпустила серверные процессоры Jintide на базе Intel Xeon 6 2 ч.
Мировой рынок оптических коммутаторов к 2029 году достигнет $2,5 млрд, но львиная доля всё равно придётся на Google 2 ч.
Оперативная память для ПК перестала дорожать, но модули для ноутбуков взлетели на 23 % за месяц 6 ч.
IT-индустрия разогнала увольнения до 30 тыс. сотрудников за январь — 2026-й рискует побить антирекорд 7 ч.
CXMT и YMTC пропали из американского «чёрного списка» по ошибке — документ уже исправляют 8 ч.
Разработчик китайских Xeon провёл IPO в Гонконге — Montage Technology привлекла почти $1 млрд 11 ч.
Новая статья: Обзор Ryzen 7 9850X3D: три процента за двадцать баксов 12 ч.
Apple выпустит доступный MacBook в «ярких цветах» — его представят в марте 12 ч.
Японская Rapidus начнёт массовое производство 2-нм чипов в 2027 году 13 ч.