Сегодня 22 мая 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Alibaba выпустила ИИ-модель Qwen2.5-Omni-3B — её можно запустить на ПК или ноутбуке

На этой неделе китайская компания Alibaba анонсировала семейство флагманских ИИ-моделей Qwen3, использующих метод «смешения экспертов» для достижения результатов, сопоставимых с итогами работы гибридных рассуждающих моделей. Спустя всего несколько дней гигант электронной коммерции и облачных вычислений представил облегчённую модель Qwen2.5-Omni-3B на базе архитектуры предыдущего поколения, которая предназначена для автономной работы на ПК и ноутбуках потребительского уровня.

 Источник изображения: BoliviaInteligente / Unsplash

Источник изображения: BoliviaInteligente / Unsplash

Qwen2.5-Omni-3B представляет собой уменьшенный до 3 млрд параметров вариант флагманского алгоритма с 7 млрд параметров. Несмотря на уменьшенный размер, эта версия ИИ-модели сохранила более 90 % мультимодальной производительности и может обеспечить генерацию в режиме онлайн как текста, так и естественной речи.

Разработчики сумели добиться значительного повышения эффективности использования памяти графического ускорителя. Отмечается, что у Qwen2.5-Omni-3B потребление видеопамяти снижено на 50 % при обработке длинных контекстов до 25 тыс. лексем. После оптимизации настроек потребление памяти снизилось с 60,2 Гбайт у модели с 7 млрд параметров до 28,2 Гбайт у модели с 3 млрд параметров. За счёт этого алгоритм Qwen2.5-Omni-3B можно развернуть на устройстве, в котором используется графический ускоритель с 24 Гбайт видеопамяти. Такие видеокарты обычно можно встретить в ПК и ноутбуках премиального уровня.

Уже сейчас Qwen2.5-Omni-3B доступна для скачивания на Hugging Face, GitHub и ModelScope. При этом условия лицензирования позволяют задействовать алгоритм только в исследовательских целях. Это означает, что без получения лицензии Alibaba на использование семейства моделей Qwen нельзя создавать какие-либо коммерческие продукты на основе Qwen2.5-Omni-3B. Результаты тестирования алгоритма в бенчмарках указывают на то, что несмотря на уменьшение размера ИИ-модели, она остаётся вполне конкурентоспособной.

 Источник изображения: venturebeat.com

Источник изображения: venturebeat.com

Qwen2.5-Omni-3B способна обрабатывать поступающие одновременно данные разного типа, генерируя текстовые или голосовые ответы в режиме реального времени. Есть возможность выбора между женским и мужским голосами, которые используются для озвучивания ответов на пользовательские запросы. Отключение генерации звука, когда в этом нет необходимости, позволит дополнительно сократить потребление памяти. Команда разработчиков подчёркивает открытый характер проекта, предоставляя доступ к наборам сопутствующих инструментов, предварительно обученным версиям алгоритма, а также возможность использования соответствующего API и руководства по развёртыванию ИИ-модели.

Несмотря на то, что Qwen2.5-Omni-3B снижает технические и аппаратные барьеры для экспериментов с мультимодальными ИИ-моделями, необходимость получения лицензии Alibaba для коммерческого использования алгоритма сохраняет определённые ограничения. Однако корпоративные разработчики смогут задействовать алгоритм для тестирования собственных идей, оценки архитектур или принятия решения о получении лицензии для коммерческого использования. В таком контексте Qwen2.5-Omni-3B становится не столько вариантом для развёртывания, сколько инструментом стратегической оценки или способом приблизиться к использованию мультимодальной ИИ-модели, выделяя на это меньше ресурсов.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Культовая стратегия Warhammer 40,000: Dawn of War в 2025 году получит новую жизнь благодаря ремастеру — трейлер и подробности 20 мин.
Warhammer 40,000: Boltgun 2 выйдет в 2026 году, а бесплатный «печатный» шутер по мотивам первой части ждать не придётся 53 мин.
Owlcat Games анонсировала ролевую игру про борьбу с ересью Warhammer 40,000: Dark Heresy и новые дополнения для Warhammer 40,000: Rogue Trader 3 ч.
Чемпионат мира по киберспорту в Саудовской Аравии остался без GeoGuessr — разработчики отказались от участия после протеста фанатов 4 ч.
Разработчики ролевого боевика Alkahest в духе Dark Messiah of Might and Magic анонсировали геймплейную демонстрацию и показали новый тизер 5 ч.
День биткоин-пиццы: 15 лет назад майнер купил две пиццы за 10 000 BTC — сегодня это $1,1 млрд 5 ч.
«Яндекс» запустил «Вертикали Поиска» — теперь искать в интернете можно сразу по объектам 6 ч.
Надёжный инсайдер раскрыл, когда для Assassin’s Creed Shadows выйдет дополнение Claws of Awaji и неанонсированный кооперативный режим 6 ч.
«Алиса» полностью переехала на YandexGPT 5: версия Lite доступна всем бесплатно, а Pro — по подписке 7 ч.
Поисковик «Яндекса» теперь может рассуждать и генерировать тексты и изображения с помощью «Алисы» 7 ч.
Qualcomm готовит 80-ядерный серверный Arm-процессор SD1 для ИИ-платформ 22 мин.
Xiaomi представила огромный 14-дюймовый планшет Pad 7 Ultra на фирменном процессоре Xring O1 3 ч.
Xiaomi представила часы Watch S4 на фирменном чипе Xring T1 с модемом 4G собственной разработки 3 ч.
SK hynix представила смартфонную память UFS 4.1 на основе 321-слойной 4D NAND 5 ч.
Представлен флагман Xiaomi 15S Pro — первый смартфон на фирменном процессоре Xring O1 5 ч.
Xiaomi представила процессор Xring O1, который быстрее и дешевле Apple A18 Pro — его разрабатывали 4 года и потратили $1,87 млрд 5 ч.
Учёные создали полупроводниковый кулер для всего — без движущихся частей, шума и жидкости 5 ч.
Дебютировал смартфон Honor 400 с 200-Мп камерой и ИИ-функциями по цене от €499 6 ч.
Представлен смартфон Honor 400 Pro — почти флагман для любителей фотографии за €799 6 ч.
Lian Li представила на Computex 2025 компьютерные корпуса разных форм и размеров 7 ч.