Alibaba выпустила ИИ-модель Qwen3-Next — она десятикратно мощнее предшественницы
Читать в полной версииAlibaba представила первую открытую модель искусственного интеллекта на новой архитектуре Qwen3-Next — она в десять раз быстрее своей прямой предшественницы, но её разработка обошлась в десять раз дешевле. По качеству и точности ответов она сравнима с флагманом предыдущего поколения.
Источник изображений: qwen.ai
Alibaba Qwen3-Next-80B-A3B с 80 млрд параметров потребовала примерно в десять раз меньше затрат на обучение по сравнению с предшественницей Qwen3-32B, но новая модель выполняет некоторые задачи в десять раз быстрее. По точности и качеству ответов она работает на уровне флагманской Qwen3-235B-A22B; модели нового поколения оптимизированы для эффективного развёртывания и работы даже на потребительском оборудовании, рассказали в Alibaba.
Компания также представила рассуждающую версию модели на той же архитектуре. Alibaba Qwen3-Next-80B-A3B-Thinking превзошла свою предшественницу Qwen3-32B-Thinking и Google Gemini-2.5-Flash-Thinking по ряду параметров, заявил разработчик со ссылкой на сторонние тесты.
Компания повысила эффективность новой модели за счёт сочетания ряда методов: в частности, использовались механизм «гибридного внимания», который помог упростить обработку входных текстовых данных, и архитектура «высокоразреженной смеси экспертов» (MoE) — она предполагает разбиение модели на подсети, специализирующиеся на разных подмножествах входных данных для совместного решения задач. Ещё одним нововведением стала стратегия «многотокенного прогнозирования», а также ряд мер, направленных на повышение стабильности модели в процессе обучения.
Модель Qwen3-Next-80B-A3B уже доступна в инфраструктуре Alibaba Cloud для работы через API; поработать с ней можно также на платформах Hugging Face и ModelScope.