Сегодня 17 сентября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Alibaba выпустила ИИ-модель Qwen3-Next — она десятикратно мощнее предшественницы

Alibaba представила первую открытую модель искусственного интеллекта на новой архитектуре Qwen3-Next — она в десять раз быстрее своей прямой предшественницы, но её разработка обошлась в десять раз дешевле. По качеству и точности ответов она сравнима с флагманом предыдущего поколения.

 Источник изображений: qwen.ai

Источник изображений: qwen.ai

Alibaba Qwen3-Next-80B-A3B с 80 млрд параметров потребовала примерно в десять раз меньше затрат на обучение по сравнению с предшественницей Qwen3-32B, но новая модель выполняет некоторые задачи в десять раз быстрее. По точности и качеству ответов она работает на уровне флагманской Qwen3-235B-A22B; модели нового поколения оптимизированы для эффективного развёртывания и работы даже на потребительском оборудовании, рассказали в Alibaba.

Компания также представила рассуждающую версию модели на той же архитектуре. Alibaba Qwen3-Next-80B-A3B-Thinking превзошла свою предшественницу Qwen3-32B-Thinking и Google Gemini-2.5-Flash-Thinking по ряду параметров, заявил разработчик со ссылкой на сторонние тесты.

Компания повысила эффективность новой модели за счёт сочетания ряда методов: в частности, использовались механизм «гибридного внимания», который помог упростить обработку входных текстовых данных, и архитектура «высокоразреженной смеси экспертов» (MoE) — она предполагает разбиение модели на подсети, специализирующиеся на разных подмножествах входных данных для совместного решения задач. Ещё одним нововведением стала стратегия «многотокенного прогнозирования», а также ряд мер, направленных на повышение стабильности модели в процессе обучения.

Модель Qwen3-Next-80B-A3B уже доступна в инфраструктуре Alibaba Cloud для работы через API; поработать с ней можно также на платформах Hugging Face и ModelScope.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Базис» выходит на рынок Бразилии 7 мин.
Microsoft хочет запретить перепродажу корпоративных лицензий Office и Windows — дело дошло до суда 2 ч.
Китайский ИИ-оптимизм на взлёте: национальные технокомпании кратно наращивают траты на инфраструктуру 2 ч.
Sony планирует активнее использовать ИИ при создании видеоигр 3 ч.
Ведомства поспорили, каких гаджетов касается требование об установке RuStore и Max — всех или не всех 4 ч.
Сэм Фишер снова в деле: Netflix показала динамичный трейлер анимационного сериала Splinter Cell: Deathwatch 4 ч.
YouTube Live получил крупнейшее обновление: двухформатные эфиры, мини-игры и многое другое 5 ч.
YouTube представил новые ИИ-инструменты для всесторонней оптимизации контента 5 ч.
TikTok в США будет на 80 % американским, но алгоритм останется китайским, и это кое-кому не нравится 5 ч.
YouTube захотел стать торговой платформой — ИИ наполнит видеоролики ссылками на товары 5 ч.
TCL представила новую технологию подсветки SQD-Mini LED с «супер-квантовыми точками» 4 мин.
IT лидирует по темпам роста среди всех крупных отраслей России — в ней занят 1 млн человек 21 мин.
Австралийцы отожгли лучший в мире суперконденсатор из графена 24 мин.
Звериный оскал дефицита: темпы удорожания DDR4-памяти превысили 5 % в неделю 26 мин.
Keychron представила первую в мире керамическую клавиатуру Q16 HE 8K весом в килограмм 2 ч.
SanDisk нагнетает: дефицит флеш-памяти продлится как минимум до 2026 года, и SSD будут дорожать 3 ч.
Looking Glass анонсировала голографические «гололюминесцентные» дисплеи с ценой от $1500 4 ч.
NVIDIA и партнёры развернут в Великобритании ИИ-фабрики со 120 тыс. ускорителей Blackwell 4 ч.
Собственный ЦОД Stargate и крупнейший в стране ИИ-суперкомпьютер: американские IT-гиганты вложат более $40 млрд в развитие ИИ в Великобритании 4 ч.
Новость из будущего: квантовая компания совершила рекордную закупку добытого на Луне гелия-3 4 ч.