Сегодня 09 марта 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → qwen
Быстрый переход

Alibaba потеряла одного из руководителей разработки ИИ-моделей Qwen

Вскоре после выпуска открытых малых моделей Qwen 3.5 ответственное за них подразделение Alibaba Qwen лишилось одного из наиболее заметных своих руководителей. Цзюньян Линь (Junyang Lin) сообщил о своём уходе, не вдаваясь в подробности, — он начал работу в Alibaba в июле 2019 года, а к отделу Qwen присоединился в апреле 2023 года.

 Источник изображения: alibabagroup.com

Источник изображения: alibabagroup.com

Внезапный уход господина Линя вызвал резкую реакцию со стороны коллег и отраслевых партнёров, особенно в свете усиления глобальной конкуренции среди разработчиков ИИ и стремления компании выпускать модели, способные конкурировать с проектами OpenAI, Google и Anthropic. Семейство моделей Alibaba Qwen сегодня является одним из наиболее известных китайских проектов в области ИИ с открытым исходным кодом; в бенчмарках эти модели не уступают проектам ведущих китайских разработчиков. Первая модель Qwen вышла в апреле 2023 года; получив разрешение от регулирующих органов, Alibaba открыла её для широкой публики в сентябре.

Ранее стало известно о выпуске малых моделей Alibaba Qwen 3.5 с 0,8, 2, 4 и 9 млрд параметров. Изначально мультимодальные модели предназначаются для использования в разных областях — от развёртывания ИИ на устройствах до создания легковесных ИИ-агентов. Квартет привлёк внимание отраслевых деятелей, и даже Илон Маск (Elon Musk) признал, что новые китайские малые модели демонстрируют «впечатляющую плотность интеллекта».

Обстоятельства ухода Цзюньяна Линя остаются неясными. Сам он комментариев по поводу произошедшего не дал. Участник проекта Qwen Чэнь Чэн (Chen Cheng) сообщил, что «убит горем» из-за этой новости, а также обратился к самому Линю со словами: «Я знаю, что уход не был твоим выбором», добавив, что всего несколько часов они работали в команде над запуском моделей. В Alibaba официальных комментариев тоже не дали.

Alibaba представила малые ИИ-модели Qwen3.5, которые работают на ноутбуке и обходят аналоги OpenAI

Специализирующееся на технологиях искусственного интеллекта подразделение Alibaba Qwen представило новую линейку моделей — их отличают небольшие размеры и высокая производительность при качестве ответов, значительно превосходящем ведущие американские аналоги.

 Источник изображений: Alibaba

Источник изображений: Alibaba

Младшие в новой линейке модели Alibaba Qwen3.5-0.8B и 2B характеризуются как «миниатюрная» и «быстрая»; они предназначаются для разработки прототипов и быстрого развёртывания на мобильных устройствах с минимальной производительностью, когда время автономной работы имеет первостепенное значение. Мультимодальная Qwen3.5-4B предназначена для создания легковесных агентов и изначально поддерживает контекстное окно в 262 144 токена. Рассуждающая Qwen3.5-9B превосходит по возможностям американского конкурента — открытую OpenAI gpt-oss-120B, которая крупнее по размеру в 13,5 раза; модель от Alibaba демонстрирует знание языков и логическое мышление на уровне аспирантуры. Веса моделей доступны для всех желающих под лицензией Apache 2.0, которая допускает корпоративное и коммерческое использование, в том числе дополнительное обучение по мере необходимости.

При разработке малых моделей серии Qwen3.5 компания отошла от стандартных архитектур Transformer — здесь использована гибридная архитектура, сочетающая нейросети Gated Delta Networks и разреженную смесь экспертов (Mixture-of-Experts — MoE). Гибридный подход помогает решить проблему «ограничения памяти», характерную для небольших моделей; Gated Delta Networks, в свою очередь, обеспечивает повышенную пропускную способность и уменьшенную задержку при ответе. Модели изначально мультимодальные. В отличие от предыдущих поколений, когда генераторы изображений «прикреплялись» к текстовым моделям, Qwen3.5 обучались на мультимодальных токенах. В результате версии 4B и 9B умеют распознавать элементы пользовательского интерфейса и подсчитывают объекты на видео.

В визуальном тесте MMMU-Pro модель Qwen3.5-9B набрала 70,1 балла, обогнав Google Gemini 2.5 Flash-Lite (59,7) и даже специализированную Qwen3-VL-30B-A3B (63,0). В тесте на логическое мышление она получила 81,7 балла, превзойдя результат OpenAI gpt-oss-120b (80,1), у которой более чем вдесятеро больше параметров. В математическом бенчмарке HMMT Feb 2025 модель Qwen3.5-9B показала 83,2 балла, а вариант 4B — 74,0, доказав, что для решения сложных задач в области точных наук больше не нужны значительные облачные ресурсы. Старшая модель стала лидером в тесте OmniDocBench v1.5 с результатом 87,7 балла; в многоязычном MMMLU она набрала 81,2 балла, обойдя gpt-oss-120b, у которой 78,2 балла.

Выпуск моделей Qwen3.5 малой серии совпал с этапом расцвета ИИ-агентов. Простых чат-ботов современному пользователю уже недостаточно — растёт спрос на функции автономности. Автономный ИИ-агент должен «думать» (рассуждать), «видеть» (быть мультимодальным) и «действовать» (уметь пользоваться инструментами). Выполнять эти функции с моделями размером в триллионы параметров, очень дорого, а эксплуатация Qwen3.5-9B обходится значительно дешевле.

Масштабировав технологию обучения с подкреплением в средах с миллионами агентов, Alibaba наделила эти модели функциями «человеческого суждения» — они могут организовать рабочий стол или провести обратное проектирование игры в код по видеозаписи. Запущенная на смартфоне версия на 0,8 млрд параметров или на рабочей станции модель на 9 млрд параметров делают «эпоху агентов» демократичной. Организации могут запускать ИИ-агентов на собственных локальных ресурсах, не расходуя средства на подключение к облачным ресурсам и не используя средства API.

Используя механизм «привязки на уровне пикселей», эти модели способны перемещаться по пользовательским интерфейсам ПК и мобильных устройств, заполнять формы и сортировать файлы, выполняя инструкции на простом языке. С продемонстрированной в тестах точностью 90 % они производят оптическое распознавание текста, анализируют макеты и извлекают структурированные данные из форм и диаграмм в документах. Можно загружать целые репозитории кода (до 400 000 строк) в контекстное окно размером до 1 млн токенов для рефакторинга или автоматизированной отладки. Предназначенные для мобильных устройств модели Qwen3.5-0.8B и 2B могут в локальном режиме составлять сводки по видео при длине до 60 секунд и частоте до 8 кадров в секунду; а также демонстрировать пространственное мышление.

Указываются и аспекты, на которые следует обращать внимание при развёртывании малых моделей Qwen3.5. В многоэтапных агентных сценариях одна ошибка на раннем этапе выполнения задачи может привести к каскаду сбоев, при котором агент будет следовать неверному или бессмысленному плану. Модели хорошо справляются с написанием кода с нуля, но могут испытывать затруднения с отладкой или доработкой сложных устаревших проектов. Для производительной работы модели Qwen3.5-9B требуется значительный объём видеопамяти. При развёртывании моделей на предприятиях следует отдавать приоритет «проверяемым» задачам: написанию кода, математическим вычислениям или следованию инструкциям — всему тому, где результаты можно проверить на соответствие определённым нормам, чтобы избежать скрытых сбоев.

Alibaba представила открытую LLM Qwen 3.5 с поддержкой ИИ-агентов и 201 языка — местами она быстрее Gemini 3 Pro

Китайский технологический гигант Alibaba представил модель искусственного интеллекта Qwen 3.5. Она доступна в открытом варианте, который позволяет всем желающим загружать, запускать, изменять и развёртывать её на собственной инфраструктуре; а также в хостинговой версии, предназначенной для работы на собственных серверах Alibaba.

 Источник изображения: qwen.ai

Источник изображения: qwen.ai

Alibaba Qwen 3.5 предлагает улучшения в производительности, стоимости обслуживания, и располагает «нативными мультимодальными возможностями», то есть одинаково хорошо работает с текстом, изображениями и видео. В соответствии с одной из ведущих тенденций отрасли ИИ модель умеет писать компьютерный код и располагает совместимостью с открытыми ИИ-агентами, включая популярный OpenClaw. ИИ-агентами называют приложения, способные самостоятельно выполнять действия и многоэтапные задачи от имени пользователя при минимальном его участии.

Открытая Alibaba Qwen 3.5 имеет 397 млрд параметров — переменных, определяющих, как обучается и рассуждает модель. Это меньше, чем у предыдущего флагмана, но, как утверждает разработчик, новая модель показала значительное улучшение в различных тестах. В работе она сопоставима с ведущими моделями OpenAI, Anthropic и Google — в отдельных тестах китайский ИИ даже превосходит западных конкурентов. Доступная через облачную платформу Model Studio версия Qwen-3.5-Plus также выступает на уровне ведущих конкурирующих продуктов, утверждает Alibaba. Она поддерживает 201 язык и диалект — у предыдущего поколения их было 82.

В дни празднования китайского Нового года Alibaba выпустит ещё несколько открытых моделей ИИ, пообещал в соцсетях технический руководитель направления Qwen в Alibaba Cloud Линь Цзюньян (Lin Junyang).

Alibaba запустила конкурента Nano Banana — мощный ИИ-генератор изображений Qwen-Image-2.0

Компания Alibaba объявила о выпуске модели искусственного интеллекта Qwen-Image-2.0, предназначенной для генерации изображений. Разработчику удалось совершить прорыв: модель справляется с отрисовкой текста без ошибок, причём позволяет выбирать стиль; поддерживаются объёмом до тысячи токенов; на выходе это могут быть фотореалистичные изображения, картинки для презентаций, плакаты, комиксы и многое другое.

 Источник изображений: qwen.ai

Источник изображений: qwen.ai

Созданию модели Qwen-Image-2.0 предшествовали два параллельных направления развития систем ИИ для работы с графикой. Первое направление — генерация изображений с максимальными точностью и детализацией, включая корректное отображение текста. Второе — редактирование изображений, где важны функциональность и согласованность, когда исходное изображение не искажается. Проект Qwen-Image-2.0 воплощает слияние этих двух направлений в единую универсальную модель, которая обладает преимуществами обеих веток. При этом она получила облегчённую архитектуру, меньший размер при более высокой скорости вывода.

В Alibaba перечислили основные преимущества Qwen-Image-2.0. Помимо точности, которую модель унаследовала от ветки редактирования изображений, это способность к созданию сложных композиций за счёт поддержки подробных запросов длиной до тысячи токенов. Ещё одно достоинство Qwen-Image-2.0 — эстетическое качество, которое, в частности, помогает модели гармонично размещать текст относительно изображений и подбирать для него нужное начертание. Примером реализма служит генерация изображения с текстом на глянцевой доске, в которой отражаются окружающие её предметы; а также гармоничное размещение объектов и текста на генерируемых кинопостерах. Наконец, организация композиции и выравнивание позволяют Qwen-Image-2.0 рисовать комиксы с информативными иллюстрациями и корректным текстовым сопровождением.

Компания Alibaba устроила слепое тестирование Qwen-Image-2.0 на платформе AI Arena. Разработчик сравнивал её возможности в генерации и редактировании изображений со способностями других моделей. В первом случае мощнее Qwen-Image-2.0 оказались только Google Gemini-3-Pro-Image-Preview и OpenAI GPT Image 1.5; во втором китайская модель уступила только флагманской Gemini.

Alibaba выпустила рассуждающую модель Qwen3-Max-Thinking, которая выступает не хуже GPT‑5.2‑Thinking и Gemini 3 Pro

Компания Alibaba Cloud открыла публичный доступ к своей новейшей флагманской модели логического рассуждения Qwen3-Max-Thinking. Модель показала производительность на уровне ведущих аналогов, таких как GPT-5.2-Thinking, Claude-Opus-4.5 и Gemini 3 Pro, по результатам 19 бенчмарков.

 Источник изображения: AI

Источник изображения: AI

В официальном блоге компании сообщается, что Qwen3-Max-Thinking достигла улучшений в фактологической точности, сложных логических рассуждениях, следовании инструкциям, соответствии пользовательским предпочтениям и агентских возможностях. Этого удалось добиться за счёт увеличения параметров модели и использования значительных вычислительных ресурсов для обучения с подкреплением (Reinforcement Learning, RL) .

Ключевым нововведением стали адаптивные инструменты и стратегия тестового масштабирования. В отличие от прежнего подхода, когда пользователь вручную выбирал инструменты, Qwen3-Max-Thinking теперь автономно задействует встроенные возможности поиска, памяти и интерпретатора кода прямо в диалоге. Разработчики заявляют, что инструменты поиска и памяти эффективно снижают «галлюцинации», дают доступ к актуальной информации и позволяют давать более персонализированные ответы, а интерпретатор кода позволяет выполнять фрагменты кода для решения сложных задач. Такой подход позволил повысить точность на нескольких специализированных тестах (GPQA, HLE, LiveCodeBench v6, IMO-AnswerBench) при сохранении прежнего объёма вычислений.

 Источник изображения: Alibaba

Источник изображения: Alibaba

По словам компании, модель с адаптивными инструментами уже доступна в Qwen Chat. Также открыт доступ к API через сервис Alibaba Cloud Model Studio, для чего необходимо зарегистрировать аккаунт в Alibaba Cloud, воспользоваться сервисом Model Studio и создать в консоли разработчика API-ключ. API Qwen совместим с протоколом OpenAI API, что позволяет использовать стандартные методы интеграции, а также реализована поддержка протокола Anthropic API, обеспечивающая бесшовную работу с инструментом Claude Code.

ИИ-бот Qwen от Alibaba научился заказывать доставку еды и бронировать поездки

Компания Alibaba представила крупное обновление ИИ-бота Qwen, который теперь позволяет выполнять такие задачи, как заказ доставки еды и бронирование поездок, не переключаясь между приложениями.

 Источник изображения: Igor Omilaev/unsplash.com

Источник изображения: Igor Omilaev/unsplash.com

«То, что мы запускаем сегодня, представляет собой переход от моделей, которые понимают, к системам, которые действуют — глубоко связанным с реальными услугами», — сообщил У Цзя (Wu Jia), вице-президент Alibaba Group.

Это обновление приложения Qwen вышло спустя два месяца после его крупного обновления в рамках стратегического перехода компании к ИИ, ориентированному на потребителя. В этой области Alibaba ранее отставала от своих внутренних конкурентов ByteDance и Tencent, сосредоточившись в основном на корпоративных ИИ-услугах с использованием своего облачного бизнеса.

Обновление интегрирует основные сервисы экосистемы Alibaba, включая платформу электронной коммерции Taobao, мгновенную коммерцию, платёжную систему Alipay, туристический сервис Fliggy и картографическую платформу Amap, в единый интерфейс искусственного интеллекта.

В частности, благодаря интеграции Alipay с приложением Qwen пользователи могут авторизовывать и завершать транзакции, не выходя из диалога с ИИ-ботом. Как сообщает компания, функция оплаты с помощью ИИ в настоящее время поддерживает заказы мгновенной торговли и со временем будет расширена на другие сервисы.

Alibaba также представила функцию Task Assistant («Помощник по задачам») в закрытой бета-версии, которая позволяет совершать телефонные звонки в рестораны, обрабатывать до 100 документов одновременно и планировать многоэтапные маршруты путешествий.

По данным компании, после запуска 17 ноября публичной бета-версии потребительского ИИ-бота Qwen его аудитория превысила 100 млн ежемесячных активных пользователей.

Alibaba выпустила ИИ-бота Qwen — будущего конкурента ChatGPT

Китайская компания Alibaba выпустила крупное обновление для своего чат-бота на базе искусственного интеллекта Qwen, тем самым обозначив своё агрессивное продвижение на рынок потребительского ИИ. Обновлённый ИИ-бот на основе передовой языковой модели компании доступен на домашнем рынке через бесплатное мобильное приложение и веб-сервис. Международная версия Qwen будет запущена позднее.

 Источник изображения: alibabagroup.com

Источник изображения: alibabagroup.com

«На основе одной команды он может сгенерировать полноценный исследовательский отчёт или автоматически создать качественную многостраничную презентацию в PowerPoint за секунды», — говорится в сообщении Alibaba. В компании добавили, что приложение Qwen перешло на стадию публичного бета-тестирования и позиционируется как «лучший персональный ИИ-помощник на базе самой мощной модели».

Запуск потребительского ИИ-бота для Alibaba является своеобразным стратегическим разворотом, поскольку прежде компания не вкладывала значительных ресурсов в создание аналога ChatGPT. До этого она в основном сосредотачивала внимание на корпоративных клиентах, предоставляя им услуги в рамках своей облачной платформы. Запуск потребительского ИИ-бота Alibaba также происходит на фоне ожесточённой ценовой войны на рынке ИИ Китая. Начало этому противостоянию положила DeepSeek, сделавшая приоритетом недорогие вычисления для ИИ, тем самым вынудив конкурентов пойти аналогичным путём.

Ранее Alibaba уже выпустила на рынок Китая несколько ИИ-продуктов, включая приложение Tongyi, которое впоследствии превратилось в Qwen, а также функции ИИ-помощника, интегрированные в фирменный браузер Quark. Несмотря на это, запуск приложения Qwen является первым случаем, когда Alibaba попыталась всерьёз выйти на потребительский рынок ИИ.

Alibaba была в числе первых китайских компаний в сфере ИИ, выпустив интеллектуального помощника для широкой аудитории ещё в конце 2023 года. Однако Tongyi так и не удалось добиться успеха. По данным сервиса Aicpb.com, в сентябре этого года у приложения было 6,96 млн ежемесячных пользователей. В это же время месячная аудитория лидера рынка в лице Doubao от ByteDance составила 150 млн человек, DeepSeek использовали 73,4 млн человек, а ИИ-бота Tencent — 64,2 млн человек.

Ant Group представила ИИ-ассистента для разработки мини-приложений за полминуты

Подразделение Alibaba Group (Ant Group), которое занимается финансовыми технологиями, на этой неделе запустило ИИ-ассистента, позволяющего за считанные секунды разрабатывать мини-приложения по заданию, формулируемому в естественной языковой форме. LingGuang считается мультимодальным ИИ-ассистентом, позволяющим создавать полезные приложения без навыков программирования всего за 30 секунд.

 Источник изображения: Ant Group

Источник изображения: Ant Group

В качестве примера подобных приложений приводятся утилита для отслеживания потребляемых с пищей калорий, игра в стиле Pac-Man и программа для заучивания китайских иероглифов. Можно использовать ИИ-ассистента для планирования путешествий, управления личными финансами и поиска нужных товаров. Ассистент также способен создавать простейшие трёхмерные модели, аудиоклипы, строить графики, создавать анимацию и интерактивные карты в минималистичном стиле. Профильное приложение доступно для скачивания под iOS и Android.

ИИ-ассистент LingGuang также позволяет создавать цифровые учебные пособия, создавая понятные анимированные иллюстрации, поясняющие сложные физические или экономические процессы. Выход LingGuang последовал за выпуском приложения Qwen, которое позволяло пользоваться экосистемой Alibaba с привлечением инструментов искусственного интеллекта.

Подобные агенты позволяют автоматизировать работу с приложениями и сервисами от лица пользователя. В июне Alibaba представила ИИ-ассистента для работы с рекомендациями в сфере здравоохранения, который предлагал около сотни различных услуг в этой сфере. Компания собирается и в дальнейшем уделять особое внимание внедрению ИИ в здравоохранении. К октябрю профильное приложение AQ уже обслуживало более 140 млн пользователей, связывая их с более чем 5000 медицинскими учреждениями и около 300 000 специалистами медицинского профиля.

Alibaba займётся созданием интеллектуальных роботов на базе ИИ-моделей Qwen

Alibaba сформировала подразделение, которое займётся созданием робототехники — китайский технологический гигант присоединился в другим крупным компаниям в гонке по разработке оборудования на базе искусственного интеллекта.

 Источник изображения: alibabagroup.com

Источник изображения: alibabagroup.com

О создании «небольшой команды по созданию робототехники и встроенного ИИ» рассказал накануне в соцсети X Цзюньян Линь (Junyang Lin) — руководитель отдела Alibaba Qwen. Команда будет действовать в составе Qwen — отдела, ответственного за разработку одноимённого семейства моделей ИИ. Линь занимает должность технического руководителя подразделения, в котором он участвовал в разработке мультимодальных моделей, способных обрабатывать не только текстовые запросы, но также звуки и изображения.

 Источник изображения: x.com/JustinLin610

Источник изображения: x.com/JustinLin610

Мультимодальные модели используются в качестве агентов, способных выполнять требующие рассуждений задачи, и эти приложения «определённо должны выйти за рамки виртуального мира в физический», отметил господин Линь. В прошлом году Alibaba выступила в качестве основного инвестора в стартап в области робототехники X Square Robot и вложила в него $140 млн. В ближайшие пять лет общий объем инвестиций в ИИ по всему миру достигнет около $4 трлн, заявил в конце сентября глава компании Эдди Ву (Eddie Wu).

В интеллектуальную робототехнику сейчас вкладывают средства ведущие технологические компании мира, в том числе Nvidia и SoftBank — последняя накануне объявила о покупке подразделения промышленных роботов ABB Ltd за $5,4 млрд.. Глава Nvidia Дженсен Хуанг (Jensen Huang) ранее выразил уверенность, что у его компании есть «многотриллионные» возможности долгосрочного роста благодаря направлениям ИИ и робототехники.

Alibaba выпустила флагманскую ИИ-модель Qwen-3 Max — она обходит GPT-5 и доступна бесплатно

Компания Alibaba объявила о релизе Qwen-3 Max — новой флагманской большой языковой модели (LLM), которая стала самой продвинутой в линейке китайского разработчика. Она призвана конкурировать с ведущими решениями индустрии, включая GPT-5 от OpenAI, Gemini 2.5 Pro от Google и Claude Opus 4 от Anthropic.

 Источник изображений: Alibaba, Qwen

Источник изображений: Alibaba, Qwen

Qwen-3 Max стала первой моделью Alibaba, преодолевшей рубеж в один триллион параметров. При этом она была обучена на массиве данных объёмом 36 трлн токенов. Контекстное окно достигает 1 млн токенов, что позволяет анализировать целые кодовые базы или многотомные документы без разделения текста.

Alibaba утверждает, что Qwen-3 Max демонстрирует заметный прогресс в понимании сложных инструкций, рассуждениях и работе с узкоспециализированными областями знаний. Кроме того, модель обеспечивает более высокую точность в задачах, связанных с математикой, программированием, логикой и наукой. Отмечается и существенно улучшенная поддержка английского и китайского языков. Наконец, Qwen-3 Max реже галлюцинирует — то есть выдумывает факты в ответах.

В популярном рейтинге LMArena новая модель в версии Qwen3-Max-Instruct заняла третье место, уступив лишь Claude Opus 4.1 Thinking, Gemini 2.5 Pro и OpenAI GPT-5 High, но при этом опередив базовую версию GPT-5. В тесте SWE-Bench Verified, проверяющем способность решать реальные задачи программирования, она набрала 69,6 балла — больше, чем DeepSeek V3.1, но немного меньше, чем Claude Opus 4. В испытании Tau2-Bench, оценивающем работу ИИ-агентов, Qwen-3 Max набрала 74,8 балла, превзойдя и DeepSeek V3.1, и Claude Opus 4.

Alibaba также упомянула перспективную версию Qwen-3-Max-Thinking, которая пока находится на стадии обучения, но уже демонстрирует «выдающийся потенциал». В частности, в пробных тестах она показала стопроцентный результат в задачах на рассуждение, включая AIME-25 и HMMT.

Воспользоваться Qwen-3 Max можно уже сейчас: модель в версии Qwen3-Max-Base доступна бесплатно через приложение или сайт Qwen. На iOS и Android новая модель теперь будет предлагаться в качестве стандартной. Если модель пока не предлагается по умолчанию, её можно активировать вручную через меню выбора модели.

Alibaba выпустила ИИ-модель Qwen3-Next — она десятикратно мощнее предшественницы

Alibaba представила первую открытую модель искусственного интеллекта на новой архитектуре Qwen3-Next — она в десять раз быстрее своей прямой предшественницы, но её разработка обошлась в десять раз дешевле. По качеству и точности ответов она сравнима с флагманом предыдущего поколения.

 Источник изображений: qwen.ai

Источник изображений: qwen.ai

Alibaba Qwen3-Next-80B-A3B с 80 млрд параметров потребовала примерно в десять раз меньше затрат на обучение по сравнению с предшественницей Qwen3-32B, но новая модель выполняет некоторые задачи в десять раз быстрее. По точности и качеству ответов она работает на уровне флагманской Qwen3-235B-A22B; модели нового поколения оптимизированы для эффективного развёртывания и работы даже на потребительском оборудовании, рассказали в Alibaba.

Компания также представила рассуждающую версию модели на той же архитектуре. Alibaba Qwen3-Next-80B-A3B-Thinking превзошла свою предшественницу Qwen3-32B-Thinking и Google Gemini-2.5-Flash-Thinking по ряду параметров, заявил разработчик со ссылкой на сторонние тесты.

Компания повысила эффективность новой модели за счёт сочетания ряда методов: в частности, использовались механизм «гибридного внимания», который помог упростить обработку входных текстовых данных, и архитектура «высокоразреженной смеси экспертов» (MoE) — она предполагает разбиение модели на подсети, специализирующиеся на разных подмножествах входных данных для совместного решения задач. Ещё одним нововведением стала стратегия «многотокенного прогнозирования», а также ряд мер, направленных на повышение стабильности модели в процессе обучения.

Модель Qwen3-Next-80B-A3B уже доступна в инфраструктуре Alibaba Cloud для работы через API; поработать с ней можно также на платформах Hugging Face и ModelScope.

Alibaba представила предварительную версию ИИ-модели Qwen3-Max с 1 триллионом параметров

Отдел разработки систем искусственного интеллекта Alibaba Qwen продуктивно провёл это лето, выпустив целый ряд моделей, которые не уступают, а то и превосходят аналоги ведущих американских лабораторий, в том числе Google, OpenAI и Anthropic. Крупнейшим проектом стала большая языковая модель Qwen3-Max-Preview (Instruct) с более чем 1 триллионом параметров.

 Источник изображения: Alibaba

Источник изображения: Alibaba

Параметры — это внутренние настройки, которые управляют поведением большой языковой модели, и чем их больше, тем обычно мощнее модель. Есть версия, что примерно то же число параметров у OpenAI GPT-4o, но в последнее время многие ведущие лаборатории ИИ стали выпускать модели меньшего размера, так что решение авторов Qwen увеличить этот показатель примечательно. Опубликованные китайскими разработчиками результаты тестов Qwen-3-Max-Preview указывают, что она превосходит предыдущую флагманскую модель компании Qwen3-235B-A22B-2507 и выступает серьёзным конкурентом другим ведущим моделям во всей отрасли. В тестах SuperGPQA, AIME25, LiveCodeBench v6, Arena-Hard v2, and LiveBench (20241125) новая Qwen3-Max-Preview держится стабильно выше Claude Opus 4, Kimi K2 и Deepseek-V3.1.

Новая модель уже доступна на собственном сайте разработчика Qwen Chat, через API в Alibaba Cloud, на платформах OpenRouter и AnyCoder. В отличие от других систем Alibaba, новая Qwen3-Max-Preview пока не доступна по лицензии с открытым исходным кодом, и для её подключения к приложениям разработчикам пока придётся довольствоваться платным API самой компании или её партнёров. На практике модель реже даёт сбои в таких задачах с подвохом как, например, сравнение одинаковых чисел или подсчёт количества заданных букв в указанном слове — не все современные ИИ пока на это способны. На платформе Qwen Chat она также работает быстрее, чем ChatGPT.

 Источник изображения: Alibaba

Источник изображения: Alibaba

Alibaba Qwen3-Max-Preview поддерживает контекстное окно длиной 262 144 токенов, максимальный объём запроса — 258 048 токенов, максимальная длина ответа — 32 768 токенов. Поддерживается кеширование контекста, что помогает оптимизировать производительность при длительных сессиях. Модель предназначается для сложных рассуждений (но режим «Мышление» в Qwen Chat пока недоступен), написания программного кода, обработки структурированных форматов данных, включая JSON, а также для задач творческого характера. Она одинаково эффективна в диалогах на разнообразные темы и в работе в качестве агента; ей могут пользоваться корпоративные клиенты и исследовательские лаборатории.

Стоимость работы с Alibaba Qwen3-Max-Preview через API в Alibaba Cloud зависит от количества токенов:

  • 0–32 тыс. токенов — $0,861 за 1 млн входящих и $3,441 за 1 млн исходящих токенов;
  • 32 тыс.–128 тыс. токенов — $1,434 за 1 млн входящих и $5,735 за 1 млн исходящих токенов;
  • 128 тыс.–252 тыс. токенов — $2,151 за 1 млн входящих и $8,602 за 1 млн исходящих токенов.

В соцсетях анонс Alibaba Qwen3-Max-Preview вызвал бурную реакцию. Авторы проекта отметили, что им удалось увеличить масштаб модели ИИ до 1 трлн параметров, и работа продолжается; более того, на предстоящей неделе они намереваются выпустить что-то ещё. Некоторые ограничения на длину контекста связаны с интерфейсом чата, а не особенностями самой модели, добавили они, и уже «в разработке» находится режим рассуждений для неё. Первые испытавшие модель пользователи выразили удовлетворение полученными в ходе начальных тестов результатами; некоторые заинтересовались, как она будет решать задачи, требующие сложных логических рассуждений.

 Источник изображения: x.com/_akhaliq

Источник изображения: x.com/_akhaliq

По запросу руководителя направления развития машинного обучения Ахсена Калика (Ahsen Khaliq) модель Alibaba Qwen3-Max-Preview построила на платформе AnyCoder воксельное изображение — модель сада в стиле Minecraft. Она, обратили внимание другие экспериментаторы, справилась с предложенными с арифметическими задачами, решила математическую «головоломку 24» и даже некую задачу, перед которой спасовали такие тяжеловесы как рассуждающая OpenAI GPT-5 и Google Gemini 2.5 Pro. Получив сложный запрос, она, как показывают наблюдения, переходит в похожий на рассуждения режим, в котором строит структурированные пошаговые ответы.

Для корпоративных клиентов ценность Qwen3-Max-Preview будет определяться не бенчмарками, а тем, как она на практике справляется с конкретными задачами. Располагая триллионом параметров, она меньше нуждается в постоянной тонкой настройке при развёртывании в приложениях, но сдерживающим фактором для бизнес-клиентов может стать многоуровневая система ценообразования. Сильными её сторонами является схожесть API с интерфейсом OpenAI и поддержка кеширования. Следует учитывать, что Qwen3-Max-Preview, как видно из названия, пока является предварительной версией модели, и поспешное её развёртывание может быть сопряжено с рисками.

Разработчики из лаборатории Alibaba Qwen также подчеркнули, что это ещё не финальная версия модели — её общедоступный вариант, вероятно, сможет похвастаться ещё более внушительными показателями. Это укрепит позиции Qwen в среде сверхбольших языковых моделей.

Alibaba представила ИИ-генератор изображений Qwen-Image с высокой степенью грамотности

Alibaba представила модель искусственного интеллекта Qwen-Image 20B MMDiT, предназначенную для работы с изображениями — в ней разработчик значительно улучшил механизмы прорисовки сложных текстов и реализовал возможности точного редактирования изображений.

 Источник изображения: huggingface.co/Qwen

Источник изображения: huggingface.co/Qwen

Модель, доступ к которой откроется на платформе Qwen Chat в разделе «Генерация изображений», обладает расширенными возможностями рендеринга текста, в том числе многострочных макетов с семантикой на уровне абзацев и детализированными элементами. Поддерживаются языки на основе букв и иероглифов. Усовершенствованные механизмы многозадачного обучения помогли расширить возможности редактирования изображений с сохранением смыслового наполнения и визуального реализма.

Новая Qwen-Image, уверяет Alibaba, обошла существующие решения в нескольких тестах по задачам на генерацию и редактирование изображений, включая GenEval, DPG, OneIG-Bench, GEdit, ImgEdit и GSO. Особых успехов удалось добиться в тестах на качество прорисовки текста, таких как LongText-Bench, ChineseWord и TextCraft — новая модель превзошла современные аналоги. Qwen-Image, в частности, справляется с точным отображением китайских иероглифов на вывесках магазинов с правильной глубиной резкости, с созданием детализированного английского текста на обложках книг и информационных слайдах, поддерживается работа с двуязычным контентом.

Помимо обработки текста, модель свободно ориентируется в художественных жанрах от фотореализма до импрессионизма; поддерживаются различные операции при редактировании изображений, в том числе изменение стиля, добавление, удаление и улучшение деталей, а также редактирование текста и изменение поз у персонажей. В проекте Qwen-Image разработчики Alibaba, по их словам стремились способствовать развитию генерации изображений, снизить технические барьеры для создания визуальных материалов и вдохновить коллег на инновационные приложения.

«Яндекс» открыл корпоративным клиентам доступ к ИИ-модели Alibaba Qwen 3 — самой мощной в ассортименте

Подразделение Yandex B2B Tech сообщило об открытии доступа в облачной инфраструктуре к модели искусственного интеллекта Alibaba Qwen3-235B-A22B-Instruct-2507, которая не уступает, а в отдельных случаях превосходит передовые разработки DeepSeek и OpenAI.

 Источник изображения: qwen.ai

Источник изображения: qwen.ai

Контекстное окно флагманской Alibaba Qwen 3 составляет до 256 тыс. токенов — это позволяет ей оперировать большими объёмами информации, обеспечивать персонализацию и давать точные ответы на вопросы. Модель располагает обширной базой знаний и поддерживает 119 языков и диалектов. Поддерживается также режим рассуждений — он необходим для пошагового решения сложных задач.

Модель обещает быть востребованной в различных направлениях деятельности — на её основе можно запустить автоматизированного агента поддержки для решения типовых проблем клиентов или виртуального помощника, способного ориентироваться в ассортименте интернет-магазина и оформлять возвраты. Разработавшая эту модель компания Alibaba уже развернула её на своих платформах электронной коммерции.

Своими силами развернуть подобную систему многим компаниям не под силу — требуются значительные вычислительные ресурсы и команда специалистов. Платформа Yandex Cloud AI Studio позволяет подключаться к ней по API — стоимость работы с Alibaba Qwen 3 составляет 50 копеек за 1000 токенов. В ассортименте платформы сегодня насчитываются 24 ИИ-модели, среди них также значатся DeepSeek и Google Gemma.

Alibaba выпустила «самую мощную» ИИ-модель для программирования — вышла открытая Qwen3-Coder

Alibaba Group объявила о выходе модели искусственного интеллекта Qwen3-Coder — она доступна с открытым исходным кодом и предназначается для написания программного кода. В компании назвали модель самым передовым средством для программирования на сегодняшний день.

 Источник изображения: qwenlm.github.io

Источник изображения: qwenlm.github.io

Гигант электронной коммерции выпустил новый проект на фоне ужесточающейся конкуренции в области разработки передовых систем ИИ — компании по обе стороны Тихого океана создают всё более сложные и мощные модели. Qwen3-Coder предназначается для решения основных задач, связанных с программированием — это не только генерация кода, но и управление сложными рабочими процессами.

Alibaba позиционирует новую модель как особенно эффективную в «связанных с программированием задачах агентного ИИ» — это автоматизированные процессы, в которых системы ИИ могут самостоятельно решать задачи при написании кода. По ключевым возможностям в области программирования Qwen3-Coder превосходит китайских конкурентов, в том числе DeepSeek и Moonshot AI K2, утверждает Alibaba. В определённых областях она, по версии разработчика, соответствует возможностям ведущих американских моделей, в том числе Anthropic Claude и OpenAI GPT-4.


window-new
Soft
Hard
Тренды 🔥
Microsoft представила Copilot Cowork — автономного ИИ-агента для сложных задач на базе моделей Anthropic 51 мин.
Anthropic подала в суд на власти США из-за включения её в «чёрный список» Пентагона 55 мин.
Журналисты выяснили, какую игру делает новая студия создателя Resident Evil и The Evil Within 3 ч.
«Щикарно»: GamesVoice анонсировала русскую озвучку South Park: The Stick of Truth с теми самыми голосами 5 ч.
Боевик Samson: A Tyndalston Story от создателя Just Cause получил системные требования — оперативной памяти нужно больше, чем места на SSD 6 ч.
Google Translate научится закреплять до десятка часто используемых языков 6 ч.
Новый трейлер раскрыл дату выхода психологического хоррора на четверых The Mound: Omen of Cthulhu 7 ч.
tinyBuild похвасталась продажами The King is Watching — российской стратегии, где никто не работает, если за ним не следить 11 ч.
ИИ-модель Anthropic Claude обнаружила 22 уязвимости в Mozilla Firefox за две недели — из них 14 весьма серьёзны 12 ч.
«Однажды мы догоним тебя, Silksong»: пиковый онлайн Slay the Spire 2 в Steam превысил полмиллиона игроков 13 ч.
Samsung скоро выпустит смартфоны Galaxy A57 и Galaxy A37 — утечка раскрыла их характеристики 46 мин.
Google выделила $50 млн на устранение суперзагрязнителей из окружающей среды 2 ч.
Oukitel представила первый в мире защищённый ноутбук, который может обойтись вообще без розетки 5 ч.
Ubitium стала на шаг ближе к выпуску универсального RISC-V процессора, заменяющего CPU, GPU, DSP и FPGA 7 ч.
Представлен Realme Note 80 — смартфон за $105 с 4 Гбайт оперативной памяти и батареей на 6300 мА·ч 8 ч.
MaxSun выпустила пару «двуглавых» видеокарт Arc Pro B60 Dual без вентиляторов 8 ч.
Договаривайтесь заранее: Sandisk пообещала скидки предусмотрительным клиентам с долгосрочными контрактами 8 ч.
Евросоюз анонсировала инициативу EURO-3C по созданию федеративной IT-инфраструктуры 10 ч.
Люди и культура: Тим Кук назвал две главные ценности Apple накануне 50-летнего юбилея компании 10 ч.
Arduino представила одноплатный компьютер Ventuno Q для ИИ-роботов 11 ч.