|
Опрос
|
реклама
Быстрый переход
Alibaba потеряла одного из руководителей разработки ИИ-моделей Qwen
04.03.2026 [12:44],
Павел Котов
Вскоре после выпуска открытых малых моделей Qwen 3.5 ответственное за них подразделение Alibaba Qwen лишилось одного из наиболее заметных своих руководителей. Цзюньян Линь (Junyang Lin) сообщил о своём уходе, не вдаваясь в подробности, — он начал работу в Alibaba в июле 2019 года, а к отделу Qwen присоединился в апреле 2023 года.
Источник изображения: alibabagroup.com Внезапный уход господина Линя вызвал резкую реакцию со стороны коллег и отраслевых партнёров, особенно в свете усиления глобальной конкуренции среди разработчиков ИИ и стремления компании выпускать модели, способные конкурировать с проектами OpenAI, Google и Anthropic. Семейство моделей Alibaba Qwen сегодня является одним из наиболее известных китайских проектов в области ИИ с открытым исходным кодом; в бенчмарках эти модели не уступают проектам ведущих китайских разработчиков. Первая модель Qwen вышла в апреле 2023 года; получив разрешение от регулирующих органов, Alibaba открыла её для широкой публики в сентябре. Ранее стало известно о выпуске малых моделей Alibaba Qwen 3.5 с 0,8, 2, 4 и 9 млрд параметров. Изначально мультимодальные модели предназначаются для использования в разных областях — от развёртывания ИИ на устройствах до создания легковесных ИИ-агентов. Квартет привлёк внимание отраслевых деятелей, и даже Илон Маск (Elon Musk) признал, что новые китайские малые модели демонстрируют «впечатляющую плотность интеллекта». Обстоятельства ухода Цзюньяна Линя остаются неясными. Сам он комментариев по поводу произошедшего не дал. Участник проекта Qwen Чэнь Чэн (Chen Cheng) сообщил, что «убит горем» из-за этой новости, а также обратился к самому Линю со словами: «Я знаю, что уход не был твоим выбором», добавив, что всего несколько часов они работали в команде над запуском моделей. В Alibaba официальных комментариев тоже не дали. Alibaba представила малые ИИ-модели Qwen3.5, которые работают на ноутбуке и обходят аналоги OpenAI
03.03.2026 [17:28],
Павел Котов
Специализирующееся на технологиях искусственного интеллекта подразделение Alibaba Qwen представило новую линейку моделей — их отличают небольшие размеры и высокая производительность при качестве ответов, значительно превосходящем ведущие американские аналоги.
Источник изображений: Alibaba Младшие в новой линейке модели Alibaba Qwen3.5-0.8B и 2B характеризуются как «миниатюрная» и «быстрая»; они предназначаются для разработки прототипов и быстрого развёртывания на мобильных устройствах с минимальной производительностью, когда время автономной работы имеет первостепенное значение. Мультимодальная Qwen3.5-4B предназначена для создания легковесных агентов и изначально поддерживает контекстное окно в 262 144 токена. Рассуждающая Qwen3.5-9B превосходит по возможностям американского конкурента — открытую OpenAI gpt-oss-120B, которая крупнее по размеру в 13,5 раза; модель от Alibaba демонстрирует знание языков и логическое мышление на уровне аспирантуры. Веса моделей доступны для всех желающих под лицензией Apache 2.0, которая допускает корпоративное и коммерческое использование, в том числе дополнительное обучение по мере необходимости. При разработке малых моделей серии Qwen3.5 компания отошла от стандартных архитектур Transformer — здесь использована гибридная архитектура, сочетающая нейросети Gated Delta Networks и разреженную смесь экспертов (Mixture-of-Experts — MoE). Гибридный подход помогает решить проблему «ограничения памяти», характерную для небольших моделей; Gated Delta Networks, в свою очередь, обеспечивает повышенную пропускную способность и уменьшенную задержку при ответе. Модели изначально мультимодальные. В отличие от предыдущих поколений, когда генераторы изображений «прикреплялись» к текстовым моделям, Qwen3.5 обучались на мультимодальных токенах. В результате версии 4B и 9B умеют распознавать элементы пользовательского интерфейса и подсчитывают объекты на видео. В визуальном тесте MMMU-Pro модель Qwen3.5-9B набрала 70,1 балла, обогнав Google Gemini 2.5 Flash-Lite (59,7) и даже специализированную Qwen3-VL-30B-A3B (63,0). В тесте на логическое мышление она получила 81,7 балла, превзойдя результат OpenAI gpt-oss-120b (80,1), у которой более чем вдесятеро больше параметров. В математическом бенчмарке HMMT Feb 2025 модель Qwen3.5-9B показала 83,2 балла, а вариант 4B — 74,0, доказав, что для решения сложных задач в области точных наук больше не нужны значительные облачные ресурсы. Старшая модель стала лидером в тесте OmniDocBench v1.5 с результатом 87,7 балла; в многоязычном MMMLU она набрала 81,2 балла, обойдя gpt-oss-120b, у которой 78,2 балла. Выпуск моделей Qwen3.5 малой серии совпал с этапом расцвета ИИ-агентов. Простых чат-ботов современному пользователю уже недостаточно — растёт спрос на функции автономности. Автономный ИИ-агент должен «думать» (рассуждать), «видеть» (быть мультимодальным) и «действовать» (уметь пользоваться инструментами). Выполнять эти функции с моделями размером в триллионы параметров, очень дорого, а эксплуатация Qwen3.5-9B обходится значительно дешевле. Масштабировав технологию обучения с подкреплением в средах с миллионами агентов, Alibaba наделила эти модели функциями «человеческого суждения» — они могут организовать рабочий стол или провести обратное проектирование игры в код по видеозаписи. Запущенная на смартфоне версия на 0,8 млрд параметров или на рабочей станции модель на 9 млрд параметров делают «эпоху агентов» демократичной. Организации могут запускать ИИ-агентов на собственных локальных ресурсах, не расходуя средства на подключение к облачным ресурсам и не используя средства API. Используя механизм «привязки на уровне пикселей», эти модели способны перемещаться по пользовательским интерфейсам ПК и мобильных устройств, заполнять формы и сортировать файлы, выполняя инструкции на простом языке. С продемонстрированной в тестах точностью 90 % они производят оптическое распознавание текста, анализируют макеты и извлекают структурированные данные из форм и диаграмм в документах. Можно загружать целые репозитории кода (до 400 000 строк) в контекстное окно размером до 1 млн токенов для рефакторинга или автоматизированной отладки. Предназначенные для мобильных устройств модели Qwen3.5-0.8B и 2B могут в локальном режиме составлять сводки по видео при длине до 60 секунд и частоте до 8 кадров в секунду; а также демонстрировать пространственное мышление. Указываются и аспекты, на которые следует обращать внимание при развёртывании малых моделей Qwen3.5. В многоэтапных агентных сценариях одна ошибка на раннем этапе выполнения задачи может привести к каскаду сбоев, при котором агент будет следовать неверному или бессмысленному плану. Модели хорошо справляются с написанием кода с нуля, но могут испытывать затруднения с отладкой или доработкой сложных устаревших проектов. Для производительной работы модели Qwen3.5-9B требуется значительный объём видеопамяти. При развёртывании моделей на предприятиях следует отдавать приоритет «проверяемым» задачам: написанию кода, математическим вычислениям или следованию инструкциям — всему тому, где результаты можно проверить на соответствие определённым нормам, чтобы избежать скрытых сбоев. Alibaba представила открытую LLM Qwen 3.5 с поддержкой ИИ-агентов и 201 языка — местами она быстрее Gemini 3 Pro
17.02.2026 [12:30],
Павел Котов
Китайский технологический гигант Alibaba представил модель искусственного интеллекта Qwen 3.5. Она доступна в открытом варианте, который позволяет всем желающим загружать, запускать, изменять и развёртывать её на собственной инфраструктуре; а также в хостинговой версии, предназначенной для работы на собственных серверах Alibaba.
Источник изображения: qwen.ai Alibaba Qwen 3.5 предлагает улучшения в производительности, стоимости обслуживания, и располагает «нативными мультимодальными возможностями», то есть одинаково хорошо работает с текстом, изображениями и видео. В соответствии с одной из ведущих тенденций отрасли ИИ модель умеет писать компьютерный код и располагает совместимостью с открытыми ИИ-агентами, включая популярный OpenClaw. ИИ-агентами называют приложения, способные самостоятельно выполнять действия и многоэтапные задачи от имени пользователя при минимальном его участии. Открытая Alibaba Qwen 3.5 имеет 397 млрд параметров — переменных, определяющих, как обучается и рассуждает модель. Это меньше, чем у предыдущего флагмана, но, как утверждает разработчик, новая модель показала значительное улучшение в различных тестах. В работе она сопоставима с ведущими моделями OpenAI, Anthropic и Google — в отдельных тестах китайский ИИ даже превосходит западных конкурентов. Доступная через облачную платформу Model Studio версия Qwen-3.5-Plus также выступает на уровне ведущих конкурирующих продуктов, утверждает Alibaba. Она поддерживает 201 язык и диалект — у предыдущего поколения их было 82. В дни празднования китайского Нового года Alibaba выпустит ещё несколько открытых моделей ИИ, пообещал в соцсетях технический руководитель направления Qwen в Alibaba Cloud Линь Цзюньян (Lin Junyang). CXMT и YMTC пропали из американского «чёрного списка» по ошибке — документ уже исправляют
16.02.2026 [03:14],
Анжелла Марина
Министерство обороны США опубликовало и почти сразу же удалило обновлённую версию перечня китайских компаний, которые, по мнению Вашингтона, связаны с военным сектором КНР. Документ находился в открытом доступе около часа, после чего был отозван без объяснения причин.
Источник изображения: Ban Daisy/Unsplash Самым неожиданным в обнародованной версии «чёрного списка», как отмечает Reuters, стало исключение из него двух ведущих производителей микросхем — CXMT и YMTC, что немедленно вызвало критику со стороны сторонников жёсткой линии в отношении Пекина, которые указывают на быстрый прогресс этих компаний в производстве чипов, способных усилить военный потенциал Китая. Одновременно с этим Пентагон добавил в перечень целый ряд технологических гигантов. В их числе оказались крупнейший китайский оператор облачной инфраструктуры и электронной коммерции Alibaba, поисковой сервис Baidu, автопроизводитель BYD, биотехнологическая фирма WuXi AppTec и разработчик робототехники RoboSense. Пентагон направил в Федеральный реестр письмо с просьбой удалить уведомление из публичного доступа и отменить его публикацию, не указав мотивы такого решения. Представители министерства обороны, Белого дома и китайского посольства в Вашингтоне отказались от комментариев. Бывший сотрудник Совета национальной безопасности при администрации Джо Байдена (Joe Biden) Крис МакГайр (Chris McGuire) предположил, что исключение производителей чипов памяти могло быть технической ошибкой, особенно на фоне добавления компаний, критически важных для развития искусственного интеллекта в Китае. Одновременно эксперт по оборонной политике в Азиатско-Тихоокеанском регионе Эрик Сэйерс (Eric Sayers) из Американского института предпринимательства связал инцидент с проблемами межведомственного согласования. По его мнению, новые включения в список, вероятно, сохранятся, тогда как решения об исключении отдельных компаний останутся на стадии пересмотра. Представитель Alibaba заявил, что оснований для включения корпорации в перечень не существует, поскольку компания не является военной и не участвует в стратегии военно-гражданской интеграции, пригрозив судебными исками против американских властей. Хотя сам список не вводит прямых санкций, новый закон запретит Пентагону заключать контракты с перечисленными фирмами в ближайшие годы. Сообщается, что инцидент произошёл на фоне смягчения торговой политики администрации Дональда Трампа (Donald Trump) по отношению к Китаю после октябрьского торгового перемирия, включая разрешение Nvidia экспортировать в КНР свои вторые по мощности чипы для ускорения задач искусственного интеллекта и отсрочку запрета на продажу технологий китайских компаний. Alibaba запустила конкурента Nano Banana — мощный ИИ-генератор изображений Qwen-Image-2.0
11.02.2026 [10:54],
Павел Котов
Компания Alibaba объявила о выпуске модели искусственного интеллекта Qwen-Image-2.0, предназначенной для генерации изображений. Разработчику удалось совершить прорыв: модель справляется с отрисовкой текста без ошибок, причём позволяет выбирать стиль; поддерживаются объёмом до тысячи токенов; на выходе это могут быть фотореалистичные изображения, картинки для презентаций, плакаты, комиксы и многое другое.
Источник изображений: qwen.ai Созданию модели Qwen-Image-2.0 предшествовали два параллельных направления развития систем ИИ для работы с графикой. Первое направление — генерация изображений с максимальными точностью и детализацией, включая корректное отображение текста. Второе — редактирование изображений, где важны функциональность и согласованность, когда исходное изображение не искажается. Проект Qwen-Image-2.0 воплощает слияние этих двух направлений в единую универсальную модель, которая обладает преимуществами обеих веток. При этом она получила облегчённую архитектуру, меньший размер при более высокой скорости вывода. ![]() В Alibaba перечислили основные преимущества Qwen-Image-2.0. Помимо точности, которую модель унаследовала от ветки редактирования изображений, это способность к созданию сложных композиций за счёт поддержки подробных запросов длиной до тысячи токенов. Ещё одно достоинство Qwen-Image-2.0 — эстетическое качество, которое, в частности, помогает модели гармонично размещать текст относительно изображений и подбирать для него нужное начертание. Примером реализма служит генерация изображения с текстом на глянцевой доске, в которой отражаются окружающие её предметы; а также гармоничное размещение объектов и текста на генерируемых кинопостерах. Наконец, организация композиции и выравнивание позволяют Qwen-Image-2.0 рисовать комиксы с информативными иллюстрациями и корректным текстовым сопровождением. ![]() Компания Alibaba устроила слепое тестирование Qwen-Image-2.0 на платформе AI Arena. Разработчик сравнивал её возможности в генерации и редактировании изображений со способностями других моделей. В первом случае мощнее Qwen-Image-2.0 оказались только Google Gemini-3-Pro-Image-Preview и OpenAI GPT Image 1.5; во втором китайская модель уступила только флагманской Gemini. Alibaba выпустила открытую ИИ-модель RynnBrain для роботов
10.02.2026 [16:55],
Павел Котов
Alibaba представила модель искусственного интеллекта, предназначенную для работы в роботизированных системах — она позволяет им выполнять задачи в реальном мире. Китайский технологический гигант стремится установить лидерство в нескольких областях отрасли ИИ.
Источник изображения: alibaba-damo-academy.github.io Входящая в китайскую компанию академия DAMO представила основополагающую модель с открытым исходным кодом — она обеспечивает взаимодействие роботов с окружающей средой. Модель понимает отношения пространства со временем и может определять шаги для выполнения задач. Проект получил название RynnBrain; в его описании указано, что модель умеет составлять карты объектов, прогнозировать траектории, ориентироваться в тесных пространствах, например, на кухне или сборочной линии на заводе. С новой моделью Alibaba бросает вызов таким технологическим гигантам как Google и Nvidia. У первой есть модель Gemini Robotics-ER 1.5, у второй — Nvidia Cosmos-Reason2. RynnBrain обучена на большой языковой модели Qwen3-VL и доступна бесплатно на платформах Face и GitHub в нескольких версиях — от базовой с 2 млрд параметров до передовой в конфигурации MoE (Mixture-of-Experts). Она создана для работы в области, где за первенство сражаются Китай и США. Робототехника выступает одним из приоритетов для Пекина, а ключевым направлением считаются человекоподобные роботы, в которых видят потенциал по доминированию в области физического ИИ и преобразованию секторов от производства до гостиничного бизнеса. Китайские компании выпускают преимущественно модели ИИ с открытым кодом, тогда как американские игроки предпочитают удерживать передовые технологии за закрытыми дверями. Стратегия открытого исходного кода по направлению физического ИИ до настоящего момента преимущественно ограничивалась проектами академических учреждений. Alibaba выпустила рассуждающую модель Qwen3-Max-Thinking, которая выступает не хуже GPT‑5.2‑Thinking и Gemini 3 Pro
27.01.2026 [06:11],
Анжелла Марина
Компания Alibaba Cloud открыла публичный доступ к своей новейшей флагманской модели логического рассуждения Qwen3-Max-Thinking. Модель показала производительность на уровне ведущих аналогов, таких как GPT-5.2-Thinking, Claude-Opus-4.5 и Gemini 3 Pro, по результатам 19 бенчмарков.
Источник изображения: AI В официальном блоге компании сообщается, что Qwen3-Max-Thinking достигла улучшений в фактологической точности, сложных логических рассуждениях, следовании инструкциям, соответствии пользовательским предпочтениям и агентских возможностях. Этого удалось добиться за счёт увеличения параметров модели и использования значительных вычислительных ресурсов для обучения с подкреплением (Reinforcement Learning, RL) . Ключевым нововведением стали адаптивные инструменты и стратегия тестового масштабирования. В отличие от прежнего подхода, когда пользователь вручную выбирал инструменты, Qwen3-Max-Thinking теперь автономно задействует встроенные возможности поиска, памяти и интерпретатора кода прямо в диалоге. Разработчики заявляют, что инструменты поиска и памяти эффективно снижают «галлюцинации», дают доступ к актуальной информации и позволяют давать более персонализированные ответы, а интерпретатор кода позволяет выполнять фрагменты кода для решения сложных задач. Такой подход позволил повысить точность на нескольких специализированных тестах (GPQA, HLE, LiveCodeBench v6, IMO-AnswerBench) при сохранении прежнего объёма вычислений.
Источник изображения: Alibaba По словам компании, модель с адаптивными инструментами уже доступна в Qwen Chat. Также открыт доступ к API через сервис Alibaba Cloud Model Studio, для чего необходимо зарегистрировать аккаунт в Alibaba Cloud, воспользоваться сервисом Model Studio и создать в консоли разработчика API-ключ. API Qwen совместим с протоколом OpenAI API, что позволяет использовать стандартные методы интеграции, а также реализована поддержка протокола Anthropic API, обеспечивающая бесшовную работу с инструментом Claude Code. ИИ-бот Qwen от Alibaba научился заказывать доставку еды и бронировать поездки
15.01.2026 [13:38],
Владимир Мироненко
Компания Alibaba представила крупное обновление ИИ-бота Qwen, который теперь позволяет выполнять такие задачи, как заказ доставки еды и бронирование поездок, не переключаясь между приложениями.
Источник изображения: Igor Omilaev/unsplash.com «То, что мы запускаем сегодня, представляет собой переход от моделей, которые понимают, к системам, которые действуют — глубоко связанным с реальными услугами», — сообщил У Цзя (Wu Jia), вице-президент Alibaba Group. Это обновление приложения Qwen вышло спустя два месяца после его крупного обновления в рамках стратегического перехода компании к ИИ, ориентированному на потребителя. В этой области Alibaba ранее отставала от своих внутренних конкурентов ByteDance и Tencent, сосредоточившись в основном на корпоративных ИИ-услугах с использованием своего облачного бизнеса. Обновление интегрирует основные сервисы экосистемы Alibaba, включая платформу электронной коммерции Taobao, мгновенную коммерцию, платёжную систему Alipay, туристический сервис Fliggy и картографическую платформу Amap, в единый интерфейс искусственного интеллекта. В частности, благодаря интеграции Alipay с приложением Qwen пользователи могут авторизовывать и завершать транзакции, не выходя из диалога с ИИ-ботом. Как сообщает компания, функция оплаты с помощью ИИ в настоящее время поддерживает заказы мгновенной торговли и со временем будет расширена на другие сервисы. Alibaba также представила функцию Task Assistant («Помощник по задачам») в закрытой бета-версии, которая позволяет совершать телефонные звонки в рестораны, обрабатывать до 100 документов одновременно и планировать многоэтапные маршруты путешествий. По данным компании, после запуска 17 ноября публичной бета-версии потребительского ИИ-бота Qwen его аудитория превысила 100 млн ежемесячных активных пользователей. Китайские разработчики ИИ признают, что в ближайшие несколько лет им вряд ли удастся опередить США
12.01.2026 [08:11],
Алексей Разин
Представители китайской ИИ-отрасли достаточно трезво смотрят на перспективы её ближайшего развития, упоминая ограниченность вычислительных ресурсов и экспортные ограничения США в качестве главных препятствий к переходу к доминированию над геополитическим соперником в этой сфере в течение ближайших трёх или пяти лет.
Источник изображения: DeepSeek Как отмечает Bloomberg, руководящий созданием больших языковых моделей семейства Qwen в компании Alibaba Джастин Линь (Justin Lin), оценивает шансы любой из китайских компаний на прорыв в этой сфере менее чем в 20 %, если говорить о перспективе ближайших трёх или пяти лет. Подобные взгляды на ситуацию разделяют и другие представители китайской ИИ-отрасли типа Tencent и Zhipu AI. Представитель Alibaba пояснил, что в сравнении с OpenAI китайский конкурент обделён необходимыми для качественного прорыва ресурсами. Этот вопрос, по его словам, давно известен: чьи шансы на инновации выше, если сравнивать богатых и бедных? При этом китайские разработчики пытаются привлекать средства на своё развитие на фондовом рынке. На прошлой неделе Zhipu и MiniMax Group сообща смогли привлечь более $1 млрд на своё развитие. По мнению сооснователя Zhipu, отставание китайских разработчиков от американских будет только увеличиваться. Год назад неожиданный успех китайской DeepSeek заставил многие компании пойти путём создания больших языковых моделей с открытым исходным кодом. На тот момент казалось, что они исключили отставание от проприетарных моделей OpenAI, Anthropic и Google. Участники тематического китайского мероприятия признали, что ограничения США на поставку в Китай оборудования и технологий для выпуска передовых чипов существенным образом сдерживают развитие китайской ИИ-отрасли. Она в целом сильнее ограничена в ресурсах. Перешедший на работу из OpenAI в Tencent Яо Шунью (Yao Shunyu) призвал представителей китайской отрасли уделять больше внимания устранению узких мест в больших языковых моделях следующего поколения. К ним он отнёс долгосрочную память и функцию самообучения. Tencent в этом году намерена открыть доступ ИИ-ассистенту Yuanbao к истории чатов в WeChat, чтобы на основе этих данных ускорить совершенствование собственных моделей. Alibaba собирается делать упор на мультимодальность и агентов для работы с реальными приложениями. Участники мероприятия высказались за сотрудничество и отказ от бессмысленной конкуренции внутри Китая. Местные разработчики должны объединить усилия, чтобы успешно представлять КНР на международном рынке систем генеративного ИИ. ИИ-модель Alibaba Qwen3-VL способна уловить почти все детали двухчасового видео, лишь раз его «просмотрев»
30.11.2025 [18:32],
Николай Хижняк
Спустя несколько месяцев после запуска Qwen3-VL компания Alibaba опубликовала подробный технический отчёт об открытой мультимодальной модели. Данные показывают, что система превосходно справляется с математическими задачами, связанными с изображениями, и может анализировать многочасовые видеоматериалы.
Источник изображений: Alibaba Система справляется с большими объёмами данных, обрабатывая двухчасовые видео или сотни страниц документов в контекстном окне из 256 тыс. токенов. В тестах «иголка в стоге сена» флагманская модель с 235 млрд параметров обнаруживала отдельные кадры в 30-минутных видео со 100-процентной точностью. Даже в двухчасовых видео, содержащих около миллиона токенов, точность сохранялась на уровне 99,5 %. Тест основан на вставке семантически важного кадра-«иглы» в случайные места длинных видео, которые система затем должна найти и проанализировать.
Тест «иголка в стоге сена» измеряет способность модели находить определенные кадры в длинных видеороликах В опубликованных бенчмарках модель Qwen3-VL-235B-A22B часто превосходит Gemini 2.5 Pro, OpenAI GPT-5 и Claude Opus 4.1, даже когда конкуренты используют функции логического мышления или требуют больших затрат на мышление. Модель доминирует в задачах с визуальным математическим анализом, набирая 85,8 % в MathVista по сравнению с 81,3 % у GPT-5. В MathVision она лидирует с 74,6 %, опережая Gemini 2.5 Pro (73,3%) и GPT-5 (65,8%). Модель также демонстрирует широкий диапазон результатов в специализированных бенчмарках. Она набрала 96,5 % в тесте на понимание документов DocVQA и 875 баллов в OCRBench, поддерживая 39 языков — почти в четыре раза больше, чем её предшественник.
Qwen3-VL достигает точности более 70 процентов при выполнении задач OCR на 32 из 39 поддерживаемых языков Alibaba утверждает, что модель также демонстрирует новые возможности в задачах графического интерфейса. Точность Qwen3-VL-32B в ScreenSpot Pro, тестирующем навигацию в графических пользовательских интерфейсах, составила 61,8 %. В AndroidWorld, где система должна самостоятельно управлять приложениями Android, Qwen3-VL-32B показал результат 63,7 %. Модель также обрабатывает сложные многостраничные PDF-документы. В MMLongBench-Doc она показала результат 56,2 % при анализе длинных документов. В бенчмарке CharXiv для научных диаграмм она достигла 90,5 % при выполнении задач описания и 66,2 % при выполнении сложных логических задач. Однако не во всех случаях Qwen3-VL оказалась лучше конкурентов. В сложном тесте MMMU-Pro модель набрала 69,3 %, уступив GPT-5 с результатом 78,4 %. Коммерческие конкуренты также обычно лидируют в тестах качества видео. Данные свидетельствуют, что Qwen3-VL специализируется на визуальных математических задачах и документах, но всё ещё отстаёт в области общих логических рассуждений. В техническом отчёте описаны три основных архитектурных обновления, реализованных в Qwen3-VL. Во-первых, «interleaved MRoPE» заменяет предыдущий метод позиционного встраивания. Вместо группировки математических представлений по размерности (время, горизонталь, вертикаль), новый подход равномерно распределяет их по всем доступным математическим областям. Это изменение направлено на повышение производительности при работе с длинными видео. Во-вторых, технология DeepStack позволяет модели получать доступ к промежуточным результатам видеокодера, а не только к конечному результату. Это предоставляет системе доступ к визуальной информации с разной степенью детализации. В-третьих, система временных меток на основе текста заменяет сложный метод T-RoPE, используемый в Qwen2.5-VL. Вместо того, чтобы присваивать математическую временную позицию каждому видеокадру, система теперь вставляет простые текстовые маркеры, например, «<3,8 секунды>», непосредственно во входные данные. Это упрощает процесс и улучшает понимание моделью задач, связанных с анализом видео с временными рамками.
Qwen3-VL объединяет видеокодер и языковую модель для одновременной обработки текста, изображений и видео. DeepStack использует визуальную информацию с разных уровней обработки Alibaba обучала модель в четыре этапа на базе 10 тыс. графических процессоров. После обучения связыванию изображений и текста система прошла полное мультимодальное обучение примерно на триллионе токенов. Источниками данных были веб-скрапы, 3 млн PDF-файлов из Common Crawl и более 60 млн STEM-задач. На последующих этапах команда постепенно расширяла контекстное окно с 8000 до 32 000 и, наконец, до 262 000 токенов. Варианты Thinking прошли специальное обучение Chain-of-thought training, что позволило им генерировать промежуточные шаги рассуждения перед предоставлением окончательного ответа для достижения лучших результатов при решении сложных задач. Все модели Qwen3-VL, выпущенные с сентября, доступны по лицензии Apache 2.0 с открытыми весами на Hugging Face. Линейка включает плотные варианты с параметрами от 2B до 32B, а также модели со смесью экспертов 30B-A3B и массивные 235B-A22B. Хотя такие функции, как извлечение кадров из длинных видео, не являются новыми (в начале 2024 года Google Gemini 1.5 Pro уже реализовал эту функцию), Qwen3-VL предлагает конкурентоспособную производительность. Поскольку предыдущая модель Qwen2.5-VL уже широко применялась в исследованиях, новая модель, вероятно, станет стимулом для дальнейшей разработки ПО с открытым исходным кодом. Смарт-очки Alibaba Quark с крошечным экраном и дизайном обычных очков поступили в продажу за $537
27.11.2025 [15:28],
Алексей Разин
Продемонстрированные в конце июля умные очки Alibaba Quark поступили в китайские магазины по цене от $537 за модель Quark S1 со встроенными полупрозрачными дисплеями типа micro-OLED. Устройство позже выйдет и на международный рынок, будет предложено клиентам популярной площадки AliExpress. ![]() Помимо старшей версии Quark S1 со встроенными дисплеями типа micro-OLED, покупателям позднее будет предложена версия Quark G1, которая обходится без таких дисплеев, но стоит примерно в два раза меньше. Оба устройства используют платформу Snapdragon AR1 компании Qualcomm, ранее сообщалось и о применении операционной системы реального времени (RTOS). Проблему автономности Alibaba пытается решить за счёт возможности заменять аккумуляторы умных очков Quark, которые в штатном режиме позволяют обеспечить до 24 часов работы без подзарядки. Очки оснащены камерами и могут распознавать объекты, а голосовое взаимодействие с пользователем осуществляется через акустическую систему, использующую метод костной проводимости. Предсказуемо, что на программном уровне поддерживаются фирменные сервисы Alibaba типа платёжной системы Alipay, работы с торговой площадкой Taobao и сервисом бронирования Fliggy. В сотрудничестве с NetEase и Tencent реализована поддержка музыкальных сервисов Cloud Music и QQ Music соответственно. По данным IDC, на китайском рынке умных очков с начала текущего года по сентябрь включительно было поставлено 1,6 млн устройств, из них на долю продукции Xiaomi пришлась примерно треть. С учётом очков, оснащённых дисплеями, объём поставок превысил 2 млн штук. Выход на местный рынок сильного игрока в лице Alibaba призван усилить конкуренцию, с учётом наличия у этого интернет-гиганта собственной разнообразной программной инфраструктуры. Китайские разработчики отправляют ИИ учиться за границу — там есть санкционные ускорители Nvidia
27.11.2025 [12:43],
Алексей Разин
По информации Financial Times, введённое при Байдене ограничение на доступ китайских компаний к зарубежным ЦОД после прихода к власти Дональда Трампа (Donald Trump) было снято, и это позволило китайским разработчикам увеличить активность по обходу санкций в сфере использования ускорителей Nvidia для своих нужд.
Источник изображения: Nvidia Китайские разработчики, включая Alibaba и ByteDance, в последнее время всё чаще используют находящиеся в соседних странах Юго-Восточной Азии вычислительные центры, принадлежащие некитайским компаниям. Арендуя подобные вычислительные мощности для обучения своих больших языковых моделей, китайские компании получают доступ к передовому оборудованию Nvidia, которое недоступно им на родине в силу целого ряда причин. Напомним, что помимо собственно американских санкций, препятствием на этом пути являются и настойчивые рекомендации китайских властей по переводу китайских ЦОД на использование ускорителей местного происхождения. На практике китайские компании применяют другой подход. Они проводят за пределами КНР в арендованных ЦОД, которые нередко находятся в Сингапуре или Малайзии, базовое обучение своих больших языковых моделей, а инференсом занимаются уже в Китае с использованием элементной базы китайского происхождения. Местные законы запрещают экспортировать персональные данные граждан, поэтому часть обучения китайские разработчики проводят на территории страны. DeepSeek на этом фоне выделяется «условным патриотизмом», поскольку свои языковые модели обучает на территории КНР, но при этом не брезгует запасаться импортными ускорителями Nvidia для собственных нужд. Аренда зарубежных ЦОД для китайских компаний обретает актуальность и по причине необходимости обслуживания своих зарубежных клиентов. Пока эта экспансия носит ограниченный характер, но Alibaba и ByteDance настроены расширить свой охват мирового рынка. Китайские компании также ищут возможность получить доступ к центрам обработки данных, расположенным на Ближнем Востоке. Alibaba выпустила ИИ-бота Qwen — будущего конкурента ChatGPT
18.11.2025 [17:56],
Владимир Фетисов
Китайская компания Alibaba выпустила крупное обновление для своего чат-бота на базе искусственного интеллекта Qwen, тем самым обозначив своё агрессивное продвижение на рынок потребительского ИИ. Обновлённый ИИ-бот на основе передовой языковой модели компании доступен на домашнем рынке через бесплатное мобильное приложение и веб-сервис. Международная версия Qwen будет запущена позднее.
Источник изображения: alibabagroup.com «На основе одной команды он может сгенерировать полноценный исследовательский отчёт или автоматически создать качественную многостраничную презентацию в PowerPoint за секунды», — говорится в сообщении Alibaba. В компании добавили, что приложение Qwen перешло на стадию публичного бета-тестирования и позиционируется как «лучший персональный ИИ-помощник на базе самой мощной модели». Запуск потребительского ИИ-бота для Alibaba является своеобразным стратегическим разворотом, поскольку прежде компания не вкладывала значительных ресурсов в создание аналога ChatGPT. До этого она в основном сосредотачивала внимание на корпоративных клиентах, предоставляя им услуги в рамках своей облачной платформы. Запуск потребительского ИИ-бота Alibaba также происходит на фоне ожесточённой ценовой войны на рынке ИИ Китая. Начало этому противостоянию положила DeepSeek, сделавшая приоритетом недорогие вычисления для ИИ, тем самым вынудив конкурентов пойти аналогичным путём. Ранее Alibaba уже выпустила на рынок Китая несколько ИИ-продуктов, включая приложение Tongyi, которое впоследствии превратилось в Qwen, а также функции ИИ-помощника, интегрированные в фирменный браузер Quark. Несмотря на это, запуск приложения Qwen является первым случаем, когда Alibaba попыталась всерьёз выйти на потребительский рынок ИИ. Alibaba была в числе первых китайских компаний в сфере ИИ, выпустив интеллектуального помощника для широкой аудитории ещё в конце 2023 года. Однако Tongyi так и не удалось добиться успеха. По данным сервиса Aicpb.com, в сентябре этого года у приложения было 6,96 млн ежемесячных пользователей. В это же время месячная аудитория лидера рынка в лице Doubao от ByteDance составила 150 млн человек, DeepSeek использовали 73,4 млн человек, а ИИ-бота Tencent — 64,2 млн человек. Ant Group представила ИИ-ассистента для разработки мини-приложений за полминуты
18.11.2025 [13:08],
Алексей Разин
Подразделение Alibaba Group (Ant Group), которое занимается финансовыми технологиями, на этой неделе запустило ИИ-ассистента, позволяющего за считанные секунды разрабатывать мини-приложения по заданию, формулируемому в естественной языковой форме. LingGuang считается мультимодальным ИИ-ассистентом, позволяющим создавать полезные приложения без навыков программирования всего за 30 секунд.
Источник изображения: Ant Group В качестве примера подобных приложений приводятся утилита для отслеживания потребляемых с пищей калорий, игра в стиле Pac-Man и программа для заучивания китайских иероглифов. Можно использовать ИИ-ассистента для планирования путешествий, управления личными финансами и поиска нужных товаров. Ассистент также способен создавать простейшие трёхмерные модели, аудиоклипы, строить графики, создавать анимацию и интерактивные карты в минималистичном стиле. Профильное приложение доступно для скачивания под iOS и Android. ИИ-ассистент LingGuang также позволяет создавать цифровые учебные пособия, создавая понятные анимированные иллюстрации, поясняющие сложные физические или экономические процессы. Выход LingGuang последовал за выпуском приложения Qwen, которое позволяло пользоваться экосистемой Alibaba с привлечением инструментов искусственного интеллекта. Подобные агенты позволяют автоматизировать работу с приложениями и сервисами от лица пользователя. В июне Alibaba представила ИИ-ассистента для работы с рекомендациями в сфере здравоохранения, который предлагал около сотни различных услуг в этой сфере. Компания собирается и в дальнейшем уделять особое внимание внедрению ИИ в здравоохранении. К октябрю профильное приложение AQ уже обслуживало более 140 млн пользователей, связывая их с более чем 5000 медицинскими учреждениями и около 300 000 специалистами медицинского профиля. Alibaba нашла способ сократить потребность в количестве используемых ускорителей Nvidia на 82 %
20.10.2025 [04:52],
Алексей Разин
Нехватка вычислительных мощностей, присущая динамично развивающемуся рынку искусственного интеллекта, в Китае усугубляется ограничениями на импорт специализированных ускорителей. Разработчики вынуждены заниматься оптимизацией, и Alibaba нашла способ сократить количество необходимых ускорителей Nvidia для работы своих языковых моделей на 82 %.
Источник изображения: Nvidia Как поясняет South China Morning Post, бета-тестирование профильной системы Aegaeon уже проводится одним их подразделений Alibaba Cloud на протяжении более чем трёх месяцев. По информации, представленной Alibaba на мероприятии SOSP в столице Южной Кореи, данная система позволила сократить количество обслуживающих десятки языковых моделей ускорителей Nvidia H20 с 1192 до 213 штук. При этом соответствующие языковые модели используют до 72 млн параметров, как поясняет источник. Представителям Alibaba в создании такой системы помогали учёные Пекинского университета, которые назвали её «первой попыткой выявить излишние затраты, связанные с одновременным обслуживанием нагрузок с большими языковыми моделями». Провайдеры облачных услуг типа Alibaba сталкиваются с необходимостью одновременного обслуживания тысяч ИИ-моделей, но в сфере инференса наиболее часто используются лишь несколько моделей типа Qwen или DeepSeek, а прочие вызываются довольно редко. Это приводит к нерациональному расходованию ресурсов. В экосистеме Alibaba Cloud, например, до 17,7 % ускорителей выделяются для обработки 1,35 % запросов. Исследователи во всём мире начали предлагать повысить эффективность использования вычислительных ресурсов за счёт объединения в пулы, когда один GPU обслуживает несколько моделей. Система Aegaeon использует автомасштабирование на уровне токенов, позволяющее GPU переключаться между разными моделями прямо в процессе генерирования токенов. Один GPU в результате способен обрабатывать до семи моделей, тогда как в альтернативно устроенных системах их количество в лучшем случае достигает двух или трёх. Задержки, необходимые на переключение между моделями, при этом сократились на 97 % в случае с Aegaeon. Alibaba эту систему испытывает на маркетплейсе моделей Bailian, который предлагает модели Qwen корпоративным пользователям. Ускорители Nvidia H20 одноимённой американской компанией были созданы специально для китайского рынка, в апреле они попали под временный запрет на поставку в КНР, но к лету он был снят. Однако, китайские власти начали настоятельно рекомендовать национальным разработчикам отдавать предпочтение местной компонентной базе. В результате позиции Nvidia на китайском рынке передовых чипов для ИИ, по словам руководителя компании, буквально сократились до нуля. |