Сегодня 29 декабря 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → alibaba
Быстрый переход

ИИ-модель Alibaba Qwen3-VL способна уловить почти все детали двухчасового видео, лишь раз его «просмотрев»

Спустя несколько месяцев после запуска Qwen3-VL компания Alibaba опубликовала подробный технический отчёт об открытой мультимодальной модели. Данные показывают, что система превосходно справляется с математическими задачами, связанными с изображениями, и может анализировать многочасовые видеоматериалы.

 Источник изображений: Alibaba

Источник изображений: Alibaba

Система справляется с большими объёмами данных, обрабатывая двухчасовые видео или сотни страниц документов в контекстном окне из 256 тыс. токенов. В тестах «иголка в стоге сена» флагманская модель с 235 млрд параметров обнаруживала отдельные кадры в 30-минутных видео со 100-процентной точностью. Даже в двухчасовых видео, содержащих около миллиона токенов, точность сохранялась на уровне 99,5 %. Тест основан на вставке семантически важного кадра-«иглы» в случайные места длинных видео, которые система затем должна найти и проанализировать.

 Тест «иголка в стоге сена» измеряет способность модели находить определенные кадры в длинных видеороликах

Тест «иголка в стоге сена» измеряет способность модели находить определенные кадры в длинных видеороликах

В опубликованных бенчмарках модель Qwen3-VL-235B-A22B часто превосходит Gemini 2.5 Pro, OpenAI GPT-5 и Claude Opus 4.1, даже когда конкуренты используют функции логического мышления или требуют больших затрат на мышление. Модель доминирует в задачах с визуальным математическим анализом, набирая 85,8 % в MathVista по сравнению с 81,3 % у GPT-5. В MathVision она лидирует с 74,6 %, опережая Gemini 2.5 Pro (73,3%) и GPT-5 (65,8%).

 Модель Gemini 2.5 Pro сохраняет небольшое преимущество в общем понимании изображений

Модель Gemini 2.5 Pro сохраняет небольшое преимущество в общем понимании изображений

Модель также демонстрирует широкий диапазон результатов в специализированных бенчмарках. Она набрала 96,5 % в тесте на понимание документов DocVQA и 875 баллов в OCRBench, поддерживая 39 языков — почти в четыре раза больше, чем её предшественник.

 Qwen3-VL достигает точности более 70 процентов при выполнении задач OCR на 32 из 39 поддерживаемых языков

Qwen3-VL достигает точности более 70 процентов при выполнении задач OCR на 32 из 39 поддерживаемых языков

Alibaba утверждает, что модель также демонстрирует новые возможности в задачах графического интерфейса. Точность Qwen3-VL-32B в ScreenSpot Pro, тестирующем навигацию в графических пользовательских интерфейсах, составила 61,8 %. В AndroidWorld, где система должна самостоятельно управлять приложениями Android, Qwen3-VL-32B показал результат 63,7 %.

Модель также обрабатывает сложные многостраничные PDF-документы. В MMLongBench-Doc она показала результат 56,2 % при анализе длинных документов. В бенчмарке CharXiv для научных диаграмм она достигла 90,5 % при выполнении задач описания и 66,2 % при выполнении сложных логических задач.

Однако не во всех случаях Qwen3-VL оказалась лучше конкурентов. В сложном тесте MMMU-Pro модель набрала 69,3 %, уступив GPT-5 с результатом 78,4 %. Коммерческие конкуренты также обычно лидируют в тестах качества видео. Данные свидетельствуют, что Qwen3-VL специализируется на визуальных математических задачах и документах, но всё ещё отстаёт в области общих логических рассуждений.

В техническом отчёте описаны три основных архитектурных обновления, реализованных в Qwen3-VL. Во-первых, «interleaved MRoPE» заменяет предыдущий метод позиционного встраивания. Вместо группировки математических представлений по размерности (время, горизонталь, вертикаль), новый подход равномерно распределяет их по всем доступным математическим областям. Это изменение направлено на повышение производительности при работе с длинными видео. Во-вторых, технология DeepStack позволяет модели получать доступ к промежуточным результатам видеокодера, а не только к конечному результату. Это предоставляет системе доступ к визуальной информации с разной степенью детализации. В-третьих, система временных меток на основе текста заменяет сложный метод T-RoPE, используемый в Qwen2.5-VL. Вместо того, чтобы присваивать математическую временную позицию каждому видеокадру, система теперь вставляет простые текстовые маркеры, например, «<3,8 секунды>», непосредственно во входные данные. Это упрощает процесс и улучшает понимание моделью задач, связанных с анализом видео с временными рамками.

 Qwen3-VL объединяет видеокодер и языковую модель для одновременной обработки текста, изображений и видео. DeepStack использует визуальную информацию с разных уровней обработки

Qwen3-VL объединяет видеокодер и языковую модель для одновременной обработки текста, изображений и видео. DeepStack использует визуальную информацию с разных уровней обработки

Alibaba обучала модель в четыре этапа на базе 10 тыс. графических процессоров. После обучения связыванию изображений и текста система прошла полное мультимодальное обучение примерно на триллионе токенов. Источниками данных были веб-скрапы, 3 млн PDF-файлов из Common Crawl и более 60 млн STEM-задач. На последующих этапах команда постепенно расширяла контекстное окно с 8000 до 32 000 и, наконец, до 262 000 токенов. Варианты Thinking прошли специальное обучение Chain-of-thought training, что позволило им генерировать промежуточные шаги рассуждения перед предоставлением окончательного ответа для достижения лучших результатов при решении сложных задач.

Все модели Qwen3-VL, выпущенные с сентября, доступны по лицензии Apache 2.0 с открытыми весами на Hugging Face. Линейка включает плотные варианты с параметрами от 2B до 32B, а также модели со смесью экспертов 30B-A3B и массивные 235B-A22B.

Хотя такие функции, как извлечение кадров из длинных видео, не являются новыми (в начале 2024 года Google Gemini 1.5 Pro уже реализовал эту функцию), Qwen3-VL предлагает конкурентоспособную производительность. Поскольку предыдущая модель Qwen2.5-VL уже широко применялась в исследованиях, новая модель, вероятно, станет стимулом для дальнейшей разработки ПО с открытым исходным кодом.

Смарт-очки Alibaba Quark с крошечным экраном и дизайном обычных очков поступили в продажу за $537

Продемонстрированные в конце июля умные очки Alibaba Quark поступили в китайские магазины по цене от $537 за модель Quark S1 со встроенными полупрозрачными дисплеями типа micro-OLED. Устройство позже выйдет и на международный рынок, будет предложено клиентам популярной площадки AliExpress.

 Источник изображения: Alibaba

Помимо старшей версии Quark S1 со встроенными дисплеями типа micro-OLED, покупателям позднее будет предложена версия Quark G1, которая обходится без таких дисплеев, но стоит примерно в два раза меньше. Оба устройства используют платформу Snapdragon AR1 компании Qualcomm, ранее сообщалось и о применении операционной системы реального времени (RTOS).

Проблему автономности Alibaba пытается решить за счёт возможности заменять аккумуляторы умных очков Quark, которые в штатном режиме позволяют обеспечить до 24 часов работы без подзарядки. Очки оснащены камерами и могут распознавать объекты, а голосовое взаимодействие с пользователем осуществляется через акустическую систему, использующую метод костной проводимости. Предсказуемо, что на программном уровне поддерживаются фирменные сервисы Alibaba типа платёжной системы Alipay, работы с торговой площадкой Taobao и сервисом бронирования Fliggy. В сотрудничестве с NetEase и Tencent реализована поддержка музыкальных сервисов Cloud Music и QQ Music соответственно.

По данным IDC, на китайском рынке умных очков с начала текущего года по сентябрь включительно было поставлено 1,6 млн устройств, из них на долю продукции Xiaomi пришлась примерно треть. С учётом очков, оснащённых дисплеями, объём поставок превысил 2 млн штук. Выход на местный рынок сильного игрока в лице Alibaba призван усилить конкуренцию, с учётом наличия у этого интернет-гиганта собственной разнообразной программной инфраструктуры.

Китайские разработчики отправляют ИИ учиться за границу — там есть санкционные ускорители Nvidia

По информации Financial Times, введённое при Байдене ограничение на доступ китайских компаний к зарубежным ЦОД после прихода к власти Дональда Трампа (Donald Trump) было снято, и это позволило китайским разработчикам увеличить активность по обходу санкций в сфере использования ускорителей Nvidia для своих нужд.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Китайские разработчики, включая Alibaba и ByteDance, в последнее время всё чаще используют находящиеся в соседних странах Юго-Восточной Азии вычислительные центры, принадлежащие некитайским компаниям. Арендуя подобные вычислительные мощности для обучения своих больших языковых моделей, китайские компании получают доступ к передовому оборудованию Nvidia, которое недоступно им на родине в силу целого ряда причин. Напомним, что помимо собственно американских санкций, препятствием на этом пути являются и настойчивые рекомендации китайских властей по переводу китайских ЦОД на использование ускорителей местного происхождения.

На практике китайские компании применяют другой подход. Они проводят за пределами КНР в арендованных ЦОД, которые нередко находятся в Сингапуре или Малайзии, базовое обучение своих больших языковых моделей, а инференсом занимаются уже в Китае с использованием элементной базы китайского происхождения. Местные законы запрещают экспортировать персональные данные граждан, поэтому часть обучения китайские разработчики проводят на территории страны. DeepSeek на этом фоне выделяется «условным патриотизмом», поскольку свои языковые модели обучает на территории КНР, но при этом не брезгует запасаться импортными ускорителями Nvidia для собственных нужд.

Аренда зарубежных ЦОД для китайских компаний обретает актуальность и по причине необходимости обслуживания своих зарубежных клиентов. Пока эта экспансия носит ограниченный характер, но Alibaba и ByteDance настроены расширить свой охват мирового рынка. Китайские компании также ищут возможность получить доступ к центрам обработки данных, расположенным на Ближнем Востоке.

Alibaba выпустила ИИ-бота Qwen — будущего конкурента ChatGPT

Китайская компания Alibaba выпустила крупное обновление для своего чат-бота на базе искусственного интеллекта Qwen, тем самым обозначив своё агрессивное продвижение на рынок потребительского ИИ. Обновлённый ИИ-бот на основе передовой языковой модели компании доступен на домашнем рынке через бесплатное мобильное приложение и веб-сервис. Международная версия Qwen будет запущена позднее.

 Источник изображения: alibabagroup.com

Источник изображения: alibabagroup.com

«На основе одной команды он может сгенерировать полноценный исследовательский отчёт или автоматически создать качественную многостраничную презентацию в PowerPoint за секунды», — говорится в сообщении Alibaba. В компании добавили, что приложение Qwen перешло на стадию публичного бета-тестирования и позиционируется как «лучший персональный ИИ-помощник на базе самой мощной модели».

Запуск потребительского ИИ-бота для Alibaba является своеобразным стратегическим разворотом, поскольку прежде компания не вкладывала значительных ресурсов в создание аналога ChatGPT. До этого она в основном сосредотачивала внимание на корпоративных клиентах, предоставляя им услуги в рамках своей облачной платформы. Запуск потребительского ИИ-бота Alibaba также происходит на фоне ожесточённой ценовой войны на рынке ИИ Китая. Начало этому противостоянию положила DeepSeek, сделавшая приоритетом недорогие вычисления для ИИ, тем самым вынудив конкурентов пойти аналогичным путём.

Ранее Alibaba уже выпустила на рынок Китая несколько ИИ-продуктов, включая приложение Tongyi, которое впоследствии превратилось в Qwen, а также функции ИИ-помощника, интегрированные в фирменный браузер Quark. Несмотря на это, запуск приложения Qwen является первым случаем, когда Alibaba попыталась всерьёз выйти на потребительский рынок ИИ.

Alibaba была в числе первых китайских компаний в сфере ИИ, выпустив интеллектуального помощника для широкой аудитории ещё в конце 2023 года. Однако Tongyi так и не удалось добиться успеха. По данным сервиса Aicpb.com, в сентябре этого года у приложения было 6,96 млн ежемесячных пользователей. В это же время месячная аудитория лидера рынка в лице Doubao от ByteDance составила 150 млн человек, DeepSeek использовали 73,4 млн человек, а ИИ-бота Tencent — 64,2 млн человек.

Ant Group представила ИИ-ассистента для разработки мини-приложений за полминуты

Подразделение Alibaba Group (Ant Group), которое занимается финансовыми технологиями, на этой неделе запустило ИИ-ассистента, позволяющего за считанные секунды разрабатывать мини-приложения по заданию, формулируемому в естественной языковой форме. LingGuang считается мультимодальным ИИ-ассистентом, позволяющим создавать полезные приложения без навыков программирования всего за 30 секунд.

 Источник изображения: Ant Group

Источник изображения: Ant Group

В качестве примера подобных приложений приводятся утилита для отслеживания потребляемых с пищей калорий, игра в стиле Pac-Man и программа для заучивания китайских иероглифов. Можно использовать ИИ-ассистента для планирования путешествий, управления личными финансами и поиска нужных товаров. Ассистент также способен создавать простейшие трёхмерные модели, аудиоклипы, строить графики, создавать анимацию и интерактивные карты в минималистичном стиле. Профильное приложение доступно для скачивания под iOS и Android.

ИИ-ассистент LingGuang также позволяет создавать цифровые учебные пособия, создавая понятные анимированные иллюстрации, поясняющие сложные физические или экономические процессы. Выход LingGuang последовал за выпуском приложения Qwen, которое позволяло пользоваться экосистемой Alibaba с привлечением инструментов искусственного интеллекта.

Подобные агенты позволяют автоматизировать работу с приложениями и сервисами от лица пользователя. В июне Alibaba представила ИИ-ассистента для работы с рекомендациями в сфере здравоохранения, который предлагал около сотни различных услуг в этой сфере. Компания собирается и в дальнейшем уделять особое внимание внедрению ИИ в здравоохранении. К октябрю профильное приложение AQ уже обслуживало более 140 млн пользователей, связывая их с более чем 5000 медицинскими учреждениями и около 300 000 специалистами медицинского профиля.

Alibaba нашла способ сократить потребность в количестве используемых ускорителей Nvidia на 82 %

Нехватка вычислительных мощностей, присущая динамично развивающемуся рынку искусственного интеллекта, в Китае усугубляется ограничениями на импорт специализированных ускорителей. Разработчики вынуждены заниматься оптимизацией, и Alibaba нашла способ сократить количество необходимых ускорителей Nvidia для работы своих языковых моделей на 82 %.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Как поясняет South China Morning Post, бета-тестирование профильной системы Aegaeon уже проводится одним их подразделений Alibaba Cloud на протяжении более чем трёх месяцев. По информации, представленной Alibaba на мероприятии SOSP в столице Южной Кореи, данная система позволила сократить количество обслуживающих десятки языковых моделей ускорителей Nvidia H20 с 1192 до 213 штук. При этом соответствующие языковые модели используют до 72 млн параметров, как поясняет источник.

Представителям Alibaba в создании такой системы помогали учёные Пекинского университета, которые назвали её «первой попыткой выявить излишние затраты, связанные с одновременным обслуживанием нагрузок с большими языковыми моделями». Провайдеры облачных услуг типа Alibaba сталкиваются с необходимостью одновременного обслуживания тысяч ИИ-моделей, но в сфере инференса наиболее часто используются лишь несколько моделей типа Qwen или DeepSeek, а прочие вызываются довольно редко. Это приводит к нерациональному расходованию ресурсов. В экосистеме Alibaba Cloud, например, до 17,7 % ускорителей выделяются для обработки 1,35 % запросов.

Исследователи во всём мире начали предлагать повысить эффективность использования вычислительных ресурсов за счёт объединения в пулы, когда один GPU обслуживает несколько моделей. Система Aegaeon использует автомасштабирование на уровне токенов, позволяющее GPU переключаться между разными моделями прямо в процессе генерирования токенов. Один GPU в результате способен обрабатывать до семи моделей, тогда как в альтернативно устроенных системах их количество в лучшем случае достигает двух или трёх. Задержки, необходимые на переключение между моделями, при этом сократились на 97 % в случае с Aegaeon.

Alibaba эту систему испытывает на маркетплейсе моделей Bailian, который предлагает модели Qwen корпоративным пользователям. Ускорители Nvidia H20 одноимённой американской компанией были созданы специально для китайского рынка, в апреле они попали под временный запрет на поставку в КНР, но к лету он был снят. Однако, китайские власти начали настоятельно рекомендовать национальным разработчикам отдавать предпочтение местной компонентной базе. В результате позиции Nvidia на китайском рынке передовых чипов для ИИ, по словам руководителя компании, буквально сократились до нуля.

Alibaba займётся созданием интеллектуальных роботов на базе ИИ-моделей Qwen

Alibaba сформировала подразделение, которое займётся созданием робототехники — китайский технологический гигант присоединился в другим крупным компаниям в гонке по разработке оборудования на базе искусственного интеллекта.

 Источник изображения: alibabagroup.com

Источник изображения: alibabagroup.com

О создании «небольшой команды по созданию робототехники и встроенного ИИ» рассказал накануне в соцсети X Цзюньян Линь (Junyang Lin) — руководитель отдела Alibaba Qwen. Команда будет действовать в составе Qwen — отдела, ответственного за разработку одноимённого семейства моделей ИИ. Линь занимает должность технического руководителя подразделения, в котором он участвовал в разработке мультимодальных моделей, способных обрабатывать не только текстовые запросы, но также звуки и изображения.

 Источник изображения: x.com/JustinLin610

Источник изображения: x.com/JustinLin610

Мультимодальные модели используются в качестве агентов, способных выполнять требующие рассуждений задачи, и эти приложения «определённо должны выйти за рамки виртуального мира в физический», отметил господин Линь. В прошлом году Alibaba выступила в качестве основного инвестора в стартап в области робототехники X Square Robot и вложила в него $140 млн. В ближайшие пять лет общий объем инвестиций в ИИ по всему миру достигнет около $4 трлн, заявил в конце сентября глава компании Эдди Ву (Eddie Wu).

В интеллектуальную робототехнику сейчас вкладывают средства ведущие технологические компании мира, в том числе Nvidia и SoftBank — последняя накануне объявила о покупке подразделения промышленных роботов ABB Ltd за $5,4 млрд.. Глава Nvidia Дженсен Хуанг (Jensen Huang) ранее выразил уверенность, что у его компании есть «многотриллионные» возможности долгосрочного роста благодаря направлениям ИИ и робототехники.

Alibaba выпустила флагманскую ИИ-модель Qwen-3 Max — она обходит GPT-5 и доступна бесплатно

Компания Alibaba объявила о релизе Qwen-3 Max — новой флагманской большой языковой модели (LLM), которая стала самой продвинутой в линейке китайского разработчика. Она призвана конкурировать с ведущими решениями индустрии, включая GPT-5 от OpenAI, Gemini 2.5 Pro от Google и Claude Opus 4 от Anthropic.

 Источник изображений: Alibaba, Qwen

Источник изображений: Alibaba, Qwen

Qwen-3 Max стала первой моделью Alibaba, преодолевшей рубеж в один триллион параметров. При этом она была обучена на массиве данных объёмом 36 трлн токенов. Контекстное окно достигает 1 млн токенов, что позволяет анализировать целые кодовые базы или многотомные документы без разделения текста.

Alibaba утверждает, что Qwen-3 Max демонстрирует заметный прогресс в понимании сложных инструкций, рассуждениях и работе с узкоспециализированными областями знаний. Кроме того, модель обеспечивает более высокую точность в задачах, связанных с математикой, программированием, логикой и наукой. Отмечается и существенно улучшенная поддержка английского и китайского языков. Наконец, Qwen-3 Max реже галлюцинирует — то есть выдумывает факты в ответах.

В популярном рейтинге LMArena новая модель в версии Qwen3-Max-Instruct заняла третье место, уступив лишь Claude Opus 4.1 Thinking, Gemini 2.5 Pro и OpenAI GPT-5 High, но при этом опередив базовую версию GPT-5. В тесте SWE-Bench Verified, проверяющем способность решать реальные задачи программирования, она набрала 69,6 балла — больше, чем DeepSeek V3.1, но немного меньше, чем Claude Opus 4. В испытании Tau2-Bench, оценивающем работу ИИ-агентов, Qwen-3 Max набрала 74,8 балла, превзойдя и DeepSeek V3.1, и Claude Opus 4.

Alibaba также упомянула перспективную версию Qwen-3-Max-Thinking, которая пока находится на стадии обучения, но уже демонстрирует «выдающийся потенциал». В частности, в пробных тестах она показала стопроцентный результат в задачах на рассуждение, включая AIME-25 и HMMT.

Воспользоваться Qwen-3 Max можно уже сейчас: модель в версии Qwen3-Max-Base доступна бесплатно через приложение или сайт Qwen. На iOS и Android новая модель теперь будет предлагаться в качестве стандартной. Если модель пока не предлагается по умолчанию, её можно активировать вручную через меню выбора модели.

Alibaba удалось разработать ИИ-чип T-Head PPU, сопоставимый по характеристикам с Nvidia H20

Китайские разработчики ускорителей вычислений вынуждены были ориентироваться на быстродействие поставляемых из-за рубежа решений Nvidia, а с недавних пор такое сопоставление требуется и по инициативе китайских властей. Подразделение Alibaba утверждает, что смогло разработать ускоритель, который сопоставим по характеристикам с Nvidia H20.

 Источник изображения: T-Head, SCMP

Источник изображения: T-Head, SCMP

Речь идёт о T-Head PPU — чипе, который разработало одноимённое подразделение Alibaba. Таблица с его сравнительными характеристиками, как сообщает South China Morning Post, мелькнула в репортаже китайского телеканала CCTV. Представители компании, как поясняется, демонстрировали новый ускоритель премьер-министру КНР Ли Цяна (Li Qiang) во время его визита в центр обработки данных China Unicom в провинции Цинхай на северо-западе страны.

Чипы T-Head при этом сравнивались по характеристикам с Nvidia H20 и A800, которые на определённых этапах поставлялись в Китай официально. В апреле этого года власти США наложили запрет на поставки H20 в КНР, но в июле его сняли. После китайские власти развернули кампанию по дискредитации ускорителей Nvidia, и недавно представленные RTX Pro 6000D крупным разработчикам рекомендовали не использовать в своей инфраструктуре в достаточно категоричной форме.

Судя по мелькнувшим в эфире CCTV кадрам, ускоритель T-Head PPU оснащается 96 Гбайт памяти типа HBM2e, предлагает пропускную способность соединительного интерфейса между чипами на уровне 700 Гбайт/с и поддержку интерфейса PCI Express 5.0. Его энергопотребление при этом укладывается в 400 Вт, что позволяет говорить о некоторой экономии по сравнению с Nvidia H20. В распоряжении China Unicom находятся 16 384 ускорителей T-Head, который в совокупности обеспечивают быстродействие на уровне 1945 петафлопс. Кроме того, China Unicom использует китайские ускорители MetaX, Biren Technology и Zhonghao Xinying Technology. К партнёрству рассматриваются и другие китайские разработчики чипов: Moore Threads, Enflame и Tecorigin.

Китайский ИИ-оптимизм на взлёте: национальные технокомпании кратно наращивают траты на инфраструктуру

Бум искусственного интеллекта уже вынуждает одного из его фаворитов в лице американского стартапа OpenAI опережающими темпами увеличивать капитальные затраты и привлекать дополнительные средства инвесторов без внятной перспективы финансовой отдачи. В Китае спрос на финансирование этой отрасли также растёт, по итогам текущего года крупные игроки рынка готовы сообща потратить на ИИ более $32 млрд.

 Источник изображения: Unsplash, Ban Daisy

Источник изображения: Unsplash, Ban Daisy

Такими прогнозами делятся аналитики Bloomberg Intelligence, которые подчёркивают, что ещё в 2023 году компании Alibaba, Tencent, Baidu и JD.com могли сообща довольствоваться в этой сфере суммой менее $13 млрд. Теперь она будет увеличена в два с половиной раза всего за пару лет. Только Alibaba в отдельности планирует в ближайшие три года потратить на развитие собственной облачной инфраструктуры и ИИ до $53 млрд, по данным Bloomberg. В сентябре этого года Alibaba, Tencent и Baidu вместе привлекли в виде облигаций более $5 млрд.

Помимо вложений в развитие программного обеспечения и обучение больших языковых моделей, китайские гиганты готовы вкладываться в разработку собственных компонентов для ускорителей вычислений, поскольку многим из них использовать передовые ускорители американского происхождения мешают санкции. Инвесторы после пары лет наблюдений за прогрессом чат-ботов и других ИИ-сервисов довольно благосклонно относятся к идее финансирования отрасли, поэтому проблем с привлечением финансовых ресурсов у китайских разработчиков не возникает. Их акции также растут в последние месяцы, что говорит о высоком доверии инвесторов.

Китайские компании предпочитают привлекать к своим облигациям, номинированным в юанях, средства зарубежных инвесторов через площадку в Гонконге. Это выгоднее, чем размещать долларовые облигации в современных условиях. Alibaba решилась на выпуск конвертируемых облигаций на сумму $3,2 млрд для финансирования своих инфраструктурных проектов в сфере ИИ. В будущем компании придётся конвертировать эти обязательства в собственные акции.

Так или иначе, китайский рынок остаётся в тени американского с точки зрения масштабов привлечения финансовых ресурсов. Крупные игроки в США рассчитывают по итогам этого года потратить $390 млрд на актуальные проекты в сфере ИИ, эта сумма более чем в два раза превышает итог 2023 года. Китайским конкурентам приходится экономить не только при обучении языковых моделей, но и при привлечении на работу востребованных специалистов. Популярные американские стартапы типа OpenAI и Anthropic сохраняют способность привлекать крупные суммы в рамках частных раундов финансирования, даже если история компании насчитывает всего несколько лет. Китайским стартапам в этом отношении приходится сложнее, но отношение к ним инвесторов тоже можно назвать доверительным.

Основатель Alibaba Джек Ма успешно пережил пять лет гонений и вернулся к управлению своей компанией

Растущее влияние китайского конгломерата Alibaba в 2020 году стало причиной начала антимонопольного расследования, после которого основатель компании Джек Ма (Jack Ma) перестал появляться на публике и делать громкие заявления. Теперь он полон решимости восстановить пошатнувшиеся рыночные позиции Alibaba, хотя прежней публичной активности от него уже не ждут.

 Источник изображения: Alibaba

Источник изображения: Alibaba

Как отмечает Bloomberg, после почти пяти лет частичного забвения Джек Ма вернулся к активной работе. По крайней мере, он полон решимости отвоевать рыночные позиции у конкурирующих торговых площадок JD.com и Meituan. На эти нужды были выделены $7 млрд, и Джек Ма был непосредственным инициатором данного решения, по данным источников. С 2023 года руководство бизнесом Alibaba было поручено ближайшим соратникам Джека Ма — Джо Цаю (Joe Tsai) и Эдди У (Eddie Wu). Они пока воздерживаются от комментариев на тему возможного возвращения Джека Ма к более активному участию в жизни его детища.

Из неофициальных источников известно, что Джек Ма начал проявлять максимальную активность в управлении бизнесом Alibaba с 2019 года, когда он ушёл с поста председателя совета директоров конгломерата. Он лично курирует новейшие инициативы компании в сфере внедрения систем искусственного интеллекта. В некоторых случаях он требует от своих подчинённых докладывать ему об изменениях до трёх раз в день. Запечатлённое прессой рукопожатие Джека Ма и Си Цзиньпина (Xi Jingpin) в феврале этого года воспринимается, как сигнал к потеплению отношения китайских властей к фигуре одного из богатейших людей страны, но эксперты считают, что теперь предприниматель будет меньше появляться на публике.

После продолжительной паузы основателю Alibaba придётся привыкать к реальности, в которой его компания более не контролирует 85 % рынка электронной коммерции в Китае, а борьба за место на нём идёт весьма жестокая. В том же сегменте услуг по доставке еды Alibaba занимает в Китае только 43 %, тогда как Meituan принадлежат все 47 %. Новая волна активности Джека Ма по оживлению конкуренции может вызвать очередные претензии властей КНР, поэтому ему придётся соблюдать некоторую осторожность.

Когда в 2020 году миллиардер попал в немилость китайских властей, Alibaba лишилась около $700 млрд своей рыночной капитализации — сейчас в такую сумму оценивается весь Tencent Holdings. Джеку Ма после приходилось проводить больше времени в Гонконге и Токио, чем в материковой части Китая. Моральный дух сотрудников Alibaba сильно упал, ситуацию также усугубили и присущие периоду пандемии ограничения. Возвращение Джека Ма в штаб-квартиру Ant Group в декабре прошлого года у некоторых сотрудников с большим стажем вызвало такой шквал эмоций, что они буквально расплакались при виде основателя холдинга.

Сейчас Джек Ма прилагает максимум усилий к развитию фирменной облачной инфраструктуры, процессоров T-head и больших языковых моделей семейства Qwen. По всем этим направлениям деятельности он требует от подчинённых ежедневных отчётов. Alibaba ведёт свою историю с 1999 года, когда Джек Ма привлёк $80 000 от 80 инвесторов для запуска площадки для интернет-торговли, которой суждено было стать одной из крупнейших в мире. В 2014 году компания смогла привлечь на IPO около $25 млрд, а в последующие годы капитализация Alibaba перевалила за $800 млрд. Преследования миллиардера со стороны властей в 2020 году наложились на влияние пандемии, после чего капитализация компании начала снижаться.

Действующих лидеров бизнеса Джек Ма также готовит на роль новых руководителей, которым предстоит его развивать в последующие годы. Прошедшие пять лет для торгового бизнеса Alibaba были очень непростыми, поскольку попытки провести реструктуризацию ни к чему хорошему не привели, и теперь руководство пытается стабилизировать ситуацию и восстановить утраченные рыночные позиции. Джек Ма, по мнению осведомлённых источников, сохраняет огромное влияние на стратегию бизнеса Alibaba, и может буквально корректировать её с помощью телефонного звонка. Возвращение Джека Ма в штаб-квартиру Alibaba породило и определённые проблемы, поскольку некоторые сотрудники считают его главным центром принятия решений, хотя в действительности у него нет никакого особого официального статуса, и вряд ли он его восстановит в дальнейшем. Тем не менее, это вносит определённую сумятицу в процесс управления бизнесом, хотя в целом и поднимает моральный дух сотрудников компании.

Alibaba выпустила ИИ-модель Qwen3-Next — она десятикратно мощнее предшественницы

Alibaba представила первую открытую модель искусственного интеллекта на новой архитектуре Qwen3-Next — она в десять раз быстрее своей прямой предшественницы, но её разработка обошлась в десять раз дешевле. По качеству и точности ответов она сравнима с флагманом предыдущего поколения.

 Источник изображений: qwen.ai

Источник изображений: qwen.ai

Alibaba Qwen3-Next-80B-A3B с 80 млрд параметров потребовала примерно в десять раз меньше затрат на обучение по сравнению с предшественницей Qwen3-32B, но новая модель выполняет некоторые задачи в десять раз быстрее. По точности и качеству ответов она работает на уровне флагманской Qwen3-235B-A22B; модели нового поколения оптимизированы для эффективного развёртывания и работы даже на потребительском оборудовании, рассказали в Alibaba.

Компания также представила рассуждающую версию модели на той же архитектуре. Alibaba Qwen3-Next-80B-A3B-Thinking превзошла свою предшественницу Qwen3-32B-Thinking и Google Gemini-2.5-Flash-Thinking по ряду параметров, заявил разработчик со ссылкой на сторонние тесты.

Компания повысила эффективность новой модели за счёт сочетания ряда методов: в частности, использовались механизм «гибридного внимания», который помог упростить обработку входных текстовых данных, и архитектура «высокоразреженной смеси экспертов» (MoE) — она предполагает разбиение модели на подсети, специализирующиеся на разных подмножествах входных данных для совместного решения задач. Ещё одним нововведением стала стратегия «многотокенного прогнозирования», а также ряд мер, направленных на повышение стабильности модели в процессе обучения.

Модель Qwen3-Next-80B-A3B уже доступна в инфраструктуре Alibaba Cloud для работы через API; поработать с ней можно также на платформах Hugging Face и ModelScope.

Китайские Baidu и Alibaba последовали «линии партии» и активно отказываются от ИИ ускорителей Nvidia

Почти три месяца добивавшаяся права возобновить поставки ускорителей H20 в Китай компания Nvidia к концу лета столкнулась с тем, что китайские клиенты не выражают прежней готовности закупать её продукцию. Многие из них переходят на собственную компонентную базу или решения китайских поставщиков. Alibaba и Baidu не стали исключением.

 Источник изображения: Nvidia

Источник изображения: Nvidia

По данным The Information, указанные китайские компании наращивают использование в своей инфраструктуре процессоров собственной разработки. В случае с Alibaba речь идёт о чипах семейства Zhenwu, которые по её заказу изготавливаются китайской компанией SMIC. При этом уровень производительности такого чипа лишь немного превышает показатели устаревшего Nvidia A100 образца 2020 года, поэтому говорить о полноценной замене импортных комплектующих рано.

Процессоры Kunlun P800 компании Baidu используются преимущественно на этапах работы с системами ИИ, не подразумевающих обучение больших языковых моделей. Это также может указывать на их скромные возможности в указанной сфере. Представители Nvidia в комментариях The Information признали, что на китайском рынке усилилась конкуренция, вне всякого сомнения. При этом американская компания продолжает работать над усилением доверия со стороны клиентов. Позиции Nvidia на китайском рынке пошатнулись как под воздействием санкций, так и в результате развития предложения со стороны китайских разработчиков. Если в прошлом году компания в КНР получила 13 % всей выручки, то в прошлом квартале эта доля сократилась до 6 %. Зато совокупная выручка компании на мировом рынке за период выросла на 56 % год к году.

Alibaba представила предварительную версию ИИ-модели Qwen3-Max с 1 триллионом параметров

Отдел разработки систем искусственного интеллекта Alibaba Qwen продуктивно провёл это лето, выпустив целый ряд моделей, которые не уступают, а то и превосходят аналоги ведущих американских лабораторий, в том числе Google, OpenAI и Anthropic. Крупнейшим проектом стала большая языковая модель Qwen3-Max-Preview (Instruct) с более чем 1 триллионом параметров.

 Источник изображения: Alibaba

Источник изображения: Alibaba

Параметры — это внутренние настройки, которые управляют поведением большой языковой модели, и чем их больше, тем обычно мощнее модель. Есть версия, что примерно то же число параметров у OpenAI GPT-4o, но в последнее время многие ведущие лаборатории ИИ стали выпускать модели меньшего размера, так что решение авторов Qwen увеличить этот показатель примечательно. Опубликованные китайскими разработчиками результаты тестов Qwen-3-Max-Preview указывают, что она превосходит предыдущую флагманскую модель компании Qwen3-235B-A22B-2507 и выступает серьёзным конкурентом другим ведущим моделям во всей отрасли. В тестах SuperGPQA, AIME25, LiveCodeBench v6, Arena-Hard v2, and LiveBench (20241125) новая Qwen3-Max-Preview держится стабильно выше Claude Opus 4, Kimi K2 и Deepseek-V3.1.

Новая модель уже доступна на собственном сайте разработчика Qwen Chat, через API в Alibaba Cloud, на платформах OpenRouter и AnyCoder. В отличие от других систем Alibaba, новая Qwen3-Max-Preview пока не доступна по лицензии с открытым исходным кодом, и для её подключения к приложениям разработчикам пока придётся довольствоваться платным API самой компании или её партнёров. На практике модель реже даёт сбои в таких задачах с подвохом как, например, сравнение одинаковых чисел или подсчёт количества заданных букв в указанном слове — не все современные ИИ пока на это способны. На платформе Qwen Chat она также работает быстрее, чем ChatGPT.

 Источник изображения: Alibaba

Источник изображения: Alibaba

Alibaba Qwen3-Max-Preview поддерживает контекстное окно длиной 262 144 токенов, максимальный объём запроса — 258 048 токенов, максимальная длина ответа — 32 768 токенов. Поддерживается кеширование контекста, что помогает оптимизировать производительность при длительных сессиях. Модель предназначается для сложных рассуждений (но режим «Мышление» в Qwen Chat пока недоступен), написания программного кода, обработки структурированных форматов данных, включая JSON, а также для задач творческого характера. Она одинаково эффективна в диалогах на разнообразные темы и в работе в качестве агента; ей могут пользоваться корпоративные клиенты и исследовательские лаборатории.

Стоимость работы с Alibaba Qwen3-Max-Preview через API в Alibaba Cloud зависит от количества токенов:

  • 0–32 тыс. токенов — $0,861 за 1 млн входящих и $3,441 за 1 млн исходящих токенов;
  • 32 тыс.–128 тыс. токенов — $1,434 за 1 млн входящих и $5,735 за 1 млн исходящих токенов;
  • 128 тыс.–252 тыс. токенов — $2,151 за 1 млн входящих и $8,602 за 1 млн исходящих токенов.

В соцсетях анонс Alibaba Qwen3-Max-Preview вызвал бурную реакцию. Авторы проекта отметили, что им удалось увеличить масштаб модели ИИ до 1 трлн параметров, и работа продолжается; более того, на предстоящей неделе они намереваются выпустить что-то ещё. Некоторые ограничения на длину контекста связаны с интерфейсом чата, а не особенностями самой модели, добавили они, и уже «в разработке» находится режим рассуждений для неё. Первые испытавшие модель пользователи выразили удовлетворение полученными в ходе начальных тестов результатами; некоторые заинтересовались, как она будет решать задачи, требующие сложных логических рассуждений.

 Источник изображения: x.com/_akhaliq

Источник изображения: x.com/_akhaliq

По запросу руководителя направления развития машинного обучения Ахсена Калика (Ahsen Khaliq) модель Alibaba Qwen3-Max-Preview построила на платформе AnyCoder воксельное изображение — модель сада в стиле Minecraft. Она, обратили внимание другие экспериментаторы, справилась с предложенными с арифметическими задачами, решила математическую «головоломку 24» и даже некую задачу, перед которой спасовали такие тяжеловесы как рассуждающая OpenAI GPT-5 и Google Gemini 2.5 Pro. Получив сложный запрос, она, как показывают наблюдения, переходит в похожий на рассуждения режим, в котором строит структурированные пошаговые ответы.

Для корпоративных клиентов ценность Qwen3-Max-Preview будет определяться не бенчмарками, а тем, как она на практике справляется с конкретными задачами. Располагая триллионом параметров, она меньше нуждается в постоянной тонкой настройке при развёртывании в приложениях, но сдерживающим фактором для бизнес-клиентов может стать многоуровневая система ценообразования. Сильными её сторонами является схожесть API с интерфейсом OpenAI и поддержка кеширования. Следует учитывать, что Qwen3-Max-Preview, как видно из названия, пока является предварительной версией модели, и поспешное её развёртывание может быть сопряжено с рисками.

Разработчики из лаборатории Alibaba Qwen также подчеркнули, что это ещё не финальная версия модели — её общедоступный вариант, вероятно, сможет похвастаться ещё более внушительными показателями. Это укрепит позиции Qwen в среде сверхбольших языковых моделей.

Alibaba разработала собственный ИИ-ускоритель — альтернатива Nvidia, но не для обучения

Китайские производители чипов и разработчики систем искусственного интеллекта при поддержке Пекина продолжают наращивать арсенал собственных технологий. Собственный ИИ-ускоритель теперь разработала Alibaba, но для обучения ИИ он не подойдёт.

 Источник изображений: alibabagroup.com

Источник изображений: alibabagroup.com

Alibaba долгое время была одним из крупнейших в стране клиентов Nvidia — теперь гиганту электронной коммерции приходится заполнять пустоту, образовавшуюся с уходом американского партнёра из-за проявившегося редкого единодушия Вашингтона и Пекина. Китай пока далёк от возможности производить чипы, способные конкурировать с передовыми американскими продуктами, поставки которых власти США запретили. Китайские компании вынуждены самостоятельно разрабатывать альтернативы ускорителю Nvidia H20, самому мощному из разрешённых к экспорту. Трамп разрешил поставлять его в Китай, но уже Пекин запретил использование этих чипов, сославшись на угрозы безопасности, которых, по словам производителя, не существует.

Alibaba иногда сравнивают с Amazon: китайский гигант электронной коммерции предоставляет услуги облачного провайдера, выступая конкурентом Amazon Web Services, Microsoft Azure и Google Cloud. Сейчас это направление деятельности, включая инфраструктуру для ИИ, для компании столь же важно, как и электронная коммерция. В ближайшие три года она намерена вложить в эту область не менее $53 млрд. В арсенале Alibaba значится и одно из наиболее популярных семейств моделей ИИ в мире — Qwen. Быстрое внедрение ИИ в китайскую экономику порождает высокий спрос на услуги инференса — запуска передовых моделей в облачных ресурсах. Для этой задачи, как правило, самые современные ИИ-ускорители не требуются.

Ранее Alibaba использовала для вывода ИИ чипы, разработанные для конкретных приложений. Новый ускоритель, который сейчас проходит испытания, предназначен для более широкого спектра задач в области ИИ, сообщает The Wall Street Journal со ссылкой на собственные источники. Чипы предыдущих версий для Alibaba выпускала TSMC, но Вашингтон запретил тайваньскому подрядчику производить чипы для Китая с использованием передовых технологий, поэтому новый ускоритель изготавливается китайской компанией.

Местное производство передовых чипов — тоже актуальная для Пекина задача из-за американских санкций, и местные власти активно инвестируют в этом направление в стремлении сформировать самодостаточную цепочку поставок для ИИ-решений. Китайским лидером в этой области является Huawei с её ускорителями Ascend — они объединяются в вычислительные системы, превосходящие по производительности стойки с 72 ускорителями семейства Nvidia Blackwell. При этом оборудование Huawei совместимо только с собственной программной средой компании, тогда как Alibaba при разработке собственного ускорителя стремилась обеспечить совместимость с экосистемой Nvidia, и клиенты смогут использовать на новых ускорителях ПО, написанное для работы в среде американской компании. Единственный недостаток — ускорители Alibaba предназначаются для вывода, а не обучения ИИ.


window-new
Soft
Hard
Тренды 🔥
10 тысяч модов и 350 миллионов загрузок: Larian похвасталась новыми достижениями игроков Baldur’s Gate 3 6 ч.
Вызывающий привыкание роглайк Ball x Pit достиг миллиона проданных копий и в 2026 году получит новые шары 7 ч.
Соавтор Counter-Strike признался в любви к русской культуре и рассказал о «самом депрессивном» периоде за 25 лет карьеры 9 ч.
Apple резко снизила награды багхантерам — при этом рост вредоносов в macOS бьёт рекорды 9 ч.
Mortal Kombat 1, Routine и Dome Keeper возглавили первую волну декабрьских новинок Game Pass, а Mortal Kombat 11 скоро подписку покинет 10 ч.
Google закрыла 107 дыр в Android — две нулевого дня уже использовались в атаках 10 ч.
В YouTube появился Recap — пользователям расскажут, чем они занимались на платформе в течение года 10 ч.
ИИ-агенты научились взламывать смарт-контракты в блокчейне — это риск на сотни миллионов долларов 10 ч.
Инструмент YouTube для защиты блогеров от дипфейков создал риск утечки их биометрии 11 ч.
В Microsoft Teams появились «иммерсивные встречи» в метавселенной с аватарами без ног 11 ч.