Сегодня 17 сентября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Alibaba представила предварительную версию ИИ-модели Qwen3-Max с 1 триллионом параметров

Отдел разработки систем искусственного интеллекта Alibaba Qwen продуктивно провёл это лето, выпустив целый ряд моделей, которые не уступают, а то и превосходят аналоги ведущих американских лабораторий, в том числе Google, OpenAI и Anthropic. Крупнейшим проектом стала большая языковая модель Qwen3-Max-Preview (Instruct) с более чем 1 триллионом параметров.

 Источник изображения: Alibaba

Источник изображения: Alibaba

Параметры — это внутренние настройки, которые управляют поведением большой языковой модели, и чем их больше, тем обычно мощнее модель. Есть версия, что примерно то же число параметров у OpenAI GPT-4o, но в последнее время многие ведущие лаборатории ИИ стали выпускать модели меньшего размера, так что решение авторов Qwen увеличить этот показатель примечательно. Опубликованные китайскими разработчиками результаты тестов Qwen-3-Max-Preview указывают, что она превосходит предыдущую флагманскую модель компании Qwen3-235B-A22B-2507 и выступает серьёзным конкурентом другим ведущим моделям во всей отрасли. В тестах SuperGPQA, AIME25, LiveCodeBench v6, Arena-Hard v2, and LiveBench (20241125) новая Qwen3-Max-Preview держится стабильно выше Claude Opus 4, Kimi K2 и Deepseek-V3.1.

Новая модель уже доступна на собственном сайте разработчика Qwen Chat, через API в Alibaba Cloud, на платформах OpenRouter и AnyCoder. В отличие от других систем Alibaba, новая Qwen3-Max-Preview пока не доступна по лицензии с открытым исходным кодом, и для её подключения к приложениям разработчикам пока придётся довольствоваться платным API самой компании или её партнёров. На практике модель реже даёт сбои в таких задачах с подвохом как, например, сравнение одинаковых чисел или подсчёт количества заданных букв в указанном слове — не все современные ИИ пока на это способны. На платформе Qwen Chat она также работает быстрее, чем ChatGPT.

 Источник изображения: Alibaba

Источник изображения: Alibaba

Alibaba Qwen3-Max-Preview поддерживает контекстное окно длиной 262 144 токенов, максимальный объём запроса — 258 048 токенов, максимальная длина ответа — 32 768 токенов. Поддерживается кеширование контекста, что помогает оптимизировать производительность при длительных сессиях. Модель предназначается для сложных рассуждений (но режим «Мышление» в Qwen Chat пока недоступен), написания программного кода, обработки структурированных форматов данных, включая JSON, а также для задач творческого характера. Она одинаково эффективна в диалогах на разнообразные темы и в работе в качестве агента; ей могут пользоваться корпоративные клиенты и исследовательские лаборатории.

Стоимость работы с Alibaba Qwen3-Max-Preview через API в Alibaba Cloud зависит от количества токенов:

  • 0–32 тыс. токенов — $0,861 за 1 млн входящих и $3,441 за 1 млн исходящих токенов;
  • 32 тыс.–128 тыс. токенов — $1,434 за 1 млн входящих и $5,735 за 1 млн исходящих токенов;
  • 128 тыс.–252 тыс. токенов — $2,151 за 1 млн входящих и $8,602 за 1 млн исходящих токенов.

В соцсетях анонс Alibaba Qwen3-Max-Preview вызвал бурную реакцию. Авторы проекта отметили, что им удалось увеличить масштаб модели ИИ до 1 трлн параметров, и работа продолжается; более того, на предстоящей неделе они намереваются выпустить что-то ещё. Некоторые ограничения на длину контекста связаны с интерфейсом чата, а не особенностями самой модели, добавили они, и уже «в разработке» находится режим рассуждений для неё. Первые испытавшие модель пользователи выразили удовлетворение полученными в ходе начальных тестов результатами; некоторые заинтересовались, как она будет решать задачи, требующие сложных логических рассуждений.

 Источник изображения: x.com/_akhaliq

Источник изображения: x.com/_akhaliq

По запросу руководителя направления развития машинного обучения Ахсена Калика (Ahsen Khaliq) модель Alibaba Qwen3-Max-Preview построила на платформе AnyCoder воксельное изображение — модель сада в стиле Minecraft. Она, обратили внимание другие экспериментаторы, справилась с предложенными с арифметическими задачами, решила математическую «головоломку 24» и даже некую задачу, перед которой спасовали такие тяжеловесы как рассуждающая OpenAI GPT-5 и Google Gemini 2.5 Pro. Получив сложный запрос, она, как показывают наблюдения, переходит в похожий на рассуждения режим, в котором строит структурированные пошаговые ответы.

Для корпоративных клиентов ценность Qwen3-Max-Preview будет определяться не бенчмарками, а тем, как она на практике справляется с конкретными задачами. Располагая триллионом параметров, она меньше нуждается в постоянной тонкой настройке при развёртывании в приложениях, но сдерживающим фактором для бизнес-клиентов может стать многоуровневая система ценообразования. Сильными её сторонами является схожесть API с интерфейсом OpenAI и поддержка кеширования. Следует учитывать, что Qwen3-Max-Preview, как видно из названия, пока является предварительной версией модели, и поспешное её развёртывание может быть сопряжено с рисками.

Разработчики из лаборатории Alibaba Qwen также подчеркнули, что это ещё не финальная версия модели — её общедоступный вариант, вероятно, сможет похвастаться ещё более внушительными показателями. Это укрепит позиции Qwen в среде сверхбольших языковых моделей.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Базис» выходит на рынок Бразилии 7 мин.
Microsoft хочет запретить перепродажу корпоративных лицензий Office и Windows — дело дошло до суда 2 ч.
Китайский ИИ-оптимизм на взлёте: национальные технокомпании кратно наращивают траты на инфраструктуру 2 ч.
Sony планирует активнее использовать ИИ при создании видеоигр 3 ч.
Ведомства поспорили, каких гаджетов касается требование об установке RuStore и Max — всех или не всех 4 ч.
Сэм Фишер снова в деле: Netflix показала динамичный трейлер анимационного сериала Splinter Cell: Deathwatch 4 ч.
YouTube Live получил крупнейшее обновление: двухформатные эфиры, мини-игры и многое другое 5 ч.
YouTube представил новые ИИ-инструменты для всесторонней оптимизации контента 5 ч.
TikTok в США будет на 80 % американским, но алгоритм останется китайским, и это кое-кому не нравится 5 ч.
YouTube захотел стать торговой платформой — ИИ наполнит видеоролики ссылками на товары 5 ч.
TCL представила новую технологию подсветки SQD-Mini LED с «супер-квантовыми точками» 4 мин.
IT лидирует по темпам роста среди всех крупных отраслей России — в ней занят 1 млн человек 21 мин.
Австралийцы отожгли лучший в мире суперконденсатор из графена 24 мин.
Звериный оскал дефицита: темпы удорожания DDR4-памяти превысили 5 % в неделю 26 мин.
Keychron представила первую в мире керамическую клавиатуру Q16 HE 8K весом в килограмм 2 ч.
SanDisk нагнетает: дефицит флеш-памяти продлится как минимум до 2026 года, и SSD будут дорожать 3 ч.
Looking Glass анонсировала голографические «гололюминесцентные» дисплеи с ценой от $1500 4 ч.
NVIDIA и партнёры развернут в Великобритании ИИ-фабрики со 120 тыс. ускорителей Blackwell 4 ч.
Собственный ЦОД Stargate и крупнейший в стране ИИ-суперкомпьютер: американские IT-гиганты вложат более $40 млрд в развитие ИИ в Великобритании 4 ч.
Новость из будущего: квантовая компания совершила рекордную закупку добытого на Луне гелия-3 4 ч.