Сегодня 16 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → qwen

Alibaba представила семейство ИИ-моделей Qwen3, которые быстрее и эффективнее DeepSeek

В начале этой недели китайская компания Alibaba Group Holdings представила новое семейство флагманских языковых моделей Qwen3, которое использует актуальный метод «смешения экспертов» для достижения результатов, сопоставимых с итогами работы гибридных рассуждающих систем.

 Источник изображения: Alibaba

Источник изображения: Alibaba

По данным Alibaba, её модели семейства Qwen3 в ряде сфер применения оказываются на уровне или даже быстрее и эффективнее разработок DeepSeek, включая решение математических задач и написание программного кода. Масштабирование этих моделей также обходится значительно дешевле большинства популярных аналогов. Модели такого типа пытаются подражать людям в логике решения задач, подобные системы уже предложены компаниями Anthropic и Alphabet (Google).

Более эффективное решение задачи осуществляется за счёт дробления её на несколько сегментов, за каждый из которых отвечает свой фрагмент кода. Это напоминает процесс решения проблемы группой экспертов, каждому из которых поручена своя задача. Alibaba ещё в марте представила модели семейства Qwen 2.5, которые могут работать с текстом, изображениями, аудио и видео, ограничиваясь при этом аппаратными ресурсами ноутбука или смартфона. Семейство моделей Qwen3 придерживается принципа открытости исходного кода.

Под давлением DeepSeek американский стартап OpenAI также пообещал представить более открытую модель, подражающую логике рассуждения человека. Стремление Alibaba усилить свои позиции на рынке систем искусственного интеллекта помогло китайскому гиганту выйти из кризиса, порождённого конфликтом основателя Джека Ма (Jack Ma) с китайскими властями, которые несколько лет назад всерьёз взялись за регулирование бизнеса в тех сферах, на которых строилось благополучие Alibaba Group.

Alibaba представила мощную ИИ-модель Qwen2.5-Max, которая лучше GPT-4o и DeepSeek V3

Alibaba Cloud, облачное подразделение китайской компании Alibaba, анонсировала выпуск обновлённой, крупномасштабной языковой модели Qwen2.5-Max. ИИ-модель основана на архитектуре Mixture-of-Experts (MoE) и обучена на более чем 20 триллионах токенов. Разработчики подчёркивают, что инструмент показал «значительный прогресс в интеллектуальных возможностях» и уже доступен для использования.

 Источник изображения: Alibaba Cloud

Источник изображения: Alibaba Cloud

Новая версия модели отличается улучшенной производительностью и точностью, способна лучше справляться с задачами, требующими глубокого понимания контекста, таких как анализ текста, перевод и генерация контента. «Qwen2.5-Max демонстрирует значительный прогресс в обработке сложных запросов и предоставлении релевантных ответов», — пишет компания на страницах своего блога.

Qwen2.5-Max была протестирована в ряде ключевых бенчмарков, включая MMLU-Pro, LiveCodeBench, LiveBench и Arena-Hard. Модель показала превосходство над DeepSeek V3 в таких тестах, как Arena-Hard, LiveBench и LiveCodeBench, а также продемонстрировала конкурентоспособные результаты в MMLU-Pro. В сравнении с другими ведущими моделями, такими как GPT-4o и Claude-3.5-Sonnet, Qwen2.5-Max также подтвердила свои лидирующие позиции.

 Источник изображения: Alibaba Cloud

Источник изображения: Alibaba Cloud

 Источник изображения: Alibaba Cloud

Источник изображения: Alibaba Cloud

Alibaba Cloud планирует интегрировать Qwen2.5-Max в свои облачные сервисы, что позволит клиентам использовать инструмент для решения широкого спектра задач, включая автоматизацию обработки данных, улучшение взаимодействия с клиентами через чат-ботов и оптимизацию бизнес-процессов.

ИИ-модель уже доступна через сервис Qwen Chat, в котором пользователи могут взаимодействовать с Qwen2.5-Max, тестировать её возможности и экспериментировать с различными функциями. Для разработчиков также открыт программный интерфейс API. Для доступа необходимо зарегистрироваться в Alibaba Cloud, активировать сервис Model Studio и создать API-ключ.

Ещё один китайский удар по OpenAI: Alibaba выпустила ИИ, который может управлять ПК и смартфоном

Самой яркой звездой китайской отрасли искусственного интеллекта в последние дни стала лаборатория DeepSeek, но не сидят сложа руки и технологические гиганты: подразделение Alibaba Qwen представило семейство моделей Qwen2.5-VL, способных управлять ПК и смартфоном, как это делает виртуальный помощник OpenAI Operator.

 Источник изображения: alibabacloud.com

Источник изображения: alibabacloud.com

Самая мощная модель в семействе Qwen2.5-VL превзошла крупнейшие американские проекты, в том числе OpenAI GPT-4o, Anthropic Claude 3.5 Sonnet и Google Gemini 2.0 Flash в ряде испытаний, включая «понимание» видео, решение математических задач, анализ документов и ответы на вопросы, утверждают разработчики. Испытать эту модель можно в приложении Alibaba Qwen Chat, доступна её загрузка с платформы Hugging Face. Она анализирует диаграммы и графики, извлекает данные из бухгалтерских документов, изучает многочасовые видео, а также распознаёт фрагменты фильмов и сериалов — возможно, её обучение велось с использованием защищённых авторским правом работ. Как и другие китайские модели, она отказывается комментировать политику Пекина.

 Источник изображения: x.com/_philschmid

Источник изображения: x.com/_philschmid

Одной из наиболее интересных особенностей Qwen2.5-VL является её способность управлять программами на ПК и мобильных устройствах. В одном из примеров модель запустила приложение на Android и забронировала авиабилеты. В другом примере ей поручили управление ПК под Linux, но она смогла совершить лишь базовые действия, в частности, переключала вкладки в браузере. Младшие версии Qwen2.5-VL-3B и Qwen2.5-VL-7B доступны по открытой лицензии без ограничений; флагманская Qwen2.5-VL-72B требует, чтобы владельцы платформ с более чем 100 млн пользователей получали разрешение у Alibaba Qwen перед коммерческим развёртыванием модели.


window-new
Soft
Hard
Тренды 🔥
Ветераны разработки Diablo выпустили в Steam масштабную демоверсию экшен-RPG нового поколения Darkhaven 59 мин.
Тысячи пользователей пожаловались на сбои в работе соцсети X 2 ч.
Календарь релизов — 16–22 февраля: Styx: Blades of Greed, Norse: Oath of Blood и Forgotlings 2 ч.
Две Assassin’s Creed, эвакуационный шутер по Второй мировой и не только: инсайдер выяснил, какие игры Ubisoft отменила вместе с ремейком «Принца Персии» 3 ч.
Blizzard: несмотря на 14 лет с релиза, в Diablo III до сих пор играют «миллионы» 3 ч.
YouTube усугубил войну с блокировщиками рекламы — пользователям начали отключать комментарии и описания роликов 3 ч.
Для безопасности и совместимости: IT-гиганты сформировали трансграничное объединение Trusted Tech Alliance 4 ч.
Microsoft начала блокировать загрузку ISO-образов Windows 11 через Rufus 4 ч.
Создатель завирусившегося ИИ-агента OpenClaw присоединился к OpenAI 4 ч.
Облачные сервисы в 2025 году росли в России самыми быстрыми темпами, опередив ИИ-сегмент 5 ч.
Следующее поколение графических процессоров Intel Xe Next будет оптимизировано для ИИ, а не для игр 23 мин.
Ту самую компьютерную колонку из 90-х увеличили до человеческого роста — и она работает 2 ч.
Apple проведёт презентацию 4 марта — ожидаются iPhone 17e, новые Mac и iPad 3 ч.
«Атомный ИИ»: Deep Atomic предлагает строить сразу и ЦОД, и АЭС для него 3 ч.
GPU видеокарты за $5090 буквально лопнул от экстремального разгона — MSI RTX 5090 Lightning Z не пережила эксперимент 4 ч.
Oxide Computer готовит блейд-платформу на базе AMD EPYC Turin 5 ч.
Одна из самых редких GeForce RTX 5090 всплыла на eBay по цене от $7000 до $15 000 6 ч.
МКС снова укомплектована космонавтами и астронавтами после экстренной эвакуации в январе 9 ч.
Попутного ветра: AWS резко сократила развёртывание СЖО для Trainium3, решив обойтись преимущественно воздушным охлаждением 10 ч.
Китайская Montage Technology выпустила серверные процессоры Jintide на базе Intel Xeon 6 11 ч.