Сегодня 29 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Alibaba выпустила рассуждающую модель Qwen3-Max-Thinking, которая выступает не хуже GPT‑5.2‑Thinking и Gemini 3 Pro

Компания Alibaba Cloud открыла публичный доступ к своей новейшей флагманской модели логического рассуждения Qwen3-Max-Thinking. Модель показала производительность на уровне ведущих аналогов, таких как GPT-5.2-Thinking, Claude-Opus-4.5 и Gemini 3 Pro, по результатам 19 бенчмарков.

 Источник изображения: AI

Источник изображения: AI

В официальном блоге компании сообщается, что Qwen3-Max-Thinking достигла улучшений в фактологической точности, сложных логических рассуждениях, следовании инструкциям, соответствии пользовательским предпочтениям и агентских возможностях. Этого удалось добиться за счёт увеличения параметров модели и использования значительных вычислительных ресурсов для обучения с подкреплением (Reinforcement Learning, RL) .

Ключевым нововведением стали адаптивные инструменты и стратегия тестового масштабирования. В отличие от прежнего подхода, когда пользователь вручную выбирал инструменты, Qwen3-Max-Thinking теперь автономно задействует встроенные возможности поиска, памяти и интерпретатора кода прямо в диалоге. Разработчики заявляют, что инструменты поиска и памяти эффективно снижают «галлюцинации», дают доступ к актуальной информации и позволяют давать более персонализированные ответы, а интерпретатор кода позволяет выполнять фрагменты кода для решения сложных задач. Такой подход позволил повысить точность на нескольких специализированных тестах (GPQA, HLE, LiveCodeBench v6, IMO-AnswerBench) при сохранении прежнего объёма вычислений.

 Источник изображения: Alibaba

Источник изображения: Alibaba

По словам компании, модель с адаптивными инструментами уже доступна в Qwen Chat. Также открыт доступ к API через сервис Alibaba Cloud Model Studio, для чего необходимо зарегистрировать аккаунт в Alibaba Cloud, воспользоваться сервисом Model Studio и создать в консоли разработчика API-ключ. API Qwen совместим с протоколом OpenAI API, что позволяет использовать стандартные методы интеграции, а также реализована поддержка протокола Anthropic API, обеспечивающая бесшовную работу с инструментом Claude Code.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Ролевая игра The Witch's Bakery подружит геймеров с общительной ведьмой-пекарем из Парижа — релиз намечен на август 2 ч.
Дополнение «Баллады прошлого» к The Witcher 3 станет «прологом» к будущему «Ведьмака» 2 ч.
Кроссовер с Clair Obscur, онлайн-кооператив и элементы 3D: инсайдеры поделились новыми подробностями ремейка Rayman Legends 3 ч.
Стартап Shift предложил бесплатную уборку домов ради обучения роботов 4 ч.
Project Lightwell: IBM и Red Hat предложили корпорациям скинуться на патчи безопасности для open source ПО и сами вложат $5 млрд 4 ч.
Фирма случайно спустила $500 млн на Anthropic Claude всего за месяц 5 ч.
В «Google Фото» появятся новые средства управления «Воспоминаниями» 6 ч.
Meta рассматривает выход на рынок облачных услуг 7 ч.
Ролевой экшен Grim Dawn спустя 10 лет после релиза получит самое масштабное дополнение Fangs of Asterkarn — дата релиза уже известна 7 ч.
Улучшение посадки семян, эксклюзивные анимации для питомцев и перенастройка управления: для Crimson Desert вышел патч 1.09.00 7 ч.
ASRock выпустит видеокарту Radeon RX 9070 XT Taichi 10th Anniversary Edition по случаю 10-летия бренда Taichi 4 мин.
Acer показала портативную консоль Nitro Blaze Link для трансляции игр с ПК по Wi-Fi 7 мин.
Acer представила «доступный всем» игровой ноутбук Nitro 16 с Ryzen 9 9955HX3D и GeForce RTX 5070 Ti 14 мин.
Acer представила флагманский игровой ноутбук Predator Helios 18 с чипами Core Ultra 9 290HX и RTX 5090 30 мин.
Работа МКС будет продлена до 2030 года, даже если Россия уйдёт со станции 33 мин.
TSMC: чистая производительность чипов больше не главное — приоритетом стала энергоэффективность 2 ч.
MSI представила первый в мире игровой монитор с QD-OLED и тремя режимами — 4K@360 Гц, 2K@520 Гц и FHD@680 Гц 2 ч.
«Воронья слободка»: Joby, Archer и Vertical погрязли в судебных войнах и поставили под удар массовый запуск аэротакси 2 ч.
G.Skill показала модули DDR5-9200 без экстремального напряжения и перегрева 3 ч.
BYD спроектировала первый в Китае 4-нм чип для систем автопилота 3 ч.