Китайская открытая ИИ-модель Z.ai GLM-5.2 обошла GPT-5.5 в тестах на программирование
Читать в полной версииКитайский стартап в области искусственного интеллекта Z.ai (ранее Zhipu) сообщил о выпуске большой языковой модели GLM-5.2 с открытыми весами и 753 млрд параметров. Её основное предназначение — написание программного кода и разработка с «длительным горизонтом планирования».
Источник изображения: Steve A Johnson / unsplash.com
Поработать с моделью можно через API на ресурсах Z.ai, на платформе Hugging Face; поддерживаются более 20 сторонних сред разработки. Модель предлагает контекстное окно в 1 млн токенов; корпоративные подписки стоят от $12,60 в месяц. Основные веса GLM-5.2 доступны по лицензии MIT — предприятия могут бесплатно скачивать, настраивать и дорабатывать модель по своему усмотрению, запуская её локально или через виртуальные машины, оплачивая только вычислительные ресурсы и электроэнергию.
Источник изображения: z.ai
Модель Z.ai GLM-5.2 имеет 753 млрд параметров, и в ней реализована важная архитектурная оптимизация IndexShare — на четыре слоя разрежённого внимания повторно используется один индексатор, что при максимальной длине контекста в 1 млн токенов помогает снизить вычислительную нагрузку в 2,9 раза. Используется также модернизированная схема многотокенного предсказания (MTP), которая при запуске метода спекулятивного декодирования пропускает на 20 % больше токенов при инференсе — это тоже помогает экономить ресурсы.
Источник изображения: z.ai
Модель позволяет выбирать «режимы рассуждений»: «максимальный» помогает расширить границы при решении логических задач, а «высокий» обеспечивает баланс между высокой производительностью и эффективностью при генерации токенов. В первом случае она выдаёт в среднем 85 000 токенов на задачу, а во втором — вдвое меньше. В стандартных отраслевых тестах Z.ai GLM-5.2 превзошла большинство флагманских открытых моделей, а также выступила близко или лучше, чем передовые закрытые модели, в том числе OpenAI GPT-5.5 и Anthropic Claude Opus 4.8.
Для работы с моделью разработчик открыл тариф GLM Coding Plan, ориентированный на подключение средств разработки, а не традиционный интерфейс чат-ботов — поддерживаются такие приложения как Claude Code, OpenClaw, Cline, Kilo Code, Crush и Factory. Тариф Lite ($12,60 в месяц или $151,20 в год, начиная со второго года) предназначен для несложных итераций в небольших репозиториях; Pro ($50,40 в месяц) предлагает впятеро больше вычислительных ресурсов, чем Lite; Max ($112,00 в месяц) предлагает в 20 раз больше ресурсов, чем Lite, и выделенные ресурсы в часы пик. Доступ по API к GLM-5.2 стоит $1,40 за 1 млн входных токенов и $4,40 за 1 млн выходных.