|
Опрос
|
реклама
Быстрый переход
Китайцы представили ИИ-модель Kimi K2-Thinking, которая превзошла GPT-5
07.11.2025 [13:29],
Павел Котов
Китайская компания Moonshot AI начала развёртывать рассуждающий вариант своей модели искусственного интеллекта — она носит название Kimi K2-Thinking. Разработчик опубликовал результаты тестов модели, из которых видно, что она выступает на равных с передовыми американскими.
Источник изображений: Moonshot AI Поработать с моделью Kimi K2-Thinking можно бесплатно в чат-боте на сайте проекта или подключить её по API — она стоит столько же, сколько и быстрый вариант нейросети, но расходует дополнительные токены на механизмы рассуждений. Moonshot AI опубликовала открытые веса Kimi K2-Thinking и привела результаты бенчмарков — модель проявила себя на уровне таких отраслевых лидеров как OpenAI GPT-5, Anthropic Claude Sonnet 4.5 и xAI Grok 4. ![]() В самом сложном мультидисциплинарном тесте Humanity's Last Exam (HLE), который включает около 3000 задач по математике, естественнонаучным и гуманитарным дисциплинам, Kimi K2-Thinking заняла первое место среди всех моделей, оставив позади GPT-5 и Claude Sonnet 4.5. Она успешно справилась с подключением инструментов для HLE, выполняя до 120 шагов. Доступен также режим Heavy, позволяющий Kimi K2-Thinking работать на уровне GPT-5 Pro и Grok 4 Heavy: параллельно запускаются восемь экземпляров модели, все дают ответы на запрос, из которых собирается окончательный. В бесплатном чат-боте эта ресурсоёмкая версия отсутствует. Китайская ИИ-модель Kimi k1.5 освоила мультимодальные рассуждения и превзошла OpenAI o1
30.01.2025 [19:29],
Сергей Сурабекянц
Если 2024 год стал годом клонов ChatGPT, то 2025 год обещает стать эрой рассуждающих моделей ИИ, а лидерство в этой области захватывают китайские лаборатории. На прошлой неделе много шума наделала DeepSeek со своей рассуждающей моделью R1. А на днях Moonshot AI представила мультимодальную Kimi k1.5, которая обгоняет в тестах OpenAI o1, а стоит в разы меньше. Эти модели представляют собой смену представления о «мыслительном процессе» ИИ.
Источник изображения: kimi.ai Новые модели далеко ушли от банального пересказа Википедии. Им по силам сложные проблемы — от решения головоломок до объяснения квантовой физики. А Kimi k1.5 уже успела заработать звание «первого настоящего конкурента o1». По оценкам экспертов, Kimi k1.5 — это не просто ещё одна модель ИИ — это скачок вперёд в мультимодальном рассуждении и обучении с подкреплением. Kimi k1.5 от Moonshot AI объединяет текст, код и визуальные данные для решения сложных задач, порою в разы превосходя таких лидеров отрасли, как GPT-4o и Claude Sonnet 3.5 в ключевых тестах. Контекстное окно Kimi k1.5 на 128 тыс. токенов позволяет модели «за один подход» обрабатывать объём информации, эквивалентный солидному роману. В математических задачах модель может планировать, отражать и корректировать свои шаги на протяжении сотен токенов, имитируя решение проблемы человеком. Вместо того, чтобы повторно генерировать полные ответы, Kimi использует фрагменты предыдущих траекторий, повышая эффективность и сокращая затраты на обучение. Традиционный подход, основанный на принципах обучения с подкреплением, предполагает использование сложных инструментов, таких как поиск по дереву Монте-Карло или сети ценностей. Команда Moonshot AI отказалась от них и создала упрощённый фреймворк на базе обучения с подкреплением, используя штраф за длину и баланс между исследованием и эксплуатацией. В результате разработчикам удалось создать модель, которая обучается быстрее и избегает «чрезмерного обдумывания» — распространённой ошибки, когда ИИ тратит вычислительные ресурсы на ненужные шаги. Kimi k1.5 успела показать себя как мощный инструмент визуализации и одновременной работы с текстом. Модель умеет анализировать диаграммы, решать геометрические задачи и отлаживать код — в тесте MathVista модель показала точность 74,9 %, объединив текстовые подсказки с графическими диаграммами. Исследователи Moonshot AI, вместо того чтобы полагаться на мощные, но медленные длинноцепочечные рассуждения (Long-CoT), использовали метод Long2Short («длинные-в-короткие»), добившись более лаконичных и быстрых ответов. Для этого применялись следующие методы:
Даже при прямом сравнении Kimi K1.5 оставляет GPT-4o и Claude Sonnet 3.5 далеко позади. Разработчикам Moonshot AI удалось оптимизировать процесс обучения с подкреплением благодаря:
По мнению экспертов, Kimi K1.5 — это не просто технологический прорыв, а взгляд в будущее ИИ. Объединяя обучение с подкреплением с мультимодальным рассуждением, эта модель решает задачи быстрее, умнее и эффективнее. |