Сегодня 03 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → moonshot ai

Китайская Moonshot AI выпустила открытую ИИ-модель Kimi K2.5 и в тестах она лучше Gemini 3 Pro и GPT-5.2

Китайская компания Moonshot AI, которую ранее поддержали гиганты Alibaba и HongShan (ранее Sequoia China), выпустила открытую модель искусственного интеллекта Kimi K2.5 — она понимает текст, изображения и видео.

 Источник изображения: kimi.com

Источник изображения: kimi.com

Модель Kimi K2.5 изначально мультимодальна: её обучили на 15 трлн смешанных визуальных и текстовых токенов; она справляется с задачами на программирование и управление несколькими ИИ-агентами. Результаты тестов указывают на то, что она не уступает закрытым аналогам, а в некоторых задачах и превосходит их. В тесте на программирование SWE-bench Verified модель Kimi K2.5 обошла Google Gemini 3 Pro, а в SWE-bench Multilingual — Gemini 3 Pro и OpenAI GPT-5.2. В тесте VideoMMMU из области распознавания видео она выступила лучше, чем Anthropic Claude Opus 4.5. В задачах на программирование Kimi K2.5 способна воспроизвести интерфейс по образцу на изображении или в видео.

Разработчик открыл эти возможности для широкой аудитории, выпустив средство программирования Kimi Code — это прямой конкурент Anthropic Claude Code и Google Gemini CLI. Этим инструментом можно пользоваться в терминале или интегрировать его со средами VSCode, Cursor и Zed — запросами могут выступать текст и видео.

Компанию Moonshot основал бывший исследователь из Google и Meta✴ Ян Чжилинь (Yang Zhilin). Она привлекла $1 млрд инвестиций в рамках раунда финансирования серии B при оценке $2,5 млрд. В декабре стартап привлёк $500 млн при оценке $4,3 млрд. Следующий раунд финансирования компания намеревается провести уже при оценке $5 млрд.

Китайцы представили ИИ-модель Kimi K2-Thinking, которая превзошла GPT-5

Китайская компания Moonshot AI начала развёртывать рассуждающий вариант своей модели искусственного интеллекта — она носит название Kimi K2-Thinking. Разработчик опубликовал результаты тестов модели, из которых видно, что она выступает на равных с передовыми американскими.

 Источник изображений: Moonshot AI

Источник изображений: Moonshot AI

Поработать с моделью Kimi K2-Thinking можно бесплатно в чат-боте на сайте проекта или подключить её по API — она стоит столько же, сколько и быстрый вариант нейросети, но расходует дополнительные токены на механизмы рассуждений. Moonshot AI опубликовала открытые веса Kimi K2-Thinking и привела результаты бенчмарков — модель проявила себя на уровне таких отраслевых лидеров как OpenAI GPT-5, Anthropic Claude Sonnet 4.5 и xAI Grok 4.

В самом сложном мультидисциплинарном тесте Humanity's Last Exam (HLE), который включает около 3000 задач по математике, естественнонаучным и гуманитарным дисциплинам, Kimi K2-Thinking заняла первое место среди всех моделей, оставив позади GPT-5 и Claude Sonnet 4.5. Она успешно справилась с подключением инструментов для HLE, выполняя до 120 шагов. Доступен также режим Heavy, позволяющий Kimi K2-Thinking работать на уровне GPT-5 Pro и Grok 4 Heavy: параллельно запускаются восемь экземпляров модели, все дают ответы на запрос, из которых собирается окончательный. В бесплатном чат-боте эта ресурсоёмкая версия отсутствует.

Китайская ИИ-модель Kimi k1.5 освоила мультимодальные рассуждения и превзошла OpenAI o1

Если 2024 год стал годом клонов ChatGPT, то 2025 год обещает стать эрой рассуждающих моделей ИИ, а лидерство в этой области захватывают китайские лаборатории. На прошлой неделе много шума наделала DeepSeek со своей рассуждающей моделью R1. А на днях Moonshot AI представила мультимодальную Kimi k1.5, которая обгоняет в тестах OpenAI o1, а стоит в разы меньше. Эти модели представляют собой смену представления о «мыслительном процессе» ИИ.

 Источник изображения: kimi.ai

Источник изображения: kimi.ai

Новые модели далеко ушли от банального пересказа Википедии. Им по силам сложные проблемы — от решения головоломок до объяснения квантовой физики. А Kimi k1.5 уже успела заработать звание «первого настоящего конкурента o1». По оценкам экспертов, Kimi k1.5 — это не просто ещё одна модель ИИ — это скачок вперёд в мультимодальном рассуждении и обучении с подкреплением. Kimi k1.5 от Moonshot AI объединяет текст, код и визуальные данные для решения сложных задач, порою в разы превосходя таких лидеров отрасли, как GPT-4o и Claude Sonnet 3.5 в ключевых тестах.

Контекстное окно Kimi k1.5 на 128 тыс. токенов позволяет модели «за один подход» обрабатывать объём информации, эквивалентный солидному роману. В математических задачах модель может планировать, отражать и корректировать свои шаги на протяжении сотен токенов, имитируя решение проблемы человеком. Вместо того, чтобы повторно генерировать полные ответы, Kimi использует фрагменты предыдущих траекторий, повышая эффективность и сокращая затраты на обучение.

 Источник изображений: medium.com

Источник изображений: medium.com

Традиционный подход, основанный на принципах обучения с подкреплением, предполагает использование сложных инструментов, таких как поиск по дереву Монте-Карло или сети ценностей. Команда Moonshot AI отказалась от них и создала упрощённый фреймворк на базе обучения с подкреплением, используя штраф за длину и баланс между исследованием и эксплуатацией. В результате разработчикам удалось создать модель, которая обучается быстрее и избегает «чрезмерного обдумывания» — распространённой ошибки, когда ИИ тратит вычислительные ресурсы на ненужные шаги.

Kimi k1.5 успела показать себя как мощный инструмент визуализации и одновременной работы с текстом. Модель умеет анализировать диаграммы, решать геометрические задачи и отлаживать код — в тесте MathVista модель показала точность 74,9 %, объединив текстовые подсказки с графическими диаграммами.

Исследователи Moonshot AI, вместо того чтобы полагаться на мощные, но медленные длинноцепочечные рассуждения (Long-CoT), использовали метод Long2Short («длинные-в-короткие»), добившись более лаконичных и быстрых ответов. Для этого применялись следующие методы:

  • Объединение моделей путём смешивания весов длинных и коротких версий CoT.
  • Выборка кратчайшего отклонения — отбор самого короткого и корректного ответа из восьми сгенерированных вариантов.
  • Оптимизация DPO — обучение модели предпочтению кратких ответов без потери смысла.

Даже при прямом сравнении Kimi K1.5 оставляет GPT-4o и Claude Sonnet 3.5 далеко позади. Разработчикам Moonshot AI удалось оптимизировать процесс обучения с подкреплением благодаря:

  • Гибридному развёртыванию — совместному использованию ресурсов GPU для обучения и вывода.
  • Частичным развёртываниям — разделению длинных траекторий на управляемые фрагменты для более эффективного обучения.
  • Песочницам кода — безопасным средам для тестирования выходных данных кода, что гарантирует их надёжность.

По мнению экспертов, Kimi K1.5 — это не просто технологический прорыв, а взгляд в будущее ИИ. Объединяя обучение с подкреплением с мультимодальным рассуждением, эта модель решает задачи быстрее, умнее и эффективнее.


window-new
Soft
Hard
Тренды 🔥
Объём слитых в интернет данных россиян взлетел почти на 70 % в прошлом году 34 мин.
Онлайн-кинотеатры в России нарастили аудиторию до 75 млн зрителей и теперь думают над повышением цен 40 мин.
Хакеры взломали популярный текстовый редактор Notepad++ и полгода распространяли вирусы с обновлениями 2 ч.
xAI выпустила Grok Imagine 1.0 с поддержкой создания 10-секундных видео в улучшенном разрешении 7 ч.
В Firefox появится выключатель всех ИИ-функций разом 12 ч.
Суровое альпинистское приключение Cairn от создателей Furi покорило вершину в 200 тысяч проданных копий всего за три дня 14 ч.
«Лучше большинства фильмов по RE»: трагичная короткометражка по мотивам Resident Evil Requiem впечатлила фанатов 16 ч.
За саундтрек можно не переживать: композитор «Ведьмака 3» напишет музыку для The Witcher 4 17 ч.
Firefly без ограничений: Adobe сняла лимиты на ИИ-генерацию изображений и видео, но не навсегда 18 ч.
Google добавит в Gemini инструмент для переноса диалогов из ChatGPT и других ИИ-ботов 19 ч.