Сегодня 13 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → moonshot

Китайский стартап Moonshot выпустил открытую ИИ-модель Kimi K2, превосходящую GPT-4

Китайский ИИ-стартап Moonshot AI, создавший популярного чат-бота Kimi, на этой неделе представил большую языковую модель с открытым исходным кодом Kimi K2. Она бросает вызов передовым аналогам от OpenAI и Anthropic, обеспечивая особенно высокий уровень производительности в сфере написания программного кода и выполнении задач автономных ИИ-агентов.

 Источник изображений: Moonshot AI

Источник изображений: Moonshot AI

Языковая модель Kimi K2 с 1 трлн параметров, из которых 32 млрд активные, построена на основе подхода «смесь экспертов» (Mixture of Experts). Это означает, что при обработке запроса запускается только часть общей модели, за счёт чего повышается скорость работы и эффективность алгоритма. Стартап выпустил сразу две версии ИИ-модели: базовый вариант для исследователей и разработчиков, а также версию Kimi K2-Instruct с возможностью настройки, оптимизированную для чат-ботов и автономных агентов.

Отличительной особенностью новой модели является её оптимизация под возможности ИИ-агентов: способность автономно использовать инструменты, писать и выполнять программный код, а также выполнять сложные многоэтапные задачи без вмешательства человека. В ходе контрольных тестов Kimi K2 достиг точности 65,8 % в тесте разработки программного обеспечения SWE-bench Verified. Это лучше результата большинства альтернатив с открытым исходным кодом и сопоставимо с показателями проприетарных моделей.

Показатели производительности Kimi K2 указывают на то, что руководству OpenAI и Anthropic следует обратить внимание на этот алгоритм. Дело в том, что Kimi K2-Instruct не просто конкурирует с ИИ-моделями крупных компаний, но и систематически превосходит их в решении задач, которые имеют важное значение для корпоративных клиентов.

В одном из наиболее актуальных тестов на написание программного кода LiveCodeBench алгоритм Kimi K2 достиг точности 53,7 %, что значительно лучше результатов DeepSeek–V3 (46,9 %) и GPT-4.1 (44,7 %). Что ещё более впечатляет, так это результат в тесте MATH-500, где Kimi K2 набрал 97,4 %, а GPT-4.1 только 92,4 %. Это может указывать на то, что Moonshot AI сделала фундаментальное открытие в математических рассуждениях, которое ускользнуло от более крупных и хорошо финансируемых конкурентов.

Стоит учесть, что Moonshot добивается столь впечатляющих результатов, имея в активе значительно меньше ресурсов и средств, чем есть у крупных компаний. К примеру, OpenAI тратит сотни миллионов долларов на то, чтобы постепенно улучшать свои ИИ-модели. Похоже, что Moonshot удалось найти более эффективный подход для достижения аналогичного результата. Последствия этого могут выйти далеко за рамки простого хвастовства. Корпоративные заказчики давно ждут появления ИИ-систем, которые действительно могли бы выполнять сложные рабочие задачи, а не просто создавать яркие демонстрации. Результаты тестирования Kimi K2 говорят о том, что добиться этого, вероятно, удастся уже скоро.

В технической документации Moonshot есть деталь, которая может оказаться более важной, чем результаты тестирования нового алгоритма. Речь идёт об оптимизаторе MuonClip, который позволил осуществить процесс обучения ИИ-модели с триллионом параметров без каких-либо сбоев.

Это не просто инженерное достижение, а, возможно, сдвиг парадигмы. Нестабильность обучения стала скрытым препятствием при разработке больших языковых моделей. Компании вынуждены проводить дорогостоящее дообучение, внедрять меры безопасности и мириться с неоптимальной производительностью, чтобы сделать процесс обучения стабильнее.

Экономические последствия могут быть не менее впечатляющими. Если MuonClip окажется универсальным, то используемый компанией метод обучения ИИ-моделей может значительно сократить затраты на вычислительные мощности. В отрасли, где затраты на обучение измеряются десятками миллионов долларов, даже незначительный прирост эффективности может дать необходимые конкурентные преимущества.

Стоит отметить, что решение Moonshot сделать исходный код Kimi K2 открытым и параллельно с этим предоставлять доступ к API алгоритма по конкурентоспособной цене демонстрирует глубокое понимание динамики рынка. Тариф Moonshot с оплатой в $0,15 за миллион вводимых токенов и $2,50 за миллион генерируемых токенов значительно ниже, чем у OpenAI и Anthropic. При этом ИИ-модель китайского стартапа предлагает сопоставимую, а в ряде случаев и превосходящую производительность. Важным стратегическим шагом является двойная доступность: корпоративные клиенты могут задействовать API для немедленного развёртывания сервиса, а уже после этого перейти на автономные алгоритмы для оптимизации затрат или повышения уровня соответствия требованиям.

Это может создать проблемы для крупных ИИ-компаний. Если они будут соответствовать тарифам Moonshot, то снизится их прибыль. Если же они не сделают этого, то будут рисковать потерять клиентов, которые захотят перейти на использование более дешёвой ИИ-модели, сравнимой по производительности. В данном случае статус модели с открытым кодом не является чем-то вроде благотворительности, это осознанный шаг для привлечения клиентов. Каждый разработчик, который скачает Kimi K2 и будет экспериментировать с алгоритмом, становится потенциальным корпоративным клиентом Moonshot. В это же время, каждое внесённое сообществом улучшение снижает затраты компании на разработку.

Демонстрации Moonshot показывают, что искусственный интеллект постепенно становится более полезным. К примеру, при анализе заработной платы Kimi K2 не просто отвечал на вопросы о данных, а автономно выполнял 16 операций для проведения статистического анализа и генерации интерактивной визуализации. Демонстрация с планированием концертов в Лондоне потребовала использования 17 инструментов на разных платформах — поиск, календарь, электронная почта, авиабилеты, бронирование жилья и ресторанов. Причём это были не подготовленные менеджерами презентации, а реальные демонстрации того, как искусственный интеллект выполняет сложные многоступенчатые задачи автономно.

Это отличается от того, как работают нынешние ИИ-помощники, которые преуспевают в разговорах, но испытывают трудности при выполнении задач. В то время как конкуренты работают над тем, чтобы сделать речь своих чат-ботов более похожей на человеческую, Moonshot уделяет приоритетное внимание тому, чтобы делать алгоритмы более полезными. Это важно, поскольку предприятиям нужен не ИИ, способный пройти тест Тьюринга, а ИИ, способный эффективно выполнять производственные задачи.

Настоящий прорыв заключается не в какой-то единой возможности, а в слаженной работе множества инструментов и сервисов. Предыдущие варианты ИИ-агентов требовали тщательной проработки, планирования рабочего процесса и постоянного контроля со стороны человека. Похоже, что Kimi K2 способен автономно справляться с когнитивными нагрузками, связанными с дроблением задач, выбором инструментов для их решения и исправлением ошибок.

В отличие от предыдущих «убийц GPT», которые преуспели в узких областях, но не имели вариантов практического применения, Kimi K2 демонстрирует высокую компетентность в широком спектре задач. Алгоритм может писать программный код, решать математические задачи, использовать различные инструменты и выполнять сложные рабочие задачи. В это же время алгоритм доступен для модификации и экспериментов, за счёт чего его развитие может проходить быстрее.

Новая компания сооснователя Blizzard анонсировала мультиплеерный шутер Wildgate, который выглядит как Sea of Thieves в космосе

Основанное в 2020 году соучредителем Blizzard Майком Морхеймом (Mike Morhaime) издательство Dreamhaven и принадлежащая ему студия Moonshot Games анонсировали Wildgate — мультиплеерный шутер о космических пиратах.

 Источник изображений: Dreamhaven

Источник изображений: Dreamhaven

Пользователи Wildgate объединяются в команды по четыре человека и отправляются в непредсказуемый и загадочный регион космоса «Предел» (The Reach) с целью добыть древний Артефакт и скрыться с ним / уничтожить соперников.

В погоне за Артефактом игроки должны работать сообща, чтобы поддерживать звездолёт на лету (снабжать его топливом, патронами, льдом), пробиваться сквозь космические штормы, сражаться с инопланетянами и грабить аванпосты.

«Взорвите ваших врагов с помощью высокотехнологичных пушек и гаджетов, заманите их в смертельные ловушки или даже проникните на их корабль и устройте там диверсию… если только они не сделают это первыми», — призывают авторы.

Обещают обширную процедурно сгенерированную карту с рандомизированными столкновениями и наградами, грандиозные сражения в космосе и уникальных героев со своими умениями и инструментами. Русский язык не заявлен.

Презентация Wildgate сопровождалась двумя геймплейными трейлерами: анонсирующим на две минуты и обзорным на четыре. В комментариях пользователи уже успели наречь игру Sea of Thieves в космосе.

Релиз Wildgate ожидается в 2025 году на PC (Steam), PS5, Xbox Series X и S. С 10 по 14 апреля на всех целевых платформах пройдёт закрытое тестирование, записаться в добровольцы на которое можно через официальный сайт.

Китайская ИИ-модель Kimi k1.5 освоила мультимодальные рассуждения и превзошла OpenAI o1

Если 2024 год стал годом клонов ChatGPT, то 2025 год обещает стать эрой рассуждающих моделей ИИ, а лидерство в этой области захватывают китайские лаборатории. На прошлой неделе много шума наделала DeepSeek со своей рассуждающей моделью R1. А на днях Moonshot AI представила мультимодальную Kimi k1.5, которая обгоняет в тестах OpenAI o1, а стоит в разы меньше. Эти модели представляют собой смену представления о «мыслительном процессе» ИИ.

 Источник изображения: kimi.ai

Источник изображения: kimi.ai

Новые модели далеко ушли от банального пересказа Википедии. Им по силам сложные проблемы — от решения головоломок до объяснения квантовой физики. А Kimi k1.5 уже успела заработать звание «первого настоящего конкурента o1». По оценкам экспертов, Kimi k1.5 — это не просто ещё одна модель ИИ — это скачок вперёд в мультимодальном рассуждении и обучении с подкреплением. Kimi k1.5 от Moonshot AI объединяет текст, код и визуальные данные для решения сложных задач, порою в разы превосходя таких лидеров отрасли, как GPT-4o и Claude Sonnet 3.5 в ключевых тестах.

Контекстное окно Kimi k1.5 на 128 тыс. токенов позволяет модели «за один подход» обрабатывать объём информации, эквивалентный солидному роману. В математических задачах модель может планировать, отражать и корректировать свои шаги на протяжении сотен токенов, имитируя решение проблемы человеком. Вместо того, чтобы повторно генерировать полные ответы, Kimi использует фрагменты предыдущих траекторий, повышая эффективность и сокращая затраты на обучение.

 Источник изображений: medium.com

Источник изображений: medium.com

Традиционный подход, основанный на принципах обучения с подкреплением, предполагает использование сложных инструментов, таких как поиск по дереву Монте-Карло или сети ценностей. Команда Moonshot AI отказалась от них и создала упрощённый фреймворк на базе обучения с подкреплением, используя штраф за длину и баланс между исследованием и эксплуатацией. В результате разработчикам удалось создать модель, которая обучается быстрее и избегает «чрезмерного обдумывания» — распространённой ошибки, когда ИИ тратит вычислительные ресурсы на ненужные шаги.

Kimi k1.5 успела показать себя как мощный инструмент визуализации и одновременной работы с текстом. Модель умеет анализировать диаграммы, решать геометрические задачи и отлаживать код — в тесте MathVista модель показала точность 74,9 %, объединив текстовые подсказки с графическими диаграммами.

Исследователи Moonshot AI, вместо того чтобы полагаться на мощные, но медленные длинноцепочечные рассуждения (Long-CoT), использовали метод Long2Short («длинные-в-короткие»), добившись более лаконичных и быстрых ответов. Для этого применялись следующие методы:

  • Объединение моделей путём смешивания весов длинных и коротких версий CoT.
  • Выборка кратчайшего отклонения — отбор самого короткого и корректного ответа из восьми сгенерированных вариантов.
  • Оптимизация DPO — обучение модели предпочтению кратких ответов без потери смысла.

Даже при прямом сравнении Kimi K1.5 оставляет GPT-4o и Claude Sonnet 3.5 далеко позади. Разработчикам Moonshot AI удалось оптимизировать процесс обучения с подкреплением благодаря:

  • Гибридному развёртыванию — совместному использованию ресурсов GPU для обучения и вывода.
  • Частичным развёртываниям — разделению длинных траекторий на управляемые фрагменты для более эффективного обучения.
  • Песочницам кода — безопасным средам для тестирования выходных данных кода, что гарантирует их надёжность.

По мнению экспертов, Kimi K1.5 — это не просто технологический прорыв, а взгляд в будущее ИИ. Объединяя обучение с подкреплением с мультимодальным рассуждением, эта модель решает задачи быстрее, умнее и эффективнее.


window-new
Soft
Hard
Тренды 🔥
Grok вышел из-под контроля, а Турция заблокировала ИИ за оскорбление президента 5 ч.
Новая статья: Dune: Awakening — песочница Лисан аль-Гаиба. Рецензия 11 ч.
Особые цены для особо ценных клиентов: Broadcom запросила у Telefónica Germany за поддержку VMware впятеро больше прежнего 12 ч.
Франция возбудила уголовное дело в отношении соцсети X по подозрению в манипулировании алгоритмами 13 ч.
Китайский стартап Moonshot выпустил открытую ИИ-модель Kimi K2, превосходящую GPT-4 14 ч.
Microsoft представила рассуждающую ИИ-модель Phi-4-mini-flash-reasoning— в 10 раз быстрее аналогов и запустится даже на смартфоне 21 ч.
ИИ-боты оказались никудышными психотерапевтами — они давали вредные советы и отказывались общаться с алкоголиками 21 ч.
Meta не откажется от бизнес-модели «плати или соглашайся», несмотря на угрозу штрафов в ЕС 22 ч.
Meta пополнила коллекцию ИИ-талантов, поглотив специализирующийся на голосовом ИИ стартап PlayAI 22 ч.
Поглощение ИИ-стартапа Windsurf компанией OpenAI сорвалось и специалистов тут же переманила Google 23 ч.