Сегодня 29 июля 2026

18+

О сайте Реклама Рассылка Контакты

moonshot ai

Теги → moonshot ai

Быстрый переход

15:54 28.07.2026 Moonshot AI опубликовала веса нашумевшей Kimi-K3 — она почти не уступает лидерам рынка, но намного проще в работе
13:07 20.07.2026 Китайская ИИ-модель Kimi K3 оказалась настолько популярной, что разработчик перестал принимать новых пользователей
18:31 18.07.2026 Китай отверг обвинения в незаконной дистилляции американских ИИ-моделей
14:53 18.07.2026 Китайская модель Kimi K3 поставила под вопрос лидерство США в области ИИ
18:57 17.07.2026 Открытые китайские ИИ-модели сократили отставание от передовых американских всего до четырёх месяцев
09:54 17.07.2026 Китайская Moonshot AI выпустила крупнейшую в мире открытую ИИ-модель Kimi K3 — у неё 2,8 трлн параметров
12:18 28.01.2026 Китайская Moonshot AI выпустила открытую ИИ-модель Kimi K2.5 и в тестах она лучше Gemini 3 Pro и GPT-5.2
13:29 07.11.2025 Китайцы представили ИИ-модель Kimi K2-Thinking, которая превзошла GPT-5
19:29 30.01.2025 Китайская ИИ-модель Kimi k1.5 освоила мультимодальные рассуждения и превзошла OpenAI o1

← В прошлое

Moonshot AI опубликовала веса нашумевшей Kimi-K3 — она почти не уступает лидерам рынка, но намного проще в работе

28.07.2026 [15:54], Павел Котов

Китайская Moonshot выполнила своё обещание и бесплатно опубликовала веса революционной модели искусственного интеллекта Kimi-K3. Теперь любой обладатель достаточно мощных вычислительных ресурсов может запустить её на своём оборудовании.

Обзор Ryzen 9 9950X3D2: правильный 16-ядерник с 3D-кешем

Выбираем лучший игровой ноутбук до 100 000 рублей: сравнительное тестирование 7 интересных моделей

Умные помощники: обзор ИИ-сервисов для обработки изображений. Часть 2, актуализированная

Обзор Infinix GT 50 Pro: геймерский смартфон со встроенной СЖО

Репортаж с IEM Cologne Major 2026: Жаб Жабыч, триумф NiKo и главные сенсации мейджора по CS2

Источник изображений: kimi.com

На практике подтвердилось, что Kimi-K3 значительно превосходит модели OpenAI GPT и Anthropic Claude предыдущих поколений и лишь немного уступает передовым Sol и Fable. При этом эксплуатация китайской модели обходится в 2–3 раза дешевле американских аналогов, а если запрос попадает в кеш, то и в 10 раз. За ввод данных на своих ресурсах Moonshot AI взимает $3 за 1 млн токенов; для сравнения, Anthropic Fable обходится в $10, а OpenAI GPT-5.6 Sol — $5. И это для некешированных входных данных; а механизмы кеширования Kimi-K3 обеспечивают попадание на 90 % для задач на написание кода, и $3 превращаются в $0,30 за тот же 1 млн токенов. Аналогичная ситуация и с выходными токенами.

Вероятнее всего, такой эффективности разработчики добились за счёт комбинации формата чисел MXFP4 для хранения весов и MXFP8 для активации входных данных — в обоих случаях точность относительно низкая, что помогает экономить память. Из 2,8 трлн параметров Kimi-K3 одновременно активны только 104,2 млрд. Интересно, что в описании упоминается работа модели только на относительно скромных ускорителях Nvidia H20, которые не имеют встроенной поддержки MX с плавающей запятой в отличие от чипов семейства Blackwell, которые не поставляются в Китай. Это значит, что Kimi-K3 оптимизирована для работы на менее мощном оборудовании, а запуск на передовых Nvidia Blackwell или других ускорителях с поддержкой MXFP может сделать её более экономичной, но официальными данными это пока не подтверждено.

Кроме того, Kimi-K3 не пользуется хранилищем key-value (KV), вместо которого предлагается обработчик состояний фиксированного размера Kimi Delta Attention, в теории обещающий экономить видеопамять и сокращать время выполнения. Алгоритм MoE (Mixture-of-Experts) предполагает запуск всего 16 из 896 «экспертов», что дополнительно способствует снижению затрат на вывод. Стоит, однако отметить, что открытые веса не означают открытого исходного кода: процесс обучения и набор данных Moonshot держит в секрете.

Китайская ИИ-модель Kimi K3 оказалась настолько популярной, что разработчик перестал принимать новых пользователей

20.07.2026 [13:07], Алексей Разин

Очередная волна интереса к китайским ИИ-моделям с открытым кодом привела к тому, что стартап Moonshot AI быстро исчерпал доступные вычислительные мощности, необходимые для обслуживания подписчиков новой модели Kimi K3. Компания была вынуждена приостановить предоставление доступа к этой модели для новых подписчиков, пока не сможет привлечь дополнительные мощности.

Обзор Infinix GT 50 Pro: геймерский смартфон со встроенной СЖО

Умные помощники: обзор ИИ-сервисов для обработки изображений. Часть 2, актуализированная

Репортаж с IEM Cologne Major 2026: Жаб Жабыч, триумф NiKo и главные сенсации мейджора по CS2

Выбираем лучший игровой ноутбук до 100 000 рублей: сравнительное тестирование 7 интересных моделей

Обзор Ryzen 9 9950X3D2: правильный 16-ядерник с 3D-кешем

Источник изображения: Kimi.com

В воскресенье на странице Moonshot AI в социальной сети X появилось сообщение, которое гласило: «За последние 48 часов рост спроса заставил нас приблизиться к пределу существующих мощностей. Наши GPU ощущают это». Компания добавила, что временно приостановила предоставление доступа к своим ИИ-моделям для новых подписчиков, но пообещала, что ограничения не коснутся уже существующих клиентов. Дополнительные мощности уже вводятся по мере возможностей стартапа, приём заявок на оформление подписки будет возобновлён поэтапно.

Moonshot AI сейчас обслуживает мощную модель Kimi K3 через облачный API-интерфейс, а 27 июля планирует раскрыть информацию о распределении весов внутри этой модели. Ожидается, что Kimi K3 станет крупнейшей передовой ИИ-моделью с открытыми весами. Несмотря на всю шумиху относительно способности китайских ИИ-моделей сокращать разрыв с американскими всё быстрее, многие пользователи отмечают, что Kimi K3 во многих случаях значительно уступает им в производительности.

Китай отверг обвинения в незаконной дистилляции американских ИИ-моделей

18.07.2026 [18:31], Владимир Мироненко

Китай отверг обвинения в том, что его компании занимается дистилляцией иностранных ИИ-моделей, после заявлений американских компаний, включая Anthropic, о том, что китайские конкуренты незаконно извлекают результаты из лучших американских ИИ-моделей для развития собственных. Об этом сообщил Bloomberg.

Обзор Ryzen 9 9950X3D2: правильный 16-ядерник с 3D-кешем

Выбираем лучший игровой ноутбук до 100 000 рублей: сравнительное тестирование 7 интересных моделей

Репортаж с IEM Cologne Major 2026: Жаб Жабыч, триумф NiKo и главные сенсации мейджора по CS2

Обзор Infinix GT 50 Pro: геймерский смартфон со встроенной СЖО

Умные помощники: обзор ИИ-сервисов для обработки изображений. Часть 2, актуализированная

Источник изображения: Steve A Johnson/unsplash.com

Вопрос о дистилляции вновь оказался в центре внимания участников ИИ-индустрии после запуска на этой неделе китайской компанией Moonshot AI новой флагманской модели Kimi K3. Она демонстрирует в отраслевых бенчмарках высочайшую производительность, сопоставимую с лучшими предложениями от OpenAI и Anthropic. Это вызвало обвал фондовых рынков по всему миру, подобный происшедшему после анонса DeepSeek своей ИИ-модели R1 в начале 2025 года.

В связи с этим Anthropic обвинила Moonshot и ещё ряд китайских фирм, включая DeepSeek, MiniMax Group Inc. и Alibaba Group Holding Ltd., в несанкционированном использовании её модели для дистилляции, а OpenAI выдвинула аналогичные обвинения против DeepSeek. Китайские фирмы пока никак не отреагировали на эти обвинения.

«Некоторые страны поднимают тему дистилляции», — сказал помощник министра иностранных дел Китая Лю Бинь (Liu Bin) участникам Всемирной конференции по искусственному интеллекту в Шанхае в субботу, не называя конкретно США. «Это ошибочно и контрпродуктивно», — добавил он. В пятницу президент Китая Си Цзиньпин также призвал к открытому подходу к глобальному развитию технологий, заявив, что «разработка ИИ не должна быть сольным выступлением одной страны».

Под дистилляцией подразумевается метод, когда более старая ИИ-модель, «учитель», используется для обучения более новой модели, «ученика», что позволяет передать ей возможности «учителя» с гораздо меньшими затратами, чем при создании оригинальной модели с нуля.

Эта проблема вынудила конкурирующие компании OpenAI, Anthropic и Google к сотрудничеству, чтобы совместными усилиями попытаться пресечь действия китайских конкурентов по предполагаемому использованию данных их передовых моделей для обучения своих.

Китайская модель Kimi K3 поставила под вопрос лидерство США в области ИИ

18.07.2026 [14:53], Павел Котов

Революционная китайская модель искусственного интеллекта Kimi K3 от Moonshot AI сумела догнать решения, которые ещё несколько недель назад определяли американскую передовую линию в ИИ-отрасли, и предложила более низкую цену, пишет Axios.

Обзор Infinix GT 50 Pro: геймерский смартфон со встроенной СЖО

Умные помощники: обзор ИИ-сервисов для обработки изображений. Часть 2, актуализированная

Репортаж с IEM Cologne Major 2026: Жаб Жабыч, триумф NiKo и главные сенсации мейджора по CS2

Обзор Ryzen 9 9950X3D2: правильный 16-ядерник с 3D-кешем

Выбираем лучший игровой ноутбук до 100 000 рублей: сравнительное тестирование 7 интересных моделей

Источник изображений: kimi.com

Вышедшая в минувший четверг Kimi K3 в одночасье изменила ход гонки ИИ. Она ворвалась в высший эшелон мировых моделей, обогнав Anthropic Fable 5 и OpenAI GPT-5.6 Sol в тестах Arena на разработку фронтенда. В тесте на написание текстов Kimi K3 сумела обойти Anthropic Opus 4.8, выступавшую флагманской до выхода Fable 5, но по себестоимости на 40 % ниже. В отличие от американских конкурентов Moonshot планирует 27 июля выпустить новую Kimi как модель с открытым исходным кодом — любой желающий сможет запускать её на собственном оборудовании и настраивать под свои нужды.

Пока китайские модели набирали обороты, американские политики и разработчики ИИ пытались утешать себя оценками, что Китай отстаёт от передовых американских технологий на 6–12 месяцев. В апреле правительственный центр тестирования ИИ в США оценил новейшую модель DeepSeek как отстающую от ведущих американских на 8 месяцев. Kimi K3 не обязана быть первой в мире: при финансовой выгоде на 40 % и возможности дополнительной настройки под нужды клиента она может выступать и наравне с лидерами рынка, чтобы стать предпочтительной. Само её существование ставит под угрозу ценовую политику американских лабораторий — они привыкли устанавливать тарифы, утверждая, что обладают технологическим превосходством, и выдвигали аргументы в пользу инвестиций в центры обработки данных для ИИ, измеряющиеся сотнями миллиардов долларов.

Anthropic обвиняла Moonshot и другие китайские лаборатории в крупномасштабных атаках с «дистилляцией» её моделей — конкуренты, по версии американской компании произвели несколько миллионов сеансов переписки с передовыми моделями из США для обучения собственных систем. При этом у китайских разработчиков есть лишь ограниченный доступ к передовым американским ИИ-ускорителям Nvidia. OpenAI и Anthropic, однако, и сами продвигаются вперёд, разрабатывая новые версии собственных моделей, в том числе GPT 6 и Claude Opus 5, — возможно, они помогут восстановить отрыв от китайских конкурентов. Но даже если это случится, Китай уже показал, что может быстро сократить отставание.

Перед Белым домом встаёт экзистенциальный вопрос о том, как сохранить конкурентоспособность США в области ИИ, особенно на фоне призывов к регулированию передовых моделей. Ужесточение норм способно замедлить развитие американских компаний; смягчение надзора поможет им двигаться быстрее, но повысит риск высвобождения опасных возможностей. Ограничения на китайские модели могут защитить американские системы внутри страны, но тогда пользователи в других странах окажутся потеряны. Америка ещё способна продвигать передовые технологии. Но помешать остальному миру выбрать более дешёвую альтернативу она уже не сможет.

Открытые китайские ИИ-модели сократили отставание от передовых американских всего до четырёх месяцев

17.07.2026 [18:57], Алексей Разин

Западные фондовые рынки начали остро реагировать на прогресс китайских разработчиков ИИ-моделей. Например, выход модели Moonshot Kimi K3 с открытыми весами к концу недели обвалил котировки американских компаний технологического сектора. Более того, британские эксперты заявили, что китайские ИИ-модели уже сократили отставание от передовых западных до четырёх месяцев.

Репортаж с IEM Cologne Major 2026: Жаб Жабыч, триумф NiKo и главные сенсации мейджора по CS2

Обзор Infinix GT 50 Pro: геймерский смартфон со встроенной СЖО

Умные помощники: обзор ИИ-сервисов для обработки изображений. Часть 2, актуализированная

Выбираем лучший игровой ноутбук до 100 000 рублей: сравнительное тестирование 7 интересных моделей

Обзор Ryzen 9 9950X3D2: правильный 16-ядерник с 3D-кешем

Источник изображения: Kimi.com

В прошлом году, как отмечает Financial Times со ссылкой на отчёт Института безопасности искусственного интеллекта Великобритании (AISI), отставание китайских моделей оценивалось в шесть или десять месяцев. По сути, разрыв сокращается быстрее, чем ожидалось. Специалисты AISI выражают опасение, что открытость китайских ИИ-моделей, которые по сути своей общедоступны для применения, создаёт новую угрозу для безопасности мировой информационной инфраструктуры. Если китайские модели по своим возможностям в сфере кибербезопасности догонят западные, то у специалистов по защите будет всё меньше времени на устранение уязвимостей и угроз. Уже сейчас передовые ИИ-модели данной специализации превосходят по своим возможностям даже самых опытных хакеров, как утверждают эксперты.

Клиенты по всему миру всё чаще обращаются к более доступным китайским ИИ-моделям, пытаясь оптимизировать свои расходы на внедрение ИИ. Подобная тенденция, по мнению представителей AISI, представляет угрозу для бизнеса, поскольку возможностей гарантировать безопасность внедряемых систем становится всё сложнее. История с ограничением доступа к ИИ-моделям Mythos 5 и Fable 5 американской компании Anthropic является примером того, как разработчики пытаются ограничить распространение мощных инструментов для проведения кибератак. За распространением открытых ИИ-моделей такого контроля нет.

По данным тестов AISI, которые выражались как набором отдельных заданий в области кибербезопасности, так и выполнением автономной миссии по проведению полноценной кибератаки силами ИИ-модели, выпущенная пекинской Z.ai модель GLM-5.2 по своим возможностям уже сопоставима с американскими, которые были выпущены за четыре месяца до её дебюта — например, теми же Opus 4.6 и GPT-5.2 Codex. Китайские модели с открытыми весами дешевле в эксплуатации, поскольку используют меньшее количество токенов в своей работе. Их стремительный прогресс ставит перед сферой кибербезопасности новые вызовы, на которые будет не так просто ответить.

Китайская Moonshot AI выпустила крупнейшую в мире открытую ИИ-модель Kimi K3 — у неё 2,8 трлн параметров

17.07.2026 [09:54], Павел Котов

Китайская компания Moonshot AI представила большую языковую модель Kimi K3 — она располагает 2,8 трлн параметров и поддерживает до 1 млн токенов, умея работать не только с текстом, но также с изображениями и видео. Модель справляется со сложными задачами на программирование, научными исследованиями и прочими многоэтапными задачами.

Обзор Ryzen 9 9950X3D2: правильный 16-ядерник с 3D-кешем

Выбираем лучший игровой ноутбук до 100 000 рублей: сравнительное тестирование 7 интересных моделей

Обзор Infinix GT 50 Pro: геймерский смартфон со встроенной СЖО

Репортаж с IEM Cologne Major 2026: Жаб Жабыч, триумф NiKo и главные сенсации мейджора по CS2

Умные помощники: обзор ИИ-сервисов для обработки изображений. Часть 2, актуализированная

Источник изображений: kimi.com

Разработчики признают, что по возможностям Kimi K3 пока уступает самым мощным в мире закрытым моделям — Anthropic Claude Fable 5 и OpenAI GPT-5.6 Sol; но среди открытых она в большинстве тестов демонстрирует лучшие результаты. Полные веса модели компания намерена опубликовать до 27 июля вместе с техническим отчётом, где будут представлены описание архитектуры, механизмы обучения и результаты тестирования.

Главные изменения по сравнению с предыдущим поколением — архитектура Kimi Delta Attention (KDA) и механизм Attention Residuals (AttnRes). Они позволяют модели эффективнее удерживать контекст при длительных цепочках рассуждений. Архитектура Mixture-of-Experts (MoE) включает 896 «экспертов», из которых одновременно активируются 16, что значительно снижает вычислительную нагрузку.

На практике эти решения позволяют Kimi K3 работать с очень крупными репозиториями кода, самостоятельно обращаться к интерфейсу командной строки и средствам разработки, анализировать скриншоты интерфейсов, а также помогать в разработке игр, веб- и CAD-проектов. В рамках испытаний модель написала собственный компилятор для программирования графических процессоров, а также за 48 часов спроектировала собственный чип для инференса ИИ на собственной архитектуре: в симуляции кристалл площадью 4 мм² с тактовой частотой 100 МГц генерировал 8700 токенов в секунду.

Когда модели поставили задачу в области вычислительной астрофизики, она самостоятельно изучила 20 научных статей, спроектировала вычислительный конвейер, обработала более 300 уравнений состояния, нашла несоответствия в опубликованных формулах, написала более 3000 строк на Python и визуализировала результаты в HTML. У человека эта работа заняла бы до двух недель — модель справилась за два часа.

Kimi K3 является мультимодальной. Она умеет работать с видео: создавать обучающие ролики и заниматься монтажом, подбирать фрагменты видео и синхронизировать визуальный ряд с музыкой: в одном из примеров она самостоятельно смонтировала рекламное видео из 56 исходных фрагментов — даже у опытного монтажёра эта задача заняла бы до двух рабочих дней.

Китайская Moonshot AI выпустила открытую ИИ-модель Kimi K2.5 и в тестах она лучше Gemini 3 Pro и GPT-5.2

28.01.2026 [12:18], Павел Котов

Китайская компания Moonshot AI, которую ранее поддержали гиганты Alibaba и HongShan (ранее Sequoia China), выпустила открытую модель искусственного интеллекта Kimi K2.5 — она понимает текст, изображения и видео.

Репортаж с IEM Cologne Major 2026: Жаб Жабыч, триумф NiKo и главные сенсации мейджора по CS2

Выбираем лучший игровой ноутбук до 100 000 рублей: сравнительное тестирование 7 интересных моделей

Умные помощники: обзор ИИ-сервисов для обработки изображений. Часть 2, актуализированная

Обзор Infinix GT 50 Pro: геймерский смартфон со встроенной СЖО

Обзор Ryzen 9 9950X3D2: правильный 16-ядерник с 3D-кешем

Источник изображения: kimi.com

Модель Kimi K2.5 изначально мультимодальна: её обучили на 15 трлн смешанных визуальных и текстовых токенов; она справляется с задачами на программирование и управление несколькими ИИ-агентами. Результаты тестов указывают на то, что она не уступает закрытым аналогам, а в некоторых задачах и превосходит их. В тесте на программирование SWE-bench Verified модель Kimi K2.5 обошла Google Gemini 3 Pro, а в SWE-bench Multilingual — Gemini 3 Pro и OpenAI GPT-5.2. В тесте VideoMMMU из области распознавания видео она выступила лучше, чем Anthropic Claude Opus 4.5. В задачах на программирование Kimi K2.5 способна воспроизвести интерфейс по образцу на изображении или в видео.

Разработчик открыл эти возможности для широкой аудитории, выпустив средство программирования Kimi Code — это прямой конкурент Anthropic Claude Code и Google Gemini CLI. Этим инструментом можно пользоваться в терминале или интегрировать его со средами VSCode, Cursor и Zed — запросами могут выступать текст и видео.

Компанию Moonshot основал бывший исследователь из Google и Meta✴✴ Ян Чжилинь (Yang Zhilin). Она привлекла $1 млрд инвестиций в рамках раунда финансирования серии B при оценке $2,5 млрд. В декабре стартап привлёк $500 млн при оценке $4,3 млрд. Следующий раунд финансирования компания намеревается провести уже при оценке $5 млрд.

Китайцы представили ИИ-модель Kimi K2-Thinking, которая превзошла GPT-5

07.11.2025 [13:29], Павел Котов

Китайская компания Moonshot AI начала развёртывать рассуждающий вариант своей модели искусственного интеллекта — она носит название Kimi K2-Thinking. Разработчик опубликовал результаты тестов модели, из которых видно, что она выступает на равных с передовыми американскими.

Выбираем лучший игровой ноутбук до 100 000 рублей: сравнительное тестирование 7 интересных моделей

Обзор Ryzen 9 9950X3D2: правильный 16-ядерник с 3D-кешем

Умные помощники: обзор ИИ-сервисов для обработки изображений. Часть 2, актуализированная

Репортаж с IEM Cologne Major 2026: Жаб Жабыч, триумф NiKo и главные сенсации мейджора по CS2

Обзор Infinix GT 50 Pro: геймерский смартфон со встроенной СЖО

Источник изображений: Moonshot AI

Поработать с моделью Kimi K2-Thinking можно бесплатно в чат-боте на сайте проекта или подключить её по API — она стоит столько же, сколько и быстрый вариант нейросети, но расходует дополнительные токены на механизмы рассуждений. Moonshot AI опубликовала открытые веса Kimi K2-Thinking и привела результаты бенчмарков — модель проявила себя на уровне таких отраслевых лидеров как OpenAI GPT-5, Anthropic Claude Sonnet 4.5 и xAI Grok 4.

В самом сложном мультидисциплинарном тесте Humanity's Last Exam (HLE), который включает около 3000 задач по математике, естественнонаучным и гуманитарным дисциплинам, Kimi K2-Thinking заняла первое место среди всех моделей, оставив позади GPT-5 и Claude Sonnet 4.5. Она успешно справилась с подключением инструментов для HLE, выполняя до 120 шагов. Доступен также режим Heavy, позволяющий Kimi K2-Thinking работать на уровне GPT-5 Pro и Grok 4 Heavy: параллельно запускаются восемь экземпляров модели, все дают ответы на запрос, из которых собирается окончательный. В бесплатном чат-боте эта ресурсоёмкая версия отсутствует.

Китайская ИИ-модель Kimi k1.5 освоила мультимодальные рассуждения и превзошла OpenAI o1

30.01.2025 [19:29], Сергей Сурабекянц

Если 2024 год стал годом клонов ChatGPT, то 2025 год обещает стать эрой рассуждающих моделей ИИ, а лидерство в этой области захватывают китайские лаборатории. На прошлой неделе много шума наделала DeepSeek со своей рассуждающей моделью R1. А на днях Moonshot AI представила мультимодальную Kimi k1.5, которая обгоняет в тестах OpenAI o1, а стоит в разы меньше. Эти модели представляют собой смену представления о «мыслительном процессе» ИИ.

Репортаж с IEM Cologne Major 2026: Жаб Жабыч, триумф NiKo и главные сенсации мейджора по CS2

Умные помощники: обзор ИИ-сервисов для обработки изображений. Часть 2, актуализированная

Выбираем лучший игровой ноутбук до 100 000 рублей: сравнительное тестирование 7 интересных моделей

Обзор Infinix GT 50 Pro: геймерский смартфон со встроенной СЖО

Обзор Ryzen 9 9950X3D2: правильный 16-ядерник с 3D-кешем

Источник изображения: kimi.ai

Новые модели далеко ушли от банального пересказа Википедии. Им по силам сложные проблемы — от решения головоломок до объяснения квантовой физики. А Kimi k1.5 уже успела заработать звание «первого настоящего конкурента o1». По оценкам экспертов, Kimi k1.5 — это не просто ещё одна модель ИИ — это скачок вперёд в мультимодальном рассуждении и обучении с подкреплением. Kimi k1.5 от Moonshot AI объединяет текст, код и визуальные данные для решения сложных задач, порою в разы превосходя таких лидеров отрасли, как GPT-4o и Claude Sonnet 3.5 в ключевых тестах.

Контекстное окно Kimi k1.5 на 128 тыс. токенов позволяет модели «за один подход» обрабатывать объём информации, эквивалентный солидному роману. В математических задачах модель может планировать, отражать и корректировать свои шаги на протяжении сотен токенов, имитируя решение проблемы человеком. Вместо того, чтобы повторно генерировать полные ответы, Kimi использует фрагменты предыдущих траекторий, повышая эффективность и сокращая затраты на обучение.

Источник изображений: medium.com

Традиционный подход, основанный на принципах обучения с подкреплением, предполагает использование сложных инструментов, таких как поиск по дереву Монте-Карло или сети ценностей. Команда Moonshot AI отказалась от них и создала упрощённый фреймворк на базе обучения с подкреплением, используя штраф за длину и баланс между исследованием и эксплуатацией. В результате разработчикам удалось создать модель, которая обучается быстрее и избегает «чрезмерного обдумывания» — распространённой ошибки, когда ИИ тратит вычислительные ресурсы на ненужные шаги.

Kimi k1.5 успела показать себя как мощный инструмент визуализации и одновременной работы с текстом. Модель умеет анализировать диаграммы, решать геометрические задачи и отлаживать код — в тесте MathVista модель показала точность 74,9 %, объединив текстовые подсказки с графическими диаграммами.

Исследователи Moonshot AI, вместо того чтобы полагаться на мощные, но медленные длинноцепочечные рассуждения (Long-CoT), использовали метод Long2Short («длинные-в-короткие»), добившись более лаконичных и быстрых ответов. Для этого применялись следующие методы:

Объединение моделей путём смешивания весов длинных и коротких версий CoT.
Выборка кратчайшего отклонения — отбор самого короткого и корректного ответа из восьми сгенерированных вариантов.
Оптимизация DPO — обучение модели предпочтению кратких ответов без потери смысла.

Даже при прямом сравнении Kimi K1.5 оставляет GPT-4o и Claude Sonnet 3.5 далеко позади. Разработчикам Moonshot AI удалось оптимизировать процесс обучения с подкреплением благодаря:

Гибридному развёртыванию — совместному использованию ресурсов GPU для обучения и вывода.
Частичным развёртываниям — разделению длинных траекторий на управляемые фрагменты для более эффективного обучения.
Песочницам кода — безопасным средам для тестирования выходных данных кода, что гарантирует их надёжность.

По мнению экспертов, Kimi K1.5 — это не просто технологический прорыв, а взгляд в будущее ИИ. Объединяя обучение с подкреплением с мультимодальным рассуждением, эта модель решает задачи быстрее, умнее и эффективнее.

← В прошлое

✴ Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»;

выдано Федеральной Службой по надзору за соблюдением законодательства в сфере массовых коммуникаций и охране культурного наследия

При цитировании документа ссылка на сайт с указанием автора обязательна. Полное заимствование документа является нарушением
российского и международного законодательства и возможно только с согласия редакции 3DNews.