Сегодня 20 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Xiaomi выпустила «самую мощную LLM с открытым исходным кодом для программной инженерии» — MiMo-V2-Flash

Xiaomi сообщила о выпуске бесплатной и открытой модели искусственного интеллекта MiMo-V2-Flash. Её отличают высокие мощность, эффективность и скорость — модель хорошо проявляет себя в сценариях с рассуждениями, программированием и работы в качестве ИИ-агента. Это отличный универсальный помощник для повседневных задач, утверждает разработчик.

 Источник изображений: mimo.xiaomi.com

Источник изображений: mimo.xiaomi.com

ИИ-модель MiMo-V2-Flash доступна для пользователей по всему миру на платформе Hugging Face, в инфраструктуре Google Cloud AI Studio, а также на собственной платформе Xiaomi для разработчиков. MiMo-V2-Flash имеет архитектуру «смеси экспертов» — её общий размер составляет 309 млрд параметров, из которых активны только 15 млрд. Ещё один механизм оптимизации — гибридный механизм полного внимания (Global Attention), при котором охватываются все токены контекста, и скользящего окна (Sliding Window Attention), предусматривающего учёт только текущего и соседних с ним токенов. Он реализуется в соотношении 1:5 — если провести параллель, модель при ответе основную часть времени смотрит себе под ноги, но иногда осматривает и всю дорогу целиком. Это позволяет добиться скорости, сравнимой с механизмом скользящего окна, при точности почти как при чистом механизме полного внимания.

В стандартных тестах SWE-bench Verified и Multilingual, которые помогают оценить способности ИИ к разработке ПО, MiMo-V2-Flash, по утверждению Xiaomi, заняла первое место среди всех открытых моделей и выступила на уровне ведущих мировых моделей с закрытым кодом. В математическом AIME 2025 и междисциплинарном GPQA-Diamond она вошла в число двух лучших открытых моделей в мире. MiMo-V2-Flash поддерживает гибридную схему мышления, позволяя пользователям переключать модель между режимом рассуждения и форматом быстрых ответов. Поддерживается генерация полнофункциональных HTML-страниц в один клик; есть возможность интеграции со сторонними инструментами «вайб-кодинга», в том числе Claude Code, Cursor и Cline; длина контекстного окна составляет 256 тыс. токенов, что позволяет MiMo-V2-Flash выполнять задачи в течение нескольких сотен раундов взаимодействия с агентами и вызова сторонних инструментов.

Механизмы оптимизации помогли «разогнать» MiMo-V2-Flash до скорости ответа в 150 токенов в секунду — по субъективным ощущениям они выдаются почти мгновенно. В инфраструктуре Xiaomi при подключении через API стоимость работы с моделью составляет $0,1 за 1 млн входных и $0,3 за 1 млн выходных токенов. Помимо гибридного механизма полного внимания и скользящего окна, разработчик повысил скорость модели, обучив её генерировать по нескольку токенов одновременно (Multi-Token Prediction — MTP): первоначально они генерируются в черновом формате, проверяются и сразу могут направляться в ответ. На практике модель генерирует в среднем от 2,8 до 3,6 токенов параллельно, что помогает ускорить её работу на величину от 2,0 до 2,6 раза.

Ещё одно нововведение в Xiaomi развернули на этапе постобучения MiMo-V2-Flash — парадигму «динамической дистилляции знаний от группы наставников» (Multi-Teacher Online Policy Distillation — MOPD). Это значит, что ответы обучаемой модели оцениваются моделями-наставниками в реальном времени, причём последние дают свои рекомендации не по схеме «правильно или неправильно», а предлагают разбор ошибок. Обучаемая же модель при этом анализирует свои собственные ответы, а не действует в рамках заданных сценариев. Эта схема позволяет использовать всего 2 % вычислительных ресурсов по сравнению с традиционным сценарием обучения с подкреплением при тонкой настройке (SFT/RL). Кроме того, децентрализованная структура MOPD позволяет прошедшему обучение «ученику» впоследствии исполнять роль «наставника» — другими словами, модель непрерывно самосовершенствуется.

По совокупности тестов модель MiMo-V2-Flash демонстрирует результаты, сравнимые с показателями ведущих китайских систем K2 Thinking и DeepSeek V3.2 Thinking; причём в задачах с длинным контекстом нейросеть от Xiaomi превзошла значительно более крупную K2 Thinking, оправдав архитектуру скользящего окна. В тесте SWE-Bench Verified она набрала 73,4 %, обошла все открытые аналоги и выступила почти на уровне OpenAI GPT-5-High; в SWE-Bench Multilingual решила 71,7 % задач, подтвердив статус самой эффективной открытой модели для разработки ПО. В тестах τ²-Bench на работу в качестве отраслевого ИИ-агента она показала результаты в 95,3 баллов для телекоммуникационного направления, 79,5 для розничной торговли и 66,0 для авиакомпаний. В бенчмарке поисковых агентов BrowseComp она набрала 45,4 балла, а с учётом управления контекстом — 58,3. Веса модели, включая MiMo-V2-Flash-Base, доступны на Hugging Face по лицензии MIT, код для инференса (вывода) направлен разработчикам фреймворка SGLang.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Vitality разгромила Spirit в финале IEM Rio 2026 и выиграла $1 млн в золотых слитках в гонке Grand Slam 4 ч.
Спустя 28 лет фанаты раскрыли «один из старейших» секретов The Elder Scrolls — что скрывается под женскими юбками в Redguard 4 ч.
Регуляторы увидели в ИИ-модели Anthropic Mythos угрозу для банковской системы 5 ч.
Продажи пиратского симулятора выживания Windrose превысили 1 млн копий, а пиковый онлайн в Steam — 222 тыс. игроков 5 ч.
Инсайдер: Far Cry 7 угодила в «ад», ремейк Splinter Cell не выйдет в 2026 году, а Assassin’s Creed Black Flag Resynced покажут 23 апреля 7 ч.
АНБ США продолжает использовать Anthropic Mythos, несмотря на запрет 7 ч.
Продажи No Rest for the Wicked перевалили за 1,7 млн копий — ролевой экшен уже два года находится в раннем доступе 8 ч.
Clair Obscur: Expedition 33 покорилось уникальное достижение Baldur’s Gate 3 8 ч.
ФГУП «ГлавНИВЦ» развивает сотрудничество с российским разработчиком «Базис» 8 ч.
ИИ-модель Mythos заставила власти США пойти на контакт с «угрожающей национальной безопасности» Anthropic 22 ч.
Гиперскейлеры убедили Евросоюз, что экологические показатели ЦОД — это коммерческая тайна 49 мин.
Huawei представила смартфон Pura 90 — тройная камера, 6,8" экран, 7-мм корпус и аккумулятор на 6500 мА·ч 56 мин.
Huawei представила широкоформатный складной смартфон Huawei Pura X Max с чипом Kirin 9030 Pro и ценой от $1615 2 ч.
Huawei представила флагман Pura 90 Pro Max с 200-Мп зум-камерой почти за $1000 и версию Pura 90 Pro подешевле 3 ч.
Набирающий силу профсоюз Samsung намерен запустить 18-дневную забастовку в мае 4 ч.
На IMEI сто рублей: новый закон может сделать смартфоны в России дороже, но операторы уже готовы распорядиться деньгами 4 ч.
Для самых мощных видеокарт: Micron начала поставки 3-Гбайт чипов GDDR7 со скоростью 32 Гбит/с 4 ч.
DEScycle поможет Cisco восстанавливать металлы из её оборудования 4 ч.
«Однодолларовый» одноплатник BeagleConnect Zepto получил микроконтроллер Texas Instruments 4 ч.
Huawei выпустила умные часы Watch Buds 2 со встроенными наушниками 6 ч.