Оригинал материала: https://3dnews.ru/1144378

Китайский гигант Meituan представил открытую ИИ-модель LongCat-2.0 на 1,6 трлн параметров — её обучили только на китайских чипах

Китайский гигант доставки еды Meituan объявил о запуске большой языковой модели с открытым исходным кодом LongCat-2.0. Компания заявила, что это первая ИИ-модель с триллионом параметров, для обучения которой использовался кластер из 50 тыс. ИИ-ускорителей китайского производства.

 Источник изображения: Ricardo / unsplash.com

Источник изображения: Ricardo / unsplash.com

Компания не раскрыла, как именно новая ИИ-модель LongCat-2.0 будет интегрирована в бизнес-процессы. Предыдущую версию системы использовали для обеспечения работы ИИ-помощников в приложениях Meituan для генерации рекомендаций по выбору ресторанов и отелей, а также выполнения разных задач, таких как формирование заказов на доставку еды и бронирование номеров в отелях. На фоне сокращения прибыли Meituan также может искать способы диверсификации источников дохода. В сообщении, опубликованном в официальном аккаунте LongCat на платформе WeChat, компания подчеркнула способность новой ИИ-модели создать игровой веб-сайт и написать роман.

Использование отечественных ИИ-ускорителей для обучения модели LongCat-2.0 подчёркивает растущую важность самообеспечения на внутреннем рынке Китая. Meituan, как и другие крупные представители ИИ-сегмента, такие как DeepSeek, Alibaba и ByteDance, работают над снижением зависимости от американских ИИ-ускорителей после введения экспортных ограничений со стороны США. Местные производители ИИ-ускорителей, такие как Huawei и Enflame, стремятся заполнить этот пробел, получая долю рынка через контракты на поставку оборудования ИИ-разработчикам.

Что касается модели LongCat-2.0, то в заявлении Meituan сказано, что нейросеть обучалась с нуля с использованием 50 тыс. отечественных ускорителей. Размер контекстного окна составляет 1 млн токенов, что позволяет нейросети осуществлять обработку объёмных документов. Модель ориентирована на агентное программирование, а её архитектура построена таким образом, чтобы эффективно и качественно справляться с решением задач, связанных с генерацией кода.

В компании отметили, что предварительная версия LongCat-2.0 вошла в число трёх наиболее используемых моделей на платформе OpenRouter. По данным Meituan, новая ИИ-модель показывает равные возможности или превосходит некоторые из передовых моделей западных компаний, включая Google Gemini, OpenAI GPT-5.5 и Anthropic Claude Opus, в некоторых бенчмарках в плане генерации программного кода и агентных возможностей.



Оригинал материала: https://3dnews.ru/1144378