Сегодня 01 октября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

ИИ-кластер Huawei CloudMatrix 384 обошёл решения Nvidia в тестах с DeepSeek R1

Новый ИИ-кластер Huawei CloudMatrix 384, построенный на базе китайских процессоров Ascend 910C, показал результаты, которые ранее считались недостижимыми без использования передовых чипов Nvidia. Как утверждает Huawei и китайский стартап SiliconFlow в техническом документе, система Huawei смогла обогнать как модифицированную для экспорта в Китай версию ускорителя Nvidia H800, так и топовую модель H100 при работе с моделью DeepSeek R1 LLM.

 Источник изображения: Huawei

Источник изображения: Huawei

CloudMatrix объединяет 384 двухчиповых процессора HiSilicon Ascend 910C, размещённых в 16 серверных стойках, а также 192 центральных процессора, соединённых между собой с помощью оптоволоконных каналов связи, обеспечивающих высокую скорость передачи данных внутри и между серверами. По замыслу создателей, эта архитектура должна была стать основой для нового поколения ИИ-инфраструктуры, способной конкурировать с западными технологиями без использования передовых полупроводников. Система, по сути, стала примером того, как с помощью увеличения мощности за счёт масшатабов оборудования можно компенсировать отсутствие доступа к передовым технологиям.

Главной целью проведения эксперимента являлось укрепление доверия внутри отечественной технологической среды к собственным разработкам. Эксперимент доказал, что китайские NPU могут быть не хуже, чем графические процессоры Nvidia. Теоретически CloudMatrix 384 действительно обладает большим потенциалом: его вычислительная мощность достигает 300 PFLOPs в формате BF16 против 180 PFLOPs у системы GB200 NVL72 от Nvidia. Также в документе указывается, что программное обеспечение Huawei CloudMatrix-Infer, позволяет генерировать 4,45 токена в секунду на каждый TFLOP при предварительной обработке запросов и 1,29 токена в секунду на TFLOP при формировании ответа, что, по данным исследования, превосходит эффективность фреймворка SGLang от Nvidia.

Вместе с тем специалисты подчёркивают, что преимущество CloudMatrix 384 имеет свою обратную сторону, заключающуюся в ограниченной энергоэффективности. Кластер потребляет 559 киловатт электроэнергии, что в четыре раза превышает показатель вычислительной системы GB200 NVL72, составляющий 145 кВт. Таким образом, за дополнительную мощность приходится платить значительно более высоким энергопотреблением. Энергоэффективность китайской системы примерно в 2,3 раза ниже, чем у аналога от Nvidia

Однако для китайских клиентов, которым закрыт доступ к системам на базе Nvidia, этот фактор играет не самую большую роль. Кроме того, в материковом Китае электричество остаётся относительно дешёвым. Как отмечает Tom's Hardware, за последние три года цены на энергию упали почти на 40 %, что делает использование ресурсоёмких решений экономически оправданным.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
ФИФА анонсировала первую FIFA после ухода Electronic Arts — это футбольная аркада FIFA Heroes для консолей и мобильных телефонов 15 мин.
Microsoft обновила иконки Office — они стали объёмнее и красочнее 28 мин.
Подписка Microsoft 365 Premium теперь доступна всем — Office, GPT-5 и другие ИИ-функции за $20 в месяц 37 мин.
«Тектонический сдвиг»: у Microsoft появится второй гендир — текущий сосредоточится на технических вопросах 50 мин.
«Любим вас больше, чем банкомат — деньги»: хоррор об ужасах долговой ямы CloverPit достиг новой вершины продаж 60 мин.
«Окей, Google, давай пообщаемся»: представлен ИИ-помощник Gemini for Home для умного дома 2 ч.
У Assassin's Creed, Far Cry и Rainbow Six теперь новый дом, которым частично владеет Tencent — Ubisoft представила Vantage Studios 3 ч.
Microsoft вывела Xbox Cloud Gaming из беты, подтянула графику до 1440p и повысила битрейт 3 ч.
Meta начнёт использовать чаты пользователей с ИИ, чтобы продавать ещё более персонализированную рекламу 3 ч.
Ultimate за $30, ПК-игры и Xbox Cloud Gaming для всех: Microsoft анонсировала масштабные изменения в Game Pass 3 ч.
Китай запустил самую мощную в мире центрифугу для экспериментов над пространством и временем 32 мин.
Apple приступила к разработке гарнитуры Vision Pro 2, подтвердила свежая утечка 2 ч.
Asus оценила GeForce RTX 5080 Hatsune Miku Edition в $1900 — на 90 % дороже рекомендованной цены 2 ч.
OpenAI построит ИИ ЦОД Stargate в Южной Корее, а Samsung поможет ей создать плавучие дата-центры 3 ч.
OpenAI объединится с Samsung и SK hynix, чтобы удовлетворить потребность в памяти для ИИ-мегапроекта Stargate 3 ч.
Oura представила керамические умные кольца Ring 4 за $499, зарядный футляр за $99 и медицинский сервис за $99 3 ч.
Сегодня в России отмечается День работников отрасли ЦОД 4 ч.
Selectel проведёт ежегодную флагманскую конференцию Selectel Tech Day 2025 в Москве 4 ч.
Паукообразный робот Charlotte будет возводить по дому в день — и на Луне тоже 4 ч.
Crucial выпустила самую быструю память LPCAMM2 LPDDR5X для ноутбуков — 8533 МТ/с 5 ч.