Сегодня 07 августа 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

ИИ-кластер Huawei CloudMatrix 384 обошёл решения Nvidia в тестах с DeepSeek R1

Новый ИИ-кластер Huawei CloudMatrix 384, построенный на базе китайских процессоров Ascend 910C, показал результаты, которые ранее считались недостижимыми без использования передовых чипов Nvidia. Как утверждает Huawei и китайский стартап SiliconFlow в техническом документе, система Huawei смогла обогнать как модифицированную для экспорта в Китай версию ускорителя Nvidia H800, так и топовую модель H100 при работе с моделью DeepSeek R1 LLM.

 Источник изображения: Huawei

Источник изображения: Huawei

CloudMatrix объединяет 384 двухчиповых процессора HiSilicon Ascend 910C, размещённых в 16 серверных стойках, а также 192 центральных процессора, соединённых между собой с помощью оптоволоконных каналов связи, обеспечивающих высокую скорость передачи данных внутри и между серверами. По замыслу создателей, эта архитектура должна была стать основой для нового поколения ИИ-инфраструктуры, способной конкурировать с западными технологиями без использования передовых полупроводников. Система, по сути, стала примером того, как с помощью увеличения мощности за счёт масшатабов оборудования можно компенсировать отсутствие доступа к передовым технологиям.

Главной целью проведения эксперимента являлось укрепление доверия внутри отечественной технологической среды к собственным разработкам. Эксперимент доказал, что китайские NPU могут быть не хуже, чем графические процессоры Nvidia. Теоретически CloudMatrix 384 действительно обладает большим потенциалом: его вычислительная мощность достигает 300 PFLOPs в формате BF16 против 180 PFLOPs у системы GB200 NVL72 от Nvidia. Также в документе указывается, что программное обеспечение Huawei CloudMatrix-Infer, позволяет генерировать 4,45 токена в секунду на каждый TFLOP при предварительной обработке запросов и 1,29 токена в секунду на TFLOP при формировании ответа, что, по данным исследования, превосходит эффективность фреймворка SGLang от Nvidia.

Вместе с тем специалисты подчёркивают, что преимущество CloudMatrix 384 имеет свою обратную сторону, заключающуюся в ограниченной энергоэффективности. Кластер потребляет 559 киловатт электроэнергии, что в четыре раза превышает показатель вычислительной системы GB200 NVL72, составляющий 145 кВт. Таким образом, за дополнительную мощность приходится платить значительно более высоким энергопотреблением. Энергоэффективность китайской системы примерно в 2,3 раза ниже, чем у аналога от Nvidia

Однако для китайских клиентов, которым закрыт доступ к системам на базе Nvidia, этот фактор играет не самую большую роль. Кроме того, в материковом Китае электричество остаётся относительно дешёвым. Как отмечает Tom's Hardware, за последние три года цены на энергию упали почти на 40 %, что делает использование ресурсоёмких решений экономически оправданным.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Microsoft отменила разработку кооперативного боевика Contraband от создателей Just Cause — разработчики выступили с официальным заявлением 21 мин.
Sony подтвердила новые сроки выхода Marathon и устала терпеть неудачи Bungie — студия теряет независимость 3 ч.
X начнёт вставлять рекламу в ответы ИИ-бота Grok 3 ч.
Трамп запустил ИИ-поисковик, который мечется между подхалимством и критикой самого Трампа 4 ч.
Предложение, от которого можно отказаться: критики вынесли вердикт Mafia: The Old Country 4 ч.
Хакеры впервые захватили умный дом с помощью ИИ Gemini и «Календаря Google» 5 ч.
Anthropic с отрывом лидирует в войне за таланты в сфере ИИ, хотя платит им меньше Meta и других 5 ч.
В Steam вышел постапокалиптический кооперативный боевик Guntouchables — первые 24 часа после релиза его раздают бесплатно 5 ч.
Смартфоны Samsung Galaxy научатся вычислять телефонных мошенников 6 ч.
Анонсирована Disciples: Domination — прямое продолжение Disciples: Liberation, но уже от других разработчиков 6 ч.
Потерянные ключи найдутся даже в глуши — Hubble Network создаст глобальную сеть Bluetooth-спутников 6 мин.
DJI вышла на рынок роботов-пылесосов — Romo получил прозрачный корпус и технологии от дронов 4 ч.
DJI пыталась обсудить с властями США запрет своих дронов, но с компанией никто не захотел разговаривать 5 ч.
Vivo представила самый тонкий смартфон с батарей на 8000 мА·ч — iQOO Z10 Turbo+ на флагманском чипе Dimensity 9400+ 5 ч.
Dell'Oro Group: мировые капитальные затраты на ЦОД достигнут $1,2 трлн к 2029 году — половина придётся на гиперскейлеров 6 ч.
Продажи PlayStation 5 перевалили за 80 млн — до рекорда PS2 ещё далеко 6 ч.
Трамп потребовал от гендиректора Intel Лип-Бу Тана немедленно уйти в отставку 7 ч.
Стартап YPlasma придумал систему плазменного охлаждения серверов 8 ч.
AMD без лишнего шума представила профессиональную видеокарту Radeon Pro W7400 начального уровня 8 ч.
В Китае придумали способ экономии на ветряках — выкинули по одной лопасти с каждого 8 ч.