Сегодня 03 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

ИИ-кластер Huawei CloudMatrix 384 обошёл решения Nvidia в тестах с DeepSeek R1

Новый ИИ-кластер Huawei CloudMatrix 384, построенный на базе китайских процессоров Ascend 910C, показал результаты, которые ранее считались недостижимыми без использования передовых чипов Nvidia. Как утверждает Huawei и китайский стартап SiliconFlow в техническом документе, система Huawei смогла обогнать как модифицированную для экспорта в Китай версию ускорителя Nvidia H800, так и топовую модель H100 при работе с моделью DeepSeek R1 LLM.

 Источник изображения: Huawei

Источник изображения: Huawei

CloudMatrix объединяет 384 двухчиповых процессора HiSilicon Ascend 910C, размещённых в 16 серверных стойках, а также 192 центральных процессора, соединённых между собой с помощью оптоволоконных каналов связи, обеспечивающих высокую скорость передачи данных внутри и между серверами. По замыслу создателей, эта архитектура должна была стать основой для нового поколения ИИ-инфраструктуры, способной конкурировать с западными технологиями без использования передовых полупроводников. Система, по сути, стала примером того, как с помощью увеличения мощности за счёт масшатабов оборудования можно компенсировать отсутствие доступа к передовым технологиям.

Главной целью проведения эксперимента являлось укрепление доверия внутри отечественной технологической среды к собственным разработкам. Эксперимент доказал, что китайские NPU могут быть не хуже, чем графические процессоры Nvidia. Теоретически CloudMatrix 384 действительно обладает большим потенциалом: его вычислительная мощность достигает 300 PFLOPs в формате BF16 против 180 PFLOPs у системы GB200 NVL72 от Nvidia. Также в документе указывается, что программное обеспечение Huawei CloudMatrix-Infer, позволяет генерировать 4,45 токена в секунду на каждый TFLOP при предварительной обработке запросов и 1,29 токена в секунду на TFLOP при формировании ответа, что, по данным исследования, превосходит эффективность фреймворка SGLang от Nvidia.

Вместе с тем специалисты подчёркивают, что преимущество CloudMatrix 384 имеет свою обратную сторону, заключающуюся в ограниченной энергоэффективности. Кластер потребляет 559 киловатт электроэнергии, что в четыре раза превышает показатель вычислительной системы GB200 NVL72, составляющий 145 кВт. Таким образом, за дополнительную мощность приходится платить значительно более высоким энергопотреблением. Энергоэффективность китайской системы примерно в 2,3 раза ниже, чем у аналога от Nvidia

Однако для китайских клиентов, которым закрыт доступ к системам на базе Nvidia, этот фактор играет не самую большую роль. Кроме того, в материковом Китае электричество остаётся относительно дешёвым. Как отмечает Tom's Hardware, за последние три года цены на энергию упали почти на 40 %, что делает использование ресурсоёмких решений экономически оправданным.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Объём слитых в интернет данных россиян взлетел почти на 70 % в прошлом году 22 мин.
Онлайн-кинотеатры в России нарастили аудиторию до 75 млн зрителей и теперь думают над повышением цен 28 мин.
Хакеры взломали популярный текстовый редактор Notepad++ и полгода распространяли вирусы с обновлениями 2 ч.
xAI выпустила Grok Imagine 1.0 с поддержкой создания 10-секундных видео в улучшенном разрешении 7 ч.
В Firefox появится выключатель всех ИИ-функций разом 12 ч.
Суровое альпинистское приключение Cairn от создателей Furi покорило вершину в 200 тысяч проданных копий всего за три дня 14 ч.
«Лучше большинства фильмов по RE»: трагичная короткометражка по мотивам Resident Evil Requiem впечатлила фанатов 16 ч.
За саундтрек можно не переживать: композитор «Ведьмака 3» напишет музыку для The Witcher 4 17 ч.
Firefly без ограничений: Adobe сняла лимиты на ИИ-генерацию изображений и видео, но не навсегда 18 ч.
Google добавит в Gemini инструмент для переноса диалогов из ChatGPT и других ИИ-ботов 18 ч.
Индия объявила 20 лет налоговых каникул для гиперскейлеров, использующих местные ЦОД для обслуживания зарубежных облачных клиентов 6 мин.
Возвращение людей к Луне отложили до марта — ракета SLS для миссии Artemis II дала течь 23 мин.
CXMT и YMTC спешат нажиться на дефиците: Китай резко нарастит выпуск памяти 30 мин.
Giga Computing представила материнские платы для рабочих станций на базе Intel Xeon 600 57 мин.
86 P-ядер, 128 линий PCIe 5.0 и 8 каналов DDR5-6400/8800: Intel представила чипы Xeon 600 для рабочих станций 2 ч.
Установлен новый мировой рекорд скорости FPV-дронов — 661 км/ч 2 ч.
Компьютеры Raspberry Pi снова подорожали — причина вся та же 2 ч.
OpenAI всё активнее ищет альтернативу ускорителям Nvidia для инференса 4 ч.
VDURA предложила программу Flash Relief Program для смягчения дефицита флеш-памяти 4 ч.
+3 % производительности ценой +30 % энергии: Ryzen 7 9800X3D превратился Ryzen 7 9850X3D повышением напряжения 6 ч.