Сегодня 03 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

ИИ-кластер Huawei CloudMatrix 384 обошёл решения Nvidia в тестах с DeepSeek R1

Новый ИИ-кластер Huawei CloudMatrix 384, построенный на базе китайских процессоров Ascend 910C, показал результаты, которые ранее считались недостижимыми без использования передовых чипов Nvidia. Как утверждает Huawei и китайский стартап SiliconFlow в техническом документе, система Huawei смогла обогнать как модифицированную для экспорта в Китай версию ускорителя Nvidia H800, так и топовую модель H100 при работе с моделью DeepSeek R1 LLM.

 Источник изображения: Huawei

Источник изображения: Huawei

CloudMatrix объединяет 384 двухчиповых процессора HiSilicon Ascend 910C, размещённых в 16 серверных стойках, а также 192 центральных процессора, соединённых между собой с помощью оптоволоконных каналов связи, обеспечивающих высокую скорость передачи данных внутри и между серверами. По замыслу создателей, эта архитектура должна была стать основой для нового поколения ИИ-инфраструктуры, способной конкурировать с западными технологиями без использования передовых полупроводников. Система, по сути, стала примером того, как с помощью увеличения мощности за счёт масшатабов оборудования можно компенсировать отсутствие доступа к передовым технологиям.

Главной целью проведения эксперимента являлось укрепление доверия внутри отечественной технологической среды к собственным разработкам. Эксперимент доказал, что китайские NPU могут быть не хуже, чем графические процессоры Nvidia. Теоретически CloudMatrix 384 действительно обладает большим потенциалом: его вычислительная мощность достигает 300 PFLOPs в формате BF16 против 180 PFLOPs у системы GB200 NVL72 от Nvidia. Также в документе указывается, что программное обеспечение Huawei CloudMatrix-Infer, позволяет генерировать 4,45 токена в секунду на каждый TFLOP при предварительной обработке запросов и 1,29 токена в секунду на TFLOP при формировании ответа, что, по данным исследования, превосходит эффективность фреймворка SGLang от Nvidia.

Вместе с тем специалисты подчёркивают, что преимущество CloudMatrix 384 имеет свою обратную сторону, заключающуюся в ограниченной энергоэффективности. Кластер потребляет 559 киловатт электроэнергии, что в четыре раза превышает показатель вычислительной системы GB200 NVL72, составляющий 145 кВт. Таким образом, за дополнительную мощность приходится платить значительно более высоким энергопотреблением. Энергоэффективность китайской системы примерно в 2,3 раза ниже, чем у аналога от Nvidia

Однако для китайских клиентов, которым закрыт доступ к системам на базе Nvidia, этот фактор играет не самую большую роль. Кроме того, в материковом Китае электричество остаётся относительно дешёвым. Как отмечает Tom's Hardware, за последние три года цены на энергию упали почти на 40 %, что делает использование ресурсоёмких решений экономически оправданным.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Классический экшен, никакого ИИ и мультиплеер на долгие годы: разработчики Serious Sam: Shatterverse ответили на вопросы игроков 38 мин.
Darkest Dungeon про альпинистов: анонсирована безжалостная пошаговая тактика Ascenders: Beyond the Peak 2 ч.
Власти обязали крупнейшие российские интернет-платформы закрыть доступ пользователям с VPN к 15 апреля 2 ч.
Rowhammer адаптировали для взлома компьютеров через видеокарты — разработаны эксплойты GDDRHammer и GeForge  2 ч.
Google обновила видеоредактор Vids новейшими ИИ-моделями Veo и Lyria, а также добавила управляемые ИИ-аватары 2 ч.
«Словно снова впервые играю в Mass Effect»: новый геймплейный тизер ролевого боевика Exodus от ветеранов BioWare заворожил фанатов 3 ч.
В Apple нашли способ быстро и эффективно строить 3D-сцены с помощью ИИ 4 ч.
Nvidia показала работу RTX Mega Geometry в The Witcher 4 — на RTX 5090 технодемо выдавало 80 кадров/с в 4K с DLSS 4 ч.
Subnautica стала временно бесплатной в Steam и Epic Games Store перед запуском Subnautica 2 6 ч.
Google выпустила семейство открытых моделей Gemma 4 с поддержкой 140 языков и лицензией Apache 2.0 10 ч.
Tesla впервые с конца 2024 года обошла BYD по объёму поставок электромобилей 2 ч.
Китайский производитель роботов UBTech готов платить ИИ-специалистам до $18 млн в год 4 ч.
Анонсирован защищённый смартфон Realme 16 5G с чипом Dimensity 6400 Turbo и батареей на 7000 мА·ч 4 ч.
d-Matrix приобрела разработки GigaIO в области дата-центров, включая НРС-платформу SuperNODE 5 ч.
OpenAI внезапно решила потратить более сотни миллионов долларов на покупку популярного ток-шоу 7 ч.
Подготовка к 5G: Yadro инвестирует 135 млрд рублей в производство телеком-оборудования 10 ч.
Новая статья: Восьмеричный путь к AGI: от ложной нирваны к истинной 15 ч.
SpaceX пожаловалась, что запуски спутников-конкурентов Amazon Leo создали риск столкновения 16 ч.
8BitDo выпустила механическую клавиатуру Retro 68 AP50 за $500 в стиле компьютера Apple II 16 ч.
К созданию спонсируемого Биллом Гейтсом нетипичного ядерного реактора подключили ИИ — процесс пойдёт живее 16 ч.