Huawei научилась создавать конкурентов для ИИ-систем Nvidia, но они проигрывают по эффективности и производительности
Читать в полной версииАппаратное обеспечение ИИ-серверов Huawei, местные поставщики компонентов для упаковки чипов и партнёры по средствам автоматизации проектирования сформировали костяк ориентированной на Китай цепочки поставок чипов. ИИ-чипы Huawei Ascend и окружившая их сеть поставщиков сейчас позиционируются как основа национальных усилий КНР по созданию независимой, полностью отечественной полупроводниковой экосистемы.
Источник изображения: Huawei
Согласно имеющимся данным, Huawei вложилась в капитал более чем 60 компаний из полупроводниковой отрасли Китая через свою дочернюю компанию Hubble. Параллельно с этим местные партнёры Huawei, такие как Empyrean, развивают инструменты проектирования для поддержки экосистемы программного обеспечения в сфере ИИ, которая не зависит от Nvidia или каких-либо других американских поставщиков.
Результат деятельности сформированной Huawei сети поставщиков на внутреннем рынке компания продемонстрировала на Международной выставке высоких технологий в Шэньчжэне. Речь идёт о ИИ-системе CloudMatrix 384, которая объединила 384 ускорителя Ascend 910C в серверных стойках и позиционируется в качестве прямого конкурента платформе Nvidia GB200.
Несмотря на сохраняющиеся компромиссы в плане производительности и энергоэффективности, система CloudMatrix 384 подчёркивает, как далеко продвинулась Huawei с момента, когда в 2019 году США впервые ограничили доступ к технологиям и оборудованию американского происхождения. Основой серверной стратегии Huawei является графический процессор Ascend 910C, созданный с использованием многослойной памяти HBM2E и архитектуры нейропроцессора DaVinci, оптимизированной для ИИ-нагрузок. Ускоритель обеспечивает производительность до 780 TFLOPS на операциях BF16 при энергопотреблении 350 Вт.
Это ниже показателей ИИ-ускорителей Nvidia на архитектурах Hopper (H100) и Blackwell (B200) как по пиковой производительности, так и по энергоэффективности. Однако Huawei компенсирует разницу за счёт масштабирования. Например, система CloudMatrix 384 объединяет 12 стоек с модулями Ascend с четырьмя стойками оптических соединений, тем самым формируя кластер из 384 ИИ-ускорителей, который обеспечивает производительность около 300 PFLOPS. Система потребляет около 559 киловатт энергии при пиковой нагрузке, что почти в четыре раза превышает энергопотребление системы Nvidia DGX на базе ускорителей GB200.
Однако китайские центры обработки данных сталкиваются с меньшими ограничениями на энергопотребление со стороны регуляторов. Кроме того, стоимость электроэнергии в Китае существенно ниже, чем в США. Такая компромиссная модель в сочетании с масштабными поставками чипов отечественного производства делает ускорители Ascend жизнеспособной основой для обучения передовых ИИ-моделей внутри страны.