На этой неделе индийский Центр развития передовых вычислений (C-DAC) анонсировал первый в стране разработанный самостоятельно процессор для высокопроизводительных вычислений (HPC). Первый индийский чип, названный Aum, основан на архитектуре Neoverse V1 Zeus (Arm v8.4) и может масштабироваться до 96 ядер. Ожидается, что он появится на рынке уже в 2024 году и будет выпускаться по техпроцессу 5 нм на мощностях TSMC.
Aum был разработан в рамках программы National Supercomputing Mission, цель которой — снизить зависимость Индии от возможных экспортных ограничений. С этой целью была поставлена задача развернуть процессорную архитектуру, разработанную на национальном уровне. Помимо этого планируется, что в будущем разработка составит конкуренцию Intel и AMD в областях высокопроизводительных вычислений и решений для персональных компьютеров.
Чиплеты A48Z, лежащие в основе 96-ядерного чипа Aum, имеют по 48 ядер Arm Zeus (базовая частота 3 ГГц, турборежим 3,5 ГГц), дополняемых 96 Мбайт кэша L2 с непосредственным доступом и ещё 96 Мбайт общего кэша третьего уровня. Чипы Aum могут оснащаться до 64 Гбайт памяти HBM3 с частотой 5,6 ГГц (хотя контроллер поддерживает до 6,4 ГГ) и пропускной способностью 2,87 Тбайт/с. Новинки также поддерживают до 16 каналов памяти DDR5 с частотой до 5200 МГц, обеспечивая пропускную способность 332,8 Гбайт/с.
Имеется 128 линий PCIe 5.0, 64 из которых позволяют использовать дополнительные ускорители (например, ускорители вычислений на базе GPU или FPGA). Оставшиеся 64, вероятно, используются для внутренней коммуникационной структуры чипа — когерентной ячеистой сети NUMA-стиля, полностью когерентных с памятью связей на основе протокола CCIX. Эта сеть используется также для связи между двумя сокетами Aum, и она заимствует некоторые конструктивные особенности у Infinity Fabric от AMD.
Aum предложит производительность в 4,6 терафлопс на сокет и 3 Тбайт/с совокупной пропускной способности памяти. Это обеспечит соотношение байт на флоп в 0,7, что намного выше 0,38, достигнутого самым быстрым в мире суперкомпьютером на базе Arm — японским Fugaku, а также значительно превосходит американский Summit на базе IBM и NVIDIA (<0,2 байт/флоп). Однако, TDP индийского чипа составит 300 Ватт, что означает меньшую энергоэффективность по сравнению с Arm-ядрами A64FX в Fugaku.
Если все пойдёт по плану, индийский процессор Aum станет сильным конкурентом в области суперкомпьютеров. Важно то, что он будет отечественным — пусть и не в значительной степени. Очевидно, что была проделана большая работа по усовершенствованию подсистемы памяти в целом. Следующим шагом C-DAC может стать кастомизация процессорного ядра, что подготовит почву для создания в большей степени суверенного чипа в Индии и придаст импульс процессу «национализации чипов» в других странах.
Источник: