Сегодня 08 мая 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

AMD рассказала о серверных ускорителях вычислений Instinct MI200 из нескольких кристаллов на CDNA 2

В рамках конференции Hot Chips 34 компания AMD поделилась деталями о серверных ускорителях вычислений серии Instinct MI200 на базе чипов Aldebaran на архитектуре CDNA 2. Это первые GPU компании AMD, в составе которых применяется компоновка из нескольких кристаллов (чиплетов), также известная как MCM-компоновка.

 Источник изображений: AMD

Источник изображений: AMD

Одними из ключевых особенностей Instinct MI200 являются:

  • архитектура CDNA 2 с матричными ядрами второго поколения для ускорения вычислений FP64 и FP32. Они до четырёх раз увеличивают производительность операций FP64 по сравнению с предыдущим поколением серверных ускорителей AMD;
  • передовая технология упаковки 2.5D Elevated Fanout Bridge (EFB), позволяющая до 1,8 раза увеличить количество ядер и до 2,7 раза повысить пропускную способность памяти по сравнению с предыдущим поколением серверных GPU AMD, а также обеспечить пиковую пропускную способности памяти в 3,2 Тбайт/c;
  • третье поколение шины AMD Infinity Fabric; поддержка до 8 линий Infinity Fabric, которые обеспечивают связь между несколькими самими AMD Instinct MI200, а также процессорами AMD EPYC, в том числе третьего поколения, что обеспечивает системе унифицированную память CPU/GPU и повышает максимальную пропускную способность.

В составе ускорителей AMD Instinct MI200 используется GPU с двумя кристаллами (чиплетами) — основным и второстепенным. Каждый кристалл содержит по 8 шейдерных движков, в каждом из которых находятся по 14 вычислительных блоков (Compute Units, CU) для операций FP64, FP32, а также матричные движки второго поколения для операций FP16 и BF16.

Таким образом на каждый кристалл приходятся по 112 вычислительных блоков или 7168 потоковых процессоров, а на весь GPU в целом — 224 CU или 14 336 потоковых процессоров. GPU производится с использованием 6-нм техпроцесса TSMC. В общей сложности в составе ускорителя присутствуют 58 млрд транзисторов.

 Блок-схема AMD Instinct MI200 GPU

Блок-схема AMD Instinct MI200 GPU

В составе чипа Aldebaran применяется скоростная шина xGMI. В составе каждого чиплета имеется движок VCN 2.6 и основной IO-контроллер, по четыре 1024-битных контроллера памяти HBM2e. На каждый чиплет также приходится по 8 Мбайт кеш-памяти L2, физически разделённой на 32 блока и по 64 Гбайт памяти HBM2e с пропускной способностью на уровне 1,6 Тбайт/с. Совокупный объём памяти HBM2e на GPU может достигать 128 Гбайт, а её пропускная способность составлять 3,2 Тбайт/с. Это на 1,2 Тбайт/с выше, чем у NVIDIA A100, оснащённой 80 Гбайт памяти HBM2e.

AMD Aldebaran поддерживают 8 каналов Infinity Fabric. Один из них может использоваться для соединения CPU и GPU (по PCI Express). Оно рассчитано на согласованную передачу данных со скоростью 144 Гбайт/с. Показатель можно масштабировать до 500 Гбайт/с используя внешний канал Infinity Fabric с четырьмя подключёнными ускорителями AMD Instinct MI200 или с помощью PCIe 4.0 ESM AIC для пропускной способности на уровне 100 Гбайт/с.

 Метрика производительности AMD Instinct MI200 (Aldebaran)

Метрика производительности AMD Instinct MI200

AMD заявляет, что в зависимости от той или иной задачи Aldebaran может быть до трёх раз производительнее по сравнению с NVIDIA A100.

Ускорители вычислений AMD Instinct MI200 на архитектуре CNDA 2 уже используются в составе суперкомпьютера Frontier эксафлопсного уровня, возглавляющего рейтинг самых производительных суперкомпьютеров мира TOP500. Он обеспечивает производительность на уровне 1,1 эксафлопс.

AMD также сообщила о планах по выпуску нового поколения ускорителей вычислений Instinct MI300. В них тоже будет использоваться чиплетная компоновка, но это уже будут APU — на одной подложке будут сочетаться кристаллы CPU и GPU. Для Instinct MI300 заявляется использование архитектур CDNA 3 GPU и Zen 4 и до 5 раз более высокая производительность в ИИ-задачах по сравнению с архитектурой CDNA 2.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Смерть ей к лицу: критики вынесли вердикт релизной версии вампирского MMO-экшена V Rising 2 ч.
Owlcat раскрыла, когда выйдет «Танец Масок» — последнее дополнение к Pathfinder: Wrath of the Righteous 2 ч.
Симулятор космической больницы Galacticare отправит спасать галактику по одному пациенту за приём — новый трейлер и дата выхода 4 ч.
TikTok подал в суд на правительство США в попытке отменить закон о запрете приложения 5 ч.
Режиссёр Deathloop и Marvel’s Blade жёстко раскритиковал руководство Microsoft за закрытие Arkane Austin 5 ч.
API Google Fit будет закрыт в 2025 году — многие носимые устройства перестанут полноценно работать 5 ч.
Apple вновь отклонила игру для Vision Pro с реалистичным изображением оружия, но потом передумала 7 ч.
Microsoft закроет три студии Bethesda, включая разработчиков Hi-Fi Rush и Redfall 8 ч.
Прибыль Disney выросла на 12 %, несмотря на провал по подписчикам Disney+ 8 ч.
CD Projekt Red раскрыла дату выхода мощного редактора модов REDkit для The Witcher 3: Wild Hunt 10 ч.
AWS вложит $9 млрд в расширение облачной инфраструктуры в Сингапуре 3 ч.
Huawei выпустила на глобальный рынок лёгкий ноутбук MateBook X Pro и планшет MatePad 11,5"S с художественным уклоном 3 ч.
Apple работает над собственными серверными ИИ-ускорителями 3 ч.
Электромобили Tesla с включённым автопилотом продолжили попадать в ДТП даже после обновления ПО 5 ч.
Apple снизила цену на iPad 10 и прекратила выпуск iPad 9 — последнего планшета с кнопкой «Домой» 5 ч.
Мировые поставки материалов для выпуска чипов упали на 8,2 % — только Китай показал рост 5 ч.
Apple представила стилус Pencil Pro с поддержкой жестов сжатия и вращения за $129 5 ч.
Apple представила клавиатуру Magic Keyboard для новых iPad Pro — теперь с функциональными клавишами, Esc и увеличенным трекпадом 5 ч.
Huawei представила смарт-часы Watch Fit 3, которые внешне похожи на Apple Watch 6 ч.
Samsung представила крупнейший в мире «ультрапремиальный» телевизор — 114 дюймов Micro-LED за $132 500 6 ч.