Новости Hardware

NVIDIA представила графический процессор Ampere и начала его поставки

Компания NVIDIA долго хранила в секрете разработку графических процессоров с архитектурой Ampere, но на этой неделе Дженсен Хуанг (Jen-Hsun Huang) предвосхитил рыночный дебют DGX A100, вынув одноимённую систему из духовки у себя на кухне. Именно с вычислительных систем этой серии NVIDIA Ampere начнёт свой рыночный путь.

 Источник изображения: NVIDIA

Источник изображения: NVIDIA

Сам графический процессор NVIDIA A100 выпускается по 7-нм технологии компанией TSMC и содержит более 54 млрд транзисторов на площади 826 мм2, что делает его крупнейшим в своём «геометрическом классе». По соседству расположилось шесть стеков памяти типа HBM2 производства Samsung совокупным объёмом 40 Гбайт с пропускной способностью 1,6 Тбайт/с. Ядра CUDA разделились по специализации: для вычислений с плавающей запятой двойной точности (FP64) отведено 3456 штук, одинарной (FP32) — 6912 штук. Количество тензорных ядер достигло 432 штук, предусмотрены и потоковые мультипроцессоры в количестве 108 штук.

 Источник изображения: NVIDIA

Источник изображения: NVIDIA

NVIDIA утверждает, что обучение нейронных систем с применением графических процессоров происходит в 20 раз быстрее по сравнению с предшественниками. Сфера применения ускорителей с архитектурой Ampere — это не только системы искусственного интеллекта, но и анализ «больших данных», научные расчёты и облачная графика. Архитектура Ampere использует тензорные ядра третьего поколения с поддержкой вычислений TF32. Внедрена и поддержка вычислений с плавающей запятой двойной точности (FP64).

 Источник изображения: NVIDIA

Источник изображения: NVIDIA

Пиковая производительность A100 в обучаемых системах при использовании вычислений с плавающей запятой одинарной точности (FP32) достигает 312 терафлопс, это в двадцать раз выше, чем у Volta. Целочисленные операции (INT8) в системах, способных делать логические выводы, Ampere выполняет со скоростью 1,248 трлн штук в секунду. Отрыв от Volta тоже двадцатикратный. Наконец, в высокопроизводительных операциях с двойной точностью (FP64) новинка NVIDIA оказывается в два с половиной раза быстрее предшественницы.

 Источник изображения: NVIDIA

Источник изображения: NVIDIA

Ориентацию на серверное применение A100 выдаёт и поддержка интерфейса NVLink третьего поколения, который позволяет обмениваться данными с аналогичными графическими процессорами со скоростью 600 Гбайт/с. Каждый графический процессор Ampere поддерживает двенадцать каналов NVLink 3.0. Впервые в серверном сегменте NVIDIA предлагает продукт с поддержкой PCI Express 4.0, им как раз является графический процессор A100. Кроме того, технология виртуализации MIG позволяет разделять ресурсы одного графического процессора на семь независимых сегментов.

NVIDIA подчёркивает, что серийное производство графического процессора A100 уже началось, ускорители на его основе поставляются клиентам. Им потребуется какое-то время, чтобы интегрировать эти ускорители в своих вычислительных системах. В суперкомпьютерах, например, Ampere пропишется не ранее второго полугодия.

Никакой официальной информации о сроках доступности игровых видеокарт с архитектурой Ampere пока нет.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Разработку новых Silent Hill подтвердил неожиданный источник 48 мин.
Toyota сообщила о возможной утечке данных 296 тысяч клиентов сервиса T-Connect 2 ч.
У приложения Meta Horizon Worlds так много проблем, что им не пользуются даже разработчики 2 ч.
В бета-версии Windows 11 появилась поддержка виджетов сторонних разработчиков и новая функция в приложении «Чат» 2 ч.
«Мы не расскажем, как найти альтернативные пути»: создатель Dead Space раскрыл продолжительность хоррора The Callisto Protocol 5 ч.
ЕС выяснит, как поглощение Activision Blizzard компанией Microsoft скажется на игровом бизнесе конкурентов 5 ч.
Хакеры украли у Binance криптовалюту на $100 млн — транзакции на криптобирже приостановлены 6 ч.
Технологичная пятёрка: Hitman 3, Spider-Man Remastered, The Riftbreaker, Enlisted и Redout 2 почти одновременно получили поддержку Intel XeSS 7 ч.
Не так уж и «скоро»: в Steam изменились сроки выхода многострадального ремейка System Shock 7 ч.
Вышла новая версия системы аудита и управления информационными активами InfoWatch Data Discovery 1.4 7 ч.