Новости Hardware

NVIDIA представила графический процессор Ampere и начала его поставки

Компания NVIDIA долго хранила в секрете разработку графических процессоров с архитектурой Ampere, но на этой неделе Дженсен Хуанг (Jen-Hsun Huang) предвосхитил рыночный дебют DGX A100, вынув одноимённую систему из духовки у себя на кухне. Именно с вычислительных систем этой серии NVIDIA Ampere начнёт свой рыночный путь.

 Источник изображения: NVIDIA

Источник изображения: NVIDIA

Сам графический процессор NVIDIA A100 выпускается по 7-нм технологии компанией TSMC и содержит более 54 млрд транзисторов на площади 826 мм2, что делает его крупнейшим в своём «геометрическом классе». По соседству расположилось шесть стеков памяти типа HBM2 производства Samsung совокупным объёмом 40 Гбайт с пропускной способностью 1,6 Тбайт/с. Ядра CUDA разделились по специализации: для вычислений с плавающей запятой двойной точности (FP64) отведено 3456 штук, одинарной (FP32) — 6912 штук. Количество тензорных ядер достигло 432 штук, предусмотрены и потоковые мультипроцессоры в количестве 108 штук.

 Источник изображения: NVIDIA

Источник изображения: NVIDIA

NVIDIA утверждает, что обучение нейронных систем с применением графических процессоров происходит в 20 раз быстрее по сравнению с предшественниками. Сфера применения ускорителей с архитектурой Ampere — это не только системы искусственного интеллекта, но и анализ «больших данных», научные расчёты и облачная графика. Архитектура Ampere использует тензорные ядра третьего поколения с поддержкой вычислений TF32. Внедрена и поддержка вычислений с плавающей запятой двойной точности (FP64).

 Источник изображения: NVIDIA

Источник изображения: NVIDIA

Пиковая производительность A100 в обучаемых системах при использовании вычислений с плавающей запятой одинарной точности (FP32) достигает 312 терафлопс, это в двадцать раз выше, чем у Volta. Целочисленные операции (INT8) в системах, способных делать логические выводы, Ampere выполняет со скоростью 1,248 трлн штук в секунду. Отрыв от Volta тоже двадцатикратный. Наконец, в высокопроизводительных операциях с двойной точностью (FP64) новинка NVIDIA оказывается в два с половиной раза быстрее предшественницы.

 Источник изображения: NVIDIA

Источник изображения: NVIDIA

Ориентацию на серверное применение A100 выдаёт и поддержка интерфейса NVLink третьего поколения, который позволяет обмениваться данными с аналогичными графическими процессорами со скоростью 600 Гбайт/с. Каждый графический процессор Ampere поддерживает двенадцать каналов NVLink 3.0. Впервые в серверном сегменте NVIDIA предлагает продукт с поддержкой PCI Express 4.0, им как раз является графический процессор A100. Кроме того, технология виртуализации MIG позволяет разделять ресурсы одного графического процессора на семь независимых сегментов.

NVIDIA подчёркивает, что серийное производство графического процессора A100 уже началось, ускорители на его основе поставляются клиентам. Им потребуется какое-то время, чтобы интегрировать эти ускорители в своих вычислительных системах. В суперкомпьютерах, например, Ampere пропишется не ранее второго полугодия.

Никакой официальной информации о сроках доступности игровых видеокарт с архитектурой Ampere пока нет.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Первый сезон MultiVersus стартует 15 августа, но Морти добавят только спустя неделю 2 ч.
Система управления уязвимостями MaxPatrol VM получила расширенные функции контроля процессов патч-менеджмента 3 ч.
Microsoft: Sony испугалась конкуренции с Game Pass, а Call of Duty без PlayStation такой же прибыльной не будет 4 ч.
Meta вынудили ускорить внедрение сквозного шифрования в мессенджерах 6 ч.
Google тестирует функцию запуска облачных игр прямо из результатов поиска 6 ч.
Интернет-магазины раскрыли даты выхода Spongebob Squarepants: The Cosmic Shake и Outcast 2 незадолго до шоу THQ Nordic 7 ч.
Похоже, новая Alone in the Dark станет переосмыслением первой части — в Сеть попали подробности и скриншоты 7 ч.
Встроенный в приложения Facebook и Instagram браузер добавляет код слежения на все страницы 7 ч.
Профессиональный игрок в Overwatch узнал об увольнении из своей команды вместе с остальным миром 8 ч.
В России замедлился рост рынка онлайн-кинотеатров 8 ч.
Производители дорогих гаджетов жалуются на падение спроса, но видят выход во взвинчивании цен 48 мин.
В Австралии придумали теплоаккумулятор для ТЭЦ — он работает за счёт возобновляемой энергии 2 ч.
Электрический седан Evolute липецкой сборки будет стоить «менее 3 млн рублей» 3 ч.
Учёные придумали способ, как повысить энергоотдачу существующих ветряных ферм 4 ч.
LG Display разработает гибкую OLED-панель для игровых мониторов с изменяемой кривизной 4 ч.
Huawei нарастила продажи впервые после введения американских санкций 5 ч.
В прошлом квартале Rivian выпустила 4401 электромобиль и увеличила чистые убытки до $1,7 млрд 5 ч.
Учебные спутники Сколтеха начали отрабатывать в космосе приёмы роевого взаимодействия 5 ч.
Испанская провинция Астурия разместит в заброшенных шахтах суперкомпьютеры 6 ч.
Фактический глава Samsung получил помилование и теперь сможет руководить компанией по-настоящему 6 ч.