Сегодня 14 июня 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

NVIDIA представила H200 — самый быстрый в мире ускоритель вычислений для мощнейших ИИ

Компания NVIDIA представила сегодня самый мощный в мире ускоритель вычислений — H200. Он построен на уже знакомой архитектуре NVIDIA Hopper, и фактически представляет собой обновлённую с помощью более скоростной памяти HBM3e версию популярного флагманского ускорителя H100. Новая память позволит ускорителю быстрее работать с огромными объемами данных для генеративного ИИ и высокопроизводительных вычислительных нагрузок.

 Источник изображений: NVIDIA

Источник изображений: NVIDIA

NVIDIA H200 — это первый графический процессор с памятью HBM3e, которая отличается от обычной HBM3 более высокой скоростью. NVIDIA H200 получил 141 Гбайт памяти HBM3e со скоростью 4,8 Тбайт/с, что почти вдвое больше по объему и в 2,4 раза больше по пропускной способности по сравнению с памятью ускорителя прошлого поколения NVIDIA A100. Для сравнения, у H100 имеется 80 Гбайт HBM3 со скоростью 3,35 Тбайт/с, тогда как грядущий ускоритель AMD Instinct MI300X получит 192 Гбайт памяти HBM3 со скоростью 5,2 Тбайт/с.

За счёт апгрейда памяти H200 обеспечит значительный рост производительности в работе уже обученных систем искусственного интеллекта (инференсе). Например, NVIDIA обещает увеличение скорости работы большой языковой модели Llama 2 с 70 млрд параметров в 1,9 раза, по сравнению с H100. А работу обученной модели GPT-3 с 175 млрд параметров новинка ускорит в 1,6 раза.

NVIDIA H200 будет доступна в серверных платах NVIDIA HGX H200 в конфигурациях с четырьмя и восемью ускорителями. Причём новинки совместимы как с аппаратным, так и с программным обеспечением систем HGX H100. Производители серверов, включая ASRock Rack, ASUS, Dell Technologies, Eviden, GIGABYTE, Hewlett Packard Enterprise, Ingrasys, Lenovo, QCT, Supermicro, Wistron и Wiwynn выпустят свои системы с ускорителями H200. В свою очередь Amazon Web Services, Google Cloud, Microsoft Azure и Oracle Cloud Infrastructure станут одними из первых поставщиков облачных услуг, которые со следующего года начнут предлагать инстансы на базе H200.

NVIDIA отмечает, что система HGX H200 с восемью ускорителями обеспечивает производительность более 32 Пфлопс (32 квадриллиона операций в секунду) в вычислениях FP8 для глубокого обучения. Причём такая система обеспечит в сумме 1,1 Тбайт памяти с высокой пропускной способностью для высочайшей производительности в генеративных приложениях ИИ и HPC.

В паре с Arm-процессорами NVIDIA Grace со сверхбыстрым интерфейсом NVLink-C2C H200 образует суперчип GH200 Grace Hopper с HBM3e. Такие интегрированные модули NVIDIA позиционирует в качестве высокопроизводительных решений для работы с приложениями HPC и ИИ гигантского масштаба.

Ещё NVIDIA представила плату Quad GH200 с четырьмя суперчипами GH200, где все ускорители связаны друг с другом посредством NVLink по схеме каждый-с-каждым. Суммарно плата несёт более 2 Тбайт высокоскоростной памяти и 288 ядер Arm, а её производительность достигает 16 Пфлопс в FP8. До конца будущего года суммарная ИИ-производительность систем с GH200, по оценкам NVIDIA, достигнет 200 Эфлопс.

Ускоритель NVIDIA H200 станет доступен со второго квартала 2024 года.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Square Enix показала 18 минут геймплея Life is Strange: Double Exposure и прояснила вопрос каноничной концовки первой игры 8 ч.
Квартальные результаты Oracle оказались ниже прогнозов, но акции выросли благодаря сделкам с Google и OpenAI 9 ч.
Ubisoft подтвердила релиз Prince of Persia: The Lost Crown в Steam — ждать осталось недолго 9 ч.
Huawei HarmonyOS вытеснила iOS со второго места по доле рынка в Китае 10 ч.
В Epic Games Store стартовала раздача антигравитационной гонки Redout 2 в духе F-Zero и Wipeout — игра доступна в России 10 ч.
THQ Nordic заинтриговала игроков линейкой проектов на gamescom 2024 — издатель ремейка «Готики» и Titan Quest 2 готовит два сюрприза 11 ч.
FromSoftware не осуждает проходивших Elden Ring с гайдами, но создаёт игры для другого типа геймеров 12 ч.
Соцсеть LinkedIn массово внедрила ИИ — он поможет найти работу или сотрудников 12 ч.
Google закрыла полсотни уязвимостей в смартфонах Pixel — одну них эксплуатируют хакеры 13 ч.
Sony PlayStation 5 наконец получит полноценную поддержку Discord 14 ч.
Broadcom увеличила квартальную выручку на 43 %, но без VMware рост составил бы 12 % 6 ч.
Маск останется в Tesla — акционеры поддержали выплату ему гонорара в $56 млрд, но этим всё не кончится 6 ч.
Новая статья: Обзор смартфона TECNO CAMON 30 5G: побудь в моей шкуре 7 ч.
Президент РФ дал добро на запуск коллайдера NICA в Дубне — установка воссоздаст условия в первые мгновения после Большого взрыва 8 ч.
Microsoft арендует у Oracle ускорители NVIDIA для нужд OpenAI 9 ч.
Китай тестирует больше всех в мире беспилотных автомобилей, но проблемы безопасности сохраняются 10 ч.
Автономное вождение по-японски: учёные создали человекоподобного робота-водителя 10 ч.
Realtek выпустит SSD-контроллер PCIe 5.0 со скоростью до 14 000 Мбайт/с 12 ч.
Western Digital показала кристаллы 3D QLC NAND объёмом 2 Тбит — очень ёмкие и доступные SSD уже не за горами 12 ч.
Honor представила дебютный смартфон-раскладушку Magic V Flip по цене от $690 12 ч.