Сегодня 06 октября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Nvidia представила GB300 Blackwell Ultra — мощнейший ИИ-ускоритель с 20 480 CUDA, 288 Гбайт HBM3E и PCIe 6.0

Nvidia опубликовала подробную информацию об ускорителе искусственного интеллекта GB300 Blackwell Ultra. От предшественника в лице GB200 его отличают увеличенные число ядер и объём памяти, более быстрый интерфейс и более высокая мощность. В основе Nvidia GB300 лежат два кристалла с суммарным числом 208 млрд транзисторов — они производятся по технологии TSMC 4NP и работают как единый графический процессор (GPU) за счёт интерконнекта NV-HBI со скоростью 10 Тбайт/с.

 Источник изображений: nvidia.com

Источник изображений: nvidia.com

GPU содержит 160 потоковых мультипроцессоров (Streaming Multiprocessors), на каждый из которых приходится по 128 ядер CUDA — всего 20 480 ядер, а также тензорные ядра пятого поколения с поддержкой вычислений на числах FP8, FP6 и нового формата NVFP4. Каждый потоковый мультипроцессор располагает 256 Кбайт тензорной памяти (TMEM) — всего 40 Мбайт. Предусмотрены также дополнительные аппаратные блоки для проведения трансцендентных вычислений и операций, оптимизированных для вычислительных ядер.

Память организована в восемь 12-слойных стеков HBM3E общим объёмом 288 Гбайт. Пропускная способность памяти у Nvidia GB300 в сравнении с GB200 не изменилась — она составляет 8 Тбайт/с, будучи организованной в 16 каналов по 512 бит (8192-битный интерфейс). Увеличенный объём памяти позволяет размещать на чипе ИИ-модель целиком, а также хранить большие объёмы кеша ключей и значений без выгрузки во внешние ресурсы. Показатель TGP вырос до 1400 Вт.

За связь между графическими процессорами отвечает интерфейс NVLink 5 с двунаправленной скоростью передачи данных 1,8 Тбайт/с на каждый GPU. Связь между GPU и центральным процессором Grace реализована через интерфейс NVLink-C2C со скоростью 900 Гбайт/с и поддержкой единого адресного пространства. Для подключения к хосту используется шина PCIe 6.0 x16 с двунаправленной полосой пропускания 256 Гбайт/с — этот интерфейс Nvidia применила впервые. Ускорители могут устанавливаться в стойку GB300 NVL72 с 72 графическими процессорами, до 20,7 Тбайт памяти HBM3E и общей полосой пропускания HBM 576 Тбайт/с. На стойку также приходится 72 Arm-ядра Grace Superchip и до 480 Гбайт LPDDR5X с полосой пропускания 512 Гбайт/с.

NVFP4 — это новый формат данных с низкой точностью, реализованный в тензорных ядрах. Он обеспечивает точность, сравнимую с FP8, но позволяет использовать в 1,8 раза меньше памяти. Массовое производство ускорителей Nvidia GB300 уже стартовало, и первые клиенты их получили.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Paradox забросит амбициозную стратегию Millennia в духе «Цивилизации» спустя всего полтора года после релиза, и фанаты не рады 2 ч.
Поглощение Activision обернулось тем, чего боялась FTC — Microsoft режет кадры и поднимает цены 2 ч.
«Это полный сюр»: хоррор об ужасах долговой ямы CloverPit за восемь дней достиг полумиллиона проданных копий в Steam 4 ч.
Orion soft представил рынку собственный VDI 4 ч.
Закулисное обновление в Steam разожгло слухи об апгрейде Red Dead Redemption 2 для «следующего поколения» 5 ч.
Новый регион, 60 часов геймплея и нелинейный сюжет: спустя 11 лет для Skyrim вышел сюжетный мод Lordbound размером с официальный аддон 6 ч.
Популярное направление: ИИ перетянул на себя больше половины средств венчурных инвесторов 6 ч.
В Meta начали отслеживать активность использования ИИ сотрудниками — через игру 10 ч.
Новая статья: NCORE — жетонов и зрелищ! Предварительный обзор 14 ч.
xAI через две недели запустит Grokipedia — конкурента «Википедии» с искусственным интеллектом 20 ч.
20 тыс. км и 260 Тбит/с: подводный кабель Bifrost между США и Сингапуром, созданный при участии Meta и AWS, готов к эксплуатации 3 ч.
250 Тбит/с на чип: Ayar Labs, Alchip и TSMC предложили референс-дизайн для упаковки ASIC, памяти и оптических модулей в одном чипе 3 ч.
+69 000 % за 20 лет: акции Nvidia — абсолютный лидер S&P 500 по долгосрочным темпам роста 4 ч.
Corning и GlobalFoundries создадут оптические коннекторы для кремниевой фотоники 5 ч.
OpenAI оснастит дата-центры энергетическим оборудованием Hitachi 6 ч.
Дефицит флеш-памяти NAND станет нормой в ближайшие десять лет, как считает глава Phison 7 ч.
Foxconn показала рекордную квартальную выручку на фоне бума ИИ-технологий 9 ч.
Новая статья: Компьютер месяца, спецвыпуск: 10 тезисов о том, как лучше собрать по-настоящему мощный игровой ПК 12 ч.
Meta построит ещё один «палаточный» ИИ ЦОД 14 ч.
BYD по итогам прошедших трёх кварталов этого года опережает Tesla на 388 000 проданных электромобилей 05-10 08:14