Сегодня 27 сентября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Nvidia представила Blackwell Ultra с 288 Гбайт HBM3e — ИИ-ускоритель «для эпохи рассуждений»

Компания Nvidia в рамках открытия конференции GTC 2025 официально анонсировала ускоритель вычислений для центров обработки данных Blackwell Ultra B300, суперчип Grace Blackwell Ultra GB300, а также различные системы на его основе. Новинка «создана для эпохи рассуждений», то есть для новейших, более сложных и требовательных к ресурсам ИИ-моделей (LLM), способных размышлять над задачами.

 Источник изображений: Nvidia

Источник изображений: Nvidia

Nvidia уже традиционно не стала раскрывать всех деталей о новинке. В компании лишь отметили, что графические процессоры Blackwell Ultra (в составе GB300 и B300) физически отличаются от чипов Blackwell (в GB200 и B200). Отметим, что Blackwell Ultra B300 представляет собой классический ускоритель на GPU, тогда как Grace Blackwell Ultra GB300 — это связка из Arm-процессора Grace с 72 ядрами Neoverse V2 и двух графических процессоров Blackwell Ultra.

 Плата с парой CPU Grace и четырьмя Blackwell Ultra

Плата с парой CPU Grace и четырьмя Blackwell Ultra

Nvidia отмечает увеличенный на 50 % объём набортной памяти. Blackwell Ultra получил 288 Гбайт HBM3e, что будет как раз кстати при работе с особенно крупными LLM. Объём памяти вырос благодаря использованию новых 12-ярусных стеков HBM3e — в Blackwell B200 применяются восьмиярусные стеки HBM3e, обеспечивающие 192 Гбайт памяти.

По словам Nvidia, производительность Blackwell Ultra должна в 1,5 раза превышать производительность Blackwell в запуске уже обученных моделей (FP4 inference). Компания заявляет о производительности в 15 Пфлопс для вычислений FP4, а также о 30 Пфлопс для разреженных FP4. Для оригинального ускорителя Blackwell B200 эти показатели составляли 10 и 20 Пфлопс соответственно.

 Источник изображений: Nvidia

GB300 NVL72

Nvidia предложит несколько готовых систем на базе новых ускорителей вычислений, которые начнут поступать в продажу во второй половине 2025 года. GB300 NVL72 — фактически это готовая серверная стойка, объединяющая 72 графических процессора Blackwell Ultra и 36 центральных процессоров Grace. Новинка, как и её предшественница GB200 NVL72, оснащена системой жидкостного охлаждения, использует NVLink пятого поколения, модули Nvidia ConnectX-8 SuperNIC и предлагает 18 Тбайт оперативной памяти LPDDR5X. Производительность достигает 1100 Пфлопс в FP4-вычислениях и до 1400 Пфлопс в разреженных вычислениях.

Nvidia особенно отмечает применение интерконнекта NVLink 5-го поколения, который соединяет отдельные чипы для создания «одного большого GPU». Он обладает пропускной способностью 1,8 Тбайт/с на GPU, а общая пропускная способность достигает 130 Тбайт/с. Начиная с Blackwell, NVLink также может использоваться в качестве интерфейса для соединения нескольких стоек, что ранее осуществлялось через InfiniBand со скоростью 100 Гбайт/с. Поэтому Nvidia заявляет о 18-кратном увеличении скорости для этого конкретного сценария.

 Blackwell Ultra DGX SuperPOD

Blackwell Ultra DGX SuperPOD

В домен NVLink можно подключить до 576 графических процессоров. Собственно, такую систему Nvidia тоже предложит — Blackwell Ultra DGX SuperPOD. Это кластер из восьми стоек NVL72, который включает 288 процессоров Grace, 576 чипов Blackwell Ultra, 300 Тбайт памяти HBM3e и FP4-производительность в 11,5 Экзафлопс.

Наконец, Nvidia представила систему HGX B300 NVL16 — решение для тех, кому вместо Arm-процессора Grace нужен чип на x86-совместимой архитектуре. В системе имеется 16 графических процессоров B300A, соединённые через NVLink, и центральные x86-процессоры. Nvidia не уточняет, какие именно CPU применены, но в прошлом использовались чипы как от AMD, так и от Intel.

Ускорители вычислений и системы на базе Blackwell Ultra появятся на рынке во второй половине текущего года. Их предложат все крупные производители серверов, а также новинки будут доступны у основных облачных провайдеров.

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Российская платформа для разработки GitFlic дополнилась интеграцией с системами управления проектами 3 мин.
«Фотографии» в Windows 11 научатся автоматически сортировать изображения и распознавать надписи не только на английском 14 мин.
В смартфонах OnePlus обнаружена дыра в безопасности — любое приложение может читать все SMS без разрешения 2 ч.
«Бро постит ИИ-бурду у себя в приложении»: Meta запустила платформу Vibes для коротких ИИ-видео 2 ч.
YouTube Music превратили в подобие радио с ИИ-ведущими, которые «расширят музыкальные горизонты» 4 ч.
Сайт и бренд закрывшегося известного магазина «Плеер.ру» сдадут в аренду — не дешевле 500 тыс. рублей в месяц 5 ч.
Сделка с TikTok оставляет дыру в нацбезопасности США — роль Oracle раскритиковали 8 ч.
Apple разработала аналог ChatGPT — приложение Veritas для iPhone, но никому его не показывает 10 ч.
Electronic Arts готовится к выкупу за $50 миллиардов, чтобы стать частной компанией — это будет самая крупная подобная сделка в истории 14 ч.
TikTok в США продолжит приносить китайской ByteDance миллиарды даже после отделения 19 ч.
Майнинговая компания Iren увеличила мощность ИИ-облака, закупив тысячи ускорителей NVIDIA и AMD за $674 млн 5 мин.
Samsung уронила цены на 2-нм чипы до $20 тысяч за пластину — на треть дешевле TSMC 2 ч.
Китай запустил первую в мире летающую ветряную электростанцию мощностью 1 МВт 2 ч.
Учёные создали невозможный в природе материал для сверхэкономичной памяти 5 ч.
Власти США предложили рассчитывать импортные тарифы на электронику, исходя из количества чипов в составе устройства 8 ч.
Пентагон может называть производителя дронов DJI китайской военной компанией, постановил суд 9 ч.
Google создала и показала в деле ИИ, который заставляет роботов сначала думать, а потом делать 15 ч.
Asus отдаст видеокарту GeForce RTX 5090 ROG Astral с подписью Хуанга за лучший дизайн видеокарты 15 ч.
Новая статья: Обзор игрового 3D-монитора Samsung Odyssey 3D G90XF: полное погружение 16 ч.
Пожар в южнокорейском ЦОД привёл к отключения более 70 государственных онлайн-сервисов 16 ч.