Сегодня 31 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → nvidia vera

Nvidia Vera разгромил лучшие Intel Xeon и AMD EPYC в тестах серверных CPU

Компания Phoronix провела тестирование новейшего процессора Nvidia Vera, которое продемонстрировало впечатляющие достижения Nvidia в разработке специализированных процессоров. Результаты тестов показывают, что эта платформа на базе архитектуры Arm достаточно мощна, чтобы превзойти новейшие модели Intel Xeon и AMD EPYC в секторе центров обработки данных (ЦОД).

 Источник изображения: Nvidia

Источник изображения: Nvidia

Процессор Vera оснащён 88 специализированными ядрами Arm v9.2 Olympus, обеспечивающими 176 вычислительных потоков благодаря физическому разделению ресурсов. Эти специализированные ядра поддерживают нативную обработку FP8, что позволяет выполнять определённые задачи ИИ непосредственно на процессоре с использованием 6×128-битной реализации SVE2.

Это второй северный центральный процессор Nvidia после Grace, и первый специально разработанный для агентных систем. Он обеспечивает оркестрацию, вызов инструментов, RL-нагрузки, анализ данных, «песочницы» для агентов и другие возможности, специфичные для ИИ-нагрузок. Процессор предназначен для ИИ-лабораторий, облачных провайдеров и компаний, масштабно работающих с агентными ИИ-системами.

Чип обеспечивает пропускную способность памяти 1,2 Тбайт/с и поддерживает до 1,5 Тбайт памяти LPDDR5X в формфакторе SOCAMM2. Технология Scalable Coherency Fabric второго поколения обеспечивает пропускную способность 3,4 Тбайт/с, соединяя ядра на едином монолитном кристалле и устраняя проблемы с задержкой, характерные для чиплетных архитектур.

Для сравнения Phoronix протестировала процессоры Intel Xeon Granite Rapids 6980P, а также чипы AMD EPYC Turin и Turin Dense, такие как AMD EPYC 9755, 9575F и 9475F. Также в тест были включены результаты процессоров Nvidia первого поколения Grace на базе ядер Arm Neoverse V2. Nvidia разрешила проводить на своём чипе только определённый набор тестов, включая стандартные рабочие нагрузки, такие как компиляция кода, производительность потоковой памяти, кодирование видео, Python/Java и производительность баз данных.

 Источник изображения: phoronix.com

Источник изображения: phoronix.com

По результатам геометрического среднего всех тестов, процессор Nvidia Vera занял первое место, показав почти на 11 % лучшие результаты, чем самые передовые разработки AMD, и примерно на 55,3 % лучшие, чем лучшие односокетные конфигурации Intel Xeon. Свежий чип от Nvidia показал себя лучше, чем конкуренты в двухсокетных конфигурациях, что говорит прежде всего о проблемах масштабирования некоторых рабочих нагрузок на нескольких сокетах.

Представленные ограниченные результаты ставят Nvidia Vera выше любой архитектуры на базе Arm, с TDP 450 Вт для процессора и 50 Вт для пула памяти объёмом 768 Гбайт. Прогнозируется, что Nvidia продаст процессоров Vera и Grace на сумму около $20 млрд, охватив общий потенциальный рынок в $200 млрд своими автономными предложениями. Такой подход потенциально может вывести компанию в число крупнейших производителей процессоров как в этом году, так и в последующие годы.

Память в серверах Nvidia подорожала на 435 % при переходе от Blackwell к Vera Rubin — стойку оценили в $7,8 млн

Одна серверная стойка Nvidia VR200 NVL72 нового поколения на архитектуре Vera Rubin обойдётся облачному оператору примерно в $7,8 млн, подчитали в Morgan Stanley. Для сравнения, GB300 NVL72 стоит около $4 млн. Стойка нового поколения VR200 NVL72 содержит больше DRAM и NAND — на память приходятся около 25 % общей стоимости.

 Источник изображения: Nvidia

Источник изображения: Nvidia

В корпусах VR200 NVL72 компания Nvidia намеревается продавать процессоры Vera по $5000 и ускорители искусственного интеллекта Rubin по $55 000 за штуку. В стойках используются уже знакомые клиентам корпуса Oberon, но внутри установлены более сложные компоненты коммутации, сетевых подключений, печатные платы, системы охлаждения, изменились даже технологии упаковки чипов — всё это влияет на стоимость систем и складывается в ценник $7,8 млн за стойку. Только компоненты памяти в стойке VR200 NVL72 обходятся около $2 млн или на 435 % больше, чем в GB300 NVL72.

 Источник изображения: x.com/Aaronwei3n

Источник изображения: x.com/Aaronwei3n

На каждую стойку нового поколения приходятся 54 Тбайт памяти LPDDR5X — втрое больше, чем 17 Тбайт у GB200 NVL72. Nvidia, по оценкам SemiAnalysis, в I квартале платила по $8 за 1 Гбайт LPDDR5X, и дальше этот показатель может только вырасти, особенно если речь идёт о дорогих в производстве и тестировании модулях SOCAMM2. Таким образом, память для GB200 NVL72 обходится в $136 000 на каждую машину; в случае VR200 NVL72 это уже $408 000, а при росте цены до $10 за 1 Гбайт это будут уже $540 000 — даже без учёта наценки самой Nvidia.

Кроме того, в каждой стойке VR200 NVL72 содержится память 3D NAND на сумму не менее $1 млн, тогда как в GB200 NVL72 её практически не было. В результате $2 млн за память на стойку Vera Rubin NVL72 представляется вполне предсказуемым показателем: здесь есть большие объёмы LPDDR5X и 3D NAND, не говоря уже о высокоскоростной HBM4 на самих ускорителях Rubin — и это в условиях дефицита и колоссальных цен на чипы памяти.

Nvidia захватила рынок ИИ-ускорителей и теперь идёт за рынком CPU — Intel и AMD под ударом

Nvidia стала самой дорогой компанией в мире, потому что завладела колоссальной долей мирового рынка ускорителей для систем искусственного интеллекта, традиционно основанных на архитектуре графических процессоров. На этом производитель решил не останавливаться и уже заявил о намерении усилить свои позиции и на рынке центральных процессоров (CPU).

 Источник изображения: nvidia.com

Источник изображения: nvidia.com

В беседе с инвесторами по итогам квартального финансового отчёта глава Nvidia Дженсен Хуанг (Jensen Huang) заявил, что центральные процессоры Vera могут оказаться революционными продуктом, который уже демонстрирует многообещающие показатели продаж. Nvidia традиционно выступает как лидер рынка графических процессоров, а сегмент центральных обычно делили между собой AMD и Intel — «зелёные» тоже выпускали CPU, но не объявляли их своим основным направлением.

С появлением чипов Vera это может измениться — их господин Хуанг назвал «первым в мире процессором, разработанным специального для агентного ИИ» и отметил, что открыл в них «новый мощный драйвер роста». «Vera открывает для Nvidia совершенно новый рынок объёмом $200 млрд, рынок, который мы никогда раньше не охватывали, и для его внедрения с нами сотрудничает каждый крупный гиперскейлер и производитель систем. Мир перестраивает вычислительные мощности для агентного ИИ и физического роботизированного ИИ. Nvidia находится в центре этих преобразований», — заявил глава компании.

«Мыслящая» часть ИИ-моделей работает на графических процессорах, а для агентов необходимы центральные — они используются для запуска поставленных задач, и вскоре для этого появятся специальные ПК. Архитектура чипов Vera предназначена для работы ИИ-агентов, потому что оптимизирована для максимально быстрой обработки токенов. Традиционно в облачных ресурсах брались в расчёт только ядра, позволяющие запускать множество экземпляров приложений с максимально возможной скоростью. К настоящему моменту Nvidia, по словам Дженсена Хуанга, продала автономных процессоров Vera на $20 млрд, и компания только в начале этого пути.

«В мире миллиард пользователей, людей. Мне кажется, в мире будут миллиарды агентов, [хотя и] не сегодня. То есть мы будем расти, но у нас будут миллиарды агентов, и все эти миллиарды агентов будут работать на оборудовании. И это оборудование будет похоже на ПК — точно как мы, люди, пользуемся ПК сегодня», — заключил глава Nvidia.

Nvidia показала полный стек Vera Rubin — от GPU до сетей для ИИ-фабрик нового поколения

Являясь одним из лидеров в сфере вычислительной инфраструктуры для систем искусственного интеллекта, Nvidia комплексно подходит к развитию собственных платформ, а потому вместе с ускорителями поколения Vera Rubin предложила ряд сопутствующих аппаратных решений.

 Источник изображений: Nvidia

Источник изображений: Nvidia

Как отмечается в корпоративном пресс-релизе, платформа Vera Rubin открывает новые рубежи в развитии агентского искусственного интеллекта. В массовом производстве сейчас находятся семь новых чипов Nvidia, позволяющих эффективно масштабировать так называемые ИИ-фабрики. В число семи аппаратных новинок Nvidia вошли графические процессоры Rubin, центральные процессоры Vera, коммутаторы NVLink 6, сетевые решения ConnectX-9 SuperNIC, специализированные процессоры BlueField-4 и Ethernet-коммутаторы Spectrum-6, а также созданные с помощью разработок одноимённого поглощённого стартапа процессоры Groq для ускорения инференса при работе с ИИ-агентами. В совокупности они работают, как ИИ-суперкомпьютер, как отмечается в материалах Nvidia для прессы на официальном сайте компании, позволяя ускорять создание профильных технологий на всех этапах жизненного цикла ИИ-систем.

Основатель и глава Nvidia Дженсен Хуанг (Jensen Huang) заявил, что с выходом платформы Vera Rubin наступил переломный момент в развитии агентского ИИ, поскольку данная платформа будет способствовать самому масштабному развёртыванию инфраструктуры в истории. Руководители OpenAI и Anthropic прокомментировали анонс Vera Rubin в предсказуемо хвалебных выражениях, подчёркивая значение этого события для всей ИИ-отрасли. Разработчики ИИ-моделей теперь смогут совершенствовать их и делать это быстрее, чем на аппаратных решениях прошлого поколения.

Структура ЦОД теперь строится на готовых модулях, как считают в Nvidia, которые содержат всё необходимое для эффективного масштабирования вычислительных мощностей с учётом постоянного роста сложности решаемых задач. Клиенты могут сочетать готовые модули ЦОД с учётом специфики своей деятельности. Например, в одной стойке Vera Rubin NVL72 находятся 72 графических процессора Rubin и 36 центральных процессоров Vera, соединённых скоростной шиной NVLink 6 и сетевыми контроллерами ConnectX-9 SuperNIC, а также специализированные процессоры BlueField-4, которые разгружают центральные процессоры от задач работы с сетевым трафиком. По сравнению с решениями поколения Blackwell новые системы Vera Rubin справляются с обучением сложных моделей силами в четыре раза меньшего количества GPU. Пропускная способность в пересчёте на ватт потребляемой энергии в задачах инференса у Vera Rubin до десяти раз выше, а затраты на один токен в десять раз ниже. В кластерах стойки NVL72 масштабируются при помощи Quantum-X800 InfiniBand и Spectrum-X Ethernet.

Центральные процессоры Vera, по словам представителей Nvidia, хорошо себя проявляют в задачах обучения с подкреплением и агентских ИИ-нагрузках. Компания может объединять в одной стойке до 256 таких процессоров, оснащённых системой жидкостного охлаждения. С прочими компонентами кластера они могут сообщаться при помощи сетевых решений Spectrum-X. По сравнению с некими традиционными CPU, на которые ссылается Nvidia, её процессоры Vera могут справляться с ИИ-задачами на 50 % быстрее.

Специализированные чипы Groq 3 LPX обеспечивают эффективную работу с агентскими ИИ-нагрузками при минимальных задержках. В сочетании с другими чипами, входящими в состав платформы Vera Rubin, они обеспечивают увеличение пропускной способности в задачах инференса до 35 раз на один мегаватт потребляемой мощности, а потенциал выручки при использовании моделей с триллионом параметров увеличивается в десять раз. В состав одной стойки входит 256 чипов LPU, 128 Гбайт интегрированной на них памяти SRAM, а пропускная способность достигает 640 Тбайт/с. В сочетании с прочими компонентами платформы Vera Rubin, чипы LPU достигают максимальной эффективности как по быстродействию, так и по энергопотреблению, а также использованию ресурсов памяти. Стойки LPX будут доступны клиентам Nvidia со второй половины текущего года.

Стойка BlueField-4 STX специализируется на унификации адресного пространства GPU между элементами кластера. Обработка хранимой в кеше информации в операциях инференса ускоряется до пяти раз, при этом обеспечивается высокая энергоэффективность по сравнению с системами на классической архитектуре. Достигается общий для кластера контекст, обеспечивающий быстрое взаимодействие с ИИ-агентами и более эффективно масштабируемыми ИИ-сервисами.

Отдельная стойка Spectrum-6 SPX отвечает за скоростной обмен данными по интерфейсу Ethernet. Она может содержать не только коммутаторы Spectrum-X Ethernet, но и коммутаторы Nvidia Quantum-X800 InfiniBand в зависимости от потребностей конкретной конфигурации. В исполнении с кремниевой фотоникой и интеграцией на уровне упаковки чипов эффективность передачи информации возрастает в пять раз, а надёжность по сравнению с традиционными подключаемыми решениями увеличивается в десять раз.

Nvidia бросила вызов Intel Xeon и AMD Epyc — серверный Arm-процессор Vera теперь продаётся отдельно

Nvidia уже несколько поколений подряд предлагает не только графические процессоры, но и так называемые «суперчипы» — связки из центрального Arm-процессора и GPU. Теперь Nvidia начала предлагать свои центральные процессоры Vera в качестве самостоятельного продукта, что знаменует дебют на рынке серверных процессоров, где доминируют Intel Xeon и AMD Epyc. Глава Nvidia Дженсен Хуанг (Jensen Huang) подтвердил серьёзность намерений компании в недавнем интервью Bloomberg.

 Источник изображений: Nvidia

Источник изображений: Nvidia

Заявление Хуанга привлекает особое внимание к новому бизнес-направлению Nvidia. Vera — это первый случай (почти), когда компания предлагает подобный чип в качестве автономного решения. Это означает, что Nvidia будет конкурировать с процессорами Intel и AMD в центрах обработки данных. Vera также может стать альтернативой собственным компонентам, используемым облачными провайдерами, такими как Graviton от Amazon. Предыдущие процессоры Nvidia были доступны только в составе систем, объединённых с другими чипами.

Процессор Vera оснащён 88 специализированными ядрами Armv9.2 Olympus, использующими технологию пространственной многопоточности, что позволяет ему обрабатывать 176 потоков за счёт физического разделения ресурсов. Эти специализированные ядра поддерживают нативную обработку FP8, что позволяет выполнять некоторые задачи ИИ непосредственно на процессоре с 6×128-битной реализацией SVE2.

Технология Scalable Coherency Fabric второго поколения обеспечивает пропускную способность 3,4 Тбайт/с, соединяя ядра на едином монолитном кристалле и устраняя проблемы с задержкой, характерные для чиплетных архитектур. Кроме того, Nvidia интегрировала технологию NVLink Chip-to-Chip второго поколения, обеспечивающую когерентную пропускную способность до 1,8 Тбайт/с для внешних графических процессоров Rubin.

Чип обеспечивает пропускную способность памяти 1,2 Тбайт/с и поддерживает до 1,5 Тбайт памяти LPDDR5X, что делает его идеальным для ресурсоёмких вычислительных задач. Однако, поскольку процессор теперь предлагается как автономное решение, неясно, будут ли доступны какие-либо классические варианты памяти, такие как DDR5 RDIMM, или же процессор будет использовать исключительно SOCAMM LPDDR5X.

«Vera — это совершенно революционный процессор», — уверен Хуанг. Он отказался назвать других заказчиков, помимо CoreWeave, но заверил, что «их будет много».

Хуанг показал Vera Rubin Superchip — CPU, два огромных GPU и 100 Пфлопс на одной плате для ИИ нового поколения

На конференции GTC 2025 глава компании Nvidia Дженсен Хуанг (Jensen Huang) продемонстрировал графический процессор следующего поколения — Rubin. Точнее, он показал со сцены прототип ускорителя Vera Rubin Superchip, который объединяет на одной плате совершенно новый центральный процессор Vera и пару огромных графических чипов Rubin. Такое сочетание обещает новый уровень производительности для ИИ-суперкомпьютеров будущего.

 Источник изображений: Nvidia

Источник изображений: Nvidia

Каждый GPU Rubin состоит из двух больших кристаллов с ядрами CUDA и восьми стеков высокоскоростной памяти HBM4 объёмом 288 Гбайт. Характеристики GPU не уточняются, равно как и пропускная способность памяти. Однако отмечается, что одна система Vera Rubin Superchip обеспечивает производительность в ИИ-операциях (FP4) на уровне 100 Пфлопс (100 квадриллионов операций в секунду).

Что касается центрального процессора Vera, то известно, что он предложит 88 ядер на неназванной версии архитектуры Arm с 176 потоками, а для его связи с графическими процессорами будет задействован интерфейс NVLink-C2C с пропускной способностью 1,8 Тбайт/с. Также на плате расположится оперативная память LPDDR (версия не уточняется, но вполне возможно, что это будет уже LPDDR6), в результате чего общий объём оперативной памяти на один «суперчип» достигнет 2 Тбайт.

На базе новых ускорителей Nvidia предложит самые разные системы, например новые Compute Tray, включая CPX-версию для задач с большим контекстом ИИ-моделей. Также компания рассказала о готовых серверных стойках Vera Rubin NVL144 с производительностью 3,6 Эфлопс (3,6 квинтильона операций в секунду) для запуска уже обученных ИИ-моделей (FP4 inference), а также 1,2 Эфлопс для обучения моделей (FP8 training).

Это примерно в 3,3 раза быстрее актуальных систем GB300 NVL72. Система предложит 13 Тбайт/c общей пропускной способности для памяти HBM4 и в совокупности 75 Тбайт быстрой системной памяти, а общая пропускная способность интерфейсов NVLink и CX9 достигнет 260 Тбайт/с и 28,8 Тбайт/с соответственно.

Nvidia также раскрыла детали о системе NVL576 на базе чипов Rubin Ultra, которые ожидаются во второй половине 2027 года. Эти чипы будут включать четыре крупных GPU-чиплета на одной подложке и 1 Тбайт памяти HBM4e. В итоге система NVL576 обеспечит производительность до 15 Эфлопс FP4 и 5 Эфлопс FP8, предлагая до 365 Тбайт быстрой системной памяти и сетевую пропускную способность до 1,5 Пбайт/с через NVLink.

Nvidia сообщила, что первые тестовые экземпляры Rubin уже поступили в лаборатории компании для испытаний, а старт массового производства запланирован на 2026 год. На смену этой архитектуре придёт совершенно новая архитектура Feynman, запуск которой намечен на 2027–2028 годы. Однако никаких чипов на этой платформе Nvidia пока не показала — вряд ли на данный момент они вообще существуют в физическом воплощении.


window-new
Soft
Hard
Тренды 🔥
Иранские хакеры превратили ChatGPT и Gemini в оружие для кибервойны 4 ч.
GamesVoice анонсировала сбор средств на русскую озвучку Cyberpunk 2077: Phantom Liberty, но CDPR это не понравилось 7 ч.
Трафик поисковика DuckDuckGo утроился после последнего обновления ИИ-поиска Google 11 ч.
ИИ стал реже галлюцинировать, но всё ещё уверенно выдаёт ложь за правду 11 ч.
Новая статья: Lego Batman: Legacy of the Dark Knight — это что, новая Batman: Arkham? Рецензия 23 ч.
Тактическая ролевая игра RuneSmith позволит возглавить отряд дворфов, чтобы выбить из главного злодея денежный долг 30-05 20:50
ООН объяснила: запрещать соцсети для детей контрпродуктивно, нужно менять сами платформы 30-05 18:10
ИИ-агент Google Gemini Spark, который работает в облаке 24/7, вышел в ограниченный доступ 30-05 17:59
AOMedia выпустила первый вариант кодека AV2 30-05 16:51
Деамериканизированный офисный пакет Euro-Office для европейских пользователей выйдет 9 июня 30-05 15:09