Nvidia ударила по Intel и AMD: представлены серверные 88-ядерные CPU Vera, которые сгодятся не только для ИИ
Читать в полной версииNvidia на конференции GTC 2026 раскрыла подробности о серверных центральных процессорах Vera, оснащённых 88 вычислительными ядрами. Компания заявляет о резком росте производительности благодаря новым ядрам Olympus. Одновременно была представлена стоечная система Vera CPU Rack с 256 процессорами, которая, по оценке Nvidia, обеспечивает шестикратный рост CPU-производительности и двукратное ускорение задач агентного ИИ.
Источник изображений: Nvidia
Процессор Vera получил 88 вычислительных ядер и 176 потоков, тогда как у первого поколения Grace было 72 ядра. Компания Nvidia заявляет о росте количества исполняемых инструкций за такт (IPC) сразу на 50 %, что является необычно крупным скачком для современной процессорной архитектуры, где прирост от поколения к поколению обычно ограничивается однозначными или небольшими двузначными процентами.
Всё дело в том, что если в Grace применялись стандартные ядра Arm Neoverse, то в Vera используются новые ядра Olympus, которые описываются как разработанные Nvidia, что указывает на серьёзные модификации базового дизайна Arm. За основу взята современная архитектура Arm v9.2-A.
Одной из ключевых особенностей стала технология пространственной многопоточности (Spatial Multi-Threading). В отличие от традиционного SMT, где потоки поочерёдно используют ресурсы ядра, здесь ключевые элементы конвейера — исполнительные блоки, кеши и регистровые файлы — физически изолированы между потоками. Благодаря этому оба потока могут фактически выполняться одновременно, что повышает параллелизм инструкций, увеличивает пропускную способность и делает производительность более предсказуемой, поскольку простаивающие исполнительные блоки могут немедленно задействовать инструкции из другого потока. Подобная схема особенно полезна в средах с большим количеством независимых пользователей и виртуальных окружений.
Все 88 ядер объединены в единый вычислительный домен без NUMA-разделения, характерного для современных многоядерных x86-процессоров. Это должно уменьшить задержки доступа к памяти, повысить предсказуемость работы системы и упростить программирование. Для организации взаимодействия между ядрами используется новое поколение фирменной шины Nvidia Scalable Coherency Fabric с сеточной или ячеистой топологией (mesh). Оно основано на когерентной сетевой архитектуре Arm CMN-700, применявшейся в Grace, однако, вероятно, использует более современную реализацию CMN S3 или её модификацию.
Сеточная структура обеспечивает высокую суммарную пропускную способность памяти и позволяет эффективно распределять ресурсы между ядрами. В процессорах Grace общая пропускная способность памяти составляла 546 Гбайт/с, что соответствовало примерно 7,6 Гбайт/с на ядро. В Vera этот показатель вырос более чем вдвое — до 1,2 Тбайт/с, которые обеспечиваются 1,5 Тбайт памяти LPDDR5 в модулях SOCAMM. Ёмкость памяти увеличилась втрое, а средняя пропускная способность на ядро при полной загрузке достигает 13,6 Гбайт/с. При неравномерной нагрузке отдельное ядро может получать до 80 Гбайт/с, что особенно важно для потоков с интенсивным доступом к памяти.
Архитектура также включает десятиканальный блок декодирования инструкций, нейросетевой предсказатель ветвлений, специализированный механизм предварительной выборки для анализа графовых баз данных и буфер инструкций, оптимизированный под PyTorch. Процессор поддерживает технологию Confidential Computing, что позволяет создавать полностью защищённые вычислительные домены CPU и GPU.
Для связи между кристаллами используется интерфейс NVLink-C2C с пропускной способностью до 1,8 Тбайт/с — вдвое больше, чем у Grace, и примерно в семь раз быстрее, чем у PCI Express 6.0. Процессоры также поддерживают двухсокетные конфигурации и современные стандарты для дата-центров, включая PCIe 6.0 и CXL 3.1.
Помимо самих процессоров Nvidia представила стоечную систему Vera CPU Rack. Если ранее процессоры Grace выступали как дополнение к ускорителям вычислений на базе GPU, то теперь Nvidia намерена предложить Vera и как самостоятельный продукт в системах, ориентированных на CPU-вычисления и другие задачи.
В одной такой стойке размещается 256 процессоров Vera с жидкостным охлаждением, а также 74 сетевых процессора BlueField-4 DPU и сетевые адаптеры ConnectX SuperNIC. Общий объём памяти достигает 400 Тбайт LPDDR5, а суммарная пропускная способность памяти — 300 Тбайт/с. В системе насчитывается 45 056 потоков, которые, по словам Nvidia, способны поддерживать до 22 500 изолированных CPU-окружений.
Компания продемонстрировала результаты тестов в широком наборе задач, включая скриптовые нагрузки, компиляцию, анализ данных, графовую аналитику и HPC-вычисления. По сравнению с Grace прирост производительности составляет от 1,8 до 2,2 раза в зависимости от типа нагрузки.
Ожидается, что системы Vera CPU Rack появятся в инфраструктуре Meta✴, а также Nvidia планирует поставлять их и другим гиперскейлерам, включая Oracle, CoreWeave, Nebius и Alibaba. Помимо стоечных систем широкий круг производителей серверного оборудования предложит собственные решения на базе Vera. Среди партнёров Nvidia названы Dell, HPE, Lenovo, Supermicro, Foxconn и другие крупные OEM- и ODM-компании. Процессоры Vera также станут частью систем Nvidia HGX NVL8.
Особое значение новые CPU имеют для платформы Vera Rubin — комплексного решения Nvidia следующего поколения. Она включает сразу несколько типов компонентов: графический процессор Rubin, коммутатор NVLink6 для межсоединений на уровне стойки, сетевой адаптер ConnectX-9 SuperNIC, сетевой процессор BlueField-4 DPU, оптический коммутатор Spectrum-X 102.4T с интегрированными оптическими модулями и ускорители Groq 3 LPU.
Новые чипы Vera ориентированы как на задачи искусственного интеллекта, так и на более универсальные вычислительные нагрузки, хотя основной упор сделан именно на ИИ. Таким образом, с выпуском Vera компания Nvidia усиливает позиции на рынке серверных центральных процессоров, где доминируют Intel и AMD, а также навязывает конкуренцию многочисленным кастомным Arm-чипам.
По словам Nvidia, процессоры Vera уже запущены в массовое производство, а первые поставки партнёрам начнутся во второй половине текущего года.