Сегодня 26 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Nvidia показала полный стек Vera Rubin — от GPU до сетей для ИИ-фабрик нового поколения

Являясь одним из лидеров в сфере вычислительной инфраструктуры для систем искусственного интеллекта, Nvidia комплексно подходит к развитию собственных платформ, а потому вместе с ускорителями поколения Vera Rubin предложила ряд сопутствующих аппаратных решений.

 Источник изображений: Nvidia

Источник изображений: Nvidia

Как отмечается в корпоративном пресс-релизе, платформа Vera Rubin открывает новые рубежи в развитии агентского искусственного интеллекта. В массовом производстве сейчас находятся семь новых чипов Nvidia, позволяющих эффективно масштабировать так называемые ИИ-фабрики. В число семи аппаратных новинок Nvidia вошли графические процессоры Rubin, центральные процессоры Vera, коммутаторы NVLink 6, сетевые решения ConnectX-9 SuperNIC, специализированные процессоры BlueField-4 и Ethernet-коммутаторы Spectrum-6, а также созданные с помощью разработок одноимённого поглощённого стартапа процессоры Groq для ускорения инференса при работе с ИИ-агентами. В совокупности они работают, как ИИ-суперкомпьютер, как отмечается в материалах Nvidia для прессы на официальном сайте компании, позволяя ускорять создание профильных технологий на всех этапах жизненного цикла ИИ-систем.

Основатель и глава Nvidia Дженсен Хуанг (Jensen Huang) заявил, что с выходом платформы Vera Rubin наступил переломный момент в развитии агентского ИИ, поскольку данная платформа будет способствовать самому масштабному развёртыванию инфраструктуры в истории. Руководители OpenAI и Anthropic прокомментировали анонс Vera Rubin в предсказуемо хвалебных выражениях, подчёркивая значение этого события для всей ИИ-отрасли. Разработчики ИИ-моделей теперь смогут совершенствовать их и делать это быстрее, чем на аппаратных решениях прошлого поколения.

Структура ЦОД теперь строится на готовых модулях, как считают в Nvidia, которые содержат всё необходимое для эффективного масштабирования вычислительных мощностей с учётом постоянного роста сложности решаемых задач. Клиенты могут сочетать готовые модули ЦОД с учётом специфики своей деятельности. Например, в одной стойке Vera Rubin NVL72 находятся 72 графических процессора Rubin и 36 центральных процессоров Vera, соединённых скоростной шиной NVLink 6 и сетевыми контроллерами ConnectX-9 SuperNIC, а также специализированные процессоры BlueField-4, которые разгружают центральные процессоры от задач работы с сетевым трафиком. По сравнению с решениями поколения Blackwell новые системы Vera Rubin справляются с обучением сложных моделей силами в четыре раза меньшего количества GPU. Пропускная способность в пересчёте на ватт потребляемой энергии в задачах инференса у Vera Rubin до десяти раз выше, а затраты на один токен в десять раз ниже. В кластерах стойки NVL72 масштабируются при помощи Quantum-X800 InfiniBand и Spectrum-X Ethernet.

Центральные процессоры Vera, по словам представителей Nvidia, хорошо себя проявляют в задачах обучения с подкреплением и агентских ИИ-нагрузках. Компания может объединять в одной стойке до 256 таких процессоров, оснащённых системой жидкостного охлаждения. С прочими компонентами кластера они могут сообщаться при помощи сетевых решений Spectrum-X. По сравнению с некими традиционными CPU, на которые ссылается Nvidia, её процессоры Vera могут справляться с ИИ-задачами на 50 % быстрее.

Специализированные чипы Groq 3 LPX обеспечивают эффективную работу с агентскими ИИ-нагрузками при минимальных задержках. В сочетании с другими чипами, входящими в состав платформы Vera Rubin, они обеспечивают увеличение пропускной способности в задачах инференса до 35 раз на один мегаватт потребляемой мощности, а потенциал выручки при использовании моделей с триллионом параметров увеличивается в десять раз. В состав одной стойки входит 256 чипов LPU, 128 Гбайт интегрированной на них памяти SRAM, а пропускная способность достигает 640 Тбайт/с. В сочетании с прочими компонентами платформы Vera Rubin, чипы LPU достигают максимальной эффективности как по быстродействию, так и по энергопотреблению, а также использованию ресурсов памяти. Стойки LPX будут доступны клиентам Nvidia со второй половины текущего года.

Стойка BlueField-4 STX специализируется на унификации адресного пространства GPU между элементами кластера. Обработка хранимой в кеше информации в операциях инференса ускоряется до пяти раз, при этом обеспечивается высокая энергоэффективность по сравнению с системами на классической архитектуре. Достигается общий для кластера контекст, обеспечивающий быстрое взаимодействие с ИИ-агентами и более эффективно масштабируемыми ИИ-сервисами.

Отдельная стойка Spectrum-6 SPX отвечает за скоростной обмен данными по интерфейсу Ethernet. Она может содержать не только коммутаторы Spectrum-X Ethernet, но и коммутаторы Nvidia Quantum-X800 InfiniBand в зависимости от потребностей конкретной конфигурации. В исполнении с кремниевой фотоникой и интеграцией на уровне упаковки чипов эффективность передачи информации возрастает в пять раз, а надёжность по сравнению с традиционными подключаемыми решениями увеличивается в десять раз.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Популярность Anthropic Cluade среди платных пользователей растёт, но лидером по-прежнему является OpenAI ChatGPT 3 ч.
«Яндекс» сделал «Алису AI» более человечной — она запоминает пользователей и подстраивается под их стиль общения 9 ч.
Несколько лет разочарований с Destiny 2 обернулись для Bungie массовыми увольнениями, но разработчики «должны гордиться» собой 12 ч.
ИИ-модель Wildberries вошла в топ-3 русскоязычного бенчмарка MERA 12 ч.
Adobe купила разработчика ИИ для повышения качества изображений и видео Topaz Labs 12 ч.
Глава Epic Games раскритиковал Valve за «очень безответственную» политику Steam в отношении генеративного ИИ 13 ч.
Ролевой боевик Enshrouded с выживанием в волшебном мире и кооперативом на 16 человек скоро выйдет из раннего доступа — дата релиза и новый трейлер 13 ч.
Московский суд оштрафовал Apple на 500 000 рублей, но дело не в удалении VK 14 ч.
Инженерные профессии оказались наиболее устойчивы в эпоху ИИ 14 ч.
Google продолжает терять ИИ-таланты — ещё двое исследователей ушли в Anthropic 14 ч.
Apple ускорит выход флагманских процессоров M7, которые предложат передовые функции ИИ 2 ч.
Новая статья: Обзор робота-уборщика Midea VCR V15 MAX ULTRA: не разменивайся на мелочи (но не переплачивай) 7 ч.
Apple явно намекнула, что сегодняшнее повышение цен — это только начало 7 ч.
Xbox Series X и S снова подорожают по всему миру — теперь сразу на $100–150 9 ч.
Планшет Honor MagicPad 4 с большим OLED-экраном и Snapdragon 8 Gen 5 поступил в продажу в России за 100 тыс. рублей 11 ч.
Акции Apple упали более чем на 5 % после резкого повышения цен на MacBook и iPad 11 ч.
Эволюция гольф-кара: выходцы из Apple и Audi создали электрический багги для дорог общего пользования за $25 000 12 ч.
Leica выпустила 44-Мп полнокадровую камеру SL3-P за $6690 — она займёт нишу между SL3 и SL3-S 12 ч.
«Звёздный разум» заполнит орбиту: SpaceX назвала будущую миллионную группировку ИИ-спутников Starmind 14 ч.
Apple подняла цены на все Mac и iPad на $100–1300 — причина та же, что и у всех 14 ч.