Сегодня 23 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → nvidia
Быстрый переход

Nvidia раскрыла свежие планы — в 2027 году появится Rubin Ultra, а на 2028 год запланирована Feynman

Nvidia представила обновлённую дорожную карту оборудования для центров обработки данных. Компания подтвердила, что намерена ежегодно обновлять семейство графических процессоров для искусственного интеллекта и раз в несколько лет радикально менять архитектуру. Изменения коснутся и сопутствующего оборудования.

 Источник изображений: Nvidia

Источник изображений: Nvidia

В 2026 году Nvidia намеревается выпустить новую платформу Vera Rubin на основе центральных процессоров Vera и графических процессоров Rubin. Ими дело, конечно, не ограничится: компания готовит предназначенный для инференса ускоритель (Language Processing Unit — LPU) Groq LP30, сетевой процессор (DPU) BlueField-4, коммутатор межсоединений NVLink 6, обновлённую сетевую инфраструктуру Ethernet Spectrum-X с интегрированной оптикой (CPO) и сетевой адаптер ConnectX 9 1600G SuperNIC. Платформа Vera Rubin интересна не только центральными и графическими процессорами, но и интеграцией LPU Groq в ассортимент оборудования Nvidia — вместо Rubin CPX, который в дорожной карте больше не упоминается.

В 2027 году Nvidia наладит выпуск ИИ-ускорителей Rubin Ultra на основе четырёх вычислительных чиплетов и 1 Тбайт памяти HBM4E — они будут значительно быстрее Rubin, намеченных на этот год. Совместно с этими графическими процессорами будут использоваться блоки инференса Groq LP35, которые получат поддержку формата данных NVFP4, а значит, станут работать значительно быстрее. Ещё одним крупным нововведением станет стоечное решение Kyber NVL144, в состав которого войдут 144 ускорителя Rubin Ultra с коммутатором NVLink 7 — ожидается как минимум четырёхкратное повышение производительности по сравнению со стойками Oberon NVL72 на основе 72 ускорителей Blackwell.

Если в следующем году Nvidia ускорит решения для ЦОД за счёт увеличения числа графических процессоров на стойку и развёртывания нового LPU с поддержкой NVFP4, то в 2028 году компания готовит радикально новую архитектуру. Она включает центральные процессоры Rosa (сокращённо от Rosalyn), графические процессоры Feynman, сетевые процессоры BlueField-5 и сетевые карты SuperNIC CX10 на инфраструктуре Ethernet Spectrum-X 7-го поколения. Стоечное решение обновится до Kyber CPO — масштабирование систем будет производиться не только за счёт медных кабелей, но и при помощи оптики.

В графических процессорах Nvidia Feynman для ЦОД будет использоваться технология многослойной компоновки кристаллов, которая поможет по-новому масштабировать их производительность; с ними, вероятно, будет использоваться обновлённая высокоскоростная память C-HBM4E с повышенной пропускной способностью и объёмом более 1 Тбайт на графический процессор. Выход чипов Rosa будет означать, что компания ускорила переход к новому поколению центральных процессоров с четырёх лет до двух — такого темпа придерживаются признанные лидеры рынка в лице AMD и Intel. Наконец, Feynman впервые будет использовать коммутаторы NVLink с интегрированной оптикой. Они позволят увеличить число ускорителей в стойке формата Oberon до 576 — или до 1152 в стойке Kyber.

Intel готовит мощности для упаковки будущих ИИ-чипов Nvidia Feynman

В дни проведения GTC 2026 активизировалось обсуждение возможной причастности Intel к упаковке будущих ИИ-чипов Nvidia поколения Feynman. По имеющейся информации, как сообщает TrendForce со ссылкой на малайзийские и тайваньские источники, Intel готовится использовать свои мощности в Малайзии и технологию EMIB для привлечения заказов Nvidia.

 Источник изображения: Intel

Источник изображения: Intel

Премьер-министр Малайзии Датук Сери Анвар (Datuk Seri Anwar) в социальных сетях признался, что глава Intel Лип-Бу Тан (Lip-Bu Tan), чья биография тоже связана с этой страной, поделился председателем правительства планами по расширению производственного комплекса в Малайзии. Он специализируется на тестировании и упаковке процессоров Intel для собственных нужд, но по мере освоения более прогрессивных технологий сможет предложить свои услуги и сторонним заказчикам. Как минимум часть новых производственных линий Intel в Малайзии будет выделена под упаковку чипов с использованием передовых технологий, по данным источников.

Intel собирается наладить в Малайзии упаковку передовых чипов с использованием как технологии EMIB, так и Foveros. Первую из них также освоил партнёр компании — Amkor. По сравнению с технологией интеграции чипов на одну подложку, которую сейчас используют подрядчики Nvidia, альтернатива Intel под названием EMIB обеспечивает более низкие затраты без ущерба для характеристик конечной продукции.

С помощью EMIB корпорация Intel готова размещать несколько чипов на подложке площадью 120 × 120 мм, включая не менее 12 стеков памяти HBM. Это заметно крупнее используемых сейчас Nvidia подложек типоразмера 100 × 100 мм. Более того, к 2028 году Intel рассчитывает увеличить размер подложки до 120 × 180 мм. В этом случае рядом с вычислительными решениями можно будет разместить уже 24 стека памяти HBM. Технология EMIB-T, которая осваивается Intel, позволит интегрировать на подложку микросхемы памяти поколения HBM4. Всё это формально позволяет Intel претендовать на получение заказов от Nvidia на упаковку будущих ИИ-чипов. Правда, этого заказчика может смутить наличие у Intel планов наладить выпуск собственных конкурентоспособных ускорителей ИИ. Кроме того, сложность описываемых технологий упаковки чипов порождает риски высокого уровня брака и дороговизны соответствующих услуг.

Дженсен Хуанг назвал OpenClaw «следующим ChatGPT»

Бум ИИ позволил Nvidia стать одной из крупнейших компаний по величине капитализации, во многом благодаря прозорливости основателя, который много лет назад начал ориентировать GPU на ускорение вычислений. К мнению Дженсена Хуанга (Jensen Huang) теперь прислушиваются многие, и недавно он заявил, что OpenClaw может стать «следующим ChatGPT».

 Источник изображения: OpenClaw

Источник изображения: OpenClaw

Как заявил генеральный директор Nvidia в интервью каналу CNBC, популярность приложения OpenClaw обусловлена тем, что меняется способ применения технологий искусственного интеллекта: люди переходят от поиска ответов на вопросы к конкретным действиям. «Теперь это крупнейший, самый популярный, самый успешный проект с открытым исходным кодом в истории человечества. Это определённо следующий ChatGPT», — охарактеризовал OpenClaw основатель Nvidia.

OpenClaw является платформой для создания автономных ИИ-агентов, которые способны самостоятельно выполнять последовательность действий с минимальным участием человека. Nvidia достаточно быстро сориентировалась в отношении растущей популярности OpenClaw, предложив ориентированную на корпоративных клиентов версию агента по имени NemoClaw, которая использует специфику платформы Nvidia. Компания стремится сделать подобные решения безопасными, масштабируемыми и пригодными для использования в реальных условиях. Особое внимание уделяется безопасности использования подобных инструментов с открытым исходным кодом в той же корпоративной среде, например.

Хуанг впечатлён возможностями таких агентов: «При помощи одной строчки кода вы можете создать своего собственного агента. После этого достаточно попросить его сделать всё, что вам необходимо». В качестве примера глава Nvidia привёл задачу по разработке дизайна кухни. Агент сперва изучает примеры чужих работ, затем знакомится со средствами дизайна, потом начинает предлагать варианты собственного авторства и непрерывно их совершенствует. Подобные решения, по мнению Хуанга, позволят людям совершенствовать свои профессиональные навыки: «Каждый плотник теперь станет архитектором. Каждый сантехник станет архитектором. Мы поднимем возможности каждого на новый уровень».

«Они совершенно неправы»: глава Nvidia ответил игрокам на критику DLSS 5

Анонсированное на конференции GTC 2026 интеллектуальное масштабирование DLSS 5 вызвало резкую критику со стороны геймеров, однако гендиректор Nvidia Дженсен Хуанг (Jensen Huang) скептицизм игроков не разделяет.

 https://3dnews.ru/1138385/nvidia-anonsirovala-dlss-5-s-neyronnim-renderingom-ii-dobavit-fotorealizm-v-kagduyu-igru-uge-osenyu

Источник изображений: Nvidia

DLSS 5 использует модель нейронного рендеринга в реальном времени, которая насыщает кадры детализацией и фотореалистичным освещением. В глазах геймеров, однако, это преображение больше похоже на ИИ-фильтр.

В частности, на данном этапе технология заменяет уникальный художественный стиль игр типовой «пластиковой» ИИ-картинкой с синтетическими лицами персонажей (DLSS 5 уже прозвали «бьютификатором»).

 Грейс из Resident Evil Requiem после инъекции DLSS 5 получила более пухлые губы и более выразительные скулы

Грейс из Resident Evil Requiem после инъекции DLSS 5 получила более пухлые губы и более выразительные скулы

Хуанг на встрече с прессой в рамках GTC 2026 по запросу портала Tom’s Hardware прокомментировал критику игроков в адрес DLSS 5: «Начнём с того, что они совершенно неправы».

Как утверждает Хуанг, DLSS 5 объединяет контроль над геометрией, текстурами и всеми другими элементами игры с генеративным ИИ. Иными словами, это «не постобработка на уровне кадра, а генеративный контроль на уровне геометрии».

 По словам Хуанга, разработчики получат полный художественный контроль над эффектами масштабирования в DLSS 5

По словам Хуанга, разработчики получат полный художественный контроль над эффектами масштабирования в DLSS 5

«Всё это находится под контролем — прямым контролем — разработчика игры. Это не просто генеративный ИИ, а генеративный ИИ с контролем контента. Поэтому мы называем его нейронным рендерингом», — объяснил Хуанг.

Релиз DLSS 5 ожидается осенью. Первыми играми с поддержкой технологии станут Resident Evil Requiem, Starfield, The Elder Scrolls IV: Oblivion Remastered, Assassin’s Creed Shadows, Hogwarts Legacy, Delta Force и Naraka: Bladepoint.

Nvidia возобновила выпуск ускорителей H200, поскольку власти Китая дали добро на их импорт

Как известно, власти США ещё с конца прошлого года пытаются создать условия для поставок ускорителей Nvidia H200 в Китай, но в силу ряда причин непосредственно поставки пока не осуществлялись. Основатель компании Дженсен Хуанг (Jensen Huang) вчера заявил, что Nvidia возобновила выпуск H200 с целью их поставки в Китай, поскольку необходимые экспортные лицензии были получены.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Считается, что выпуск H200 был приостановлен в прошлом году, поскольку за пределами Китая эти ускорители с не самой передовой архитектурой Hopper не так востребованы, а поставлять их в Китай компания на тот момент не могла. К настоящему времени Nvidia не только получила необходимые экспортные лицензии в США, но и набрала некоторое количество заказов в Китае, и всё это позволило ей несколько недель назад возобновить производство ускорителей H200. По словам Хуанга, «цепочки поставок разогреваются».

Агентство Reuters со ссылкой на собственные источники также сообщило, что китайские власти разрешили импорт ускорителей Nvidia H200, и это во многом создаёт все необходимые условия для их поставок в страну в сочетании с наличием экспортных лицензий США и заказов со стороны китайских клиентов. По словам главы Nvidia, приобрести H200 желают многие китайские компании. Последним также удалось получить необходимые лицензии от американской стороны, что не менее важно. Наличие одобрения на поставки H200 в Китай глава Nvidia отдельно подтвердил в интервью CNBC, подчеркнув, что соответствующие согласования пройдены как с американской, так и с китайской стороны. Накладываются ли на китайских клиентов Nvidia какие-то дополнительные условия со стороны местных властей, не уточняется. Ранее считалось, что ради возможности закупать американские ускорители H200 им придётся взять обязательства по приобретению ускорителей китайского происхождения в определённых пропорциях.

Nvidia готовит для китайского рынка особую версию ИИ-чипов Groq

В прошлом году Nvidia в рамках сделки на сумму $17 млрд получила доступ к разработкам стартапа Groq, и уже в этом месяце представила специализированные чипы LPU для ускорения работы ИИ в задачах инференса. Как отмечают источники, для Китая компания уже готовит адаптированную версию чипов Groq, с учётом существующих в США экспортных ограничений.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Об этом накануне сообщило агентство Reuters со ссылкой на собственные источники. Одновременно глава Nvidia Дженсен Хуанг (Jensen Huang) заявил, что компания возобновила выпуск чипов H200 собственной разработки, которые собирается продавать на китайском рынке. Nvidia удалось получить необходимые для отгрузки H200 китайским клиентам экспортные лицензии США, а китайские органы власти разрешили их импорт в Поднебесную.

Среди китайских конкурентов Nvidia немало тех, кто предлагает собственные специализированные чипы для инференса, поэтому возможность поставки адаптированных решений семейства Groq важна для американской компании с точки зрения сохранения своих позиций на китайском рынке. Как поясняет Reuters, адаптация чипов Groq для Китая будет заключаться не в снижении быстродействия, а в сохранении возможности работы с другими системами. Поставки чипов Groq начнутся в мае этого года, для Китая их не будут выпускать отдельно от основных партий.

Nvidia наконец выпустила рабочую станцию DGX Station на базе GB300 Grace Blackwell — у неё почти полтерабайта LPDDR5X

Компания Nvidia официально выпустила рабочую станцию DGX Station, представленную в прошлом году на конференции GTC 2025. Система ориентирована на разработчиков программного обеспечения, исследователей, специалистов по обработке данных и всех, кому требуется больше вычислительной мощности для ИИ, чем может обеспечить более компактная модель Nvidia DGX Spark.

 Источник изображения: Nvidia

Источник изображения: Nvidia

В составе DGX Station используется ускоритель Nvidia GB300 Grace Blackwell Ultra, который сочетает 72-ядерный процессор Grace и графический процессор Blackwell Ultra, объединённые интерфейсом NVLink C2C со скоростью 900 Гбайт/с. Система оснащена впечатляющим объёмом встроенной памяти — 784 Гбайт. Процессор работает в паре с 496 Гбайт памяти LPDDR5X со скоростью 396 Гбайт/с, а графический процессор — с 252 Гбайт памяти HBM3e со скоростью 7,1 Тбайт/с. Оба пула памяти объединены, что позволяет процессору и графическому процессору совместно использовать память друг друга для максимальной производительности ИИ.

Nvidia оснастила DGX Station тремя слотами PCIe 5.0 x16: один поддерживает 16 линий, а два других — по восемь линий. Система официально поддерживает установку дискретных видеокарт, которые можно подключать к слотам PCIe для выполнения дополнительных задач, таких как моделирование и трассировка лучей. Поддерживаются следующие GPU: RTX Pro 6000 Workstation Edition, RTX Pro 6000 Blackwell Max-Q Workstation Edition, RTX Pro 4000 Blackwell SFF Edition и RTX Pro 2000 Blackwell. Рабочая станция DGX Station также оснащена четырьмя слотами M.2, аудиоразъёмами и портами USB.

В рабочей станции используется сетевой контроллер Nvidia ConnectX-8 SuperNIC, поддерживающий скорость до 800 Гбит/с через два порта QSFP112. Система предназначена для ускорения проектов в области искусственного интеллекта путём подключения до двух станций DGX для масштабирования производительности и возможностей моделирования. Питание осуществляется через один 24-контактный разъём ATX, один 8-контактный разъём EPS и три разъёма питания 12V-2x6 для GPU, обеспечивающие заявленную мощность системы в 1600 Вт.

Nvidia заявляет, что DGX Station уже доступна для заказа и начнёт поставляться в ближайшие месяцы через компании-партнёры, включая Asus, Dell, Gigabyte, MSI, Supermicro и HP.

Nvidia выпустила однослотовый серверный ускоритель RTX Pro 4500 Blackwell Server Edition для ИИ и других задач

Компани Nvidia представила профессиональную видеокарту RTX Pro 4500 Blackwell Server Edition, предназначенную для центров обработки данных, периферийных устройств и облачных вычислений. Карта ориентирована на выполнение задач искусственного интеллекта, обработку данных, видеозадачи и визуальные вычисления.

 Источник изображений: Nvidia

Источник изображений: Nvidia

Новая серверная версия ускорителя выполнена в форм-факторе карты расширения PCIe толщиной в один слот, как и ранее выпущенная стандартная версия RTX Pro 4500 Blackwell для рабочих станций. Обе карты имеют по 10 496 ядер CUDA и по 32 Гбайт памяти GDDR7. Одними из ключевых отличий между двумя ускорителями являются дизайн и энергопотребление. Серверная версия оснащена однослотовой пассивной системой охлаждения и имеет заявленный показатель энергопотребления 165 Вт. Стандартный вариант RTX Pro 4500 Blackwell толщиной в два слота расширения оснащён кулером с вентилятором тангенциального типа. При этом энергопотребление карты заявлено на уровне 200 Вт.

Серверная версия также поставляется с памятью с более низкой пропускной способностью. Чипы памяти модели RTX Pro 4500 Blackwell Server Edition работают с частотой 3125 МГц, что соответствует 25 Гбит/с эффективной пропускной способности на контакт, по сравнению с 3500 МГц или 28 Гбит/с у стандартной RTX Pro 4500. В результате общая пропускная способность памяти у серверной версии составляет 800 Гбайт/с вместо 896 Гбайт/с у обычной.

Ещё одно отличие заключается в наборе внешних разъёмов. По сравнению со стандартной RTX Pro 4500 Blackwell серверная версия не оснащена внешними видеопортами. Это ожидаемо для устройства, ориентированного на центры обработки данных, где карта будет использоваться в составе стоечных серверов для удалённых рабочих нагрузок, а не в составе рабочих станций для локальных задач.

 Вся актуальная линейка ускорителей Nvidia RTX Pro для серверов и рабочих станций. Источник изображения: VideoCardz

Вся актуальная линейка ускорителей Nvidia RTX Pro для серверов и рабочих станций. Источник изображения: VideoCardz

Nvidia позиционирует RTX Pro 4500 Blackwell Server Edition как более компактную и энергоэффективную альтернативу в профессиональной линейке Blackwell. Она сохраняет ту же конфигурацию графического процессора и тот же объём памяти в 32 Гбайт, что и стандартная RTX Pro 4500 Blackwell, но жертвует видеовыходами и некоторой пропускной способностью памяти в пользу пассивной однослотовой конструкции, лучше подходящей для корпоративных платформ.

SRAM какой-то: Nvidia представила чип Groq 3 LPU для ускорения инференса ИИ-моделей на уровне токенов

На прошедшей в этом году конференции GTC генеральный директор Nvidia Дженсен Хуанг (Jensen Huang) сообщил, что в этом году платформа Vera Rubin получит расширение. Nvidia использует для этого интеллектуальную собственность, приобретённую у Groq. В состав Rubin вошёл новый чип Nvidia Groq 3 LPU. Компания определяет его как ускоритель инференса. Его задача — выдавать токены в большом объёме и с низкой задержкой.

 Источник изображений: Nvidia

Источник изображений: Nvidia

Платформа Rubin уже включает шесть компонентов, из которых Nvidia собирает стоечные системы и затем масштабирует их до ИИ-фабрик. Это GPU Rubin, CPU Vera, коммутаторы внутрисистемного масштабирования NVLink 6, интеллектуальный сетевой адаптер ConnectX-9, процессор обработки данных BlueField-4 и коммутатор межсистемного масштабирования Spectrum-X с совместно интегрированной оптикой. Groq 3 LPU стал новым элементом этой платформы и ещё одним строительным блоком Rubin при масштабном развёртывании.

Groq 3 LPU отличается от большинства ИИ-ускорителей схемой памяти. Обычно такие системы используют HBM в качестве рабочего уровня памяти. Каждый Groq 3 LPU содержит 500 Мбайт SRAM. Для сравнения, каждый GPU Rubin оснащён 288 Гбайт HBM4. По ёмкости разница велика. По пропускной способности соотношение иное: SRAM обеспечивает до 150 Тбайт/с, а HBM4 — около 22 Тбайт/с. Для ИИ-задач, чувствительных к пропускной способности, рост этого показателя даёт преимущество при инференсе. Именно поэтому Nvidia вводит Groq 3 в состав Rubin.

Стойка Groq 3 LPX включает 256 чипов Groq 3 LPU. Такая система располагает 128 Гбайт SRAM. Её суммарная пропускная способность достигает 40 Пбайт/с. Для объединения чипов внутри стойки предусмотрен выделенный интерфейс внутрисистемного масштабирования. Его пропускная способность составляет 640 Тбайт/с на стойку.

Вице-президент Nvidia по гипермасштабируемым решениям Иэн Бак (Ian Buck) назвал Groq LPX сопроцессором для Rubin. По его словам, он повысит производительность декодирования «на каждом слое ИИ-модели на каждом токене». Nvidia связывает это решение со следующим рубежом ИИ — мультиагентными системами. Речь идёт о сценариях, где нужно обеспечивать интерактивную работу при инференсе моделей с триллионами параметров и окнами контекста в миллионы токенов.

Когда ИИ-агенты всё чаще обмениваются данными друг с другом, а не с человеком в окне чат-бота, меняется и порог приемлемого отклика. Скорость, достаточная для человека, оказывается слишком низкой для ИИ-агента. Бак описывает переход от мира, где разумным считался уровень 100 токенов в секунду, к уровню 1 500 токенов в секунду и выше для межагентного обмена.

Добавление Groq 3 LPU должно усилить позиции Rubin в сегменте низколатентного инференса. В тексте в качестве конкурента названа Cerebras. Компания использует процессоры Wafer-Scale Engine (WSE), выполненные на целой кремниевой пластине, где большие объёмы SRAM объединены с вычислениями для низколатентного инференса на продвинутых моделях. OpenAI также привлекала мощности Cerebras для обслуживания части передовых моделей из-за выгодных характеристик задержки этой платформы.

Иэн Бак также допустил, что появление Groq 3 LPU может сократить роль ускорителя инференса Rubin CPX. Он сказал, что сейчас Nvidia сосредоточена на интеграции стойки Groq 3 LPX с Rubin. Дополнительных подробностей он не привёл. При этом оба чипа рассчитаны на сходное усиление инференса, но Groq LPU не требует большого объёма памяти GDDR7, который нужен каждому модулю Rubin CPX.

Nvidia ускорит и обезопасит запуск ИИ-агентов — представлены Agent Toolkit и NemoClaw

Среди прочих крупных анонсов на мероприятии GTC 2026 глава компании Nvidia Дженсен Хуанг (Jensen Huang) анонсировал множество новых моделей искусственного интеллекта, а также инструменты Agent Toolkit и NemoClaw, предназначенные для быстрого запуска ИИ-агентов на оборудовании Nvidia.

 Источник изображений: nvidia.com

Источник изображений: nvidia.com

Nvidia Agent Toolkit — платформа с открытым исходным кодом, предназначенная для разработчиков и располагающая средствами стандартизации и масштабирования при запуске автономных ИИ-агентов в масштабах предприятия. NemoClaw представляет собой программный стек на основе популярного OpenClaw с дополнительными средствами обеспечения конфиденциальности и контроля. Оба инструмента предназначены для ускоренного развёртывания ИИ-агентов и предлагают оптимизацию для оборудования Nvidia — от компактных DGX Spark до мощных серверов Vera Rubin.

Компания отметила, что множество её партнёров уже взяли на себя обязательства вести разработку с использованием средств Agent Toolkit — среди них упомянуты Adobe, Salesforce, SAP, ServiceNow, Siemens, CrowdStrike, Atlassian и Palantir. Agent Toolkit позволяет быстро интегрировать функции ИИ-агентов в бизнес-приложения с общими ресурсами и едиными стандартами — это снижает нагрузку на инженеров и обеспечивает тесную связь с имеющимся вычислительным стеком Nvidia, что помогает оптимизировать производительность.

NemoClaw представляет собой готовый программный пакет, включающий установку OpenClaw, открытых моделей Nvidia Nemotron и среды выполнения OpenShell одной командой. Стандартный вариант OpenClaw получил дополнительные функции конфиденциальности, безопасности и оперативного контроля для ИИ-агентов. В качестве аппаратной платформы могут выступать ПК с видеокартами Nvidia RTX, компьютеры DGX Spark и DGX Station, а также серверы с ускорителями Nvidia. Компания упомянула, что с обновлением ПО появилась поддержка кластеризации до четырёх систем DGX Spark в единой конфигурации (против двух на момент запуска).

Отдельно было сказано о новом партнёрском проекте Nvidia с Adobe — последнюю заинтересовали средства Agent Toolkit, компания также решила интегрировать в свои приложения инструменты CUDA-X и Omniverse, а ИИ-модели нового поколения будут обучаться на ИИ-оборудовании Nvidia. «Зелёные» напомнили о семействе открытых моделей Alpamayo класса Vision-Language-Action (VLA) для систем автопилота. Наконец, было объявлено о создании организации Nemotron Coalition, в которую, помимо самой Nvidia, вошли Black Forest Labs, Cursor, LangChain, Mistral AI, Perplexity, Reflection AI, Sarvam и Thinking Machines Lab. Они решили вести разработку открытых ИИ-моделей совместно, используя единые ресурсы Nvidia DGX Cloud, что позволит им не дублировать усилия на базовых этапах. Специализация будет проводиться с учётом потребностей отраслей, регионов и сценариев использования — результаты работы коалиции лягут в основу перспективного семейства моделей Nemotron 4.

Nvidia показала полный стек Vera Rubin — от GPU до сетей для ИИ-фабрик нового поколения

Являясь одним из лидеров в сфере вычислительной инфраструктуры для систем искусственного интеллекта, Nvidia комплексно подходит к развитию собственных платформ, а потому вместе с ускорителями поколения Vera Rubin предложила ряд сопутствующих аппаратных решений.

 Источник изображений: Nvidia

Источник изображений: Nvidia

Как отмечается в корпоративном пресс-релизе, платформа Vera Rubin открывает новые рубежи в развитии агентского искусственного интеллекта. В массовом производстве сейчас находятся семь новых чипов Nvidia, позволяющих эффективно масштабировать так называемые ИИ-фабрики. В число семи аппаратных новинок Nvidia вошли графические процессоры Rubin, центральные процессоры Vera, коммутаторы NVLink 6, сетевые решения ConnectX-9 SuperNIC, специализированные процессоры BlueField-4 и Ethernet-коммутаторы Spectrum-6, а также созданные с помощью разработок одноимённого поглощённого стартапа процессоры Groq для ускорения инференса при работе с ИИ-агентами. В совокупности они работают, как ИИ-суперкомпьютер, как отмечается в материалах Nvidia для прессы на официальном сайте компании, позволяя ускорять создание профильных технологий на всех этапах жизненного цикла ИИ-систем.

Основатель и глава Nvidia Дженсен Хуанг (Jensen Huang) заявил, что с выходом платформы Vera Rubin наступил переломный момент в развитии агентского ИИ, поскольку данная платформа будет способствовать самому масштабному развёртыванию инфраструктуры в истории. Руководители OpenAI и Anthropic прокомментировали анонс Vera Rubin в предсказуемо хвалебных выражениях, подчёркивая значение этого события для всей ИИ-отрасли. Разработчики ИИ-моделей теперь смогут совершенствовать их и делать это быстрее, чем на аппаратных решениях прошлого поколения.

Структура ЦОД теперь строится на готовых модулях, как считают в Nvidia, которые содержат всё необходимое для эффективного масштабирования вычислительных мощностей с учётом постоянного роста сложности решаемых задач. Клиенты могут сочетать готовые модули ЦОД с учётом специфики своей деятельности. Например, в одной стойке Vera Rubin NVL72 находятся 72 графических процессора Rubin и 36 центральных процессоров Vera, соединённых скоростной шиной NVLink 6 и сетевыми контроллерами ConnectX-9 SuperNIC, а также специализированные процессоры BlueField-4, которые разгружают центральные процессоры от задач работы с сетевым трафиком. По сравнению с решениями поколения Blackwell новые системы Vera Rubin справляются с обучением сложных моделей силами в четыре раза меньшего количества GPU. Пропускная способность в пересчёте на ватт потребляемой энергии в задачах инференса у Vera Rubin до десяти раз выше, а затраты на один токен в десять раз ниже. В кластерах стойки NVL72 масштабируются при помощи Quantum-X800 InfiniBand и Spectrum-X Ethernet.

Центральные процессоры Vera, по словам представителей Nvidia, хорошо себя проявляют в задачах обучения с подкреплением и агентских ИИ-нагрузках. Компания может объединять в одной стойке до 256 таких процессоров, оснащённых системой жидкостного охлаждения. С прочими компонентами кластера они могут сообщаться при помощи сетевых решений Spectrum-X. По сравнению с некими традиционными CPU, на которые ссылается Nvidia, её процессоры Vera могут справляться с ИИ-задачами на 50 % быстрее.

Специализированные чипы Groq 3 LPX обеспечивают эффективную работу с агентскими ИИ-нагрузками при минимальных задержках. В сочетании с другими чипами, входящими в состав платформы Vera Rubin, они обеспечивают увеличение пропускной способности в задачах инференса до 35 раз на один мегаватт потребляемой мощности, а потенциал выручки при использовании моделей с триллионом параметров увеличивается в десять раз. В состав одной стойки входит 256 чипов LPU, 128 Гбайт интегрированной на них памяти SRAM, а пропускная способность достигает 640 Тбайт/с. В сочетании с прочими компонентами платформы Vera Rubin, чипы LPU достигают максимальной эффективности как по быстродействию, так и по энергопотреблению, а также использованию ресурсов памяти. Стойки LPX будут доступны клиентам Nvidia со второй половины текущего года.

Стойка BlueField-4 STX специализируется на унификации адресного пространства GPU между элементами кластера. Обработка хранимой в кеше информации в операциях инференса ускоряется до пяти раз, при этом обеспечивается высокая энергоэффективность по сравнению с системами на классической архитектуре. Достигается общий для кластера контекст, обеспечивающий быстрое взаимодействие с ИИ-агентами и более эффективно масштабируемыми ИИ-сервисами.

Отдельная стойка Spectrum-6 SPX отвечает за скоростной обмен данными по интерфейсу Ethernet. Она может содержать не только коммутаторы Spectrum-X Ethernet, но и коммутаторы Nvidia Quantum-X800 InfiniBand в зависимости от потребностей конкретной конфигурации. В исполнении с кремниевой фотоникой и интеграцией на уровне упаковки чипов эффективность передачи информации возрастает в пять раз, а надёжность по сравнению с традиционными подключаемыми решениями увеличивается в десять раз.

«Не могу поверить, что это не первоапрельская шутка»: нейронный рендеринг в DLSS 5 оказался больше похож на ИИ-фильтр

Анонсированное компанией Nvidia на конференции GTC 2026 интеллектуальное масштабирование DLSS 5 вызвало стойкое отторжение среди геймеров, ценящих художественный замысел своих любимых игр.

 Источник изображений: Nvidia

Источник изображений: Nvidia

По словам Nvidia, DLSS 5 использует модель нейронного рендеринга в реальном времени, которая насыщает игровые кадры фотореалистичным освещением и детализацией материалов.

Несмотря на громкие обещания, дебютная демонстрация DLSS 5 на YouTube-канале Nvidia (см. видео ниже) собрала в четыре раза больше дизлайков, чем лайков — 48 тыс. негативных оценок на 11 тыс. положительных.

Пользователи массово раскритиковали то, как DLSS 5 преображает изображение и, в частности, персонажей. Например, Грейс Эшкрофт из Resident Evil Requiem после инъекции DLSS 5 получила более пухлые губы и более выразительные скулы.

Предполагается, что новый апскейлер Nvidia должен сделать героев более реалистичными, но выглядит, словно их обработал ИИ-фильтр. «Не могу поверить, что это не первоапрельская шутка», — удивляется azul1458.

В комментариях к ролику Nvidia уверяет, что DLSS 5 предоставляет разработчикам полный художественный контроль над эффектами масштабирования, что позволяет им «сохранять уникальную эстетику своей игры».

Релиз DLSS 5 ожидается осенью. Первыми играми с поддержкой технологии станут Resident Evil Requiem, Starfield, The Elder Scrolls IV: Oblivion Remastered, Assassin’s Creed Shadows, Hogwarts Legacy, Delta Force и Naraka: Bladepoint.

Хуанг пообещал, что Nvidia заработает $1 трлн на ИИ-железе до конца 2027 года

Подобные заявления формально больше подходят для квартальной отчётной конференции, но основатель Nvidia Дженсен Хуанг (Jensen Huang) на открытии мероприятия GTC 2026 не удержался от финансовых прогнозов. Он ожидает, что до конца 2027 года компания выручит на продажах «железа» для ИИ не менее $1 трлн.

 Источник изображения: Nvidia

Источник изображения: Nvidia

«Я ожидаю, что до конца 2027 года продажи аппаратного обеспечения для ИИ обеспечат не менее $1 трлн», — заявил генеральный директор компании. Сейчас в мире попросту нет компаний, получающих подобную выручку за год, но прогноз Хуанга относится к периоду с 2025 по 2027 годы включительно, то есть, он охватывает три года сразу. Ближайшие к показателю годовой выручки в $1 трлн компании — это американский гигант розничной торговли Walmart ($681 млрд) и в чём-то родственная ей Amazon, которая одновременно выступает и в роли облачного гиганта ($638 млрд). Даже Apple в прошлом году выручила только $391 млрд, а это один из крупнейших поставщиков аппаратного обеспечения в мире, если считать смартфоны и прочую мобильную электронику.

В прошлом фискальном году Nvidia выручила $215 млрд, но и это было существенным прогрессом по сравнению с предыдущим отчётным периодом, который обеспечил только $130,5 млрд годовой выручки. В текущем фискальном квартале Nvidia рассчитывает выручить $78 млрд. Чтобы достичь объёма выручки в $578 млрд по итогам 2028 фискального года (примерно совпадает с 2027 календарным), Nvidia должна сохранить средний темп увеличения выручки в 164 % за год. Если же ориентироваться на годовую выручку в $1 трлн, то Nvidia при условии сохранения ИИ-бума выйдет на такой показатель примерно к 2030 году, по мнению некоторых аналитиков.

Важно понимать, что высокие темпы роста выручки Nvidia также обеспечиваются и ростом средних цен на её ускорители вычислений. Они становятся производительнее и сложнее в компоновке, а потому дорожают опережающими темпами. Кроме того, высокий спрос также подогревает реальные рыночные цены, хотя в этом случае не вся добавленная стоимость оседает в карманах самой Nvidia. Физически не все партнёры Nvidia способны выпускать столько компонентов, чтобы покрыть её потребности в полной мере. Помимо TSMC, сдержанных темпов увеличения объёмов выпуска продукции придерживаются и производители памяти. По крайней мере, за спросом все они сейчас точно не успевают. Этот фактор также будет определять темпы роста выручки Nvidia.

«Космические вычисления уже здесь»: Nvidia представила модуль Space-1 Vera Rubin для орбитальных ИИ-серверов

Генеральный директор Nvidia Дженсен Хуанг (Jensen Huang) анонсировал на конференции GTC 2026 космический модуль Nvidia Space-1 Vera Rubin Module. По словам Хуанга, модуль обеспечивает до 25 раз большую вычислительную мощность для задач искусственного интеллекта, чем сервер с ускорителями H100.

 Источник изображения: Nvidia

Источник изображения: Nvidia

По словам Nvidia, в настоящее время шесть коммерческих космических компаний используют её платформы в орбитальной и наземной средах: Aetherflux, Axiom Space, Kepler Communications, Planet Labs PBC, Sophia Space и Starcloud. При этом Kepler использует в своей спутниковой группировке платформу Jetson Orin для управления данными с помощью ИИ. «Nvidia Jetson Orin внедряет передовые технологии ИИ непосредственно на наши спутники, позволяя нам интеллектуально управлять данными и маршрутизировать их по всей нашей группировке», — заявила Мина Митри (Mina Mitry), генеральный директор компании, в официальном пресс-релизе Nvidia.

В октябре прошлого года основатель Amazon и Blue Origin Джефф Безос (Jeff Bezos) предсказал, что орбитальные центры обработки данных гигаваттного уровня появятся через 10–20 лет. В качестве основных преимуществ таких платформ он назвал непрерывное солнечное электроснабжение и упрощённую систему охлаждения в космосе. Starcloud, один из шести партнёров Nvidia, уже строит, как он сам описывает, специально разработанные орбитальные центры обработки данных, предназначенные для выполнения задач обучения моделей ИИ и вывода данных на орбите.

«Космические вычисления, последний рубеж, уже здесь», — сказал Дженсен Хуанг, добавив, что «обработка данных с помощью ИИ в космических и наземных системах обеспечивает сбор данных в реальном времени, принятие решений и автономность, превращая орбитальные центры обработки данных в инструменты исследований, а космические аппараты — в системы с автономным управлением».

Глава Nvidia не сказал, когда космический модуль Vera Rubin станет доступен для развёртывания. Компания уже предлагает в качестве космических платформ IGX Thor, Jetson Orin и RTX Pro 6000 Blackwell Server Edition.

Nvidia ударила по Intel и AMD: представлены серверные 88-ядерные CPU Vera, которые сгодятся не только для ИИ

Nvidia на конференции GTC 2026 раскрыла подробности о серверных центральных процессорах Vera, оснащённых 88 вычислительными ядрами. Компания заявляет о резком росте производительности благодаря новым ядрам Olympus. Одновременно была представлена стоечная система Vera CPU Rack с 256 процессорами, которая, по оценке Nvidia, обеспечивает шестикратный рост CPU-производительности и двукратное ускорение задач агентного ИИ.

 Источник изображений: Nvidia

Источник изображений: Nvidia

Процессор Vera получил 88 вычислительных ядер и 176 потоков, тогда как у первого поколения Grace было 72 ядра. Компания Nvidia заявляет о росте количества исполняемых инструкций за такт (IPC) сразу на 50 %, что является необычно крупным скачком для современной процессорной архитектуры, где прирост от поколения к поколению обычно ограничивается однозначными или небольшими двузначными процентами.

Всё дело в том, что если в Grace применялись стандартные ядра Arm Neoverse, то в Vera используются новые ядра Olympus, которые описываются как разработанные Nvidia, что указывает на серьёзные модификации базового дизайна Arm. За основу взята современная архитектура Arm v9.2-A.

Одной из ключевых особенностей стала технология пространственной многопоточности (Spatial Multi-Threading). В отличие от традиционного SMT, где потоки поочерёдно используют ресурсы ядра, здесь ключевые элементы конвейера — исполнительные блоки, кеши и регистровые файлы — физически изолированы между потоками. Благодаря этому оба потока могут фактически выполняться одновременно, что повышает параллелизм инструкций, увеличивает пропускную способность и делает производительность более предсказуемой, поскольку простаивающие исполнительные блоки могут немедленно задействовать инструкции из другого потока. Подобная схема особенно полезна в средах с большим количеством независимых пользователей и виртуальных окружений.

Все 88 ядер объединены в единый вычислительный домен без NUMA-разделения, характерного для современных многоядерных x86-процессоров. Это должно уменьшить задержки доступа к памяти, повысить предсказуемость работы системы и упростить программирование. Для организации взаимодействия между ядрами используется новое поколение фирменной шины Nvidia Scalable Coherency Fabric с сеточной или ячеистой топологией (mesh). Оно основано на когерентной сетевой архитектуре Arm CMN-700, применявшейся в Grace, однако, вероятно, использует более современную реализацию CMN S3 или её модификацию.

Сеточная структура обеспечивает высокую суммарную пропускную способность памяти и позволяет эффективно распределять ресурсы между ядрами. В процессорах Grace общая пропускная способность памяти составляла 546 Гбайт/с, что соответствовало примерно 7,6 Гбайт/с на ядро. В Vera этот показатель вырос более чем вдвое — до 1,2 Тбайт/с, которые обеспечиваются 1,5 Тбайт памяти LPDDR5 в модулях SOCAMM. Ёмкость памяти увеличилась втрое, а средняя пропускная способность на ядро при полной загрузке достигает 13,6 Гбайт/с. При неравномерной нагрузке отдельное ядро может получать до 80 Гбайт/с, что особенно важно для потоков с интенсивным доступом к памяти.

Архитектура также включает десятиканальный блок декодирования инструкций, нейросетевой предсказатель ветвлений, специализированный механизм предварительной выборки для анализа графовых баз данных и буфер инструкций, оптимизированный под PyTorch. Процессор поддерживает технологию Confidential Computing, что позволяет создавать полностью защищённые вычислительные домены CPU и GPU.

Для связи между кристаллами используется интерфейс NVLink-C2C с пропускной способностью до 1,8 Тбайт/с — вдвое больше, чем у Grace, и примерно в семь раз быстрее, чем у PCI Express 6.0. Процессоры также поддерживают двухсокетные конфигурации и современные стандарты для дата-центров, включая PCIe 6.0 и CXL 3.1.

Помимо самих процессоров Nvidia представила стоечную систему Vera CPU Rack. Если ранее процессоры Grace выступали как дополнение к ускорителям вычислений на базе GPU, то теперь Nvidia намерена предложить Vera и как самостоятельный продукт в системах, ориентированных на CPU-вычисления и другие задачи.

В одной такой стойке размещается 256 процессоров Vera с жидкостным охлаждением, а также 74 сетевых процессора BlueField-4 DPU и сетевые адаптеры ConnectX SuperNIC. Общий объём памяти достигает 400 Тбайт LPDDR5, а суммарная пропускная способность памяти — 300 Тбайт/с. В системе насчитывается 45 056 потоков, которые, по словам Nvidia, способны поддерживать до 22 500 изолированных CPU-окружений.

Компания продемонстрировала результаты тестов в широком наборе задач, включая скриптовые нагрузки, компиляцию, анализ данных, графовую аналитику и HPC-вычисления. По сравнению с Grace прирост производительности составляет от 1,8 до 2,2 раза в зависимости от типа нагрузки.

Ожидается, что системы Vera CPU Rack появятся в инфраструктуре Meta✴, а также Nvidia планирует поставлять их и другим гиперскейлерам, включая Oracle, CoreWeave, Nebius и Alibaba. Помимо стоечных систем широкий круг производителей серверного оборудования предложит собственные решения на базе Vera. Среди партнёров Nvidia названы Dell, HPE, Lenovo, Supermicro, Foxconn и другие крупные OEM- и ODM-компании. Процессоры Vera также станут частью систем Nvidia HGX NVL8.

Особое значение новые CPU имеют для платформы Vera Rubin — комплексного решения Nvidia следующего поколения. Она включает сразу несколько типов компонентов: графический процессор Rubin, коммутатор NVLink6 для межсоединений на уровне стойки, сетевой адаптер ConnectX-9 SuperNIC, сетевой процессор BlueField-4 DPU, оптический коммутатор Spectrum-X 102.4T с интегрированными оптическими модулями и ускорители Groq 3 LPU.

Новые чипы Vera ориентированы как на задачи искусственного интеллекта, так и на более универсальные вычислительные нагрузки, хотя основной упор сделан именно на ИИ. Таким образом, с выпуском Vera компания Nvidia усиливает позиции на рынке серверных центральных процессоров, где доминируют Intel и AMD, а также навязывает конкуренцию многочисленным кастомным Arm-чипам.

По словам Nvidia, процессоры Vera уже запущены в массовое производство, а первые поставки партнёрам начнутся во второй половине текущего года.


window-new
Soft
Hard
Тренды 🔥
ИИ-супермодель Claude Mythos всего за месяц обнаружила свыше 10 тыс. уязвимостей в ПО 4 ч.
WhatsApp покажет отдельным списком, кто из контактов онлайн 7 ч.
В Linux обнаружена очередная серьёзная уязвимость — и ей уже десять лет 7 ч.
Firefox перестал вылетать на ПК с процессорами Intel Raptor Lake — на исправление ошибки ушёл год 7 ч.
Outlook Classic перестал показывать картинки, но Microsoft обещала всё починить 7 ч.
На GitHub напал Megalodon — вредоносный код заразил более чем 5500 репозиториев 11 ч.
Марк Цукерберг высказался в защиту тотальной слежки за действиями сотрудников Meta — для обучения ИИ, но это не точно 12 ч.
Техногиганты в последний момент отговорили Трампа подписывать указ об обязательных проверках ИИ 12 ч.
Новый поиск Google оказался капризным: из-за ИИ запросы «стой» и «игнорируй» ломают выдачу 14 ч.
Глава DeepMind спрогнозировал появление сильного искусственного интеллекта (AGI) к 2030 году 19 ч.