Сегодня 03 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → nvidia blackwell
Быстрый переход

Nvidia представила Blackwell Ultra с 288 Гбайт HBM3e — ИИ-ускоритель «для эпохи рассуждений»

Компания Nvidia в рамках открытия конференции GTC 2025 официально анонсировала ускоритель вычислений для центров обработки данных Blackwell Ultra B300, суперчип Grace Blackwell Ultra GB300, а также различные системы на его основе. Новинка «создана для эпохи рассуждений», то есть для новейших, более сложных и требовательных к ресурсам ИИ-моделей (LLM), способных размышлять над задачами.

 Источник изображений: Nvidia

Источник изображений: Nvidia

Nvidia уже традиционно не стала раскрывать всех деталей о новинке. В компании лишь отметили, что графические процессоры Blackwell Ultra (в составе GB300 и B300) физически отличаются от чипов Blackwell (в GB200 и B200). Отметим, что Blackwell Ultra B300 представляет собой классический ускоритель на GPU, тогда как Grace Blackwell Ultra GB300 — это связка из Arm-процессора Grace с 72 ядрами Neoverse V2 и двух графических процессоров Blackwell Ultra.

 Плата с парой CPU Grace и четырьмя Blackwell Ultra

Плата с парой CPU Grace и четырьмя Blackwell Ultra

Nvidia отмечает увеличенный на 50 % объём набортной памяти. Blackwell Ultra получил 288 Гбайт HBM3e, что будет как раз кстати при работе с особенно крупными LLM. Объём памяти вырос благодаря использованию новых 12-ярусных стеков HBM3e — в Blackwell B200 применяются восьмиярусные стеки HBM3e, обеспечивающие 192 Гбайт памяти.

По словам Nvidia, производительность Blackwell Ultra должна в 1,5 раза превышать производительность Blackwell в запуске уже обученных моделей (FP4 inference). Компания заявляет о производительности в 15 Пфлопс для вычислений FP4, а также о 30 Пфлопс для разреженных FP4. Для оригинального ускорителя Blackwell B200 эти показатели составляли 10 и 20 Пфлопс соответственно.

 Источник изображений: Nvidia

GB300 NVL72

Nvidia предложит несколько готовых систем на базе новых ускорителей вычислений, которые начнут поступать в продажу во второй половине 2025 года. GB300 NVL72 — фактически это готовая серверная стойка, объединяющая 72 графических процессора Blackwell Ultra и 36 центральных процессоров Grace. Новинка, как и её предшественница GB200 NVL72, оснащена системой жидкостного охлаждения, использует NVLink пятого поколения, модули Nvidia ConnectX-8 SuperNIC и предлагает 18 Тбайт оперативной памяти LPDDR5X. Производительность достигает 1100 Пфлопс в FP4-вычислениях и до 1400 Пфлопс в разреженных вычислениях.

Nvidia особенно отмечает применение интерконнекта NVLink 5-го поколения, который соединяет отдельные чипы для создания «одного большого GPU». Он обладает пропускной способностью 1,8 Тбайт/с на GPU, а общая пропускная способность достигает 130 Тбайт/с. Начиная с Blackwell, NVLink также может использоваться в качестве интерфейса для соединения нескольких стоек, что ранее осуществлялось через InfiniBand со скоростью 100 Гбайт/с. Поэтому Nvidia заявляет о 18-кратном увеличении скорости для этого конкретного сценария.

 Blackwell Ultra DGX SuperPOD

Blackwell Ultra DGX SuperPOD

В домен NVLink можно подключить до 576 графических процессоров. Собственно, такую систему Nvidia тоже предложит — Blackwell Ultra DGX SuperPOD. Это кластер из восьми стоек NVL72, который включает 288 процессоров Grace, 576 чипов Blackwell Ultra, 300 Тбайт памяти HBM3e и FP4-производительность в 11,5 Экзафлопс.

Наконец, Nvidia представила систему HGX B300 NVL16 — решение для тех, кому вместо Arm-процессора Grace нужен чип на x86-совместимой архитектуре. В системе имеется 16 графических процессоров B300A, соединённые через NVLink, и центральные x86-процессоры. Nvidia не уточняет, какие именно CPU применены, но в прошлом использовались чипы как от AMD, так и от Intel.

Ускорители вычислений и системы на базе Blackwell Ultra появятся на рынке во второй половине текущего года. Их предложат все крупные производители серверов, а также новинки будут доступны у основных облачных провайдеров.

Санкции сократили объёмы поставок ускорителей Nvidia в Китае в два раза

В своём годовом отчёте в конце прошлого месяца Nvidia уже отмечала, что доля Китая и Гонконга в структуре общей выручки компании по сравнению с предыдущим годом снизилась с 17 до 13 %, но сумма этой выручки всё равно выросла на 66 %. На этой неделе финансовый директор компании заявила, что из-за санкций США количество отгружаемых в Китай ускорителей Nvidia сократилось вдвое.

Данные комментарии прозвучали из уст Колетт Кресс (Colette Kress) на технологической конференции Morgan Stanley. В текущем квартале, по её словам, объёмы поставок ускорителей Nvidia останутся примерно на таком уже уровне. Разработанные с учётом позапрошлогодних экспортных ограничений США ускорители H20 обеспечивают уровень быстродействия, позволяющий Nvidia конкурировать с китайскими разработчиками. Если опустить его ещё ниже, то поставки продукции Nvidia в Китай утратят особый смысл из-за роста конкуренции с китайскими игроками рынка, по словам Колетт Кресс. По сравнению с Blackwell, однако, H20 демонстрирует примерно в 25 раз более низкое быстродействие.

Как резюмировала представительница Nvidia, «H20 будет поставляться так долго, как этого потребует спрос, и по мере соответствия актуальным требованиям экспортного контроля». Напомним, что в январе администрация Байдена успела ввести новые ограничения на поставку ускорителей вычислений за пределы США с более серьёзной географической градацией и усиленной системой лицензирования поставок. Поскольку эти требования вступят в силу не ранее мая текущего года, а у власти в США сейчас находится Дональд Трамп (Donald Trump), руководство Nvidia не считает разумным строить какие-либо прогнозы на тему дальнейшего влияния санкций на свой бизнес.

Поступившие в продажу бракованные GeForce RTX 5080 оказались до 11 % медленнее нормальных

Игровые тесты YouTube-канала Gamers Nexus показали, что GeForce RTX 5080 с бракованным графическим процессором, у которого не хватает восьми блоков растеризации (ROP), теряет до 11 % производительность в играх с растровой графикой.

 Источник изображений: YouTube / Gamers Nexus

Источник изображений: YouTube / Gamers Nexus

Изначально Nvidia признала, что в продажу попало некоторое количество видеокарт GeForce RTX 5090(D), а также RTX 5070 Ti, оснащённых дефектными графическими процессорами, у которых оказалось на 8 блоков ROP меньше, чем положено по спецификации. У GeForce RTX 5090(D) их 168 вместо положенных 176, а у GeForce RTX 5070 Ti — 88 вместо необходимых 96. Nvidia заявила, что всего 0,5 % от попавших на рынок видеокарт GeForce RTX 50-й серии оказались оснащены бракованными GPU. Однако после появления первых сообщений от владельцев RTX 5080 о том, что у их карт тоже не хватает блоков (104 ROP вместо положенных 112), Nvidia признала проблемы с браком и у этой модели тоже. Таким образом, предыдущее официальное заявление Nvidia о 0,5 % бракованных карт может быть неточным.

 Потеря производительности в играх с разрешением 1440p

Потеря производительности в играх с разрешением 1440p

Тесты показали, что у GeForce RTX 5090(D) дефицит ROP приводит к снижению быстродействия на 5–8 %, а у RTX 5070 Ti в синтетических тестах производительность падает до 11 % (игровые тесты пока не проводились). YouTube-канал Gamers Nexus провёл тесты бракованной RTX 5080 и выяснил, что из-за нехватки ROP карта теряет от 0,1 до 11 % быстродействия в играх. Наибольшее падение производительности было отмечено в Total War: Warhammer 3. В Dying Light 2 просадка быстродействия оказалась до 8,7 %, а в Dragon’s Dogma 2 — до 4,9 %.

 Потеря производительности в играх с разрешением 4K

Потеря производительности в играх с разрешением 4K

Примечательно, что Nvidia не предпринимала никаких попыток сообщить, что некоторые экземпляры карт GeForce 50-й серии могут поставляться с бракованными GPU (они работают, но обеспечивают более низкую производительность). О факте производственного брака компания сказала только в комментариях для СМИ после выявления проблемы и не предоставила никакой информации о том, как можно заменить такую видеокарту. Похоже, компания решила переложить задачу по выявлению и обмену дефектных видеокарт на плечи их владельцев.

Gamers Nexus порекомендовал тем, кто приобрёл видеокарту из серии GeForce RTX 50-й серии, проверить её на наличие правильного количества блоков ROP. К сожалению, сделать это до покупки невозможно. Nvidia не сообщала ни номеров партий, ни серийных номеров, ни дат производства бракованных карт. Поэтому самый быстрый и простой способ — установка видеокарты в ПК, инсталляция драйвера и проверка с помощью утилиты GPU-Z.

Nvidia отчиталась о рухнувших продажах GeForce, но «удивительный» спрос на ИИ-чипы поднял прибыль на 80 %

Многие инвесторы ждали квартальной отчётности Nvidia с некоторой тревогой, поскольку к традиционному тезису о неизбежности снижения спроса на ускорители вычислений добавлялся фактор DeepSeek, теоретически работающий в том же направлении. В действительности же выручка Nvidia в прошлом квартале превзошла ожидания рынка, равно как и прогноз на текущий квартал.

 Источник изображений: Nvidia

Источник изображений: Nvidia

Хронологическая обособленность отчётного мероприятия Nvidia обусловлена тем, что в календаре компании четвёртый квартал 2025 фискального года завершился только 26 января текущего года. Более оптимистичная отчётность компании по сравнению с ожиданиями инвесторов не вызвала роста курсовой стоимости акций после закрытия торгов. Напротив, она снизилась на полтора процента, поскольку инвесторы поняли, что темпы роста выручки компании снижаются по сравнению с первыми двумя годами ИИ-бума.

Квартальная выручка Nvidia увеличилась в годовом сравнении на 78,8 % до $39,33 млрд, что выше ожидавшихся $38,05 млрд. Удельный доход на одну акцию достиг $0,89, что также выше прогнозной величины в $0,84. В текущем квартале компания рассчитывает выручить $43 млрд против ожидаемых инвесторами $41,78 млрд, данная величина будет соответствовать годовому росту на 65 %. Если учесть, что год назад подобный прирост достигал 262 %, это могло стать некоторым разочарованием для инвесторов.

Судя по заявлениям представителей Nvidia, проблемы с выпуском ускорителей Blackwell, которые наблюдались на старте, удалось решить, и в прошедшем квартале поставки данной продукции принесли компании $11 млрд выручки. Об их экспансии можно говорить, как о самой быстрой в истории компании, по словам финансового директора Колетт Кресс (Colette Kress). Больше всего ускорители Blackwell покупались провайдерами облачных услуг, клиенты такого класса обеспечили половину всей выручки серверного подразделения Nvidia.

В целом, направление центров обработки данных увеличило выручку Nvidia на 93 % до $35,6 млрд, что также превышает прогнозы инвесторов. Непосредственно поставки вычислительных средств в серверном сегменте увеличили выручку на 116 % до $32,6 млрд, а вот сетевые решения сократили её на 9 % до $3 млрд. Тем не менее, руководство Nvidia с гордостью отметило, что компоненты сетевой инфраструктуры проекта Stargate в США будут поставляться именно этой компанией. Рост выручки от поставок вычислительных решений для ЦОД в прошлом квартале был обусловлен не только высоким спросом на ускорители Blackwell, но и последовательным ростом спроса на ускорители H200 поколения Hopper. Направление ЦОД обеспечивает до 91 % всей выручки Nvidia, за два предыдущих года его выручка увеличилась примерно в десять раз.

Чистая прибыль Nvidia в прошлом квартале выросла на 80 % до $22,1 млрд. Норма прибыли сократилась с 76 до 73 %, но в компании объясняют это ростом затрат на экспансию ускорителей Blackwell, одновременно рассчитывая на улучшение прибыльности во втором полугодии. В прошлом же квартале операционные расходы выросли на 48 % до $4,7 млрд. Операционная прибыль при этом выросла на 77 % до $24 млрд.

Если в сфере вычислений и сетевых решений выручка Nvidia по итогам четвёртого квартала увеличилась на 101 % до $36 млрд, то поставки графических решений сократили профильную выручку на 22 % до $3,3 млрд. В игровом сегменте выручка компании упала на 11 % в годовом сравнении, и на 22 % последовательно, до $2,54 млрд. Финансовый директор компании подобную динамику объяснила дефицитом графических процессоров как поколения Blackwell, так и семейства Ada Lovelace. По итогам 2025 фискального года в целом игровая выручка выросла на 9 % до $11,35 млрд, во многом за счёт популярности видеокарт семейства GeForce RTX 40-й серии.

По итогам всего фискального года выручка Nvidia выросла на 114 % до $130,5 млрд, операционная прибыль выросла на 147 % до $81,5 млрд, чистая прибыль увеличилась на 145 % до $72,9 млрд, а норма прибыли поднялась с 72,7 до 75 %. По сути, замедление темпов роста финансовых показателей по итогам четвёртого квартала в отдельности и вызвало обеспокоенность отдельных инвесторов. В текущем календарном году выручка Nvidia должна заметно увеличиться, как заявил генеральный директор.

Руководство компании предсказуемо делало эмоциональные заявления, которые были направлены на переубеждение скептиков. Генеральный директор и основатель Nvidia Дженсен Хуанг (Jensen Huang) назвал спрос на Blackwell «удивительным». Финансовый директор компании добавила, что «языковые модели с рассуждением требуют в 100 раз больше вычислительных ресурсов». Хуанг присоединился в своих выражениях к этому тезису, традиционно усилив его прогнозом о предстоящем появлении ИИ-алгоритмов нового поколения, которые потребуют «в миллионы раз бόльших вычислительных ресурсов». Уже сейчас, по его словам, основная часть вычислительных нагрузок на инфраструктуру ИИ подразумевает функцию рассуждения.

Угрозу со стороны разрабатываемых облачными провайдерами собственных ускорителей глава Nvidia игнорирует. Как он убеждён, существование подобных чипов ещё не означает, что они в массовом порядке применяются.

По поводу влияния DeepSeek глава Nvidia повторился, что распространение подобных более эффективных моделей будет лишь способствовать увеличению спроса на ускорители вычислений. Прорыв DeepSeek он назвал «превосходной инновацией». Оценить потенциальное влияние таможенных тарифов США на бизнес Nvidia он не взялся. «ИИ продвигается вперёд со скоростью света», — подытожил свою оценку текущего состояния рынка Дженсен Хуанг.

Заказы Nvidia займут до 70 % всех мощностей TSMC по упаковке чипов методом CoWoS-L в этом году

Независимые аналитики уже отмечали, что заказы на изготовление чипов для ускорителей Nvidia в этом году потребуют использования 77 % всех доступных кремниевых пластин соответствующего класса. Тайваньские источники теперь добавляют, что эти же заказы загрузят около 70 % мощностей по тестированию и упаковке чипов с использованием передового метода CoWoS-L.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Данная технология упаковки требуется для производства чипов поколения Blackwell, лежащих в основе передовых ускорителей вычислений Nvidia, как напоминает Economic Daily News. В течение этого года TSMC будет ежеквартально увеличивать мощности по упаковке чипов этим методом на 20 % как минимум, что позволит по итогам года в целом выйти на обработку более 2 млн изделий такого типа. Кроме того, дополнительный спрос могут создать заказы со стороны участников инициативы Stargate в США, поскольку для развития национальной вычислительной структуры в этой стране тоже потребуется приличное количество ускорителей Nvidia.

Если в прошлом году услуги по упаковке чипов с использованием передовых методов обеспечивали 8 % всей выручки TSMC, то в этом они перевалят за 10 %, по мнению руководства компании. Экспансия производства ускорителей поколения Blackwell постепенно снизит потребность в представителях семейства Hopper (H100/H200), и новое поколение начнёт доминировать уже во втором полугодии.

В ближайшее время, как сообщается, TSMC приложит усилия к расширению восьми своих предприятий по упаковке чипов методом CoWoS. Среди них имеются и два предприятия, купленных у Innolux, на которых ранее выпускались панели для дисплеев. Кроме того, TSMC пока не определилась с местом строительства двух новых предприятий такого профиля. Как не устаёт отмечать руководство TSMC, даже существующие темпы расширения мощностей по упаковке чипов не позволяют покрыть имеющийся спрос на данные услуги. С конца прошлого года до конца следующего TSMC планирует увеличить мощности по упаковке чипов в три раза.

Феномен DeepSeek не заставит разработчиков ИИ тратить меньше денег на чипы Nvidia, считают эксперты

Откровения вокруг китайского стартапа DeepSeek, предположительно создавшего передовую языковую модель со значительно меньшими затратами по сравнению с западными конкурентами, заставил многих инвесторов понервничать. Представители Wedbush, однако, убеждены в готовности компаний и дальше тратить приличные деньги на ускорители Nvidia Blackwell.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Напомним, что тезис «ИИ-скептиков» в свете прорыва DeepSeek подразумевал, что способность разработчиков больших языковых моделей обходиться более слабыми аппаратными ресурсами снизит спрос на дорогое и передовое «железо» Nvidia. Аналитики Wedbush Securities убеждены, что этого не произойдёт. По итогам очередной регулярной поездки по Азии и общения с поставщиками электроники они утверждают, что никто из желающих развивать свою ИИ-инфраструктуру не намерен снижать темпы расширения профильных мощностей после шумихи вокруг DeepSeek.

В случае с продукцией Nvidia семейства Blackwell спрос всё равно продолжает сильно превышать предложение. «Никто из клиентов Nvidia не хочет потерять своё место в очереди за чипами этой марки следующего поколения», — поясняют авторы аналитической записки. По оценкам Wedbush, в текущем году от 10 до 15 % всех бюджетов компаний в сфере информационных технологий будут направляться на покрытие потребностей в сегменте ИИ. Капитальные затраты семи крупнейших компаний технологического сектора в совокупности могут вырасти примерно в полтора раза до $325 млрд. Многие компании в этом году только ускорят внедрение искусственного интеллекта, как утверждают представители Wedbush.

Вышли обзоры GeForce RTX 5080 — жалкий апгрейд по сравнению с GeForce RTX 4080

Завтра начнутся продажи старших видеокарт Nvidia нового поколения на архитектуре Blackwell. Обзоры флагманской GeForce RTX 5090 вышли в минувший четверг, а сегодня профильная пресса опубликовала результаты тестирования второй по старшинству видеокарты новой серии — GeForce RTX 5080.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Видеокарта GeForce RTX 5080 построена на графическом процессоре Nvidia GB203-400, который предлагает 10 752 ядра CUDA, 336 текстурных и 112 растровых блоков, а также 84 RT-ядра четвёртого поколения и 336 тензорных ядер пятого поколения. Базовая тактовая частота GPU у эталонной версии составляет 2300 МГц, а Boost-частота — 2620 МГц.

Графический ускоритель GeForce RTX 5080 получил 16 Гбайт видеопамяти GDDR7 со скоростью 30 Гбит/с и 256-битной шиной, что в итоге обеспечивает пропускную способность подсистемы памяти на уровне 960 Гбайт/с. Интересно, что память здесь более быстрая, чем у RTX 5090. Энергопотребление видеокарты составляет 360 Вт — весьма внушительный показатель, но в сравнении с флагманской RTX 5090 и её 575 Вт не так уж много.

Рекомендованная стоимость GeForce RTX 5080 составляет $999 — вдвое дешевле флагманской GeForce RTX 5090. Если сравнивать с предшественниками, то GeForce RTX 4080 в своё время вышла с рекомендованной ценой $1199, а её улучшенная версия GeForce RTX 4080 Super предлагалась за те же $999.

Тесты TechSpot показали, что новая GeForce RTX 5080 обеспечивает практически тот же уровень производительности, что и RTX 4080 Super. При традиционном рендеринге, без трассировки лучей, в разрешении Full HD (1920 × 1080) новинка и вовсе уступила предшественнице, тогда как в 1440p (2560 × 1440) и 4K (3840 × 2160) опередила её на 5–10 % в среднем. С трассировкой лучей ситуация изменилась незначительно, но в Full HD отставания уже нет.

Тесты портала TechPowerUp в целом подтвердили результаты коллег, хотя и показали чуть лучшую для RTX 5080 картину: новинка опередила RTX 4080 Super в среднем на 6 % в Full HD, на 9 % в 1440p и на 12 % в 4K. Схожие цифры приводит и немецкий портал ComputerBase. А вот если сравнивать с GeForce RTX 3080, то здесь разница уже очень заметна — около 37–43 %.

У GeForce RTX 5080 есть козырь в рукаве, которого нет у GeForce RTX 4080 Super и любой другой видеокарты прошлого поколения, — поддержка генерации нескольких кадров DLSS 4 MFG. Напомним, что видеокарты Blackwell способны генерировать с помощью ИИ до трёх дополнительных кадров на каждый отрисованный кадр. В свою очередь, карты прошлого поколения могут предложить генерацию лишь одного дополнительного кадра. Конечно, это значительно повышает FPS.

С генерацией множества кадров видеокарта заметно вырывается вперёд относительно RTX 4080 Super. В зависимости от сценария и игры новинка может обеспечить от двух до почти четырёхкратного прироста частоты кадров по сравнению с GeForce RTX 4080 Super. Обозреватели отмечают, что включение генерации кадров повышает задержку, но незначительно — примерно на 10 %. Динамичные игры, как отмечает ComputerBase, выигрывают от DLSS 4 MFG: на мониторе с высокой частотой обновления игра выглядит намного плавнее, чем при обычной генерации кадров. Однако в целом «настоящий» рендеринг без генерации с визуальной точки зрения выглядит лучше.

Что касается энергопотребления, то здесь без сюрпризов. В играх GeForce RTX 5080 Founders Edition потребляет 325 Вт, максимальное потребление составляет 375 Вт, а пиковое — 417 Вт. Это заметно выше показателей GeForce RTX 4080 и GeForce RTX 4080 Super.

В целом GeForce RTX 5080 — весьма достойная видеокарта, обеспечивающая очень высокую производительность в любой современной игре с максимальными настройками качества графики и трассировки лучей. Однако обозреватели сходятся во мнении, что GeForce RTX 5080 переоценена. Новая карта за $999 предлагает почти тот же уровень чистой производительности, что и предшественница за ту же цену полтора года назад.

«Видеокарта демонстрирует наименьший скачок в производительности по сравнению с предшественницей за всю историю GeForce 80-й серии, которая существует уже более двух десятилетий. Даже GeForce GTX 580 показала больший прирост по сравнению с GTX 480, несмотря на практически идентичный GPU», — подметили в ComputerBase.

Таким образом, покупка RTX 5080 имеет смысл в основном для владельцев видеокарт GeForce RTX 30-й серии и более старых моделей. Поддержка генерации нескольких кадров является скорее приятным бонусом — по крайней мере, на данный момент, поскольку DLSS 4 поддерживается всего в нескольких играх. Обладателям GeForce RTX 4080 и RTX 4080 Super беспокоиться о необходимости замены на новинку не стоит.

Кристалл графического процессора Blackwell GB202 из GeForce RTX 5090 показался на фото

В Сети появились фото кристалла флагманского графического процессора Nvidia GB202, который стал основой видеокарты GeForce RTX 5090. Схема, опубликованная в X пользователем Kurnal, демонстрирует расположение ключевых компонентов архитектуры Blackwell, включая кеш L2, графические кластеры (GPC), потоковые мультипроцессоры (SM), контроллеры памяти и другие элементы. Также было опубликовано сравнение размеров GB202 и AD102 — чипа предыдущего поколения, используемого в GeForce RTX 4090.

 Источник изображения: Kurnal/X

Источник изображения: Kurnal/X

На снимке кристалла GB202 можно увидеть, что кеш L2 расположен в центре чипа и разделён на блоки 2 Мбайт, который вместе образуют модули по 32 Мбайт. Вокруг кеша L2 размещены 12 графических процессорных кластеров. Каждый содержит несколько кластеров обработки текстур, отвечающих за затенение вершин, текстурирование и растеризацию. При этом, как пишет Tom's Hardware, внутри каждого кластера обработки текстур находятся потоковые процессоры, включающие ядра CUDA и кеш L1. А всего насчитывается 96 таких кластеров, каждый из которых содержит до четырёх потоковых мультипроцессоров.

 Источник изображения: Kurnal/X

Источник изображения: Kurnal/X

По периметру кеша L2 расположены 12 блоков растеризации и 3D-преобразования, которые преобразуют геометрическое представление сцены (например, полигоны) в изображение на экране. В центре кристалла GB202, от верхней точки до нижней, находятся видеокодеры и декодеры Nvidia (NVDEC и NVENC), обеспечивающие эффективное воспроизведение и запись видео.

Далее мы видим, что по обе стороны от кеша L2 расположены восемь 64-битных контроллеров памяти, а сверху, слева и справа от кристалла находятся 32-битные физические интерфейсы GDDR7, соединяющие графический процессор с модулями памяти GDDR7. В нижней части чипа расположены физический интерфейс PCIe 5.0 x16 и контроллер дисплея.

Если сравнивать размеры GB202 и AD102, то изображение наглядно демонстрирует внушительное отличие чипов друг от друга. Площадь кристалла GB202 составляет 761,56 мм², что на 24 % больше, чем у AD102 (616 мм²). И, так как Blackwell использует техпроцесс TSMC N4P, улучшенную версию N4, используемого в архитектуре Ada Lovelace, именно этим объясняется значительное увеличение физических размеров GB202 по сравнению с AD102.

 Источник изображения: Kurnal/X

Источник изображения: Kurnal/X

 Источник изображения: Kurnal/X

Источник изображения: Kurnal/X

Предполагается, что использование более современного техпроцесса TSMC 3N могло бы позволить создать чипы Blackwell с аналогичными размерами, что и у Ada Lovelace, но с улучшенными характеристиками производительности, однако эта информация, по словам Tom's Hardware, пока не подтверждена. Также стоит отметить, что вообще GB202 не является самым большим чипом, когда-либо созданным Nvidia — этот рекорд по-прежнему принадлежит архитектурам Hopper (GH100) и Volta (GV100), площадь которых составляет 814 мм² и 815 мм² соответственно.

Nvidia переведёт чипы Blackwell на улучшенную упаковку CoWoS-L — это сулит трудности для компании и партнёров

Уже второй год подряд посещая Китай и Тайвань в канун Нового года по китайскому лунному календарю, основатель и бессменный руководитель Nvidia Дженсен Хуанг (Jensen Huang) пояснил, что для производства передовых ускорителей вычислений семейства Blackwell будет востребована технология упаковки CoWoS-L, а от устаревающей CoWoS-S компания будет постепенно отходить. Возможно, такая миграция создаст определённые трудности в работе как самой Nvidia, так и её партнёров.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Как отмечает Reuters, глава Nvidia сделал следующие пояснения: «По мере перехода на Blackwell, мы будем в основном использовать CoWoS-L. Конечно, мы всё ещё производим Hopper, который будет использовать CoWoS-S. Мы также будем переводить связанные с CoWoS-S мощности на использование CoWoS-. По сути, главным преимуществом CoWoS-L является возможность объединить несколько кристаллов на одной подложке специальным высокоскоростным интерфейсом, и такая компоновка очень востребована в сегменте ускорителей вычислений. Другими словами, как добавил Хуанг, речь идёт не о снижении объёмов упаковки чипов в целом, а о переходе с CoWoS-S на CoWoS-L.

В любом случае, как признался глава Nvidia, сейчас компании и её партнёрам доступно в четыре раза больше мощностей по упаковке чипов, чем пару лет назад. По данным известных отраслевых аналитиков, Nvidia недавно пересмотрела свои перспективные производственные планы, отдав приоритет использованию упаковки CoWoS-L, которая применяется в сочетании с многокристальной упаковкой. Соответственно, однокристальные версии ускорителей семейства Blackwell были сняты с производства, и теперь все силы брошены на увеличение объёмов выпуска многокристальных версий, которым нужна упаковка CoWoS-L. Компания TSMC в этом контексте пострадает не так сильно, а вот некоторые поставщики обеих компаний окажутся в затруднительном положении из-за срочной перестройки цепочек поставок и производства.

ИИ, RT, производительность и не только: Nvidia раскрыла детали архитектуры Blackwell видеокарт GeForce RTX 5000

Компания Nvidia раскрыла больше подробностей о своей новой архитектуре графических процессоров Blackwell, которая стала основой для видеокарт GeForce RTX 50-й серии. Основные акценты были сделаны на нейронные вычисления, энергоэффективность и поддержку современных технологий, включая память GDDR7 и интерфейса PCIe 5.0, обеспечивающего максимальную пропускную способность.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Как сообщает Tom's Hardware, Nvidia обозначила на презентации главные ориентиры Blackwell — оптимизацию для нейронных вычислений, уменьшение объёма занимаемой памяти, новые возможности управления качеством обслуживания и повышение энергоэффективности. Однако радикальных изменений в архитектуре, по сравнению с предыдущими видеокартами серии GeForce RTX 40 на базе Ada Lovelace, не так много. Исключением стал флагман GeForce RTX 5090, который получил существенно увеличенный размер кристалла — 744 мм² против 608 мм² у GeForce RTX 4090, позволив тем самым реализовать дополнительные улучшения.

Тем не менее, произошли значительные изменения в рендеринге и поддержке новых интерфейсов. Четвёртое поколение RT-ядер Blackwell обеспечивает вдвое большую скорость пересечения лучей и треугольников по сравнению с архитектурой Ada Lovelace, что особенно важно для игр на движке Unreal Engine 5. Шейдеры GPU также были улучшены для работы с Neural Shaders. Кроме того, Blackwell станет первой серией видеокарт Nvidia с поддержкой DisplayPort 2.1 UHBR20 (80 Гбит/с) и PCIe 5.0, правда, пока не известно, распространяется ли это на все GPU Blackwell или только на флагманскую GeForce RTX 5090. Видеокодирование и декодирование также улучшены, включая поддержку потоков 4:2:2.

 Источник изображения: Nvidia

Источник изображения: Nvidia

В плане вычислительной мощности GeForce RTX 5090 получила увеличение в производительности до 27 % (1676 TFLOPS в формате FP8) по сравнению с GeForce RTX 4090, что хотя и значительно, но в глобальном плане не так существенно, как переход от GeForce RTX 3090 к GeForce RTX 4090, где улучшение составило 132 %. Аналогичный прирост наблюдается и в других показателях — 104,8 терафлопс FP32 против 82,6 у GeForce RTX 4090, и может говорить о том, что Nvidia сосредоточилась на более точечных улучшениях, нежели на кардинальной перестройке архитектуры.

Что касается памяти, Blackwell переходит на GDDR7, обеспечивая более высокую пропускную способность по сравнению с GDDR6 и GDDR6X, используемыми в предыдущих поколениях. Ожидается, что большинство видеокарт серии GeForce RTX 50 получат память с пропускной способностью 28 Гбит/с, а GeForce RTX 5080 — 30 Гбит/с. Флагман GeForce RTX 5090 выделился ещё больше — он получил 512-битную шину и 32 Гбайт памяти, обеспечив огромный прирост пропускной способности.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Ещё одним важным новшеством стал процессор управления ИИ (AI Management Processor). С его помощью GPU смогут эффективнее распределять ресурсы между различными задачами, такими как масштабирование изображения, генерация кадров и работа с нейронными текстурами. Это особенно актуально для игр, где активно используются технологии генеративного ИИ.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Также Blackwell улучшила управление энергопотреблением, позволяя быстрее переходить в спящий режим и выходить из него, снижая энергозатраты при низкой нагрузке. В целом, по мнению экспертов, архитектура Blackwell обещает заметный, но не революционный прирост производительности. Основные улучшения связаны с ИИ, нейронным рендерингом и энергоэффективностью. Ожидается, что GeForce RTX 5090 станет флагманом новой линейки, но её преимущества перед GeForce RTX 4090 будут наиболее заметны в задачах, связанных с искусственным интеллектом и нейронными технологиями.

Microsoft, Google и прочие урезали заказы на серверы с Nvidia Blackwell из-за перегрева и проблем с передачей данных

Злые языки, которые с середины прошлого года утверждали, что у серверных ускорителей вычислений Nvidia семейства Blackwell возникают то дефекты дизайна, то проблемы с перегревом, не успокоились и с наступлением января. Издание The Information заявило, что крупные клиенты Nvidia сокращают объёмы закупок серверных систем на базе Blackwell из-за проблем с перегревом.

 Источник изображения: Nvidia

Источник изображения: Nvidia

По данным источника, в серверных системах на базе Blackwell были обнаружены проблемы с перегревом и передачей информации между чипами из-за дефекта соединения. Соответственно, крупные покупатели таких систем в лице Microsoft, Amazon, Alphabet (Google) и Meta Platforms сократили количество заказанных серверных систем на базе чипов Nvidia GB200 относительно первоначальных планов. Представители перечисленных компаний своих комментариев Reuters на эту тему не предложили.

Каждая из этих компаний, по данным источника, первоначально потратила более $10 млрд на заказы, связанные с поставкой серверных систем на базе Blackwell. Теперь клиенты Nvidia предпочитают либо дождаться исправленных версий систем на базе Blackwell, либо согласны получить стойки на основе менее производительных ускорителей поколения Hopper.

На одной из своих площадок в Аризоне, как сообщается, Microsoft планировала установить не менее 50 000 ускорителей поколения Blackwell. Обслуживаемая ею OpenAI в итоге решила ограничиться ускорителями поколения Hopper, чтобы меньше страдать от вероятной задержки с поставками Blackwell. На фоне данных слухов акции Nvidia начали терять в цене до 4 %. Представители Google, на которых ссылается Seeking Alpha, задержку с поставками ускорителей Blackwell не подтвердили, а представители Nvidia от комментариев отказались.

Nvidia уже запустила массовое производство ИИ-ускорителей Blackwell, хотя слухи говорили о задержках и проблемах

Слухи о задержке начала массового производства серверных систем на базе ускорителей с архитектурой Blackwell преследовали Nvidia на протяжении основной части прошлого года, но на выставке CES 2025 основатель компании Дженсен Хуанг (Jensen Huang) заявил, что массовое производство Blackwell уже началось и уже около 15 поставщиков предлагают серверные системы на основе Blackwell в ассортименте из 200 конфигураций.

 Источник изображения: Nvidia

Источник изображения: Nvidia

«Полномасштабное производство Blackwell началось, невероятно, как это выглядит, но прежде всего, каждый провайдер облачных услуг сейчас располагает работоспособными системами»,заявил глава Nvidia на пресс-конференции, проходившей после его выступления на открытии CES 2025. Для производителей серверных систем освоение продуктов на базе Blackwell может представлять определённые трудности, поскольку уровень энергопотребления этих ускорителей значительно выше. Если стойка на базе Hopper потребляет 40 кВт, то вариант с 72 ускорителями Blackwell может требовать до 120 кВт.

«Мы сейчас располагаем системами от 15 производителей, которые выпускают около 200 различных конфигураций», — описал ситуацию с серийным производством ускорителей Blackwell генеральный директор Nvidia. По его словам, партнёры компании предлагают серверные системы на базе Blackwell с жидкостным или воздушным охлаждением, оснащаемые x86-совместимыми центральными процессорами или собственными чипами Nvidia семейства Grace с архитектурой Arm. Доступны стойки в конфигурациях NVL72×1 и NVL36×2, что подтверждает готовность Nvidia и её партнёров поставлять последние вопреки ранним слухам, говорившим об обратном.

Как пояснил глава Nvidia, серверные системы на базе Blackwell производятся с участием около 45 предприятий по всему миру, что показывает степень вовлечённости отрасли в развитие инфраструктуры систем искусственного интеллекта.

MSI представила свои версии GeForce RTX 5090, RTX 5080, RTX 5070 Ti и RTX 5070, включая новые Vanguard и лаконичные Inspire

Компания MSI представила видеокарты GeForce RTX 5090, GeForce RTX 5080, GeForce RTX 5070 Ti и GeForce RTX 5070 в своих фирменных исполнениях Suprim, Suprim Liquid, Vanguard, Gaming Trio, Ventus 3X и Inspire.

 Источник изображений: MSI

Источник изображений: MSI

Модели серии MSI Suprim Liquid оснащены необслуживаемой системой жидкостного охлаждения. В её состав входит внешний радиатор типоразмера 360 мм. Эффективное рассеивание тепла обеспечивают новые вентиляторы Stormforce. В составе системы также используется водоблок с ребристым медным основанием и специальным водоотводом (только у модели RTX 5090) для охлаждения GPU и чипов памяти.

Визуально серия Suprim с воздушным охлаждением изменилась незначительно по сравнению с предыдущей итерацией. В систему охлаждения входят испарительная камера, массивный радиатор и три вентилятора Stormforce. По заявлению производителя, эти вентиляторы обеспечивают на 14,7 % более эффективный воздушный поток к компонентам видеокарты и до 37,1 % эффективнее рассеивают тепло.

Серия MSI Vanguard предлагает совершенно новый дизайн, ранее не представленный у производителя. Он сочетает систему охлаждения Hyper Frozr с новейшими семилопастными вентиляторами Stormforce и усовершенствованной испарительной камерой для более эффективного отвода тепла. Производитель отмечает, что карты в исполнении MSI Vanguard выполнены в футуристичном стиле космического корабля и обильно оснащены RGB-подсветкой.

Ставшая классикой серия Gaming Trio сочетает дизайн системы охлаждения Tri Frozr 4 с вентиляторами Stormforce, текстурированными лопастями, никелированной медной опорной пластиной и технологиями улучшения воздушного потока, такими как Wave Curved 4.0 и Air Antegrade Fin 2.0 (используемыми и в других представленных картах MSI), для эффективного охлаждения и бесшумной работы.

Серия Ventus предлагает оптимальный баланс между производительностью и доступностью. Карты GeForce RTX 50-й серии в этом исполнении оснащены системами охлаждения с тремя вентиляторами TORX Fan 5.0. Модели GeForce RTX 5080, RTX 5070 Ti и RTX 5070 в этой серии соответствуют концепции SFF-Ready, предполагающей использование мощных видеокарт в компактных ПК.

Серия Inspire отличается строгим внешним видом, вдохновлённым картиной 1918 года голландского художника Пита Мондриана (Pieter Cornelis Mondriaan). Производитель позиционирует новинку как решение для творческих и профессиональных пользователей.

В составе системы охлаждения видеокарт Inspire используются высокоэффективные вентиляторы Stormforce и никелированное медное основание радиатора. В этом исполнении будут выпускаться модели GeForce RTX 5080, RTX 5070 Ti и RTX 5070, которые также соответствуют концепции SFF-Ready.

Asus показала огромную GeForce RTX 5090 Astral с вентилятором на изнанке и ещё 23 видеокарты GeForce RTX 50-й серии

Компания Asus готовит к выпуску в общей сложности 24 варианта видеокарт GeForce RTX 5090, RTX 5080, RTX 5070 Ti и RTX 5070. Новинки будут представлены в составе уже известных фирменных серий производителя ROG Strix, Prime и TUF, а также в совершенно новом исполнении Astral.

 Источник изображений: VideoCardz / Asus

Источник изображений: VideoCardz / Asus

Серия ROG Astral станет флагманской у производителя. Карты этой серии будут предлагаться как с воздушной, так и с жидкостной системой охлаждения. При этом воздушная система охлаждения включает использование четырёх вентиляторов: три расположены на фронтальной стороне карты, а один — на тыльной.

В составе систем охлаждения ROG Astral возвращена запатентованная технология испарительной камеры Asus с фрезерованными дорожками. Такая конструкция позволяет интегрировать радиаторы непосредственно в поверхность камеры без плоских краёв.

В версиях с воздушным охлаждением карты ROG Astral будут иметь толщину в четыре слота расширения. Новая система охлаждения обеспечит до 20 % более эффективное охлаждение по сравнению с системами охлаждения, использующими три вентилятора. В рамках серии ROG Astral будут выпускаться только модели RTX 5090 и RTX 5080.

Версии ROG Astral Liquid Cooled (LC) оснащены необслуживаемой системой жидкостного охлаждения с массивным внешним радиатором типоразмера 360 мм. Компания утверждает, что такое решение обеспечивает на 30 % более эффективное охлаждение по сравнению с воздушным.

Оба варианта (с воздушным охлаждением и СЖО) предполагают использование одной и той же печатной платы, так как производитель упоминает наличие 80-амперной конструкции системы питания для обоих. Однако карты рассчитаны на разную аудиторию энтузиастов.

Модель с жидкостным охлаждением также включает в себя полноценную охлаждающую пластину, которая отводит тепло от графического процессора и чипов памяти.

В рамках серии ROG Strix будут выпускаться только модели GeForce RTX 5070 Ti и RTX 5070. Это говорит о том, что дизайн Astral фактически заменил Strix в сегменте ультра-high-end. Аналогично модель RTX 5090 не будет представлена в серии Prime. В свою очередь серия TUF охватит весь сегмент видеокарт GeForce RTX 50-й серии.

Одной из примечательных особенностей видеокарт GeForce RTX 50-й серии является использование для GPU термопрокладок с фазовым переходом. Такая же технология будет применяться и в видеокартах серии Radeon RX 9070 от AMD.

Asus пока не раскрыла технические характеристики представленных новинок и не сообщила их цены.

Nvidia представила настольный ИИ-суперкомпьютер Project Digits на суперчипе Grace Blackwell за $3000

Nvidia представила персональный ИИ-суперкомпьютер. В мае этого года компания начнёт продажи системы под названием Project Digits, в основе которой лежит новый суперчип GB10 Grace Blackwell. Он обладает достаточной вычислительной мощностью для запуска сложных моделей ИИ (LLM) и при этом достаточно компактен, чтобы поместиться на столе и работать от стандартной розетки. Ранее для такой вычислительной мощности требовались гораздо более крупные и энергоёмкие системы.

 Источник изображений: Nvidia

Источник изображений: Nvidia

«ИИ станет основным в каждом приложении для каждой отрасли. Благодаря Project Digits суперчип Grace Blackwell станет доступен миллионам разработчиков, — заявил генеральный директор Nvidia Дженсен Хуанг (Jensen Huang). — Размещение суперкомпьютера ИИ на столах каждого специалиста по обработке данных, исследователя ИИ и студента даст им возможность участвовать в формировании эпохи ИИ».

Система Project Digits, размером с традиционный настольный мини-ПК вроде Mac mini, может работать с моделями ИИ, содержащими до 200 миллиардов параметров, а её стартовая цена составляет 3000 долларов. Для ещё более требовательных приложений две системы Project Digits могут быть объединены для работы с моделями, содержащими до 405 миллиардов параметров (лучшая модель Meta, Llama 3.1, как раз имеет 405 миллиардов параметров).

Чип GB10 Grace Blackwell обеспечивает производительность до 1 петафлопа с точностью FP4, то есть он способен выполнять 1 квадриллион операций в секунду для обучения и запуска ИИ-моделей. Система оснащена графическим процессором с ядрами Nvidia CUDA последнего поколения и тензорными ядрами пятого поколения. Он подключён через NVLink-C2C к центральному процессору Grace с 20 энергоэффективными ядрами на архитектуре Arm. В разработке GB10 участвовала компания MediaTek, помогая оптимизировать энергоэффективность и производительность. Каждая система оснащается 128 Гбайт унифицированной когерентной оперативной памяти и до 4 Тбайт NVMe-накопителя.

Пользователи также получат доступ к библиотеке программного обеспечения Nvidia для ИИ, включая наборы для разработки, инструменты оркестрации и предварительно обученные модели, доступные в каталоге Nvidia NGC. Система работает на базе Linux Nvidia DGX OS и поддерживает такие популярные фреймворки, как PyTorch, Python и Jupyter Notebooks. Разработчики могут настраивать модели с помощью фреймворка Nvidia NeMo и ускорять рабочие процессы в области науки о данных с помощью библиотек Nvidia RAPIDS.

Пользователи могут разрабатывать и тестировать свои модели ИИ локально на Project Digits, а затем развёртывать их в облачных сервисах или инфраструктуре центров обработки данных, которые используют ту же архитектуру Grace Blackwell и программную платформу Nvidia AI Enterprise.

Заметим, что это далеко не первый «потребительский» ИИ-суперкомпьютер Nvidia. В декабре компания анонсировала версию своего компьютера Jetson за 249 долларов для приложений ИИ, ориентированную на любителей и стартапы, под названием Jetson Orin Nano Super, который способен справляться с LLM до 8 миллиардов параметров.


window-new
Soft
Hard
Тренды 🔥
Amazon включилась в борьбу за американский бизнес TikTok 2 мин.
«Яндекс» представил «Нейроэксперта» — ИИ, который соберёт базу знаний по ссылкам и файлам пользователя 2 ч.
«Хуже моего самого страшного кошмара»: утечка геймплея с тестирования новой The Sims ужаснула фанатов 2 ч.
Самые полные издания Borderlands 3 и Diablo III добавят в Game Pass, а лучшая игра 2024 года по версии 3DNews подписку скоро покинет 13 ч.
«Эпический» сериал Netflix по Assassin’s Creed впервые за несколько лет подал признаки жизни 14 ч.
Спустя 10 лет после релиза Enter the Gungeon получит «крупнокалиберный сиквел» — первый трейлер и подробности Enter the Gungeon 2 16 ч.
«Наш контент бесплатный, а инфраструктура — нет»: ИИ-боты разоряют «Википедию» 17 ч.
Nintendo поднимет цены на игры раньше Take-Two с GTA VI — Mario Kart World для Switch 2 будет стоить $80 в «цифре» и $90 в рознице 17 ч.
Роскомнадзор наделил себя правом собирать IP-адреса россиян 17 ч.
«Торт не был ложью!»: Nintendo подтвердила релиз Hollow Knight: Silksong в 2025 году и показала 5 секунд геймплея 18 ч.
Российского инженеры начали судить за кражу секретных технологий ASML для запуска производства чипов в России 3 мин.
Самый опасный в истории наблюдений астероид теперь угрожает Луне, а не Земле 23 мин.
Apple, Nvidia и Amazon под ударом: трампоские пошлины полностью перекроят технологическую отрасль 27 мин.
Российская WildTeam выступила генеральным проектировщиком ЦОД общей ёмкостью 350 МВт 35 мин.
Смартфон Poco M7 Pro 5G с чипом Dimensity 7025-Ultra поступил в глобальную продажу 2 ч.
Названа дата запуска первой партии интернет-спутников Amazon Project Kuiper — они полетят на ракете с российскими двигателями 2 ч.
Samsung резко нарастила поставки чипов в Китай, пока этому не мешают санкции 2 ч.
Western Digital выпустила HDD серии Purple Pro ёмкостью 26 Тбайт для систем видеонаблюдения 3 ч.
Китай увеличил закупки ИИ-чипов Nvidia в четыре раза — до $16 млрд за первый квартал 5 ч.
Акции Tesla отыграли потери на слухах об уходе Илона Маска из правительства США 6 ч.