Сегодня 18 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → blackwell
Быстрый переход

Nvidia похвалилась, что Blackwell удешевили инференс нейросетей до 10 раз — и это заслуга не только «железа»

С развёртыванием ускорителей искусственного интеллекта на архитектуре Nvidia Blackwell стоимость инференса, то есть запуска обученных систем ИИ, удалось сократить в 4–10 раз. Такие данные привела сама Nvidia. Но за счёт одной только аппаратной части добиться подобных результатов не получилось бы.

 Источник изображений: nvidia.com

Источник изображений: nvidia.com

Значительного снижения затрат удалось добиться за счёт запуска ускорителей на архитектуре Nvidia Blackwell и моделей с открытым исходным кодом в инфраструктуре облачных операторов Baseten, DeepInfra, Fireworks AI и Together AI для задач, связанных со здравоохранением, играми, агентским ИИ и обслуживанием клиентов. Ещё один фактор — оптимизированные программные стеки. Перевод оборудования на Nvidia Blackwell помог сократить стоимость инференса вдвое по сравнению с ускорителями предыдущего поколения, а дальнейшему снижению затрат способствовал перевод систем в форматы пониженной точности, такие как NVFP4.

Компания Sully.ai добилась сокращения затрат на вывод данных ИИ в области здравоохранения на 90 %, то есть в десять раз; время отклика улучшилось на 65 % за счёт перехода от закрытых к открытым моделям ИИ в инфраструктуре Baseten. Автоматизация задач по написанию кода и ведению медицинских записей помогла сэкономить специалистам 30 млн минут рабочего времени. Latitude на своей платформе AI Dungeon сократила затраты на вывод данных ИИ в четыре раза. Для этого она запустила в инфраструктуре DeepInfra модели с конфигурацией «смеси экспертов» (MoE), снизив стоимость 1 млн токенов с $0,20 до $0,10, а перевод системы на низкоточный формат данных NVFP4 помог сократить цену до $0,05.

Sentient Foundation повысила экономическую эффективность платформы агентного чата на 25–50 % за счёт оптимизированного для Blackwell стека обработки данных Fireworks AI — платформа управления сложными рабочими процессами в неделю вирусного запуска обработала 5,6 млн запросов без ущерба для величины задержки. Decagon шестикратно снизила затраты на запрос для голосовой поддержки клиентов с ИИ, запустив многомодельный стек в инфраструктуре Together AI на ускорителях Blackwell. Время ответа сохранялось менее 400 мс даже при обработке нескольких тысяч токенов на запрос, что критически важно при голосовом взаимодействии, когда клиенты в любой момент могут прервать разговор.

Значение имеют характеристики рабочей нагрузки. ИИ-ускорители Blackwell успешно работают с «рассуждающими» ИИ-моделями, потому что для получения более качественных ответов те генерируют большее число токенов. Платформы эффективно обрабатывают эти расширенные последовательности за счёт дезагрегированного обслуживания — отдельной обработки предварительного заполнения контекста и собственно генерации токенов. При оценке затрат эти аспекты следует учитывать: при высоких объёмах генерации токенов можно добиться десятикратного повышения эффективности; уменьшенная генерация токенов в моделях высокой плотности ведёт лишь к четырёхкратному росту показателей.

В приведённых выше примерах речь идёт об ускорителях Nvidia Blackwell, но есть и альтернативные способы снижения затрат на вывод данных. Например, перевод систем на ускорители AMD Instinct MI300, Google TPU, а также специализированное оборудование Groq и Cerebras. Собственные средства оптимизации развёртывают и облачные провайдеры. Поэтому вопрос не в том, является ли архитектура Blackwell единственным вариантом, а в том, соответствует ли конкретное сочетание оборудования, ПО и моделей ИИ требованиям конкретной рабочей нагрузки.

Новых GeForce RTX пока не будет, — а заодно Nvidia сократит выпуск существующих видеокарт на 30–40 %

Бум систем ИИ вызвал не только дефицит памяти, но и высокий спрос на ускорители вычислений Nvidia, поэтому для этой компании выгоднее сосредоточиться именно на последней категории продукции. Как отмечает The Information со ссылкой на собственные источники, впервые в своей новейшей истории Nvidia может пережить текущий год без анонса новых моделей игровых видеокарт.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Существующие квоты на микросхемы памяти Nvidia намеревается использовать для комплектации востребованных и более прибыльных ускорителей вычислений. Долгое время Nvidia считалась поставщиком игровых решений, но на фоне бума ИИ её приоритеты могли измениться, даже если руководство публично будет настаивать на обратном. Некоторые источники даже сообщают, что и объёмы выпуска игровых видеокарт существующего поколения (GeForce RTX 50) сокращаются из-за дефицита памяти. Нехватка самих видеокарт уже вызвала рост розничных цен по всему миру.

Представители Nvidia прокомментировали эту публикацию The Information лишь дежурной фразой о том, что спрос на видеокарты GeForce RTX остаётся высоким, а доступность памяти ограничена. Поставки видеокарт данного семейства продолжаются, а с производителями памяти компания старается работать над улучшением ситуации с доступностью компонентов.

По неофициальным данным, первоначально Nvidia в этом году планировала представить обновлённое семейство видеокарт с условным обозначением Kicker, чьи характеристики незначительно бы превосходили GeForce RTX 50, и разработка нового семейства фактически завершена. В декабре руководство компании якобы заявило заинтересованным специалистам, что вывод Kicker на рынок отложен на неопределённый срок. Имеющуюся в условиях дефицита память решено было направить на удовлетворение спроса в серверном сегменте.

Скорее всего, анонс более серьёзно обновлённого семейства видеокарт GeForce RTX 60 с архитектурой Rubin, который был запланирован на конец следующего года, тоже будет сдвинут «вправо». В серверном сегменте ускорители с архитектурой Rubin уже выпускаются, они будут доступны клиентам Nvidia со второй половины текущего года. За первые девять месяцев прошлого фискального года игровая выручка компании составляла лишь 8 % от совокупной, хотя до выхода ChatGPT осенью 2022 года эта доля достигала 35 %. Кроме того, на ускорителях вычислений Nvidia зарабатывает гораздо больше (до 65 %), чем на игровых видеокартах в удельном измерении (лишь 40 %).

Глава Gigabyte объяснил, почему Nvidia выгоднее производить одни варианты RTX 50 в ущерб другим

Главный редактор портала Tom's Hardware Пол Алкорн (Paul Alcorn) пообщался на выставке CES 2026 с генеральным директором Gigabyte Эдди Лином (Eddie Lin). В разговоре Лин предположил, что Nvidia будет отдавать приоритет определённым моделям видеокарт GeForce RTX 5000, основываясь на довольно простом расчёте. Если это действительно так, то в этом году рынок может ожидать дефицит некоторых вариантов GeForce RTX 50-й серии.

 Источник изображения: Gigabyte

Источник изображения: Gigabyte

Лин описал возможную стратегию Nvidia по распределению производства графических процессоров в рамках игровой серии Blackwell, которая фокусируется на максимизации прибыли с учётом ограниченных поставок чипов памяти для потребительского сегмента видеокарт.

«Они не могут производить только высокопроизводительные или низкопроизводительные [продукты]. Например, у них есть пять сегментов видеокарт. Они фокусируются на первом, третьем и пятом сегментах, снижая в процентном соотношении выпуск второго и четвёртого сегмента, потому второй и четвёртый сегмент приносят меньше выручки в расчёте на один гигабайт используемой памяти. Они будут рассчитывать, какой вклад в выручку [каждый сегмент] вносит в расчёте на гигабайт памяти», — сказал Лин.

Он привёл пример условной видеокарты стоимостью $300 (например, та же RTX 5060). Доход с неё, по словам Лина, составит «$35 за каждый гигабайт». Если же взять видеокарту за $400, оснащённую 8 Гбайт памяти, то доход с каждого гигабайта памяти составит $50. Для видеокарты за $500 долларов с 16 Гбайт памяти доход составит всего $32 доллара за один гигабайт памяти, то есть вклад этой карты в общую выручку будет минимальным из трёх.

В разговоре с Tom's Hardware Лин заявил, что Gigabyte продолжает получать от Nvidia не только графические процессоры, но и чипы памяти. Ранее появились слухи о том, что Nvidia перестала поставлять комплекты GPU и чипов памяти своим OEM-партнёрам, что может создать серьёзные проблемы для более мелких производителей, поскольку им в таком случае придётся покупать чипы памяти на открытом рынке. Tom's Hardware отмечает, что другие OEM-производители могут быть связаны другими соглашениями и условиями с Nvidia, но на данный момент нет подтверждений от поставщиков видеокарт о том, что Nvidia больше не поставляет память в комплектах.

Используя модель Лина, Tom's Hardware создал таблицу, которая позволяет понять, какие видеокарты, скорее всего, будут иметь приоритет в производстве, а какие — будут производиться в 2026 году по остаточному принципу.

 Источник изображения: Tom's Hardware

Источник изображения: Tom's Hardware

В нижнем ценовом сегменте рынка модель RTX 5060 Ti 8GB приносит $47,38 выручки на гигабайт памяти GDDR7 по сравнению с $37,38 у менее производительной RTX 5060 с тем же объёмом памяти, что означает, что RTX 5060 Ti 8GB, вероятно, будет иметь приоритет при распределении производства, несмотря на крайне слабый интерес потребителей к этой модели. Модель RTX 5060 Ti 16GB является наиболее уязвимой картой из всей группы по этому показателю, поскольку из-за своей рекомендованной розничной цены и большего объёма видеопамяти она приносит всего $26,81 выручки на гигабайт GDDR7 — это самый низкий показатель среди всех карт серии RTX 50.

В верхнем ценовом сегменте модели RTX 5070 и RTX 5070 Ti приносят одинаковую выручку за гигабайт используемой памяти, что означает, что более дешёвая в производстве RTX 5070, вероятно, будет предпочтительнее версии Ti (которая использует более крупный и энергоёмкий графический процессор и более сложную конструкцию платы). Или же обе карты по приоритету производства окажутся ниже более прибыльной RTX 5060 Ti 8GB.

В верхнем сегменте модели RTX 5080 и RTX 5090 приносят почти одинаковый размер выручки в пересчёте на гигабайт видеопамяти, что означает, что RTX 5080, вероятно, получит приоритет при распределении 2-гигабайтных чипов GDDR7 в будущем из-за меньшего размера графического процессора (вдвое меньше, чем у RTX 5090) и гораздо менее сложной конструкции платы. Старшая карта оснащается 32 Гбайт памяти. Это означает, можно выпустить две более простые по схемотехнике 16-гигабайтные RTX 5080, что одновременно позволило бы увеличить объём предложений для более ходовой модели и, возможно, привело бы к увеличению прибыли.

Модели RTX 5090 и RTX Pro 6000 Blackwell используют один и тот же графический процессор GB202 (хотя и с разным количеством SM-блоков), но даже с 96 Гбайт памяти GDDR7 на борту RTX Pro 6000 приносит на целых 41 % больше выручки на каждый гигабайт используемой памяти GDDR7 по сравнению с RTX 5090.

Здесь важно отметить, что в составе RTX Pro 6000 использует 3-гигабайтные чипы GDDR7, распаянные с обеих сторон платы видеокарты для достижения общей ёмкости в 96 Гбайт, а не 2-гигабайные микросхемы, которые у RTX 5090 находятся на одной стороне платы, поэтому это не совсем корректное сравнение. И всё же это может объяснить, почему Nvidia, скорее всего, не просто перенесла запуск обновлённых моделей видеокарт RTX 50 Super, а отказалась от их выпуска. Маржа, обеспечиваемая использованием 3-гигабайтных чипов в продуктах RTX Pro гораздо привлекательнее, чем могла бы быть для GeForce RTX, которые, предположительно, продавались бы по ценам, близким к ценам на карты без приставки Super на момент их запуска.

Портал Tom’s Hardware ожидает, что в перспективе модели RTX 5060 Ti 8GB, RTX 5070 и RTX 5080 будут относительно более доступными в продаже, в то время как популярные среди энтузиастов модели RTX 5060 Ti 16GB и RTX 5070 Ti окажутся в дефиците. Ситуация с RTX 5090 также очевидна. Количество предложений даже в интернет-магазинах резко сокращаются, а цены на эти модели быстро растут.

Китайские власти ещё не разрешили местным разработчикам закупку Nvidia H200, но уже интересуются, потребуется ли им Blackwell

Накануне уже сообщалось, что китайские таможенные органы пока не готовы разрешить массовый ввоз в страну ускорителей Nvidia H200, поставки которых номинально одобрила американская сторона. Изданию Nikkei Asian Review удалось выяснить другие подробности условий, на которых импорт ускорителей Nvidia может быть разрешён в Китай.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Во-первых, окончательные правила пока не сформулированы, и в ходе работы над ними власти КНР стараются консультироваться с конечными пользователями подобных ускорителей вычислений. В частности, чиновники пытаются понять, насколько критичен для китайских разработчиков доступ к импортным ускорителям, и насколько эффективными могут быть отечественные аналоги. Предполагается, что при работе с инференсом и развёртывании инфраструктуры под уже обученные языковые модели вполне достаточными будут характеристики ускорителей китайского производства. В подобных случаях разработчикам предстоит обосновать свою потребность в импортных ускорителях.

Во-вторых, ожидается, что разрешение на поставку первой немногочисленной партии H200 в Китай будет получено от местных властей в конце текущего месяца, но чиновники могут ограничить количество доступных ускорителей для каждой из нуждающихся компаний. Другой вариант схемы импорта ИИ-чипов в Китай предусматривает определённую пропорцию зарубежных ускорителей и выпускаемых местными компаниями. В этом случае закупающие импортные решения китайские разработчики будут обязаны в нагрузку приобрести некоторое количество местных ускорителей.

Самое интересное, что китайские чиновники в общении с технологическими компаниями Поднебесной начали изучать потенциальный спрос на ускорители Nvidia поколения Blackwell, которые эта компания надеялась поставить в Китай ещё летом прошлого года, но русло переговоров с властями США привело к разрешению на поставки ускорителей H200 с более зрелой архитектурой Hopper. Напомним, недавно глава Nvidia Дженсен Хуанг (Jensen Huang) заявил, что хотел бы наладить поставки в Китай не только ускорителей Blackwell, но и следующих за ними Rubin. Правда, это станет возможным только при условии, что клиентам в США к тому времени будут доступны более совершенные ускорители.

Дженсен Хуанг показал ускорители Rubin на CES 2026 — их массовое производство уже запущено

Вполне предсказуемо, что основатель и генеральный директор Nvidia Дженсен Хуанг (Jensen Huang) трибуну CES 2026 использовал не только для рассказа о новейших продуктах и технологиях компании, но и для убеждения инвесторов в том, что ИИ-пузырь далёк от схлопывания. Одним из аргументов стала демонстрация образцов ускорителей с архитектурой Rubin.

 Источник изображения: Nikkei Asian Review

Источник изображения: Nikkei Asian Review

Они выйдут на рынок в этом году, во второй его половине, но глава Nvidia подчеркнул, что их производство уже идёт полным ходом. Архитектура Rubin является преемником весьма успешной Blackwell, и Nvidia не скрывает, что связывает с ней особые надежды. Отвечая на вопросы аудитории на CES 2026, основатель компании пояснил: «Мы попытаемся наращивать поставки изо всех сил. Во втором полугодии мы будет продавать много, поставлять много (ускорителей Rubin)». По сравнению с Blackwell, ускорители Rubin обеспечат рост производительности в инференсе в пять раз, а также в три с половиной раза в обучении языковых моделей. В обеих сферах удельная стоимость генерируемого токена сократится в десять раз по сравнению с Blackwell, поэтому разработчикам будет выгодно переходить на Rubin даже в том случае, если новые ускорители окажутся заметно дороже старых.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Непосредственно графические процессоры поколения Rubin станут первыми продуктами Nvidia с памятью типа HBM4, которая обеспечит скорость передачи информации до 22 терабайт в секунду. Одними из первых клиентов Nvidia, получивших ускорители Rubin во втором полугодии, станут облачные провайдеры CoreWeave и Microsoft Azure. Образцы ускорителей Rubin уже вовсю тестируются клиентами Nvidia.

В одной серверной стойке могут объединяться до 72 графических процессоров Rubin и 36 центральных процессоров Vera. В одном вычислительном кластере могут объединяться до 1000 чипов Rubin, эффективность обмена данными между ними будет во многом определяться новыми сетевыми интерфейсами, которые были представлены параллельно. При работе в инференсе с форматом данных NVFP4, который Nvidia будет продвигать, ускорители Rubin обеспечивают быстродействие на уровне 50 петафлопс. Кратное повышение производительности и эффективности вычислений по сравнению с Blackwell было достигнуто при всего лишь 1,6-кратном увеличении количества транзисторов на чипе.

Gigabyte выпустила GeForce RTX 5070 Ti WindForce OC V2 — меньше первой версии и без сомнительного термогеля

Компания Gigabyte представила новую версию GeForce RTX 5070 Ti WindForce OC V2 16G (модель GV-N507TWF3OCV2-16GD). Новинка отличается от оригинальной модели WindForce OC размерами, а также изменениями в конструкции системы охлаждения.

 Источник изображений: VideoCardz / Gigabyte

Источник изображений: VideoCardz / Gigabyte

GeForce RTX 5070 Ti WindForce OC V2 16G предлагает те же заводские настройки разгона для GPU (Boost-частота 2497 МГц), что и существующая модель WindForce OC SFF для компактных ПК, а также оснащена 16 Гбайт памяти GDDR7 со скоростью 28 Гбит/с на контакт и поддержкой 256-битной шины.

 Gigabyte GeForce RTX 5070 Ti WindForce V2

Gigabyte GeForce RTX 5070 Ti WindForce V2

 оригинальная Gigabyte GeForce RTX 5070 Ti WindForce

оригинальная Gigabyte GeForce RTX 5070 Ti WindForce

В описании модели V2 говорится, что карта оснащена тремя 80-мм вентиляторами и восемью композитными теплотрубками, а её радиатор имеет медную основу. Характеристики также подтверждают, что карта сохранила толщину оригинальной модели (50 мм) и ту же высоту (126 мм), однако версия V2 стала значительно короче. Её длина составляет 261 мм против 304 мм у оригинальной модели WindForce OC.

 Gigabyte GeForce RTX 5070 Ti WindForce V2

Gigabyte GeForce RTX 5070 Ti WindForce V2

Примечательно, что нигде в описании GeForce RTX 5070 Ti WindForce OC V2 16G не упоминается использование «термогеля серверного уровня» в качестве термоинтерфейса, который присутствует у других моделей видеокарт RTX 50 от Gigabyte. Например, на странице модели GeForce RTX 5070 Ti WindForce OC SFF есть упоминание термогеля.

 оригинальная Gigabyte GeForce RTX 5070 Ti WindForce

оригинальная Gigabyte GeForce RTX 5070 Ti WindForce

Ранее сообщалось, что некоторые пользователи столкнулись с вытеканием термогеля из видеокарт Gigabyte. Компания признала проблему, сообщив, что в первых партиях ускорителей было нанесено избыточное количество термогеля, и пообещала пересмотреть объём термоинтерфейса в последующих партиях. Более того, сам по себе термогель оказался менее эффективен в охлаждении по сравнению с обычными термопрокладками, что было показано на примере видеокарты Gigabyte Aorus Radeon RX 9070 XT Elite 16G.

Китайская Tencent получила доступ к 15 000 санкционных ИИ-чипов Nvidia Blackwell через Японию

Не секрет, что нуждающиеся в доступе к передовым ускорителям вычислений западного производства китайские компании прибегают к аренде зарубежных облачных мощностей, чтобы избежать полного влияния американских санкций. Один из японских владельцев ЦОД на контрактах с китайской Tencent по этой схеме смог получить контракты на более чем $1,2 млрд.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Как поясняет Financial Times, китайский гигант взаимодействует с японской Datasection через посредника, стараясь не слишком афишировать подобное сотрудничество, но эта схеме позволяет Tencent использовать основную часть из 15 000 ускорителей Nvidia с архитектурой Blackwell, которые установлены в ЦОД первой из компаний на территории Японии. В таком варианте доступа к вычислительным мощностям со стороны китайского разработчика нет ничего противозаконного, поскольку при Трампе власти США начали закрывать на такие проявления деятельности китайских компаний глаза. Тем не менее, лишнее внимание способно вызвать изменения в обстановке, которые для Tencent нежелательны.

Характерно, что контракт с Tencent превратил Datasection в одного из крупнейших провайдеров на рынке «neocloud» в Азии, которые зарабатывают на аренде имеющихся у них вычислительных мощностей. Изначально Datasection работала в сфере маркетинговых услуг и строила ЦОД недалеко от Осаки для собственных нужд, но сдача их в аренду китайским клиентам оказалась более выгодным бизнесом. По словам главы Datasection Норихико Исихары (Norihiko Ishihara), ещё полгода назад для поддержания ИИ-модели было достаточно 5000 ускорителей Nvidia B200, а сейчас эта цифра как минимум удвоилась. Это предъявляет к участникам бизнеса особые требования.

По оценкам аналитиков Bernstein Research, флагманские чипы Huawei и Alibaba обеспечивают около трети уровня производительности Nvidia B200, поэтому спрос на них в Китае сохраняется. Даже не самые современные H200, поставки которых США недавно разрешили в КНР, оказываются почти на четверть быстрее китайских лидеров. При этом первые примерно в четыре раза уступают передовым Nvidia B300, поставки которых в Китай запрещены.

Как отмечается, японская Datasection свою сделку с Tencent через посредника заключила уже после того, как в мае Дональд Трамп (Donald Trump) отменил запрет на аренду зарубежных вычислительных мощностей китайскими компаниями. На первом этапе Datasection собирается на протяжении трёх лет сдавать в аренду 15 000 ускорителей Nvidia для нужд Tencent. В дальнейшем профильные мощности вырастут до более чем 100 000 ускорителей. Официально представители Datasection отрицают своё сотрудничество с китайской Tencent.

Партия из 5000 ускорителей Nvidia B200 обошлась японской компании примерно в $272 млн по состоянию на июль этого года. За свой трёхлетний контракт с клиентом она при этом должна выручить $406 млн. Второй контракт на три года подразумевает получение $800 млн, которые будут направлены на строительство второго ЦОД, расположенного в Сиднее. Австралийская площадка разместит десятки тысяч передовых ускорителей Nvidia B300. Первая партия из 10 000 таких ускорителей будет стоить Datasection примерно $521 млн. По неофициальным данным, мощности австралийского ЦОД также будут использоваться преимущественно Tencent в ближайшие годы. Китайская компания утверждает, что использование зарубежных ЦОД никак не нарушает законы вовлечённых в процесс стран.

Для провайдера в данном случае важно отбить затраты на закупку ускорителей. Как правило, срок амортизации рассчитан на пять лет, тогда как контракты заключаются на три года, но клиенты могут продлить их ещё на два года. Datasection оставляет за собой право разорвать соглашение с китайскими клиентами, если того потребуют изменения в законодательстве. По словам руководства компании, использование ускорителей Nvidia китайскими клиентами согласовано как с самим поставщиком, так с Министерством торговли США.

Datasection намерена развивать ЦОД и на территории Европы, при этом потепления отношений между США и КНР компания не очень боится, поскольку в случае отказа китайских клиентов от аренды ЦОД она быстро найдёт новых, ведь спрос на инфраструктуру ИИ сейчас очень высок. В самом неблагоприятном случае, по словам провайдера, деятельность придётся остановить всего лишь на неделю.

Nvidia запустила продажи видеокарт RTX Pro 5000 Blackwell с 72 Гбайт памяти

Компания Nvidia подтвердила поступление в продажу профессиональной видеокарты RTX Pro 5000 Blackwell в версии с 72 Гбайт памяти, сообщив об этом в своём блоге. Информация о доступности продукта также размещена на сайтах партнёров, включая Ingram Micro, Leadtek, Unisplendour и xFusion, а более широкая доступность через глобальных системных интеграторов ожидается в начале следующего года.

 Источник изображений: Nvidia

Источник изображений: Nvidia

Технические характеристики карты, предоставленные самой Nvidia, указывают на то, что карта отличается от ранее выпущенного варианта с 48 Гбайт памяти только увеличенным объёмом видеопамяти. В описании продукта отмечается использование графического процессора с 14 080 ядрами CUDA (как у 48-гигабайтной версии), а также одинаковое общее энергопотребление на уровне 300 Вт.

Не совсем понятным моментом остаётся ширина интерфейса памяти. В технической документации Nvidia RTX Pro 5000 по-прежнему указан 512-битный интерфейс памяти, а также заявлена пропускная способность памяти 1344 Гбайт/с. Этот показатель точно соответствует скорости чипов памяти 28 Гбит/с на контакт с учётом поддержки 384-битной шины памяти, что также подтверждается данными сторонних источников. Если же в карте действительно используется 512-битная шина, то та же пропускная способность в 1344 Гбайт/с подразумевает применение чипов памяти со скоростью 21 Гбит/с на контакт.

Nvidia до сих пор не озвучила цену на RTX Pro 5000 с 72 Гбайт памяти. В сообщении в блоге и материалах о продукте подтверждается его доступность, однако в них не указаны ни рекомендованная розничная цена, ни цены партнёров. Версия с 48 Гбайт памяти предлагается по цене от $4250 до $4600, в то время как модели RTX Pro 6000 стоят более $8300.

DeepSeek заподозрили в обучении новейшего ИИ на контрабандных чипах Nvidia Blackwell

Ещё на этапе первичного успеха DeepSeek эту китайскую компанию американские чиновники подозревали в использовании для обучения своих ИИ-моделей полученных нелегально ускорителей Nvidia с архитектурой Hopper. В новом варианте подозрений уже фигурируют более совершенные укорители Blackwell. Сама Nvidia пока считает эти подозрения бездоказательными.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Как сообщает The Information, ускорители Blackwell в условиях экспортных ограничений США попали в руки DeepSeek якобы в результате сложной многоэтапной операции. Сперва они будто бы были доставлены в те страны, которые имеют возможность их получать без ограничений, затем были разобраны на части, в таком виде отправлены в Китай, а после собраны в исходное состояние уже на территории КНР.

Представители Nvidia эту историю прокомментировали следующим образом: «Мы не получили каких-либо улик или подтверждений скрытных ЦОД, собранных для введения в заблуждение нас или наших OEM-партнёров, а затем разобранных, отправленных нелегальными путями и заново собранных в каком-то другом месте. Хотя подобные подозрения кажутся нам надуманными, мы изучаем любые получаемые сигналы».

На этой неделе стало известно, что после многочисленных попыток руководства Nvidia убедить американские власти разрешить поставки ускорителей Blackwell в Китай, президент Дональд Трамп (Donald Trump) позволил отгружать проверенным получателям более старые ускорители H200, которые всё равно в несколько раз превосходят по быстродействию те же H20, разрешённые для поставок ранее. Компаниям Intel и AMD будут предоставлены сопоставимые экспортные возможности, но поставки ускорителей Blackwell и более совершенных Rubin в Китай по официальным каналам будут по-прежнему запрещены.

Nvidia распродала все ИИ-ускорители, но на подходе ещё больше Blackwell

Nvidia побила собственные прогнозы по прибыли за III квартал 2026 финансового года, реализовав больше ускорителей искусственного интеллекта, чем когда-либо прежде. Компания распродала все серверные чипы, заявил её гендиректор Дженсен Хуанг (Jensen Huang), но вскоре их запасы увеличатся.

 Источник изображения: nvidia.com

Источник изображения: nvidia.com

По итогам отчётного периода выручка Nvidia составила рекордные $57 млрд, а чистая прибыль в пересчёте составила $4000 в секунду. Всего за один квартал бизнес компании в сфере центров обработки данных вырос на $10 млрд до $51,2 млрд — это на 66 % больше, чем за аналогичный период прошлого года. Для аналитиков показатели дохода Nvidia по направлению ЦОД служат индикатором «пузыря ИИ», о котором в последнее время говорят всё больше. Но никаких признаков негативной динамики у компании не наблюдается: прогноз на IV квартал составляет $65 млрд, то есть всего за три месяца квартальная выручка увеличится ещё на $8 млрд.

«Продажи [ИИ-ускорителей на архитектуре] Blackwell зашкаливают, а облачные GPU распроданы», — заявил Дженсен Хуанг. Впрочем, распроданы, видимо, они не окончательно. «У нас ещё достаточно Blackwell на продажу и много Blackwell на подходе», — добавил он позже. Основной движущей силой роста в сегменте ЦОД и не только стали ускорители на обновлённой архитектуре Blackwell Ultra, признался гендиректор Nvidia: «Наша ведущая архитектура для всех категорий клиентов теперь Blackwell Ultra; продолжительным высоким спросом пользовалась наша предыдущая архитектура Blackwell».

Выручка по игровому направлению показала рост на 30 % по сравнению с прошлым годом, и это хороший сигнал для видеокарт семейства Nvidia Blackwell, отзывы о которых в начале года были неоднозначными. Инвесторов же Дженсен Хуанг призвал не паниковать: «О пузыре ИИ говорят много. С нашей точки зрения наблюдается нечто совершенно иное». Nvidia много лет предупреждала, что ИИ изменит всё, и сейчас эта технология достигла переломного момента, считает глава компании: «Революционным станет переход к агентному и физическому ИИ». Под последним понимается робототехника с ИИ.

Игровые видеокарты теперь приносят всего 7,5 % выручки Nvidia — ИИ-чипы разогнали доходы до $57 млрд

Отчётность Nvidia за минувший фискальный квартал смогла порадовать тех инвесторов, которые ждали косвенных подтверждений сохранения высокого спроса компоненты для инфраструктуры ИИ. По итогам прошлого квартала выручка компании составила рекордные $57 млрд, увеличившись в годовом сравнении на 62 %, а последовательно сразу на 22 % или $10 млрд.

 Источник изображений: Nvidia

Источник изображений: Nvidia

Как отметила на мероприятии финансовый директор Nvidia Колетт Кресс (Colette Kress), компания рассчитывает выручить от реализации ускорителей семейств Blackwell и Rubin в размере $500 млрд за период с начала текущего года до конца 2026 календарного года. Спрос на компоненты для инфраструктуры ИИ продолжает превышать собственные ожидания Nvidia, по словам Колетт Кресс. Уже эксплуатируемые в составе облачных систем ускорители поколений Ampere, Hopper и Blackwell полностью загружены вычислениями.

В серверном сегменте выручка Nvidia в прошлом квартале выросла на 66 % в годовом сравнении до рекордных $51,2 млрд. Направление сетевых решений увеличило выручку сразу на 162 % до $8,2 млрд, что позволяет профильному бизнесу считаться крупнейшим в мире. В структуре ускорителей Blackwell произошло важное изменение: более современные GB300 начали доминировать над GB200 и формировать до двух третей всей выручки в семействе. Даже в условиях весьма серьёзных геополитических противоречий между Китаем и США компании удалось выручить за квартал на китайском рынке $50 млн от реализации ускорителей H20, хотя в конце прошлого квартала Nvidia не хотела публиковать подобную статистику в целом. Так или иначе, руководство компании утверждает, что продажи H20 не оказали существенного влияния на итоги квартала.

Игровой сегмент показал рост выручки на 30 % в годовом сравнении до $4,3 млрд (всего 7,5 % от всей выручки), но последовательно она снизилась на 1 %. Такая коррекция, по словам финансового директора Nvidia, обусловлена выходом складских запасов на более близкий к норме уровень в ожидании сезона предпраздничных распродаж. В годовом сравнении игровая выручка выросла преимущественно за счёт высокой популярности семейства Blackwell.

В сфере профессиональных решений для визуализации семейство Blackwell также показало себя с лучшей стороны, способствуя росту выручки на 56 % год к году до $760 млн, но в этом контексте упоминается и положительное влияние DGX Spark. Выручка Nvidia в автомобильном сегменте ограничилась $592 млн, но она выросла на 32 % в годовом сравнении и на 1 % последовательно. Наконец, сегмент OEM-решений и прочих источников дохода позволил Nvidia увеличить выручку на 79 % до $174 млн в годовом сравнении, хотя последовательный рост тоже ограничился 1 %.

В общей сложности, вычислительные и сетевые решения увеличили квартальную выручку Nvidia на 64 % до $50,9 млрд, тогда как на долю графических решений как таковых осталось только $6,1 млрд выручки. Тем не менее, и она в годовом сравнении увеличилась на 51 %. Руководство компании считает, что ежегодно в мире будет тратиться от $3 до $4 трлн на создание инфраструктуры для ИИ.

В части сроков анонса новых ускорителей с архитектурой Rubin финансовый директор Nvidia повторила, что они выйдут во второй половине 2026 года. Платформа Vera Rubin, сформированная из 7 чипов, способна обеспечить кратное увеличение быстродействия по сравнению с Blackwell.

В текущем квартале Nvidia рассчитывает выручить около $65 млрд, это подразумевает последовательный рост выручки на 14 %, во многом обусловленный высоким спросом на компоненты с архитектурой Blackwell. Если в прошлом квартале норма выручки компании составила 73,4 %, то в текущем она расположится в районе 74,8 %. В следующем году расходы компании вырастут, но Nvidia постарается поддерживать норму прибыли на уровне 74–76 %, по словам Кресс. На получение значимой выручки в Китае компания в текущем квартале тоже не рассчитывает.

Выход видеокарт GeForce RTX 50 Super не отменяется, но переносится на лучшие времена

Видеокарты Nvidia GeForce RTX 50 серии Super на чипах Blackwell не появятся в первой половине 2026 года — их придётся подождать до III квартала будущего года, сообщает VideoCardz.com со ссылкой на появившиеся утечки. Ранее утверждалось, что выход RTX 50 Super может быть отменён, но новые данные не столь категоричны — речь якобы идёт лишь о сдвиге сроков выпуска на пару кварталов.

 Источник изображения: BoliviaInteligente / unsplash.com

Источник изображения: BoliviaInteligente / unsplash.com

Отличительной особенностью видеокарт Nvidia GeForce RTX 50 улучшенной серии Super обещает стать память GDDR7 на чипах по 3 Гбайт. Первоначально предполагалось, что компания анонсирует их на выставке CES 2026 в начале года, а продажи видеокарт новой серии должны были стартовать через несколько недель. Однако авторитетный инсайдер MEGAsizeGPU сообщил, что компания перенесла их выпуск на вторую половину года — информация от него может означать, что для занимающихся непосредственным выпуском видеокарт партнёров Nvidia это тоже стало сюрпризом.

По одной из версий, причиной решения стал дефицит чипов GDDR7 увеличенной ёмкости — компания так и не заключила контрактов на достаточный объём их поставок. Косвенным тому подтверждением, утверждает источник, станет грядущая нехватка видеокарт Nvidia GeForce RTX 5060 Ti с 16 Гбайт памяти GDDR7. С другой стороны, оснований называть происходящее задержкой или переносом выхода моделей серии Super было бы некорректно, потому что Nvidia нигде не говорила о сроках их появления, даже неофициально. Обычно за месяц или два до этого момента компания выпускает документ под названием GeForce Product Embargo, и пока в отношении видеокарт GeForce RTX 50 серии Super он ещё не появлялся.

Asus ROG Matrix Platinum GeForce RTX 5090 показалась в Европе по цене выше €4000

Видеокарта Asus ROG Matrix Platinum GeForce RTX 5090 появится в продаже позже, чем ожидалось. Ретейлеры сообщают о начале поставок новинки в конце ноября. По данным немецкого Proshop, поставки карты ожидаются с 27 ноября. Она выставлена по цене €4099 (включая НДС), что почти вдвое дороже актуальной рекомендованной стоимости (€2099) эталонной RTX 5090 Founders Edition в Европе.

 Источник изображений: Asus

Источник изображений: Asus

В финском офисе Proshop карта имеет ценник €4199 (включая НДС), но поставки там ожидаются с 24 ноября. Графический процессор в составе видеокарты имеет дополнительный заводской разгон. Его базовая частота составляет 2010 МГц, а Boost-частота — 2760 МГц.

 Источник изображения: Proshop.de

Источник изображения: Proshop.de

Asus выпустила модель ROG Matrix Platinum по случаю своего 30-летия на рынке видеокарт. Карта занимает четыре слота расширения. С учётом цены и эксклюзивности она явно не рассчитана на обычных потребителей — скорее, на коллекционеров. Компания выпустит всего 1000 подобных видеокарт.

Основная особенность карты — двойная система подачи питания. ROG Matrix Platinum оснащена стандартным 12+4-контактным разъёмом 12V-2×6, обеспечивающим передачу до 600 Вт. В сочетании с материнскими платами BTF можно использовать скрытый разъём питания, который увеличивает максимальную мощность карты до 800 Вт, обеспечивает прирост производительности около 10 % и даёт больший запас по мощности для дополнительного разгона.

Система охлаждения видеокарты включает четыре вентилятора, медную испарительную камеру, массивный радиатор и жидкий металл в качестве термоинтерфейса.

Для энтузиастов Asus предусмотрела в видеокарте фирменную технологию Memory Defroster для предотвращения замерзания микросхем памяти при охлаждении видеокарты жидким азотом во время экстремального разгона, а также функцию Power Detector+ в составе утилиты GPU Tweak, предназначенной для мониторинга стабильности питания видеокарты.

Nvidia всё ещё надеется ослабить Blackwell так, чтобы США разрешили поставлять их в Китай

Компания Nvidia, считающаяся ведущим поставщиком ускорителей вычислений для систем ИИ, оказалась в щекотливой ситуации, когда власти США не разрешают ей поставлять в Китай передовые решения семейства Blackwell, а китайская сторона при этом не готова принимать более зрелые H20 с архитектурой Hopper. По слухам, Nvidia пытается ухудшить характеристики Blackwell до такой степени, чтобы получить «добро» Вашингтона.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Хотя президент Дональд Трамп (Donald Trump) накануне переговоров со своим китайским коллегой Си Цзиньпином (Xi Jinping) выразил готовность обсудить возможности поставок «супер-дупер» чипов Blackwell в Китай, по факту эта тема в конкретном узком толковании не поднималась. После этого представители Белого дома прямым текстом заявили, что власти США в данный момент не заинтересованы в поставках Blackwell на китайский рынок.

По данным The Information, на которые ссылается Reuters, администрация президента США действительно уведомила подконтрольные правительственные структуры о том, что не собирается разрешать продажу адаптированных для китайского рынка новейших ускорителей Nvidia. Последняя изначально готовила для поставок в Китай ускорители B30A, оптимизированные для обучения больших языковых моделей, но урезанные по быстродействию до уровня, приемлемого с точки зрения действующих экспортных ограничений США. Компания даже успела отправить образцы таких ускорителей своим китайским клиентам для оценки их применимости.

Источники The Information утверждают, что Nvidia всё ещё надеется получить соответствующее разрешение американских властей, а потому сейчас пытается дальнейшим образом изменить характеристики B30A и добиться права поставлять такие ускорители на китайский рынок. В настоящий момент компания оценивает свою долю на китайском рынке ускорителей в 0 % и не включает потенциальную выручку с продаж в регионе в собственные финансовые прогнозы.

Действия китайской стороны также усложняют ситуацию для Nvidia. Китайские власти не только затрудняют оформление поставок американских ускорителей при ввозе в страну, но и начали требовать от получателей правительственных субсидий избавиться от импортных ускорителей в центрах обработки данных, возводимых на территории Китая. «Пряником» в этой ситуации является готовность властей КНР предоставлять субсидии на оплату электроэнергии владельцам тех ЦОД, которые построены на китайской компонентной базе.

Тема возможных поставок Blackwell в Китай оказалась настолько навязчивой, что основателю Nvidia пришлось вернуться к ней после прибытия на Тайвань в конце этой рабочей недели, как сообщило агентство Bloomberg. Здесь глава компании должен встретиться с коллегами из TSMC, но сперва ему пришлось пояснить, что свои недавние слова о победе Китая над США в сфере ИИ он произнёс исключительно ради выделения потенциала китайской отрасли. «Нет никаких активных обсуждений. Мы сейчас не планируем ничего поставлять в Китай. Это Китаю решать, когда позволить продуктам Nvidia вернуться на китайский рынок. Я жду, что они сменят свою политику, и тогда мы, надеюсь, сможем снова обслуживать китайский рынок», — прокомментировал глава Nvidia слухи о ведении переговоров по поводу поставок Blackwell в Китай.

Настольный суперкомпьютер Nvidia DGX Spark запустил Cyberpunk 2077 и не только — но только после «танцев с бубном»

Nvidia DGX Spark — компактный ПК, созданный для разработчиков систем искусственного интеллекта и специалистов смежных направлений. Первые системы на суперчипе GB10 начали поставляться не так давно, с некоторым опозданием, и первые тесты этих мини-ПК были посвящены ИИ, полностью игнорируя игры. Однако на DGX Spark и других системах на GB10 можно запускать игры — правда, это потребует специфических умений и терпения.

 Источник изображения: VideoCardz

Источник изображения: VideoCardz

Системы DGX Spark и первые решения на этой платформе от партнёров Nvidia начали появляться в руках пользователей, которым также интересны игры. Суперчип GB10 Blackwell сочетает 20-ядерный процессор Arm, графический процессор с 6144 ядрами CUDA (базовая частота — 1665 МГц, Boost-частота — 2525 МГц) и 128 Гбайт памяти LPDDR5X с пропускной способностью около 600 Гбайт/с, поэтому теоретически он должен быть близок к графическим процессорам класса GeForce RTX 5070. Проблема заключается в архитектуре: на сегодняшний день официальной сборки Windows для Arm с поддержкой указанной платформы нет. Вместо этого покупатели получают DGX OS — дистрибутив на базе Ubuntu, который позволяет устанавливать собственные инструменты, но не предлагает готовый игровой стек.

 Источник изображения: Reddit

Источник изображения: Reddit

В недавнем посте на Reddit показана работа игры Cyberpunk 2077 на DGX Spark через Box64 — слой трансляции x86–Arm. Пользователь скомпилировал Box64 v0.3.8 с поддержкой BOX32, установил Steam с помощью предоставленного скрипта, перезапустил systemd-binfmt, а затем запустил Steam и игру под управлением Box64. В итоге Cyberpunk 2077 показал на такой системе до 50 кадров в секунду в разрешении 1080p на средних настройках. При отсутствии поддержки DLSS и наличии неоднозначной стабильности автор называет всю эту схему использования «крутым, но бесполезным способом потратить около $4000». Именно столько стоит DGX Spark.

 Источник изображений здесь и ниже: YouTube / ETA Prime

Источник изображений здесь и ниже: YouTube / ETA Prime

MSI EdgeXpert AI — один из первых мини-ПК на базе DGX Spark. Он использует ту же конфигурацию GB10 и 128 Гбайт памяти, но поставляется в более традиционном корпусе по цене около $2999. В ранних тестах системы YouTube-блогер ETA Prime использовал эмулятор RPCS3 для запуска на ней игры Skate 3 для PlayStation 3 и Xemu для оригинальной Xbox. В этих рабочих нагрузках система поддерживала около 60 кадров в секунду при разрешении 1080p.

Первые тесты показывают, что DGX Spark и его клоны способны запускать игры, но только с использованием слоя трансляции, тонкой настройки Linux и изрядной доли терпения. Nvidia позиционирует платформу как устройство для искусственного интеллекта, а не как игровую систему. Для неё вряд ли когда-либо появятся официальные игровые драйверы, как и оптимизированные под платформу версии Windows.


window-new
Soft
Hard
Тренды 🔥
Психологический хоррор-шутер Total Chaos от создателя Turbo Overkill скоро станет ещё сложнее и страшнее — дата выхода «Новой игры +» 6 мин.
«Немного ошеломлены»: кошачий роглайк Mewgenics от автора The Binding of Isaac и Super Meat Boy за неделю достиг миллиона проданных копий 2 ч.
Google рассказала, как сделает работу всех смартфонов более плавной в Android 17 2 ч.
Lenovo обвинили в массовом сборе данных американцев и передаче их в Китай — компания всё отрицает 5 ч.
Lenovo обвинили в массовой передаче данных американцев в Китай 11 ч.
Activision подтвердила дату смерти Call of Duty: Warzone Mobile — игру закроют спустя всего два года после запуска 13 ч.
Unity пообещала ИИ, который позволит создавать игры по текстовому описанию — вообще без программирования 15 ч.
Хакеры применили поддельные страницы CAPTCHA для распространения вирусов для Windows 15 ч.
Российский бизнес распробовал ИИ от Яндекса — потребление токенов за год выросло всемеро 15 ч.
Microsoft подтвердила релиз Kingdom Come: Deliverance 2 в Game Pass, а скоро в подписку добавят полное издание The Witcher 3: Wild Hunt 16 ч.