Сегодня 04 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → blackwell
Быстрый переход

Nvidia представила настольный суперкомпьютер DGX Station на Windows — суперчип GB300 и 748 Гбайт памяти

На выставке Computex 2026 компания Nvidia анонсировала DGX Station для Windows — настольный суперкомпьютер на базе процессора Nvidia GB300 Grace Blackwell Ultra Desktop Superchip, разработанный для мощных ИИ-агентов и ресурсоёмких корпоративных задач в области ИИ. Платформа переносит инфраструктуру ИИ класса Grace Blackwell от Nvidia в экосистему Windows, обеспечивая поддержку ИИ-моделей с триллионами параметров.

 Источник изображений: Nvidia

Источник изображений: Nvidia

В основе системы, которая выглядит как рабочая станция, лежит SoC Nvidia GB300 Grace Blackwell Ultra Desktop Superchip. Чип сочетает мощный 72-ядерный CPU Nvidia Grace с унифицированной памятью объёмом до 748 Гбайт и может подключаться к дискретному графическому процессору Nvidia Blackwell, например Nvidia RTX PRO 6000 Blackwell Workstation Edition, через интерфейс NVLink-C2C, обеспечивающий лучшую в своём классе связь и производительность. Заявленная производительность DGX Station в операциях FP4 составляет до 20 Пфлопс.

Впечатляет и сетевая пропускная способность рабочей станции: до 800 Гбайт/с через сетевой адаптер ConnectX-8 SuperNIC, который обеспечивает быструю передачу данных по сети и возможность подключения нескольких систем DGX Station. Nvidia отмечает, что DGX Station была разработана в сотрудничестве с Microsoft для масштабируемого запуска ИИ-агентов для инженерных, проектных и других задач в рамках новой защищённой управляемой платформы с открытым исходным кодом Nvidia OpenShell.

«На протяжении десятилетий Microsoft и Nvidia сотрудничают для развития самых мощных вычислительных платформ в мире. Сегодня мы выводим это сотрудничество на новый уровень, масштабируя всю мощь Windows от тонких и лёгких ПК до рабочих станций центров обработки данных с помощью DGX Station на базе GB300. Это открывает новый класс производительности ИИ на Windows, платформе, которой предприятия доверяют в вопросах безопасности, управляемости и совместимости», — сказал Паван Давулури (Pavan Davuluri), исполнительный вице-президент Windows & Devices в Microsoft.

«По мере того, как предприятия масштабируют агентов ИИ по всей своей организации, им необходима инфраструктура ИИ, которая может напрямую подключаться к приложениям и рабочим процессам, обеспечивающим работу их бизнеса. DGX Station предоставляет возможности ИИ суперкомпьютерного класса непосредственно в среде Windows, где миллионы людей уже ежедневно занимаются проектированием, разработкой, исследованиями и созданием», — сказал Крис Марриотт (Chris Marriott), вице-президент по корпоративным платформам Nvidia.

Выпуск DGX Station для Windows запланирован на четвёртый квартал 2026 года. Системы будут поставляться компаниями Asus, Dell Technologies, Gigabyte, HP, MSI и Supermicro.

MSI представила RTX 5090 Gaming Trio Next-Gen с улучшенным кулером и RTX 5090 Suprim Safeguard с защитой от оплавления

Компания MSI готовит видеокарты GeForce RTX 5090 Gaming Trio Next-Gen и GeForce RTX 5090 Suprim Safeguard. Первая, несмотря на название, не имеет никакого отношения к видеокартам нового поколения. Она основана на всё той же актуальной архитектуре Blackwell.

 Источник изображений: VideoCardz / MSI

Источник изображений: VideoCardz / MSI

По словам MSI, новая модель GeForce RTX 5090 Gaming Trio Next-Gen оснащена улучшенной системой охлаждения. Компания заявляет, что карта разработана для более тихой работы при низких нагрузках и более низких температур при полной нагрузке на графический процессор.

 MSI GeForce RTX 5090 32G Gaming Trio Next-Gen

MSI GeForce RTX 5090 Gaming Trio Next-Gen

MSI пока не привела полные технические характеристики версии Next-Gen. Текущая модель GeForce RTX 5090 Gaming Trio OC использует систему охлаждения MSI TRI FROZR 4 и вентиляторы Stormforce. В описании этой модели указана тактовая частота в режиме Extreme Performance 2497 МГц, которая выставляется в фирменной утилите MSI Center, а также 2482 МГц в режиме Boost — как в игровом, так и в тихом режимах.

GeForce RTX 5090 Gaming Trio Next-Gen может занять место актуальной модели Gaming Trio, однако ни цену, ни информацию о сроках начала продаж компания не привела.

 MSI GeForce RTX 5090 Suprim Safeguard

MSI GeForce RTX 5090 Suprim Safeguard

Модель GeForce RTX 5090 Suprim Safeguard, в свою очередь, оснащена встроенной системой защиты Safeguard для мониторинга стабильности питания. Она включает функцию предупреждения, а также предохранители по линии 12 В.

Аналогичные функции Safeguard и Safeguard+ ранее были представлены производителем для новых блоков питания MPG Ai1600TS и MPG Ai1300TS PCIE5 (Safeguard+), а также MAG A1200PLS и MAG A1000PLS PCIE5 (Safeguard). Единственное различие между этими двумя функциями заключается в том, что Safeguard+ отображает на экране монитора всплывающее окно вместе со звуковым предупреждением, тогда как обычная Safeguard выдаёт только звуковое предупреждение.

Компания также добавила поддержку GPU Safeguard+ в утилиту Afterburner 4.6.7 Beta 2. Она может считывать состояние аварийных сигналов разъёмов поддерживаемых блоков питания MSI и применять более низкий профиль энергопотребления для графического процессора при обнаружении неисправности. На графических процессорах Nvidia аварийный профиль по умолчанию устанавливает ограничение мощности на уровне 75 %.

Стоимость GeForce RTX 5090 Suprim Safeguard тоже неизвестна. Компания не сообщила, когда видеокарта поступит в продажу. Полные технические характеристики новинки производитель также не привёл.

Gigabyte выпустила вторую ревизию GeForce RTX 5060 Gaming OC — она стала быстрее на 7 МГц

Компания Gigabyte выпустила ещё один вариант видеокарты GeForce RTX 5060. Речь идёт о модели GeForce RTX 5060 Gaming OCV2-8GD. Карта уже появилась в продаже в Японии, где, согласно местным источникам, стоит 64 500 иен (с НДС) или около $405.

 Источник изображений: Gigabyte

Источник изображений: Gigabyte

Версия V2, по всей видимости, представляет собой незначительное обновление существующей модели Gaming OC. По сравнению с предыдущим вариантом, новинка имеет всего лишь на 7 МГц более высокую Boost-частоту GPU — 2602 МГц вместо 2595 МГц.

Остальные характеристики карты остались без изменений. Оба варианта оснащены одинаковым объёмом памяти — 8 Гбайт GDDR7 с 128-битной шиной. Обе карты также используют интерфейс PCIe 5.0, один 8-контактный разъём питания и одинаковую систему охлаждения Windforce с тремя вентиляторами.

Размеры GeForce RTX 5060 Gaming OC V2 8G остались прежними — 281 × 119 × 40 мм. Набор внешних разъёмов тоже не изменился: три DisplayPort 2.1b и один HDMI 2.1b.

Palit выпустила GeForce RTX 5080 Infinity 3 без RGB-подсветки в версиях с разгоном и без

Компания Palit представила видеокарту GeForce RTX 5080 в новом фирменном дизайне Infinity 3. Новинка оснащена системой охлаждения с тремя вентиляторами и не имеет RGB-подсветки. В рамках серии производитель выпустил стандартную модель GeForce RTX 5080 Infinity 3 и версию с дополнительным разгоном GeForce RTX 5080 Infinity 3 OC.

 Источник изображений: Palit

Источник изображений: Palit

Для версии с дополнительным заводским разгоном заявлена Boost-частота GPU на уровне 2625 МГц, для версии без разгона — 2617 МГц. Оба варианта предлагают по 16 Гбайт памяти GDDR7 со скоростью 30 Гбит/с на контакт и поддержкой 256-битной шины.

В составе системы охлаждения карт используются вентиляторы Palit TurboFan 4.0, а также композитные теплотрубки. Palit заявляет, что вентиляторы TurboFan 4.0 снижают уровень шума и оптимизируют теплоотвод на 33 %, а композитные теплотрубки улучшают эффективность передачи тепла до 32 %.

Карты получили по одному видеовыходу HDMI 2.1 и по три DisplayPort 2.1b. Дополнительное питание на карты подаётся через один разъём 12V-2×6. Размеры видеокарт составляют 331,9 × 127,1 × 56,8 мм. Их толщина — 2,8 слота расширения.

Это первый запуск новых видеокарт Palit после новостей о том, что управление брендами Galax, KFA2 и HOF перешло под непосредственный контроль Palit Group. При этом сами бренды никуда не уходят и продолжат выпускать видеокарты.

Nvidia представила мобильную GeForce RTX 5070 с 12 Гбайт памяти

Компания Nvidia официально представила 12-Гбайт версию мобильной видеокарты GeForce RTX 5070, расширив тем самым количество доступных для ноутбуков карт RTX 50-й серии до семи. До анонса новинка отметилась в характеристиках новых ноутбуков от компании MSI, хотя на тот момент Nvidia не подтвердила планов выпуска обновлённой версии.

 Источник изображений: VideoCardz

Источник изображений: VideoCardz

Существующий вариант GeForce RTX 5070 с 8 Гбайт памяти не будет снят с производства. Версия с 12 Гбайт GDDR7 её просто дополнит, что предоставит производителям лэптопов больше гибкости, несмотря на сохраняющийся дефицит чипов памяти.

«Спрос на графические процессоры GeForce RTX остается высоким, а объёмы доступной памяти ограничен. Чтобы обеспечить максимальную доступность памяти, мы выпускаем конфигурацию графического процессора GeForce RTX 5070 для ноутбуков с 12 Гбайт 24-гигабитной памяти G7. Это даёт нашим партнерам дополнительный выбор в пользу дополнительного объёма памяти к 16-гигабитным чипам G7, которые в настоящее время поставляются с большинством графических процессоров GeForce. Конфигурация с 12 Гбайт памяти будет выпускаться наряду с текущей конфигурацией с 8 Гбайт памяти, что позволит нашим партнёрам предложить потребителям более широкий ассортимент ноутбуков с GeForce RTX 5070», — Nvidia.

Характеристики мобильной GeForce RTX 5070 с 12 Гбайт памяти точно такие же, как у версии с 8 Гбайт. Карта использует GPU серии Blackwell с 4608 ядрами CUDA и поддержкой 128-битной шины памяти. Пропускная способность памяти GDDR7 версии карты с 8 Гбайт составляет 384 Гбайт/с. Новая версия GeForce RTX 5070 Laptop GPU с 12 Гбайт памяти должна сократить в ноутбуках разрыв между RTX 5070 и RTX 5070 Ti, но только в вопросе объёма памяти, а не пропускной способности последней или производительности GPU. Вероятно, на фоне увеличения на 50 % объёма видеопамяти у 12-Гбайт версии RTX 5070 также несколько увеличен показатель TDP. Однако Nvidia на этот счёт пока ничего не сказала.

Спрос на аренду устаревающих ускорителей Nvidia H100 не падает, а цены и вовсе подскочили на 40 % за полгода

Данные исследования SemiAnalysis позволяют предположить, что в условиях бума ИИ не все рыночные тенденции являются предсказуемыми. Ранее считалось, что после выхода в оборот новейших ускорителей вычислений Nvidia с архитектурой Blackwell спрос на их предшественников снизится, а вместе с этим упадут и цены, однако реальность оказалась иной.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Как отмечает источник, расценки на аренду облачных вычислительных мощностей на базе ускорителей Nvidia H100 с архитектурой Hopper в период с октября прошлого года по март нынешнего увеличились с $1,7 до $2,35 в час. Более того, свободных мощностей для аренды в этом сегменте рынка нет, а действующие контракты арендаторы стараются всеми правдами и неправдами продлить, даже если им приходится переплачивать за такую возможность. Клиенты облачных провайдеров готовы арендовать H100 ещё на четыре года, причём дефицит предложений есть и в сегменте крупных вычислительных кластеров этого поколения. По мере появления более современных инстансов предложение на рынке по устаревающим не увеличивается.

При этом ускорителей Blackwell на рынке аренды облачных мощностей пока не так много, основная их часть будет введена в строй не ранее середины текущего года, а спрос на вычислительные мощности продолжает серьёзно превышать предложение. Ожидания, согласно которым спрос на аренду ускорителей H100 начнёт падать с конца прошлого года, не оправдались. Провайдеры, работающие с краткосрочными контрактами на аренду ускорителей, в таких условиях могут неплохо заработать, поскольку цены выросли, а спрос остаётся высоким.

Asus выпустила две версии GeForce Prime RTX 5080 EVO без испарительной камеры

Компания Asus выпустила две версии видеокарты GeForce Prime RTX 5080 EVO 16GB. От ранее выпущенной обычной модели Prime они отличаются отсутствием испарительной камеры в составе их систем охлаждения.

 Источник изображений: Asus

Источник изображений: Asus

По сравнению с ранее выпущенной моделью Prime у новых версий RTX 5080 EVO (модели PRIME-RTX5080-16G-EVO и PRIME-RTX5080-O16G-EVO) нет никаких внешних отличий. Карты имеют тот же размер и ту же толщину — 2,5 слота расширения. Однако в описании продукта отсутствует упоминание испарительной камеры. На изображениях структуры радиатора этот элемент у моделей EVO заменён классическим решением с тепловыми трубками.

 Обычная Prime с испарительной камерой (сверху) и модель EVO без испарительной камеры (снизу)

Обычная Prime с испарительной камерой (сверху) и модель EVO без испарительной камеры (снизу)

Использование испарительной камеры в мощных видеокартах обычно позволяет более эффективно распределять тепло по радиатору и избегать локального перегрева графического процессора.

Для модели PRIME-RTX5080-O16G-EVO заявляется частота графического процессора до 2685 МГц в режиме OC, а для модели PRIME-RTX5080-16G-EVO — до 2640 МГц. Обе карты имеют размеры 304 × 126 × 50 мм и оснащены одним 12+4-контактным разъёмом питания. Производитель рекомендует использовать с картами блок питания мощностью от 850 Вт.

Как фен помог обойти санкции: топ-менеджеров Supermicro обвинили в контрабанде ИИ-чипов в Китай

До сих пор все инциденты с подозрением американских регуляторов по поводу участия американских граждан в контрабандной поставке ИИ-ускорителей в Китай имели отношение к небольшим компаниям, но на днях обвинение было выдвинуто в адрес лиц, имеющих непосредственное отношение к руководству компании Supermicro.

 Источник изображения: Super Micro Computer

Источник изображения: Super Micro Computer

Как подчёркивает CNBC, обвинительное определение Офиса федерального прокурора США по Южному округу Нью-Йорка содержит упоминания о частных лицах, связанных с неким американским производителем серверного оборудования, но из фамилий и имён обвиняемых становится понятно, что речь идёт именно о Super Micro Computer. Упоминаемый в документе И Шянь Лио (Yih-Shyan Liaw) является сооснователем компании и действующим членом совета директоров. Руэй Цань Чан (Ruei-Tsan Chang) руководит продажами оборудования этой марки на Тайване, а Тин Вэй Сунь (Ting-Wei Sun) является представителем подрядчика Supermicro.

По версии американских органов правопорядка, трое обвиняемых организовали нелегальный экспорт серверного оборудования с ускорителями Nvidia в Китай с использованием подставной компании в Юго-Восточной Азии, которая в документах значилась конечным получателем продукции. Ещё одна компания была задействована для переупаковки поставляемых грузов, чтобы скрыть факт их поставки в Китай.

Сообщается, что обвиняемые подготовили тысячи неработающих поддельных серверов для проверок, а затем снова использовали эти же «пустышки» во время проверки Министерства торговли США. По словам прокуроров, перед этой проверкой участники схемы с помощью обычного строительного фена сняли и заново наклеили этикетки и наклейки с серийными номерами, после чего переупаковали поддельные серверы в коробки производителя.

Обвиняемые, по версии следствия, оказывали давление на инспектирующие органы, а также пытались ввести в заблуждение представителя Министерства торговли США, которому была поручена дополнительная проверка поставок. Торговый представитель Supermicro на Тайване якобы участвовал в манипуляциях документами и пытался привлечь «нужного» аудитора к проверке.

Следствие считает, что И Шянь Лио в конце 2024 года пытался организовать поставки ускорителей Nvidia B200 в Китай через подставную компанию. Следователи располагают фрагментами переписки представителя Supermicro с предполагаемыми соучастниками. В 2025 году он торопил поставщиков, стремясь отправить в Китай больше оборудования до вступления в силу новых официальных запретов. Из троих фигурантов дела двое уже арестованы, тайваньский представитель Sipermicro находится в розыске. Акции компании на фоне таких новостей упали в цене на 12 %.

Colorful выпустила видеокарту iGame GeForce RTX 5070 Ti Ultra Z Black OC со съёмным разъёмом питания GC-HPWR

Компания Colorful представила видеокарту iGame GeForce RTX 5070 Ti Ultra Z Black OC 16GB. Карта выделяется оформлением и RGB-подсветкой в стиле граффити. А ещё она оснащена дополнительным съёмным ножевым разъёмом питания GC-HPWR.

 Источник изображений: Colorful

Источник изображений: Colorful

В основе видеокарты используется графический процессор с 8960 ядрами CUDA. Для чипа заявлен дополнительный заводской разгон. Базовая частота GPU составляет 2295 МГц, а Boost-частота — 2452 МГц. Доступный профиль разгона One-Key OC повышает частоту Boost до 2497 МГц. Карта имеет 16 Гбайт памяти GDDR7 (28 Гбит/с на контакт) с 256-битной шиной и общей пропускной способностью 896 Гбайт/с. Энергопотребление iGame GeForce RTX 5070 Ti Ultra Z Black OC 16GB заявлено на уровне 300 Вт. Производитель рекомендует использовать с ней блок питания мощностью от 750 Вт. В оснащение карты входят три разъёма DisplayPort 2.1b и один порт HDMI 2.1b.

Размеры карты составляют 300,5 × 120 × 50 мм, а вес — 1,1 кг без комплектной подставки. Карта занимает 2,5 слота расширения. Помимо одного привычного 12+4-контактного разъёма 12V-2x6 карта оснащена съёмным ножевым разъёмом GC-HPWR. Судя по всему, одновременное использование обоих способов подключения питания не поддерживается.

В Китае iGame GeForce RTX 5070 Ti Ultra Z Black OC 16GB оценивается в 8099 юаней (около $1176). Это соответствует цене ранее выпущенной версии SFF (для компактных ПК), не оснащённой разъёмом GC-HPWR.

Nvidia наконец выпустила рабочую станцию DGX Station на базе GB300 Grace Blackwell — у неё почти полтерабайта LPDDR5X

Компания Nvidia официально выпустила рабочую станцию DGX Station, представленную в прошлом году на конференции GTC 2025. Система ориентирована на разработчиков программного обеспечения, исследователей, специалистов по обработке данных и всех, кому требуется больше вычислительной мощности для ИИ, чем может обеспечить более компактная модель Nvidia DGX Spark.

 Источник изображения: Nvidia

Источник изображения: Nvidia

В составе DGX Station используется ускоритель Nvidia GB300 Grace Blackwell Ultra, который сочетает 72-ядерный процессор Grace и графический процессор Blackwell Ultra, объединённые интерфейсом NVLink C2C со скоростью 900 Гбайт/с. Система оснащена впечатляющим объёмом встроенной памяти — 784 Гбайт. Процессор работает в паре с 496 Гбайт памяти LPDDR5X со скоростью 396 Гбайт/с, а графический процессор — с 252 Гбайт памяти HBM3e со скоростью 7,1 Тбайт/с. Оба пула памяти объединены, что позволяет процессору и графическому процессору совместно использовать память друг друга для максимальной производительности ИИ.

Nvidia оснастила DGX Station тремя слотами PCIe 5.0 x16: один поддерживает 16 линий, а два других — по восемь линий. Система официально поддерживает установку дискретных видеокарт, которые можно подключать к слотам PCIe для выполнения дополнительных задач, таких как моделирование и трассировка лучей. Поддерживаются следующие GPU: RTX Pro 6000 Workstation Edition, RTX Pro 6000 Blackwell Max-Q Workstation Edition, RTX Pro 4000 Blackwell SFF Edition и RTX Pro 2000 Blackwell. Рабочая станция DGX Station также оснащена четырьмя слотами M.2, аудиоразъёмами и портами USB.

В рабочей станции используется сетевой контроллер Nvidia ConnectX-8 SuperNIC, поддерживающий скорость до 800 Гбит/с через два порта QSFP112. Система предназначена для ускорения проектов в области искусственного интеллекта путём подключения до двух станций DGX для масштабирования производительности и возможностей моделирования. Питание осуществляется через один 24-контактный разъём ATX, один 8-контактный разъём EPS и три разъёма питания 12V-2x6 для GPU, обеспечивающие заявленную мощность системы в 1600 Вт.

Nvidia заявляет, что DGX Station уже доступна для заказа и начнёт поставляться в ближайшие месяцы через компании-партнёры, включая Asus, Dell, Gigabyte, MSI, Supermicro и HP.

Nvidia выпустила однослотовый серверный ускоритель RTX Pro 4500 Blackwell Server Edition для ИИ и других задач

Компани Nvidia представила профессиональную видеокарту RTX Pro 4500 Blackwell Server Edition, предназначенную для центров обработки данных, периферийных устройств и облачных вычислений. Карта ориентирована на выполнение задач искусственного интеллекта, обработку данных, видеозадачи и визуальные вычисления.

 Источник изображений: Nvidia

Источник изображений: Nvidia

Новая серверная версия ускорителя выполнена в форм-факторе карты расширения PCIe толщиной в один слот, как и ранее выпущенная стандартная версия RTX Pro 4500 Blackwell для рабочих станций. Обе карты имеют по 10 496 ядер CUDA и по 32 Гбайт памяти GDDR7. Одними из ключевых отличий между двумя ускорителями являются дизайн и энергопотребление. Серверная версия оснащена однослотовой пассивной системой охлаждения и имеет заявленный показатель энергопотребления 165 Вт. Стандартный вариант RTX Pro 4500 Blackwell толщиной в два слота расширения оснащён кулером с вентилятором тангенциального типа. При этом энергопотребление карты заявлено на уровне 200 Вт.

Серверная версия также поставляется с памятью с более низкой пропускной способностью. Чипы памяти модели RTX Pro 4500 Blackwell Server Edition работают с частотой 3125 МГц, что соответствует 25 Гбит/с эффективной пропускной способности на контакт, по сравнению с 3500 МГц или 28 Гбит/с у стандартной RTX Pro 4500. В результате общая пропускная способность памяти у серверной версии составляет 800 Гбайт/с вместо 896 Гбайт/с у обычной.

Ещё одно отличие заключается в наборе внешних разъёмов. По сравнению со стандартной RTX Pro 4500 Blackwell серверная версия не оснащена внешними видеопортами. Это ожидаемо для устройства, ориентированного на центры обработки данных, где карта будет использоваться в составе стоечных серверов для удалённых рабочих нагрузок, а не в составе рабочих станций для локальных задач.

 Вся актуальная линейка ускорителей Nvidia RTX Pro для серверов и рабочих станций. Источник изображения: VideoCardz

Вся актуальная линейка ускорителей Nvidia RTX Pro для серверов и рабочих станций. Источник изображения: VideoCardz

Nvidia позиционирует RTX Pro 4500 Blackwell Server Edition как более компактную и энергоэффективную альтернативу в профессиональной линейке Blackwell. Она сохраняет ту же конфигурацию графического процессора и тот же объём памяти в 32 Гбайт, что и стандартная RTX Pro 4500 Blackwell, но жертвует видеовыходами и некоторой пропускной способностью памяти в пользу пассивной однослотовой конструкции, лучше подходящей для корпоративных платформ.

ByteDance нашла обход санкций США — её ИИ будет работать на Nvidia B200 в Малайзии

Для китайских разработчиков ИИ геополитическая ситуация неприятна тем, что передовые американские ускорители им запрещают импортировать не только США, но и власти КНР, а на внутреннем рынке альтернатив им по быстродействию нет. В таких условиях ByteDance намерена эксплуатировать построенный в Малайзии ЦОД, который будет оснащён ускорителями Nvidia B200 с архитектурой Blackwell.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Как отмечает The Wall Street Journal, в интересах ByteDance южноазиатская компания Aolani Cloud строит в Малайзии центр обработки данных, включающий 36 000 ускорителей Nvidia B200, которые нельзя импортировать на территорию КНР из-за американских санкций. В свою очередь, Aolani будет закупать серверные системы у Aivres, которая их производит. Первая из компаний официально входит в число привилегированных партнёров Nvidia, которые в первую очередь получают ускорители для развития ИИ-инфраструктуры.

Основанная в 2023 году, Aolani входит в зарегистрированный на Каймановых островах холдинг. С февраля прошлого года она сдаёт в аренду ByteDance малазийские ЦОД на основе ускорителей Nvidia H100. Теперь китайский гигант надеется получить доступ к вычислительным мощностям на базе более современных B200 с архитектурой Blackwell, и для этого уже авансом перевела Aolani некоторую часть суммы, подразумевающей оплату сделки. Для оснащения нового ЦОД в Малайзии потребуется закупить оборудование на сумму $2,5 млрд, как минимум. Уже сейчас в строй введено аппаратное обеспечение на общую сумму около $100 млн. Aolani подчёркивает, что осуществляет свою деятельность в строгом соответствии с американскими правилами экспортного контроля. Компания собирается открыть вычислительные мощности в Южной Корее, Австралии и Европе.

Самой ByteDance данная малазийская площадка потребуется для проведения разработок и исследований, а также обслуживания клиентов за пределами Китая. Уже сейчас владелец TikTok около четверти общей выручки получает на внешних рынках. Пять разработанных ByteDance приложений входят в число 50 наиболее популярных в мире по итогам января текущего года. Команды разработчиков ByteDance находятся не только в Китае, но и в Сингапуре и США, причём в последнем из государств штат специалистов китайской компании активно расширяется. Компания планирует использовать в своих целях серверные системы на базе более чем 7000 ускорителей Nvidia B200, которые расположены в Индонезии, так что Малайзия является не единственным местом концентрации обслуживающих её интересы ЦОД.

MSI выпустила GeForce RTX 5070 Light Edition и Void Edition по мотивам World of Warcraft: Midnight

Компания MSI анонсировала ограниченный выпуск специальных версий GeForce RTX 5070 в оформлении по мотивам дополнения World of Warcraft: Midnight. Производитель выпустил два варианта карты — в исполнении Light Edition и Void Edition.

 Источник изображений: VideoCardz / MSI

Источник изображений: VideoCardz / MSI

MSI заявляет, что оба дизайна вдохновлены Кель'Таласом (новым регионом в игре) и темой Света против Пустоты. В издании Light Edition используется светлое оформление, в то время как в издании Void Edition преобладает более темный стиль и многослойные элементы освещения.

Что касается аппаратной части, обе карты имеют одинаковые основные характеристики. MSI указывает одинаковую тактовую частоту в режиме «экстремальная производительность» (2625 МГц через MSI Center) и частоту в режиме Boost 2610 МГц для обеих версий. Обе карты имеют по 6144 ядра CUDA и по 12 Гбайт памяти GDDR7 со скоростью 28 Гбит/с на контакт с шиной памяти 192 бит. Набор внешних разъёмов у них тоже одинаковый: три DisplayPort 2.1b и один HDMI 2.1b.

Карты основаны на дизайне MSI TRI FROZR 4. В нём же выпускаются модели Gaming Trio. В комплект поставки видеокарт входят подставки и стандартный набор дополнительных аксессуаров. Показатель энергопотребления у карт заявлен на уровне 250 Вт. Они оснащены одним 12+4-контактным разъёмом 12v-2x6. Производитель рекомендует использовать с картами блок питания мощностью от 650 Вт.

MSI добавила, что карты Light Edition и Void Edition появились в продаже по всему миру со 2 марта, но их поставки ограничены. Стоимость новинок производитель не сообщил.

Asus поделилась деталями ProArt GeForce RTX 5090 — минималистичный дизайн в стиле Founders Edition и заводской разгон GPU

Компания Asus поделилась полными техническими характеристиками видеокарты ProArt GeForce RTX 5090 32GB GDDR7 OC Edition (PROART-RTX5090-O32G). Впервые новинку продемонстрировали на выставке CES 2026.

 Источник изображений: VideoCardz / Asus

Источник изображений: VideoCardz / Asus

В основе ProArt RTX 5090 используется печатная плата в стиле PCB эталонной модели RTX 5090 Founders Edition от Nvidia. Карта оснащена так называемой сквозной системой охлаждения. Она получила два больших вентилятора диаметром 115 мм, которые прогоняют воздух через радиатор и выталкивают его с обратной стороны через два крупных отверстия. Производитель также применяет в составе системы охлаждения испарительную камеру и жидкий металл в качестве термоинтерфейса для GPU. В отличие от модели Founders Edition версия ProArt дополнительно оснащена видеовыходом USB Type-C.

От Founders Edition модель от Asus также отличается частотами графического процессора. В «стандартном» режиме для чипа заявлена частота 2482 МГц в режиме Boost. В режиме «разгона», доступном через фирменную утилиту GPU Tweak III, указана частота 2512 МГц. Для сравнения, для RTX 5090 Founders Edition заявлена частота 2,41 ГГц в режиме Boost.

Помимо USB Type-C, в набор внешних разъёмов видеокарты от Asus входят один HDMI 2.1b и два DisplayPort 2.1b. Размеры карты составляют 304 × 140 × 50 мм. Её толщина соответствует 2,5 слота расширения, а потому обеспечивается совместимость с компактными SFF-системами. Asus рекомендует использовать с картой блок питания мощностью от 1200 Вт.

Производитель не сообщил, когда карта поступит в продажу. Её стоимость также неизвестна. Рекомендованная цена RTX 5090 от Nvidia по-прежнему составляет $1999, однако текущая реальная розничная стоимость версий данного ускорителя обычно как минимум на $1500 выше.

Nvidia похвалилась, что Blackwell удешевили инференс нейросетей до 10 раз — и это заслуга не только «железа»

С развёртыванием ускорителей искусственного интеллекта на архитектуре Nvidia Blackwell стоимость инференса, то есть запуска обученных систем ИИ, удалось сократить в 4–10 раз. Такие данные привела сама Nvidia. Но за счёт одной только аппаратной части добиться подобных результатов не получилось бы.

 Источник изображений: nvidia.com

Источник изображений: nvidia.com

Значительного снижения затрат удалось добиться за счёт запуска ускорителей на архитектуре Nvidia Blackwell и моделей с открытым исходным кодом в инфраструктуре облачных операторов Baseten, DeepInfra, Fireworks AI и Together AI для задач, связанных со здравоохранением, играми, агентским ИИ и обслуживанием клиентов. Ещё один фактор — оптимизированные программные стеки. Перевод оборудования на Nvidia Blackwell помог сократить стоимость инференса вдвое по сравнению с ускорителями предыдущего поколения, а дальнейшему снижению затрат способствовал перевод систем в форматы пониженной точности, такие как NVFP4.

Компания Sully.ai добилась сокращения затрат на вывод данных ИИ в области здравоохранения на 90 %, то есть в десять раз; время отклика улучшилось на 65 % за счёт перехода от закрытых к открытым моделям ИИ в инфраструктуре Baseten. Автоматизация задач по написанию кода и ведению медицинских записей помогла сэкономить специалистам 30 млн минут рабочего времени. Latitude на своей платформе AI Dungeon сократила затраты на вывод данных ИИ в четыре раза. Для этого она запустила в инфраструктуре DeepInfra модели с конфигурацией «смеси экспертов» (MoE), снизив стоимость 1 млн токенов с $0,20 до $0,10, а перевод системы на низкоточный формат данных NVFP4 помог сократить цену до $0,05.

Sentient Foundation повысила экономическую эффективность платформы агентного чата на 25–50 % за счёт оптимизированного для Blackwell стека обработки данных Fireworks AI — платформа управления сложными рабочими процессами в неделю вирусного запуска обработала 5,6 млн запросов без ущерба для величины задержки. Decagon шестикратно снизила затраты на запрос для голосовой поддержки клиентов с ИИ, запустив многомодельный стек в инфраструктуре Together AI на ускорителях Blackwell. Время ответа сохранялось менее 400 мс даже при обработке нескольких тысяч токенов на запрос, что критически важно при голосовом взаимодействии, когда клиенты в любой момент могут прервать разговор.

Значение имеют характеристики рабочей нагрузки. ИИ-ускорители Blackwell успешно работают с «рассуждающими» ИИ-моделями, потому что для получения более качественных ответов те генерируют большее число токенов. Платформы эффективно обрабатывают эти расширенные последовательности за счёт дезагрегированного обслуживания — отдельной обработки предварительного заполнения контекста и собственно генерации токенов. При оценке затрат эти аспекты следует учитывать: при высоких объёмах генерации токенов можно добиться десятикратного повышения эффективности; уменьшенная генерация токенов в моделях высокой плотности ведёт лишь к четырёхкратному росту показателей.

В приведённых выше примерах речь идёт об ускорителях Nvidia Blackwell, но есть и альтернативные способы снижения затрат на вывод данных. Например, перевод систем на ускорители AMD Instinct MI300, Google TPU, а также специализированное оборудование Groq и Cerebras. Собственные средства оптимизации развёртывают и облачные провайдеры. Поэтому вопрос не в том, является ли архитектура Blackwell единственным вариантом, а в том, соответствует ли конкретное сочетание оборудования, ПО и моделей ИИ требованиям конкретной рабочей нагрузки.


window-new
Soft
Hard
Тренды 🔥
Instagram оповестил пользователей, которых взломали с помощью ИИ-бота Meta 7 мин.
Авторитетный инсайдер считает, что большая июньская презентация Nintendo Direct пройдёт на следующей неделе 2 ч.
Глава Take-Two Interactive Штраус Зельник стал рестлером — руководителя добавили в WWE 2K26 3 ч.
Meta вместо закрытия VR-приложения Supernatural выделит его разработку в самостоятельную компанию 3 ч.
Star Wars Zero Company скоро выйдет из тени — инсайдер рассекретил дату релиза суровой тактической стратегии от ветеранов XCOM 3 ч.
Google начала скупать исходный код приложений из «Play Маркета» для обучения ИИ 4 ч.
Вакансии CD Projekt Red раскрыли новые подробности Hadar — загадочной RPG с «безграничным потенциалом» 4 ч.
На Android Go появится облегчённый ИИ-помощник Gemini Go 5 ч.
Запущен экспериментальный сервис Google Dreambeans — он рисует комиксы по жизни пользователя 5 ч.
Ролевой экшен No Rest for the Wicked покинет ранний доступ в октябре и также выйдет на PS5 7 ч.
Репортаж со стенда DeepCool на Computex 2026: беспроводные вентиляторы, кулеры с экранами и блоки питания до 3200 Вт 6 мин.
«Яндекс» применит концепцию кампусов ЦОД и жидкостное охлаждение для быстрого развёртывания ИИ-мощностей 18 мин.
В Сахаре нашли осколок исчезнувшей протопланеты времён рождения Солнечной системы 2 ч.
Iren построит в Австралии кампус ЦОД мощностью 800 МВт 2 ч.
Google ставит на виртуальные электростанции Voltus для обеспечения роста ЦОД 2 ч.
«Сбер» анонсировал НЕО — «первый в мире» платёжный терминал с ИИ 2 ч.
Касперский анонсировал «российскую железку» с фирменной ОС, которую «невозможно взломать» 2 ч.
Pacific Fusion испытала прототип «бюджетного» термоядерного зажигания — на инерциальном сжатии топлива с помощью конденсаторов 2 ч.
Apple высмеяла Android-смартфоны за проблемы с конфиденциальностью в новой рекламе iPhone 2 ч.
Baidu выведет на биржу своего разработчика ИИ-чипов стоимостью до $64 млрд 3 ч.