Сегодня 16 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → ускоритель
Быстрый переход

AMD по примеру Nvidia возобновит поставки своих ИИ-ускорителей Instinct в Китай

Представитель AMD в разговоре с порталом Tom’s Hardware подтвердил, что компания возобновит поставки ИИ-ускорителей MI308 в Китай. Это специализированная модификация ускорителей серии Instinct MI300, разработанная специально для соответствия экспортным правилам, установленным Министерством торговли США.

 Источник изображения: AMD

Источник изображения: AMD

Ранее сегодня глава Nvidia Дженсен Хуанг (Jensen Huang) публично подтвердил, что компания немедленно приступает к подготовке возобновления продаж своих ИИ-ускорителей Hopper H20 в Китае. Nvidia рассчитывает получить разрешение на продажу этих специализированных GPU, изготовленных по индивидуальному заказу, после того как в апреле они были запрещены к продаже в Китае обновлёнными экспортными правилами США.

AMD и Nvidia ясно дали понять, что китайский рынок критически важен для их бизнеса, поскольку они разрабатывают специализированные GPU для центров обработки данных с учётом ограничений правительства США. Однако проектирование и выпуск таких вариантов графических чипов — процесс небыстрый: их разработка, производство, сборка и настройка занимают месяцы. После завершения разработки и установки необходимой прошивки устройства фактически становятся программно заблокированными в соответствии с экспортными ограничениями, что часто затрудняет их продажу за пределами рынков, для которых эти ограничения были введены.

«Мы планируем возобновить поставки, как только получим одобрение по лицензии. Министерство торговли недавно сообщило нам, что заявки на получение лицензий на экспорт продукции MI308 в Китай будут переданы на рассмотрение», — заявил представитель AMD в разговоре с Tom’s Hardware.

Обе компании оказались под давлением в связи с масштабным экспортным контролем на поставки технологий, связанных с ИИ, введённым ещё предыдущей администрацией президента США Джо Байдена и продолженным нынешней администрацией президента Дональда Трампа. Последняя, хоть и сузила ограничения, всё же включила в список запрещённых к поставке чипов такие модели, как H20 и MI308.

Согласно оценке AMD, экспортные ограничения могут обойтись ей примерно в $800 млн в виде нераспроданных запасов, невыполненных обязательств по заказам и оставшихся резервов. Хотя это значительно меньше, чем масштабное списание Nvidia в размере $5,5 млрд, потери всё же заметно ударят по чистой прибыли AMD. После сегодняшнего объявления акции AMD подскочили на 5,7 % вслед за аналогичным ростом акций Nvidia.

Один сбитый бит — и всё пропало: атака GPUHammer на ускорители Nvidia ломает ИИ с минимальными усилиями

Команда исследователей из Университета Торонто обнаружила новую атаку под названием GPUHammer, которая может инвертировать биты в памяти графических процессоров Nvidia, незаметно повреждая модели ИИ и нанося серьёзный ущерб, не затрагивая при этом сам код или входные данные. К счастью, Nvidia уже опередила потенциальных злоумышленников, которые могли бы воспользоваться этой уязвимостью, и выпустила рекомендации по снижению риска, связанного с этой проблемой.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Исследователи продемонстрировали, как GPUHammer может снизить точность модели ИИ с 80 % до менее 1 % — всего лишь инвертируя один бит в памяти. Они протестировали уязвимость на реальной профессиональной видеокарте Nvidia RTX A6000, используя технику многократного инжектирования ячеек памяти до тех пор, пока одна из соседних ячеек не инвертируется, что нарушает целостность хранящихся в ней данных.

GPUHammer — это версия известной аппаратной уязвимости Rowhammer, ориентированная на графические процессоры. Это явление уже давно существует в мире процессоров и оперативной памяти. Современные микросхемы памяти настолько плотно упакованы, что многократное чтение или запись одной строки может вызвать электрические помехи, которые переворачивают (инвертируют) биты в соседних строках. Этим перевернутым битом может быть что угодно — число, команда или часть веса нейронной сети.

До сих пор эта уязвимость в основном касалась системной памяти DDR4, но GPUHammer продемонстрировала свою эффективность с видеопамятью GDDR6, которая используется во многих современных видеокартах Nvidia. Это серьёзная причина для беспокойства, по крайней мере, в определённых ситуациях. Исследователи показали, что даже при наличии некоторых мер защиты они могут вызывать множественные перевороты битов в нескольких банках памяти. В одном случае это полностью сломало обученную модель ИИ, сделав её практически бесполезной. Примечательно, что для этого даже не требуется доступ к данным. Злоумышленнику достаточно просто использовать тот же графический процессор в облачной среде или на сервере, и он потенциально может вмешиваться в вашу рабочую нагрузку по своему усмотрению.

Исследователи протестировали метод атаки на карте RTX A6000, но риску подвержен широкий спектр графических процессоров Ampere, Ada, Hopper и Turing, особенно тех, что используются в рабочих станциях и серверах. Nvidia опубликовала полный список уязвимых моделей ускорителей и рекомендует использовать функцию коррекции ошибок ECC для решения большинства из них. При этом новые графические процессоры, такие как RTX 5090 и серверные H100, имеют встроенную ECC непосредственно на GPU, и она работает автоматически — настройка пользователем не требуется.

Данная уязвимость не затрагивает обычных пользователей домашних ПК. Она актуальна для общих сред графических процессоров, таких как облачные игровые серверы, кластеры обучения ИИ или конфигурации VDI, где несколько пользователей запускают рабочие нагрузки на одном оборудовании. Тем не менее угроза реальна и должна быть серьезно воспринята всей индустрией, особенно с учётом того, что всё больше игр, приложений и сервисов начинают в той или иной мере использовать ИИ.

Рекомендация Nvidia сводится к использованию функции ECC. Её можно включить с помощью командной строки Nvidia, введя команду nvidia-smi -e 1. Проверить активность функции ECC можно с помощью команды nvidia-smi -q | grep ECC. Следует помнить, что включение ECC имеет небольшой недостаток — снижение производительности примерно на 10 % при выполнении задач машинного обучения и сокращение объёма используемой видеопамяти примерно на 6–6,5 %. Но для серьёзной работы с ИИ это разумный компромисс.

Атаки, подобные GPUHammer, не просто приводят к сбоям в работе систем или вызывают сбои. Они нарушают целостность самого ИИ, влияя на поведение моделей или принятие решений. И поскольку всё это происходит на аппаратном уровне, эти изменения практически незаметны, особенно если не знать, что именно и где искать. В регулируемых отраслях, таких как здравоохранение, финансы или автономный транспорт, это может привести к серьёзным проблемам — неверным решениям, нарушениям безопасности и даже юридическим последствиям.

Nvidia выпустит ИИ-ускоритель B30 специально для Китая взамен запрещённого H20

Nvidia разрабатывает специализированный ИИ-ускоритель B30, соответствующий требованиям экспортного контроля США и предназначенный для поставок в Китай. Новый графический ускоритель (GPU) построен на архитектуре Blackwell и, вероятно, получит поддержку NVLink для объединения нескольких GPU в вычислительные кластеры. Эта разработка стала прямым ответом Nvidia на запрет, введённый правительством США на экспорт в КНР чипов линейки H20 на архитектуре Hopper.

 Источник изображений: Nvidia

Источник изображений: Nvidia

Главная особенность будущего B30 — поддержка масштабирования через объединение нескольких GPU. Эта функция, по мнению аналитиков, может быть реализована либо с применением технологии NVLink, либо посредством сетевых адаптеров ConnectX-8 SuperNIC с поддержкой PCIe 6.0. Несмотря на то, что Nvidia официально исключила NVLink из потребительских GPU начиная с предыдущего поколения, существует вероятность, что компания модифицировала кристаллы GB202, используемые в RTX 5090, и повторно активировала NVLink в их серверной конфигурации.

Изначально будущий GPU фигурировал под различными названиями — от RTX Pro 6000D до B40, а теперь B30. Это, вероятно, указывает на наличие нескольких вариантов в рамках новой серии BXX, различающихся по уровню производительности и соответствию требованиям экспортного регулирования. Все модификации предполагается строить на чипах GB20X с использованием памяти GDDR7. Примечательно, что GB20X — это те же кристаллы, которые лежат в основе потребительских видеокарт линейки RTX 50. Таким образом, Nvidia не создаёт принципиально новый чип, а адаптирует уже существующую архитектуру для обхода ограничений.

 Nvidia RTX PRO 6000 Blackwell Workstation Edition

Nvidia RTX PRO 6000 Blackwell Workstation Edition

На выставке Computex в Тайбэе Nvidia представила серверные системы RTX Pro Blackwell, рассчитанные на установку до восьми GPU RTX Pro 6000. Эти ускорители соединяются между собой через сетевые адаптеры ConnectX-8 SuperNIC, оснащённые встроенными PCIe 6.0-коммутаторами, обеспечивающими прямое взаимодействие между GPU. Та же схема коммуникации применяется при объединении двух суперчипов DGX Spark, которые служат основой для корпоративных и облачных ИИ-решений. Вероятнее всего, аналогичная архитектура будет использована и в B30.

Комментируя запрет на экспорт H20, бессменный руководитель Nvidia Дженсен Хуанг (Jensen Huang) подчеркнул, что компания прекращает разработку альтернатив на архитектуре Hopper и сосредотачивается на Blackwell. Правительство США, в свою очередь, заявило, что у H20 — слишком высокая пропускная способность памяти и интерфейсных соединений, что делает чип неприемлемым для свободного экспорта. Эти параметры, по мнению регуляторов, создают риск использования ускорителей в составе китайских суперкомпьютеров, способных обслуживать оборонные и военные программы.

 Nvidia H200 Tensor Core GPU

Nvidia H200 Tensor Core GPU

Ситуация с экспортными ограничениями не ограничивается только Nvidia. Американские регуляторы оказывают серьёзное влияние на весь рынок высокопроизводительных ИИ-решений. Компания AMD, например, оценивает потенциальные убытки от запрета на экспорт ускорителей MI308 в размере до $800 млн. Эта оценка была представлена сразу после вступления в силу новых ограничений. На протяжении последних лет Nvidia ведёт постоянную борьбу с регуляторами, сталкиваясь с чередой запретов и требований, где каждое новое поколение чипов, от A100 до H100 и H20, подвергается новым формам контроля.

Хуанг, критикуя действующую экспортную политику США, назвал её «провалом» и предупредил о рисках стратегического отставания. По его мнению, такие меры лишь подталкивают китайские технологические компании, включая Huawei, к активному развитию собственных ИИ-решений. В результате они могут не только догнать, но и перегнать американских техногигантов, сформировав собственные стандарты, которые в будущем могут стать основой глобальной ИИ-инфраструктуры. Это создаёт угрозу потери влияния США не только в технологической, но и в военно-стратегической сфере.

Intel представила профессиональные видеокарты Arc Pro B60 и Arc Pro B50, и возможно двухчиповую версию B60

Компания Intel представила профессиональные видеокарты Arc Pro B50 и Arc Pro B60 для рабочих станций. Старшая модель оснащена 24 Гбайт памяти, младшая — 16 Гбайт. Производитель также анонсировал рабочую станцию под названием Battlematrix, которая соединит в себе до восьми графических процессоров Arc Pro B60 — вероятно, в двухчиповой конфигурации.

 Источник изображений: Tom's Hardware / Intel

Источник изображений: Tom's Hardware / Intel

В основе Arc Pro B60 используется полноценный графический чип BGM-G21 с 20 ядрами Xe2-HPG, 20 блоками трассировки лучей и 160 матричными движками (XMX). Карта получила 24 Гбайт памяти GDDR6 со скоростью 19 Гбит/с на контакт, 192-битной шиной и пропускной способностью 456 Гбайт/с.

Для работы новинка использует восемь линий PCIe 5.0. Набор внешних видеоразъёмов будет варьироваться в зависимости от производителя.

По словам Intel, Arc Pro B60 обеспечивает до 197 TOPS производительности в 8-битных целочисленных операциях (INT8). Энергопотребление карты заявлено в диапазоне от 120 до 200 Вт (в зависимости от конкретной модели партнёра). В своих внутренних тестах компания подчёркивает преимущество 24 Гбайт памяти у Arc Pro B60 по сравнению с конкурентами — RTX 200 Ada 16 Гбайт и RTX 5060 Ti 16 Гбайт от Nvidia, утверждая, что это обеспечивает превосходство до 2,7 раза при работе с различными ИИ-моделями. Также подчёркиваются преимущества большей ёмкости памяти с учётом объёма моделей, сценариев использования и масштабирования параллелизма.

Модель Arc Pro B50 включает графический процессор BGM-G21 с 16 ядрами Xe2-HPG, 16 блоками трассировки лучей и 128 матричными движками (XMX).

Карта оснащена 16 Гбайт памяти GDDR6 со скоростью 19 Гбит/с на контакт, 128-битной шиной и пропускной способностью 224 Гбайт/с. В задачах INT8 она обеспечивает производительность до 170 TOPS. Энергопотребление карты составляет 70 Вт. Набор внешних видеоразъёмов включает четыре mini-DisplayPort 2.1. Для подключения используется 8 линий PCIe 5.0.

Компания заявляет, что Arc Pro B50 демонстрирует в графических задачах до 3,4 раза более высокую производительность по сравнению с предшественником A50. В качестве основного конкурента Intel выделяет Nvidia RTX 1000.

Что касается проекта Battlematrix, то судя по иллюстрации, а также анонсу китайской компании MaxSun, в системах будут использованы карты с двумя графическими процессорами Arc Pro B60 и 48 Гбайт памяти. Это даст до 192 Гбайт видеопамяти на одну машину. Также в этих системах будут использоваться процессоры Intel Xeon.

Стоимость подобных рабочих станций будет варьироваться от $5000 до $10 000. Компания отмечает, что рабочие станции Battlematrix предназначены для работы с ИИ-моделями с более чем 70 млрд параметров.

Arc Pro B50 компания Intel оценила в $299, тогда как Arc Pro B60 будет стоит около $500. Оба ускорителя станут доступны в третьем квартале текущего года в составе готовых рабочих станций. Однако в четвёртом квартале года карты также ожидаются в виде самостоятельных продуктов.

Профессиональная видеокарта Nvidia RTX Pro 6000 Blackwell Workstation Edition с 96 Гбайт GDDR7 поступила в продажу за €9000

Компания Nvidia пока официально не объявляла о старте продаж профессиональной видеокарты RTX Pro 6000 Blackwell Workstation Edition, однако, как сообщает VideoCardz, она уже появилась у некоторых ритейлеров. В марте компания представила новинку вместе с моделью RTX Pro 6000 Blackwell Server Edition с 96 Гбайт памяти GDDR7 — специализированной версией для серверов.

 Источник изображений: Reddit

Источник изображений: Reddit

Как и ожидалось, RTX Pro 6000 Blackwell Workstation Edition оказалась очень дорогой. Новинку удалось найти по цене €8982 (включая НДС 21 %). Карта появилась в базах данных многих европейских и канадских ритейлеров, что может свидетельствовать о её поставках в эти регионы в преддверии официального запуска продаж.

 RTX Pro Blackwell 6000 Workstation Edition у ретейлеров в Европе

RTX Pro 6000 Blackwell Workstation Edition у ретейлеров в Европе

Один из пользователей Reddit приобрёл RTX Pro 6000 Blackwell Workstation Edition и опубликовал её фотографии. По его словам, видеокарта была куплена с использованием гранта в размере $5000. Однако даже с учётом этого её стоимость оказалась выше, чем у игрового флагмана RTX 5090, который в настоящий момент продаётся примерно за $3000.

В основе RTX Pro 6000 Blackwell Workstation Edition используется графический процессор GB202 с 24 064 ядрами CUDA и 96 Гбайт памяти GDDR7 с поддержкой ECC. Энергопотребление заявлено на уровне 600 Вт. Помимо RTX Pro 6000 Blackwell Workstation Edition и RTX Pro 6000 Blackwell Server Edition, компания Nvidia также выпустит модель RTX Pro 6000 Blackwell Max-Q Edition с энергопотреблением 300 Вт.

У AMD пока нет альтернатив этим картам. Кроме того, не поступало сообщений о планах компании выпустить профессиональный ускоритель с 96 Гбайт памяти. Архитектура Navi 4 поддерживает шину памяти шириной до 256 бит и не была замечена в конфигурациях с памятью GDDR7. На рынке также отсутствуют 3-Гбайт чипы памяти GDDR6, что делает аналогичную конфигурацию маловероятной в текущем поколении ускорителей AMD. Другими словами, серия RTX Pro 6000 остаётся единственным настольным GPU с таким объёмом памяти.

Nvidia придумала, как законно обойти антикитайские санкции, и продолжит поставки ИИ-ускорителей в Китай

После ужесточения санкций со стороны США и запрета на поставку в Китай ИИ-ускорителя H20, Nvidia оказалась в сложной ситуации и вынуждена пересмотреть стратегию работы с ключевым китайским рынком, чтобы избежать нарушений экспортных ограничений. Компания ведёт переговоры с Alibaba, ByteDance и Tencent о поставках адаптированных чипов.

 Источник изображения: Mariia Shalabaieva / Unsplash

Источник изображения: Mariia Shalabaieva / Unsplash

По сообщению Reuters, генеральный директор компании Дженсен Хуан (Jensen Huang) лично проинформировал партнёров о новых разработках во время своего визита в Пекин в середине апреля. Эта поездка состоялась вскоре после того, как США ограничили экспорт в Китай чипов H20 (специализированный вариант H100) для задач искусственного интеллекта.

По оценкам самой Nvidia, новые экспортные ограничения могут лишить компанию $5,5 млрд выручки, и чтобы минимизировать потери, разрабатываются чипы, которые формально соответствовали бы американским требованиям, но при этом сохраняли бы высокую производительность. Параллельно ведётся работа над «китайской» версией новейшего процессора Blackwell.

Китайский рынок остаётся критически важным для Nvidia, поэтому компания ищет любые способы сохранить там своё присутствие. Ранее она уже выпускала «урезанные» версии чипов для этого региона, но новые санкции требуют более сложных технических решений, над чем сейчас и трудятся инженеры. Сообщается, что первые образцы ИИ-ускорителей поступят китайским клиентам уже в июне, а китайская версия Blackwell — немного позже.

Представители Nvidia отказались комментировать эту информацию. Компании ByteDance, Alibaba и Tencent, а также Министерство торговли США не ответили на запросы Reuters.

В Китае подоспела замена ИИ-чипам Nvidia: Huawei начнёт отгрузки Ascend 910C в мае

Компания Huawei Technologies планирует уже в следующем месяце начать массовые поставки своего усовершенствованного ИИ-ускорителя Ascend 910C на внутренний рынок китайским клиентам. Единичные отгрузки чипов уже состоялись и, как отмечает Reuters, планы компании совпадают с ключевым моментом — китайские разработчики остались без доступа к современным чипам Nvidia из-за новых экспортных ограничений США.

 Источник изображения: Huawei Technologies

Источник изображения: Huawei Technologies

С начала апреля администрация президента США Дональда Трампа (Donald Trump) потребовала, чтобы Nvidia получила экспортную лицензию на поставки в Китай своего чипа H20, который был одним из немногих, разрешённых к свободной продаже в Поднебесной. Теперь китайские компании вынуждены искать внутренние альтернативы, и Huawei со своим новым чипом может занять освободившуюся нишу.

Huawei Ascend 910C представляет собой графический процессор (GPU), который, по словам экспертов, достигает уровня производительности, сопоставимого с Nvidia H100. Это стало возможным благодаря объединению двух чипов 910B в одном корпусе с использованием современных технологий интеграции. Уточняется, что новинка обладает вдвое большей вычислительной мощностью и объёмом памяти по сравнению с предыдущей моделью, а также улучшенной поддержкой различных типов нагрузок, связанных с работой искусственного интеллекта (ИИ).

Хотя Huawei официально отказывается комментировать планы по поставкам и не раскрывает технические характеристики 910C, эксперты считают, что чип может стать основным выбором китайских разработчиков ИИ-моделей в условиях усилившегося технологического давления со стороны США.

Как стало известно Reuters, Huawei ещё в конце прошлого года разослала тестовые образцы Ascend 910C технологическим компаниям и начала принимать заказы. Однако какие именно предприятия производят новый чип, пока неизвестно. По данным источников, часть компонентов изготавливает китайская SMIC по 7-нанометровой технологии, но с низким процентом выхода годных чипов.

Также выяснилось, что некоторые GPU 910C содержат полупроводники, произведённые тайваньской компанией TSMC для китайской Sophgo. В связи с этим Министерство торговли США начало расследование, поскольку TSMC с 2020 года официально не сотрудничает с Huawei. По данным исследователя из Центра технологий, безопасности и политики RAND в Арлингтоне (США) Леннарта Хайма (Lennart Heim), TSMC выпустила всего около трёх миллионов чипов по заказу Sophgo.

Huawei отрицает использование чипов TSMC в своих процессорах. Sophgo не прокомментировала ситуацию, а TSMC заявила о полном соблюдении экспортных ограничений.

AMD анонсировала мероприятие Advancing AI, на котором представит ИИ-ускорители Instinct MI355X

Компания AMD запланировала проведение мероприятия Advancing AI на 12 июня. На нём будут представлены специализированные ускорители Instinct нового поколения. Компания также пообещала обновления для своей платформы Radeon Open Compute Platform (ROCm), предназначенной для высокопроизводительных вычислений (HPC) и задач искусственного интеллекта.

 Источник изображения: AMD

Источник изображения: AMD

От AMD ожидается анонс ИИ-ускорителей Instinct MI355X. Ранее компания заявляла, что этот продукт будет выпущен во второй половине 2025 года. В составе ускорителей будут использоваться графические процессоры на архитектуре CDNA 4, производимые по 3-нм техпроцессу, а также до 288 Гбайт памяти HBM3e.

Возможно, компания также поделится свежими подробностями об ускорителях Instinct MI400, выход которых намечен на 2026 год. Они станут первыми ИИ-ускорителями AMD, использующими память HBM4.

AMD проведёт прямую трансляцию мероприятия Advancing AI 12 июня в 9:30 по тихоокеанскому времени (19:30 мск). Вести мероприятие будет глава компании AMD Лиза Су (Lisa Su).

Китай ударит по Nvidia новыми экологическими нормами — компания потеряет до $17 млрд выручки в год

Китайские власти ввели новые нормы энергоэффективности при использовании передовых чипов — из-за них китайские компании могут лишиться возможности покупать самые продаваемые в Китае ускорители Nvidia. Самой компании эти правила грозят потерей выручки в размере $17 млрд в год, пишет Financial Times.

 Источник изображения: nvidia.com

Источник изображения: nvidia.com

Государственный комитет по развитию и реформам КНР рекомендует использовать в новых центрах обработки данных и при расширении существующих объектов чипы, отвечающие строгим требованиям, и ускорители Nvidia H20, которые производятся специально для Китая в соответствии с американскими санкциями, этим требованиям не соответствуют. В последние месяцы китайские власти негласно отговаривали местных технологических гигантов, в том числе Alibaba, ByteDance и Tencent от закупки H20; сейчас эти нормы не соблюдаются по всей строгости и пока не повлияли на продажи ускорителей данной модели. Но если ведомство решит ужесточить запрет, это создаст угрозу для бизнеса Nvidia в стране, где годовой оборот компании составляет $17 млрд.

Китай активно строит новые ЦОД, и американский производитель рискует растерять заказы, которые уйдут местным конкурентам, в том числе Huawei, чья продукция в большей мере соответствует повестке Пекина. В попытке избежать реализации неблагоприятного сценария руководство Nvidia стремится в ближайшие месяцы провести встречу с главой комитета Чжэном Шаньцзе (Zheng Shanjie). Новые нормы были введены ещё в прошлом году, ранее о них не сообщалось — они возникли на фоне торговой напряжённости между США и Китаем, соревнующихся в разработке передового искусственного интеллекта. Пекин пытается снизить зависимость местных компаний от продукции зарубежных игроков вроде Nvidia, чья продукция оказалась критически важной при разработке передовых моделей ИИ.

Несоблюдение требований грозит компаниям проверками на местах и штрафами — всего этого они стремятся избежать. Чтобы преодолеть угрозу, Nvidia подготовила решение для внесения корректировок в ускорители H20, но они могут снизить эффективность компонента и сделать его менее конкурентоспособным на китайском рынке. Технологические гиганты, в том числе Alibaba и Tencent, в этом году активно нарастили заказы на H20 после выхода эффективной рассуждающей модели ИИ DeepSeek R1.

Nvidia тем временем всё чаще попадает в поле зрения китайских регуляторов: Государственное управление рыночного регулирования (SAMR) в декабре инициировало проверку, чтобы выяснить, не ограничивала ли Nvidia поставки ускорителей в Китай в 2022 году ещё до введения американских санкций. По итогам 2025 финансового года доход компании в стране составил $17,1 млрд — это 13 % от общего объёма продаж. Новым экологическим требованиям не соответствуют также чипы Intel HL328 и HL388, но из-за их незначительного присутствия на рынке масштабных последствий от возможных мер в отношении этой продукции не предвидится.

Nvidia представила видеокарты с 96 Гбайт GDDR7 — профессиональные RTX Pro Blackwell для серверов, ПК и ноутбуков

Компания Nvidia представила новые профессиональные настольные и мобильные видеокарты серии Nvidia RTX Pro на архитектуре Blackwell для рабочих станций и серверов. Эти решения предназначены для различных задач, включая работу с агентными ИИ, моделированием, дополненной реальностью, 3D-дизайном, сложными визуальными эффектами, а также разработку ИИ для робототехники и транспортных средств.

 Источник изображений: Nvidia

Источник изображений: Nvidia

Для дата-центров компания подготовила ускоритель Nvidia RTX Pro 6000 Blackwell Server Edition, построенный на чипе GB202 в полной конфигурации с 24 064 ядрами CUDA, который дополняют 96 Гбайт памяти GDDR7.

 Nvidia RTX Pro 6000 Blackwell Server Edition

Nvidia RTX Pro 6000 Blackwell Server Edition

Для настольных систем представлены модели Nvidia RTX Pro 6000 Blackwell Workstation Edition, Nvidia RTX Pro 6000 Blackwell Max-Q Workstation Edition, Nvidia RTX Pro 5000 Blackwell, Nvidia RTX Pro 4500 Blackwell и Nvidia RTX Pro 4000 Blackwell. Видеокарты RTX Pro 6000 предлагают те же характеристики, что и серверная версия, а версия Max-Q отличается от обычной вдвое меньшим энергопотреблением. Остальные карты предлагают более скромные характеристики, от 8960 CUDA и 24 Гбайт памяти до 14 080 CUDA и 48 Гбайт памяти.

 Nvidia RTX Pro 6000 Blackwell Workstation Edition

Nvidia RTX Pro 6000 Blackwell Workstation Edition

 Nvidia RTX Pro 4000 Blackwell

Nvidia RTX Pro 4000 Blackwell

 Nvidia RTX Pro 6000 Blackwell Max-Q Workstation Edition

Nvidia RTX Pro 6000 Blackwell Max-Q Workstation Edition

Для мобильных рабочих станций анонсированы видеокарты Nvidia RTX Pro 5000 Blackwell, Nvidia RTX Pro 4000 Blackwell, Nvidia RTX Pro 3000 Blackwell, Nvidia RTX Pro 2000 Blackwell, Nvidia RTX Pro 1000 Blackwell и Nvidia RTX Pro 500 Blackwell. Они предлагают от 6 до 24 Гбайт памяти GDDR7 и графические процессоры поколения Blackwell, которые насчитывают от 1792 до 10 496 ядеро CUDA.

Новые ускорители Nvidia RTX Pro Blackwell обладают рядом преимуществ. Потоковые мультипроцессоры Nvidia обеспечивают до 1,5 раза более высокую пропускную способность и включают новые нейронные шейдеры. Четвёртое поколение RT-ядер обеспечивает двукратный прирост производительности при рендеринге фотореалистичных сцен и сложных 3D-проектов, оптимизированных под Nvidia RTX Mega Geometry. Четвёртое поколение тензорных ядер выполняет до 4000 триллионов ИИ-операций в секунду, поддерживает вычисления FP4 и работу технологии Nvidia DLSS 4 Multi Frame Generation. Ускорители оснащены аппаратным многопоточным кодировщиком Nvidia NVENC девятого поколения с поддержкой кодирования 4:2:2, а также кодировщиком шестого поколения для декодирования 4:2:2 H.264 и HEVC.

 Nvidia RTX Pro 6000 Blackwell Server Edition

Все модели поддерживают интерфейс PCIe 5.0, DisplayPort 2.1 с разрешением до 4K@180 Гц или 8K@165 Гц, а также технологию Multi-Instance GPU (MIG), позволяющую разделять один GPU на четыре независимых виртуальных графических процессора, что вдвое больше по сравнению с предыдущими моделями.

Первые тестирования показали высокую эффективность новинок. Компания Foster + Partners отметила пятикратный рост производительности в среде проектирования Cyclops по сравнению с Nvidia RTX A6000. GE HealthCare зафиксировала двукратный прирост эффективности в обработке алгоритмов реконструкции. SoftServe заявила, что 96 Гбайт памяти у Nvidia RTX Pro Workstation Edition увеличивают продуктивность при работе с Llama 3.3-70B, Mistral 8x7b и платформой Nvidia Omniverse в три раза.

Профессиональные ускорители Nvidia RTX Pro 6000 Blackwell Workstation Edition и Nvidia RTX Pro 6000 Blackwell Max-Q Workstation Edition поступят в продажу через глобальных партнёров-дистрибьюторов, таких как PNY и TD SYNNEX, в апреле. В мае они появятся у BOXX, Dell, HP Inc., Lambda и Lenovo. Модели Nvidia RTX Pro 5000, RTX Pro 4500 и RTX Pro 4000 Blackwell поступят в продажу летом в магазинах BOXX, Dell, HP и Lenovo, а также через глобальных партнеров-дистрибьюторов. Профессиональные ускорители Nvidia RTX Pro для ноутбуков ожидаются в ассортименте компаний Dell, HP, Lenovo и Razer позже в этом году.

У OpenAI закончились ИИ-ускорители — глава компании объяснил задержку GPT-4.5

OpenAI сообщила о выходе модели искусственного интеллекта GPT-4.5, но доступ к ней получили только пользователи подписки ChatGPT Pro, которые платят $200 в месяц. Полномасштабное развёртывание новой модели пришлось отложить, поскольку «мы слишком выросли, и у нас закончились графические процессоры», необходимые для этого, сообщил глава компании Сэм Альтман (Sam Altman).

 Источник изображения: nvidia.com

Источник изображения: nvidia.com

«На следующей неделе мы добавим несколько десятков тысяч графических процессоров и выпустим её на тариф Plus», — пообещал гендиректор OpenAI и добавил, что вскоре компания получит ещё сотни тысяч ускорителей. Из-за мирового дефицита вычислительных мощностей компания была вынуждена обратиться к Broadcom с целью совместной разработки собственного ускорителя для ИИ. Однако на это уйдёт не один год, а пока для удовлетворения своих потребностей и потребностей клиентов компании приходится работать с оборудованием Nvidia и других поставщиков.

Это в очередной раз подчёркивает, в каком выгодном положении остаётся Nvidia. Недавно компания заявила, что ускорители последнего поколения Blackwell распроданы до октября текущего года. А поскольку мировая отрасль центров обработки данных планирует крупномасштабное расширение существующих и строительство новых объектов, успех будет сопутствовать «зелёным» ещё несколько лет. Только OpenAI и Microsoft работают над суперкомпьютером, который обойдётся в $100 млрд, а Илон Маск (Elon Musk) намеревается расширить свой суперкомпьютер Colossus в Мемфисе (штат Теннесси, США) до более чем миллиона ускорителей. В Южной Корее одобрение получил объект мощностью 3 ГВт, а ЦОД планируют запустить даже на Луне.

Глава Microsoft Сатья Наделла (Satya Nadella) выразил опасение, что мощности объектов для ИИ окажутся чрезмерными, хотя новые модели становятся всё более требовательными к вычислительным ресурсам. Яркий тому пример — новая OpenAI GPT-4.5. Это «гигантская, дорогая модель», как охарактеризовал её Сэм Альтман. Стоимость подключения к ней составит $75 за 1 млн входных токенов и $150 за 1 млн выходных — для сравнения, у GPT-4o эти тарифы составляют $2,50 и $10 соответственно. Несмотря на цену, это «не рассуждающая модель, и [она] не побьёт эталонных показателей», признался гендиректор OpenAI, но, по его словам, «это другой вид интеллекта, [у него] есть волшебство, которого я прежде не ощущал».

Nvidia выпустит 77 % всех чипов для ИИ в мире в 2025 году

Переживающий небывалый подъём рынок искусственного интеллекта можно оценивать по разным критериям. Наиболее очевидными представляются производительность и потребление энергии, но аналитики Morgan Stanley решили обратиться к потреблению кремниевых пластин для ИИ-процессоров. Как выяснилось, в 2025 году Nvidia претендует на 77 % мирового рынка этой продукции.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Nvidia продолжает работать в беспрецедентных масштабах и резко наращивать производство, тогда как доля AMD в разрезе использования пластин за год обещает снизиться. В доклад также включены данные по AWS, Google, Tesla, Microsoft и китайским поставщикам. По итогам 2025 года на Nvidia придётся до 535 000 300-мм пластин для ИИ-чипов, что составит 77 % мирового рынка. Для сравнения: в 2024 году доля компании составляла 51 %, указывают аналитики Morgan Stanley.

Активно набирают обороты альтернативные чипы, в том числе Google TPU v6 и AWS Trainium, но они сильно уступают темпам Nvidia. Доля AWS в течение года снизится с 10 % до 7 %, а доля Google — с 19 % до 10 %. Google потребуется 85 000 пластин для TPU v6; AWS — 30 000 для Trainium 2 и 16 000 для Trainium 3.

 Источник изображения: x.com/Jukanlosreve

Источник изображения: x.com/Jukanlosreve

Доля AMD снизится с 9 % до 3 %. Для её ИИ-ускорителей Instinct MI300, MI325 и MI355 понадобятся от 5000 до 25 000 пластин в зависимости от модели. В абсолютных показателях AMD не намерена сокращать потребление пластин, но её доля на рынке уменьшится. Процессоры Intel Gaudi 3 (Habana) займут всего 1 %; незначительны также доли Tesla, Microsoft и китайских поставщиков.

Доля чипов Tesla Dojo и FSD остаётся невеликой, поскольку компания является нишевым игроком на рынке ИИ. Потребности Microsoft в кремниевых пластинах также скромны: её ускоритель Maia 200 и его улучшенная версия используются в ограниченных масштабах, поскольку корпорация продолжает применять решения Nvidia как для обучения, так и для запуска моделей ИИ. В докладе не уточняется, чем обусловлено доминирование Nvidia в этом году — спросом или объёмом зарезервированных мощностей у TSMC.

Рынок ИИ-чипов в 2025 году, как ожидается, потребует 688 000 пластин, что в денежном выражении составит $14,57 млрд. Однако этот показатель может оказаться заниженным, поскольку в 2024 году TSMC заработала $64,93 млрд, из которых 51 % (более $32 млрд) пришлось на сегменты высокопроизводительных вычислений (HPC).

Технически это направление включает в себя не только ИИ-ускорители, но и процессоры для потребительских ПК, а также чипы для игровых приставок. Однако значительная часть доходов связана именно с графическими и центральными процессорами для центров обработки данных.

Наибольший вклад в показатели Nvidia вносит модель B200: для её производства потребуется 220 000 пластин, что эквивалентно $5,84 млрд дохода. Компания укрепит свои позиции за счёт ускорителей H100, H200 и B300. Все они производятся по техпроцессу TSMC 4 нм, а размеры вычислительных кристаллов варьируются от 814 до 850 мм², что объясняет высокий спрос на кремниевые пластины.

OpenAI завершит разработку и запустит производство своего ИИ-чипа уже в 2025 году — это первый шаг к снижению зависимости от Nvidia

Признанный лидер в сфере ИИ, компания OpenAI, прикладывает серьёзные усилия по снижению зависимости от ускорителей ИИ производства Nvidia. В ближайшие несколько месяцев OpenAI планирует завершить разработку собственного чипа и начать его производство на фабриках TSMC с использованием самых передовых техпроцессов.

 Источник изображения: Samsung

Источник изображения: Samsung

По мнению аналитиков, «OpenAI находится на пути к достижению своей амбициозной цели массового производства на мощностях TSMC в 2026 году». Наиболее ответственным этапом на пути от дизайна к выпуску готовых чипов является Tape-out («тейпаут») — процесс переноса цифрового проекта чипа на фотошаблон для последующего производства. Обычно этот этап обходится в несколько десятков миллионов долларов, а до выпуска первого чипа проходит до шести месяцев. В случае сбоя требуется диагностировать проблему и повторить процесс.

OpenAI рассматривает свой будущий ускоритель ИИ как стратегический инструмент для укрепления переговорных позиций с другими поставщиками чипов. Если первоначальный выпуск пройдёт удачно, OpenAI уже в этом году представит альтернативу чипам Nvidia, которые сейчас занимают более80 % рынка ИИ-ускорителей.

В случае успеха первого чипа инженеры OpenAI планируют разрабатывать все более продвинутые процессоры с более широкими возможностями с каждой новой итерацией. Компания уже стала участником инфраструктурной программы Stargate стоимостью $500 млрд, объявленной президентом США Дональдом Трампом (Donald Trump) в прошлом месяце.

Чип разрабатывается внутренней командой OpenAI во главе с Ричардом Хо (Richard Ho) в сотрудничестве с Broadcom. Хо более года назад перешёл в OpenAI из Google, где руководил программой по созданию специализированных чипов ИИ. Хотя команда Хо за последние месяцы выросла до 40 сотрудников, это количество по прежнему на порядок меньше, чем в масштабных проектах таких технологических гигантов, как Google или Amazon.

Аналитики полагают, что на первом этапе новый ускоритель ИИ от OpenAI будет играть ограниченную роль в инфраструктуре компании. Чтобы создать столь же всеобъемлющую программу по проектированию чипов ИИ, как у Google или Amazon, OpenAI придётся нанять сотни инженеров.

Согласно отраслевым источникам, новый дизайн чипа для амбициозной масштабной программы может обойтись в $500 млн. Эти расходы могут удвоиться, если учитывать необходимость создания программного обеспечения и периферийных устройств. Для сравнения: в 2025 году Meta планирует потратить $60 млрд на ИИ-инфраструктуру, а годовые инвестиции Microsoft в этом направлении составят $80 млрд.

Акции AMD пошли на снижение из-за недостаточного внимания компании к ИИ

Компания AMD считается крупнейшим конкурентом Nvidia на рынке ускорителей, которые используются для обучения систем искусственного интеллекта, но как показывает динамика акций «красных», инвесторы не уверены, что компания способна справиться с этой ролью, пишет Bloomberg.

 Источник изображения: amd.com

Источник изображения: amd.com

Сейчас ценные бумаги AMD находятся на самом низком уровне с ноября 2023 года — по сравнению с концом 2023 года они подешевели на 25 %. Для сравнения, показатель Philadelphia Stock Exchange Semiconductor Index за то же время вырос более чем на 20 %, а акции Nvidia подорожали на 160 %. Только накануне, 7 февраля 2025 года, акции AMD потеряли в цене 0,9 %. Причиной тому стала излишняя осторожность гендиректора компании Лизы Су (Lisa Su) — в ходе квартального отчёта она воздержалась от отдельного годового прогноза по ИИ-ускорителям, которые считаются ключевым продуктом. Тем самым она не дала катализатора финансового развития на ближайшие полгода и перевела вложения в AMD в категорию «мёртвых денег», пожаловались инвесторы. Усугубил ситуацию тот факт, что ранее компания подробно рассказывала о доходах в секторе ИИ, так что загадочное молчание на сей раз вызвало опасения, что Nvidia слишком сильно опередила всех конкурентов, и у AMD могут возникнуть сложности с реализацией своих чипов для ИИ.

 Источник изображения: bloomberg.com

Источник изображения: bloomberg.com

В остальном квартальный отчёт оценивается как положительный: компания показала выручку выше ожидаемой и дала оптимистичный общий прогноз. Доктор Су отметила, что продажи ИИ-ускорителей в первой половине 2025 года останутся примерно на уровне второй половины 2024 года. Ситуация может измениться к лучшему в середине года, когда AMD выпустит ускоритель нового поколения — это привлекло внимание инвесторов, ожидающих линейного роста компании, который, по версии руководства AMD, в ближайшие годы будет продолжаться. Но Citi понизил рейтинг AMD и был в этом не одинок: Bank of America, HSBC Holdings и Melius Research указали на сложный характер конкуренции с Nvidia. «Зелёным», по версии IDC, в III квартале принадлежали 89 % мирового рынка серверной графики, тогда как AMD достались лишь 10,3 %, а Intel — всего 1,1 %. Ситуацию не спасла даже сенсация китайской DeepSeek, которая добилась значительных результатов при минимальных затратах: крупные компании всё равно решили удвоить затраты на ИИ — одна только Alphabet подготовила $75 млрд.

Но и безнадёжным положение AMD инвесторы пока не считают. Nvidia и Broadcom едва ли смогут удовлетворить спрос всего рынка, и если AMD нарастит долю хотя бы до 15 %, её доходы будут значительными, рассуждают они. Но после публикации квартального отчёта аналитики снизили прогнозируемые показатели AMD: на 15 % по чистой прибыли и на 0,4 % по выручке. В этом году, как ожидается, доходы компании вырастут на 24 %, а чистая прибыль — более чем в три раза. В следующем году рост замедлится: выручка увеличится на 21 %, чистая прибыль — на 46 %. Это значит, что акции торгуются по цене менее 23-кратной предполагаемой прибыли — на 35 % ниже указанной аналитиками средней целевой цены. То есть худшее для AMD на фондовом рынке, вероятно, уже позади.

Для мелких производителей ИИ-чипов DeepSeek оказалась не угрозой, а шансом

DeepSeek потрясла мировой рынок искусственного интеллекта во главе с американскими компаниями — один только производитель ИИ-ускорителей Nvidia потерял несколько сотен миллиардов долларов капитализации. И пока лидеры рынка пытаются преодолеть последствия, мелкие производители видят в случившемся шанс нарастить масштабы деятельности, пишет CNBC.

 Источник изображения: Solen Feyissa / unsplash.com

Источник изображения: Solen Feyissa / unsplash.com

«Разработчики очень хотят заменить дорогие и закрытые модели OpenAI моделями с открытым исходным кодом, такими как DeepSeek R1», — считает Эндрю Фельдман (Andrew Feldman), гендиректор стартапа Cerebras Systems, выпускающего чипы для ИИ. Компания выступает конкурентом Nvidia и предлагает облачные сервисы в собственных кластерах. Выход DeepSeek R1 спровоцировал один из крупнейших всплесков спроса на услуги компании за всю её историю, и по словам её главы, показал, что рост рынка ИИ не будет связан с доминированием всего одной компании, потому что открытые модели не привязаны к определённым оборудованию или ПО. DeepSeek утверждает, что её рассуждающая модель потребляет меньше вычислительных ресурсов, чем американские аналоги, и обучается без передовых ускорителей.

Китайский стартап способен ускорить процесс развёртывания новых технологий в области ИИ-ускорителей, охватив и обучение моделей, и их запуск. Nvidia занимает доминирующее положение на рынке оборудования для обучения ИИ, и многие её конкуренты считают, что у них есть возможность расширить своё присутствие в области запуска уже обученных моделей, обещая клиентам более высокую эффективность за меньшие деньги. Обучение ИИ требует значительных вычислительных ресурсов, но для работы уже обученной системы достаточно и менее мощного оборудования, ограниченного более узким кругом задач. И здесь разработчики альтернативных ускорителей отмечают рост спроса, потому что многие клиенты готовы решать свои задачи на основе уже обученных моделей DeepSeek.

Аналитики и отраслевые эксперты уверены, что китайская лаборатория, которая понизила планку на обучение и запуск систем ИИ, окажет влияние на развитие всей отрасли: если услуги запуска уже обученных моделей станут дешевле, технологии ИИ начнут внедряться активнее, потому что снижение затрат приводит к повышению спроса — это явление называется парадоксом Джевона. Рост спроса подтвердили представители специализирующихся на разработке ускорителей стартапов d-Matrix и Etched. «Благодаря широкой доступности моделей малого размера они послужили катализатором эпохи вывода [ИИ]», — рассказали в d-Matrix. «Компании переводят свои затраты с обучающих кластеров на кластеры вывода», — добавили в Etched, к которой с момента выхода DeepSeek R1 обратились уже десятки корпоративных клиентов. Наконец, следует помнить, что небезграничны и ресурсы Nvidia — даже технологический гигант её масштаба физически не сможет удовлетворить весь мировой спрос на ИИ-ускорители. А значит, у мелких игроков действительно есть шанс.


window-new
Soft
Hard
Тренды 🔥
«Спустя 23 года мы снова дома, милорды»: новый ремастер культовой стратегии Stronghold Crusader стартовал в Steam с «очень положительными» отзывами 2 ч.
В персональной ленте Google Discover появились ИИ-сводки — это грозит новостным сайтам падением посещаемости 2 ч.
Анонсирован нелинейный ролевой триллер Agent of Strange от создателей «Жизнь и страдания господина Бранте» — первый трейлер и подробности 3 ч.
xAI отучила ИИ-чат-бот Grok оглядываться на мнение Илона Маска и приписывать себе странные фамилии 4 ч.
Банк России объявил, когда начнётся массовое внедрение цифрового рубля 4 ч.
RoboCop: Rogue City, Wuchang: Fallen Feathers, Grounded 2 и не только: Microsoft раскрыла последние новинки Game Pass в июле 6 ч.
В SelectOS появились функции автоматической установки на выделенных серверах и запуска через облако 7 ч.
Европа начала тестировать сервис проверки возраста для доступа к контенту 18+ 7 ч.
Cyberpunk 2077 выйдет на Mac уже совсем скоро — амбициозный патч 2.3 тоже не заставит себя долго ждать 7 ч.
Атмосфера первых частей, запретная любовь и заявка на успех: новый геймплей и подробности Mafia: The Old Country 9 ч.