Сегодня 30 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → intel gaudi2

Intel также будет вынуждена ограничить поставки ускорителей вычислений в Китай

Требования американских властей к допустимому быстродействию ускорителей вычислений, разрешённых к поставке в Китай, в большинстве случаев формулируются в виде каких-то измеримых характеристик, но редко становятся известны общественности. Компания Intel, как стало известно на этой неделе, также столкнётся с ограничениями на поставку ускорителей Gaudi в Китай.

 Источник изображения: Intel

Источник изображения: Intel

Переживающего не самый простой период в своей истории процессорного гиганта сейчас сложно назвать заметным игроком в сегменте ускорителей вычислений для систем искусственного интеллекта. Из тех 10 % рынка, которые оставляет прочим участникам рынка компания Nvidia, основная часть приходится на долю AMD, а роль Intel в данном виде коммерческой деятельности вообще минимальна. К слову, данное упущение не осталось без внимания нового генерального директора Intel Лип-Бу Тана (Lip-Bu Tan), и он пообещал укреплять позиции компании в сегменте ускорителей для систем ИИ.

По данным Financial Times, компания Intel уже уведомила своих китайских клиентов о необходимости получить экспортную лицензию на поставку в КНР своих ускорителей вычислений, обладающих уровнем быстродействия выше заявленных властями США пределов. Так, для пропускной способности памяти установлен порог в 1400 Гбайт/с, для пропускной способности интерфейсов — 1100 Гбайт/с, при этом в совокупности эти величины не могут превышать 1700 Гбайт/с. Как и ускорители Nvidia H20, решения Intel семейства Gaudi заведомо попадают под ограничения.

Nvidia уже оценила свои возможные потери от новых санкций США в данной сфере в $5,5 млрд по итогам только первого квартала. По неофициальным данным, по итогам всего текущего года эти потери легко превысят $10 млрд. Компания AMD пока довольствуется более скромными оценками ущерба на уровне $800 млн, а Intel свои расчёты на эту тему пока не опубликовала. Упоминание о необходимости получить экспортные лицензии для поставки ускорителей в Китай является лишь формальностью. На практике у всех трёх компаний крайне мало шансов подобными лицензиями обзавестись.

ИИ-ускоритель Intel Gaudi2 оказался на 55 % быстрее Nvidia H100 в тестах Stable Diffusion 3, но есть нюанс

Компания Stability AI, разработчик популярной модели генеративного ИИ Stable Diffusion, сравнила производительность модели Stable Diffusion 3 на популярных ускорителях вычислений для центров обработки данных, включая Nvidia H100 Hopper, A100 Ampere и Intel Gaudi2. По утверждению Stability AI, Intel Gaudi2 продемонстрировал производительность примерно на 56 % выше, чем Nvidia H100.

 Источник изображения: Intel

Источник изображения: Intel

В отличие от H100, который представляет собой суперскалярный графический процессор с тензорными CUDA-ядрами, Gaudi2 специально спроектирован для ускорения генеративного ИИ и больших языковых моделей (LLM). В тестах приняли участие пары кластеров, которые в сумме обеспечивали по 16 тех или ускорителей, а проводились тесты с постоянным размером батча (число тренировочных объектов) в 16 на каждый ускоритель (всего 256). Системы на Intel Gaudi2 оказались способны генерировать 927 изображений в секунду по сравнению с 595 изображениями для ускорителей H100 и 381 изображением в секунду для массива A100.

 Источник изображения: Stability AI

Источник изображения: Stability AI

При увеличении количества кластеров до 32, а числа ускорителей до 256 и размере батча 16 на ускоритель (общий размер 4096), массив Gaudi2 генерирует 12 654 изображения в секунду или 49,4 изображения в секунду на ускоритель, по сравнению с 3992 изображениями в секунду или 15,6 изображениями в секунду на устройство у массива A100 Ampere.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Необходимо отметить, что производительность ускорителей ИИ измерялась с использованием фреймворка PyTorch, а в случае применения оптимизации TensorRT чипы A100 создают изображения до 40 % быстрее, чем Gaudi2. Тем не менее, исследователи Stability AI ожидают, что при дальнейшей оптимизации Gaudi2 превзойдёт A100. Компания полагает, что более быстрый интерконнект и больший объем памяти (96 Гбайт) делают решения Intel вполне конкурентоспособными и планирует использовать ускорители Gaudi2 в Stability Cloud.

 Источник изображения: techpowerup.com

Источник изображения: techpowerup.com

По сообщению Stability AI, в более ранних тестах модели Stable Diffusion XL с использованием фреймворка PyTorch ускоритель Intel Gaudi2 генерирует при 30 шагах изображение размером 1024 × 1024 за 3,2 секунды по сравнению с 3,6 секунды для PyTorch на Nvidia A100 и 2,7 секунды при использовании оптимизации TensorRT на Nvidia А100.


window-new
Soft
Hard
Тренды 🔥
Доминирование Google пошатнулось — его доля на мировом рынке поиска скатилась ниже 90 % впервые за десять лет 8 мин.
Intel раскрыла потенциал встроенной графики Core Ultra 200V — свежий драйвер повысил FPS на 10 % и не только 29 мин.
«Яндекс Маркет» обзавёлся чат-ботом на мощнейшем ИИ «Яндекса» — он поможет выбрать покупки 42 мин.
Футуристический шутер La Quimera от бывших разработчиков Metro пройдёт через ранний доступ Steam, чтобы стать «большой и цельной» игрой 43 мин.
Xiaomi выпустила открытую рассуждающую ИИ-модель MiMo и заявила, что она быстрее OpenAI o1-mini 2 ч.
Глава Gearbox опроверг, что Borderlands 4 перенесли ради GTA VI или «любого другого продукта» 2 ч.
Релиз амбициозного китайского боевика Lost Soul Aside отложили на три месяца — объявлена новая дата выхода 4 ч.
Криптобиржу Grinex заподозрили в связях с заблокированной российской биржей Garantex 5 ч.
Reddit заблокировала учёных за тайный эксперимент с ИИ-ботами в дискуссиях 8 ч.
OpenAI откатила обновление ChatGPT из-за подхалимского поведения ИИ 8 ч.
Экипаж «Шэньчжоу-19» приземлился после шести месяцев космической вахты на станции «Тяньгун» 3 мин.
Электролёт Joby Aviation впервые с пилотом на борту полетал в режимах вертолёта и самолёта 12 мин.
Innodisk выпустила E3.L SSD с интерфейсом PCIe 5.0 ёмкостью 128 Тбайт 2 ч.
Nvidia опровергла слухи о намерениях создать совместное предприятие в Китае 2 ч.
У Apple произошли перестановки в музыкальном и международном отделах 2 ч.
Российские производители потребовали полностью запретить госзакупки иностранной электроники 3 ч.
США собрались пересмотреть экспортные ограничения на ИИ-чипы, но вряд ли остальным странам станет от этого лучше 3 ч.
AWS построит в Индиане дата-центр, который будет потреблять энергии как половина населения штата 5 ч.
Выручка Seagate выросла на 31 % и превзошла ожидания аналитиков 6 ч.
Ракета Firefly Alpha доставила спутник в Тихий океан вместо орбиты — всему виной загадочный сбой 6 ч.
Включить темный режим