Сегодня 20 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-ускоритель Intel Gaudi2 оказался на 55 % быстрее Nvidia H100 в тестах Stable Diffusion 3, но есть нюанс

Компания Stability AI, разработчик популярной модели генеративного ИИ Stable Diffusion, сравнила производительность модели Stable Diffusion 3 на популярных ускорителях вычислений для центров обработки данных, включая Nvidia H100 Hopper, A100 Ampere и Intel Gaudi2. По утверждению Stability AI, Intel Gaudi2 продемонстрировал производительность примерно на 56 % выше, чем Nvidia H100.

 Источник изображения: Intel

Источник изображения: Intel

В отличие от H100, который представляет собой суперскалярный графический процессор с тензорными CUDA-ядрами, Gaudi2 специально спроектирован для ускорения генеративного ИИ и больших языковых моделей (LLM). В тестах приняли участие пары кластеров, которые в сумме обеспечивали по 16 тех или ускорителей, а проводились тесты с постоянным размером батча (число тренировочных объектов) в 16 на каждый ускоритель (всего 256). Системы на Intel Gaudi2 оказались способны генерировать 927 изображений в секунду по сравнению с 595 изображениями для ускорителей H100 и 381 изображением в секунду для массива A100.

 Источник изображения: Stability AI

Источник изображения: Stability AI

При увеличении количества кластеров до 32, а числа ускорителей до 256 и размере батча 16 на ускоритель (общий размер 4096), массив Gaudi2 генерирует 12 654 изображения в секунду или 49,4 изображения в секунду на ускоритель, по сравнению с 3992 изображениями в секунду или 15,6 изображениями в секунду на устройство у массива A100 Ampere.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Необходимо отметить, что производительность ускорителей ИИ измерялась с использованием фреймворка PyTorch, а в случае применения оптимизации TensorRT чипы A100 создают изображения до 40 % быстрее, чем Gaudi2. Тем не менее, исследователи Stability AI ожидают, что при дальнейшей оптимизации Gaudi2 превзойдёт A100. Компания полагает, что более быстрый интерконнект и больший объем памяти (96 Гбайт) делают решения Intel вполне конкурентоспособными и планирует использовать ускорители Gaudi2 в Stability Cloud.

 Источник изображения: techpowerup.com

Источник изображения: techpowerup.com

По сообщению Stability AI, в более ранних тестах модели Stable Diffusion XL с использованием фреймворка PyTorch ускоритель Intel Gaudi2 генерирует при 30 шагах изображение размером 1024 × 1024 за 3,2 секунды по сравнению с 3,6 секунды для PyTorch на Nvidia A100 и 2,7 секунды при использовании оптимизации TensorRT на Nvidia А100.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Амбициозный боевик Peter Jackson's King Kong: The Official Game of the Movie в честь 20-летия получил масштабный фанатский патч 16 мин.
Cloud.ru запустил Evolution AI Factory в коммерческую эксплуатацию по доступным ценам 19 мин.
Telegram получил большое обновление: прямые эфиры, регулярные сообщения и аукционы подарков 28 мин.
CD Projekt Red привлекла к работе над Cyberpunk 2 бывшего нарративного руководителя BioShock 4 2 ч.
Google представила ИИ-поисковик научных работ, но его подход к ранжированию вызывают вопросы 2 ч.
Разрушительный шутер The Finals от авторов нашумевшей ARC Raiders нельзя будет запустить на PS4 с марта будущего года 2 ч.
В YouTube встроили мессенджер для сообщений и видео, но доступен он не всем 4 ч.
Супергеройская комедия Dispatch от ведущих разработчиков The Wolf Among Us достигла нешуточного успеха — два миллиона проданных копий за месяц 5 ч.
Adobe стала владельцем основанного россиянами разработчика ПО Semrush — сумма сделки составила $1,9 млрд 7 ч.
Apple объявила финалистов премии App Store Awards 2025 7 ч.
США притормозили 100-% тарифы на чипы — опасаются взвинтить цены и обострить отношения с Китаем 6 мин.
Европейская фабрика TSMC всё ближе к запуску — монтаж оборудования для выпуска чипов в Дрездене начнётся в 2026 году 14 мин.
Лазеры запекают титановый порошок: Apple раскрыла детали 3D-печати корпусов Watch 30 мин.
Превосходный отчёт Nvidia вдохновил инвесторов — акции технологических компаний подорожали по всему миру 58 мин.
Белый дом уговаривает Конгресс США не убивать экспорт ИИ-чипов — иначе Китай создаст свои и догонит 2 ч.
Представлен самый мощный суперкомпьютер на Ближнем Востоке — 122,8-Пфлопс система Shaheen III 3 ч.
Nvidia признала, что сделка с OpenAI на $100 млрд ещё может сорваться 3 ч.
Nvidia распродала все ИИ-ускорители, но на подходе ещё больше Blackwell 3 ч.
Игровые видеокарты теперь приносят всего 7,5 % выручки Nvidia — ИИ-чипы разогнали доходы до $57 млрд 4 ч.
EDF и OpCore переделают закрытую французскую ТЭС в крупный ИИ ЦОД стоимостью €4 млрд 4 ч.