Сегодня 25 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-ускоритель Intel Gaudi2 оказался на 55 % быстрее Nvidia H100 в тестах Stable Diffusion 3, но есть нюанс

Компания Stability AI, разработчик популярной модели генеративного ИИ Stable Diffusion, сравнила производительность модели Stable Diffusion 3 на популярных ускорителях вычислений для центров обработки данных, включая Nvidia H100 Hopper, A100 Ampere и Intel Gaudi2. По утверждению Stability AI, Intel Gaudi2 продемонстрировал производительность примерно на 56 % выше, чем Nvidia H100.

 Источник изображения: Intel

Источник изображения: Intel

В отличие от H100, который представляет собой суперскалярный графический процессор с тензорными CUDA-ядрами, Gaudi2 специально спроектирован для ускорения генеративного ИИ и больших языковых моделей (LLM). В тестах приняли участие пары кластеров, которые в сумме обеспечивали по 16 тех или ускорителей, а проводились тесты с постоянным размером батча (число тренировочных объектов) в 16 на каждый ускоритель (всего 256). Системы на Intel Gaudi2 оказались способны генерировать 927 изображений в секунду по сравнению с 595 изображениями для ускорителей H100 и 381 изображением в секунду для массива A100.

 Источник изображения: Stability AI

Источник изображения: Stability AI

При увеличении количества кластеров до 32, а числа ускорителей до 256 и размере батча 16 на ускоритель (общий размер 4096), массив Gaudi2 генерирует 12 654 изображения в секунду или 49,4 изображения в секунду на ускоритель, по сравнению с 3992 изображениями в секунду или 15,6 изображениями в секунду на устройство у массива A100 Ampere.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Необходимо отметить, что производительность ускорителей ИИ измерялась с использованием фреймворка PyTorch, а в случае применения оптимизации TensorRT чипы A100 создают изображения до 40 % быстрее, чем Gaudi2. Тем не менее, исследователи Stability AI ожидают, что при дальнейшей оптимизации Gaudi2 превзойдёт A100. Компания полагает, что более быстрый интерконнект и больший объем памяти (96 Гбайт) делают решения Intel вполне конкурентоспособными и планирует использовать ускорители Gaudi2 в Stability Cloud.

 Источник изображения: techpowerup.com

Источник изображения: techpowerup.com

По сообщению Stability AI, в более ранних тестах модели Stable Diffusion XL с использованием фреймворка PyTorch ускоритель Intel Gaudi2 генерирует при 30 шагах изображение размером 1024 × 1024 за 3,2 секунды по сравнению с 3,6 секунды для PyTorch на Nvidia A100 и 2,7 секунды при использовании оптимизации TensorRT на Nvidia А100.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Крупные американские страховщики требуют исключить из правил риски, связанные с ИИ 3 ч.
Anthropic бросает вызов Gemini 3: представлена мощная ИИ-модель Opus 4.5 и инструмент для покорения Excel 7 ч.
Маск ударил по фабрикам троллей: X начала показывать местоположение аккаунтов 8 ч.
Календарь релизов 24 – 30 ноября: Of Ash and Steel, Project Motor Racing и Hail to the Rainbow 9 ч.
В Steam стартовала распродажа «Чёрная пятница» и голосование за лучшие игры 2025 года 9 ч.
Внедрение облачных технологий увеличивает прибыль компаний, показало исследование Yandex B2B Tech и «Яков и Партнёры» 9 ч.
Научно-фантастическое выживание StarRupture от авторов Green Hell скоро дадут попробовать с друзьями — анонсировано кооперативное тестирование 11 ч.
Дископанковый шутер RetroSpace в духе System Shock получил новый геймплейный трейлер и сроки выхода 13 ч.
Meta «похоронила» исследование о вреде соцсетей — теперь в суде ответят и она, и TikTok, и Google 13 ч.
Российская служба каталогов ALD Pro дополнилась ИИ-помощником для системных администраторов 14 ч.
Apple сократила десятки специалистов по корпоративным продажам своей продукции 28 мин.
Новая статья: Тестируем DDR5-6000 CL26 — память, которой не хватало Ryzen 6 ч.
Honor представила смарт-часы Watch X5 в стиле Apple Watch со 120 спортивными режимами за $63 7 ч.
Новая статья: Обзор и тестирование корпуса Chieftec Night Hunter: всё что нужно и ничего лишнего 8 ч.
Россияне стали реже менять смартфоны и всё чаще выбирают дешёвую электронику 8 ч.
Представлены Honor 500 и Honor 500 Pro — смартфоны с дизайном iPhone Air и батареями на 8000 мА·ч по цене от $380 9 ч.
Steam Machine дешёвой не будет: Valve не станет продавать мини-ПК себе в убыток по консольной модели 11 ч.
Дешевле купить PS5: из-за дефицита комплект DDR5 на 64 Гбайт взлетел до $600 11 ч.
Джони Айв и Сэм Альтман создали прототип совместного ИИ-устройства, но никому его не показали 12 ч.
MSI выпустила игровой монитор MAG 274QPF X32 — 1440p, 320 Гц и консольный режим 13 ч.