Сегодня 12 сентября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-ускоритель Intel Gaudi2 оказался на 55 % быстрее Nvidia H100 в тестах Stable Diffusion 3, но есть нюанс

Компания Stability AI, разработчик популярной модели генеративного ИИ Stable Diffusion, сравнила производительность модели Stable Diffusion 3 на популярных ускорителях вычислений для центров обработки данных, включая Nvidia H100 Hopper, A100 Ampere и Intel Gaudi2. По утверждению Stability AI, Intel Gaudi2 продемонстрировал производительность примерно на 56 % выше, чем Nvidia H100.

 Источник изображения: Intel

Источник изображения: Intel

В отличие от H100, который представляет собой суперскалярный графический процессор с тензорными CUDA-ядрами, Gaudi2 специально спроектирован для ускорения генеративного ИИ и больших языковых моделей (LLM). В тестах приняли участие пары кластеров, которые в сумме обеспечивали по 16 тех или ускорителей, а проводились тесты с постоянным размером батча (число тренировочных объектов) в 16 на каждый ускоритель (всего 256). Системы на Intel Gaudi2 оказались способны генерировать 927 изображений в секунду по сравнению с 595 изображениями для ускорителей H100 и 381 изображением в секунду для массива A100.

 Источник изображения: Stability AI

Источник изображения: Stability AI

При увеличении количества кластеров до 32, а числа ускорителей до 256 и размере батча 16 на ускоритель (общий размер 4096), массив Gaudi2 генерирует 12 654 изображения в секунду или 49,4 изображения в секунду на ускоритель, по сравнению с 3992 изображениями в секунду или 15,6 изображениями в секунду на устройство у массива A100 Ampere.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Необходимо отметить, что производительность ускорителей ИИ измерялась с использованием фреймворка PyTorch, а в случае применения оптимизации TensorRT чипы A100 создают изображения до 40 % быстрее, чем Gaudi2. Тем не менее, исследователи Stability AI ожидают, что при дальнейшей оптимизации Gaudi2 превзойдёт A100. Компания полагает, что более быстрый интерконнект и больший объем памяти (96 Гбайт) делают решения Intel вполне конкурентоспособными и планирует использовать ускорители Gaudi2 в Stability Cloud.

 Источник изображения: techpowerup.com

Источник изображения: techpowerup.com

По сообщению Stability AI, в более ранних тестах модели Stable Diffusion XL с использованием фреймворка PyTorch ускоритель Intel Gaudi2 генерирует при 30 шагах изображение размером 1024 × 1024 за 3,2 секунды по сравнению с 3,6 секунды для PyTorch на Nvidia A100 и 2,7 секунды при использовании оптимизации TensorRT на Nvidia А100.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
В Steam совсем скоро выйдет Easy Delivery Co. — смесь Animal Crossing и The Long Dark с графикой времён PS1 7 ч.
Власти США начали расследование безопасности ИИ-чат-ботов для детей: под прицелом Google, Meta, OpenAI и xAI 7 ч.
Нил Дракманн объяснил, почему Naughty Dog взялась делать Intergalactic: The Heretic Prophet, а не The Last of Us Part III 9 ч.
Киберпанковый слешер Ghostrunner 2 попал в новую раздачу Epic Games Store вместе с Monument Valley 2 и ещё одной игрой 10 ч.
Cyberpunk 2077 получила патч 2.31 с улучшенным автопилотом и новыми настройками для фоторежима 11 ч.
Критики вынесли вердикт Borderlands 4 — всё ещё не уровень Borderlands 2, но уже лучше Borderlands 3 11 ч.
Игровая выставка РЭД ЭКСПО 2025 отменена — «Леста Игры» выбрала «Игромир» и Comic Сon 13 ч.
Вышла предварительная версия Microsoft Visual Studio 2026: обновился дизайн, углубилась интеграция с ИИ 14 ч.
Счастливый финал с подвохом: с дополнением Legacy of the Forge в Kingdom Come: Deliverance 2 появилась новая секретная концовка 14 ч.
Технокомпании обучают ИИ на миллионах роликов, скаченных с YouTube, без разрешения их авторов 14 ч.
Заявление SK hynix о завершении разработки HBM4 вызвало рост курса акций компании до рекордных высот 34 мин.
Новая статья: Обзор системы жидкостного охлаждения MSI MAG CoreLiquid A15 360: апгрейд на треть 5 ч.
Intel покидает уже второй по счёту главный архитектор Xeon в этом году 6 ч.
Новая статья: Обзор лазерного 4К-проектора Hisense M2 Pro: универсальный компаньон 7 ч.
Nebius привлекла $3,75 млрд после заключения контракта с Microsoft 8 ч.
SK hynix начала массовое производство флеш-памяти ZUFS 4.1 для смартфонов с ИИ 10 ч.
Китай попытается создать ИИ-чипы нового типа, так как подражать США «смертельно опасно» 10 ч.
darkFlash представила необычный корпус Floatron F1 с пьедесталом 11 ч.
Samsung работает над камерой для смартфонов с непрерывным зумом, но первыми её получат китайцы 11 ч.
Китайская Ant Group показала гуманоидного робота с ИИ — он умеет готовить и давать медицинские советы 12 ч.