Сегодня 30 января 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-ускоритель Intel Gaudi2 оказался на 55 % быстрее Nvidia H100 в тестах Stable Diffusion 3, но есть нюанс

Компания Stability AI, разработчик популярной модели генеративного ИИ Stable Diffusion, сравнила производительность модели Stable Diffusion 3 на популярных ускорителях вычислений для центров обработки данных, включая Nvidia H100 Hopper, A100 Ampere и Intel Gaudi2. По утверждению Stability AI, Intel Gaudi2 продемонстрировал производительность примерно на 56 % выше, чем Nvidia H100.

 Источник изображения: Intel

Источник изображения: Intel

В отличие от H100, который представляет собой суперскалярный графический процессор с тензорными CUDA-ядрами, Gaudi2 специально спроектирован для ускорения генеративного ИИ и больших языковых моделей (LLM). В тестах приняли участие пары кластеров, которые в сумме обеспечивали по 16 тех или ускорителей, а проводились тесты с постоянным размером батча (число тренировочных объектов) в 16 на каждый ускоритель (всего 256). Системы на Intel Gaudi2 оказались способны генерировать 927 изображений в секунду по сравнению с 595 изображениями для ускорителей H100 и 381 изображением в секунду для массива A100.

 Источник изображения: Stability AI

Источник изображения: Stability AI

При увеличении количества кластеров до 32, а числа ускорителей до 256 и размере батча 16 на ускоритель (общий размер 4096), массив Gaudi2 генерирует 12 654 изображения в секунду или 49,4 изображения в секунду на ускоритель, по сравнению с 3992 изображениями в секунду или 15,6 изображениями в секунду на устройство у массива A100 Ampere.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Необходимо отметить, что производительность ускорителей ИИ измерялась с использованием фреймворка PyTorch, а в случае применения оптимизации TensorRT чипы A100 создают изображения до 40 % быстрее, чем Gaudi2. Тем не менее, исследователи Stability AI ожидают, что при дальнейшей оптимизации Gaudi2 превзойдёт A100. Компания полагает, что более быстрый интерконнект и больший объем памяти (96 Гбайт) делают решения Intel вполне конкурентоспособными и планирует использовать ускорители Gaudi2 в Stability Cloud.

 Источник изображения: techpowerup.com

Источник изображения: techpowerup.com

По сообщению Stability AI, в более ранних тестах модели Stable Diffusion XL с использованием фреймворка PyTorch ускоритель Intel Gaudi2 генерирует при 30 шагах изображение размером 1024 × 1024 за 3,2 секунды по сравнению с 3,6 секунды для PyTorch на Nvidia A100 и 2,7 секунды при использовании оптимизации TensorRT на Nvidia А100.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
ИИ схлестнулся с людьми в битве на креативность — результаты неоднозначны 40 мин.
Nvidia обновила драйвер для устаревших видеокарт Maxwell, Pascal и Volta — только патчи и никаких игровых оптимизаций 2 ч.
В США расследуют, имели ли сотрудники Meta доступ к «секретным» чатам WhatsApp 2 ч.
ChatGPT скоро лишится устаревших моделей GPT-4o, GPT-4.1, GPT-4.1 mini и o4-mini 2 ч.
«Игра явно не готова к выходу»: ролевой аниме-боевик Code Vein 2 стартовал в Steam с рейтингом 52 % 3 ч.
Спустя 13 лет классическая Final Fantasy VII в Steam получит новую версию — когда и зачем, Square Enix не сказала 3 ч.
Microsoft попытается вернуть доверие к Windows 11, подорванное багами, замедлением и насаждением Edge, Bing, OneDrive и Copilot 4 ч.
Китайский ролевой боевик Genigods: Nezha отправит сражаться с богами и спасать мир от пространственно-временного коллапса — геймплейный трейлер 5 ч.
Google открыла широкий доступ к Genie — ИИ-генератору игровых миров 5 ч.
В видеоигры играет «почти каждый второй россиянин» — к 2035 году объём индустрии в стране превысит полтриллиона рублей 6 ч.
Батареи с БАКом: дома французов начали обогревать теплом от Большого адронного коллайдера 42 мин.
Дефицит диктует приоритеты: Apple сосредоточится на самых дорогих iPhone в этом году 2 ч.
Утечка подтвердила дату анонса смартфонов Samsung Galaxy S26 — ждать осталось меньше месяца 2 ч.
Биоинженеры впервые встроили квантовый механизм в природный белок 2 ч.
В России стартовали продажи смартфонов Oppo Reno 15 и Reno15 F с 50-Мп фронтальными камерами и ёмкими батареями 4 ч.
Выручка Western Digital подскочила на четверть — 9 из 10 жестких дисков теперь идут в серверы 4 ч.
Астрономы нашли похожую на Землю планету-снежок 4 ч.
Нужно больше финансирования: OpenAI наметила выход на IPO на четвёртый квартал 2026 года 5 ч.
Спасите наши SSD: VAST Data запустила программу VAST Amplify для повышения эффективности использования имеющихся SSD 6 ч.
Lightmatter представила оптический движок Guide для ИИ-платформ нового поколения 6 ч.