Сегодня 20 августа 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-ускоритель Intel Gaudi2 оказался на 55 % быстрее Nvidia H100 в тестах Stable Diffusion 3, но есть нюанс

Компания Stability AI, разработчик популярной модели генеративного ИИ Stable Diffusion, сравнила производительность модели Stable Diffusion 3 на популярных ускорителях вычислений для центров обработки данных, включая Nvidia H100 Hopper, A100 Ampere и Intel Gaudi2. По утверждению Stability AI, Intel Gaudi2 продемонстрировал производительность примерно на 56 % выше, чем Nvidia H100.

 Источник изображения: Intel

Источник изображения: Intel

В отличие от H100, который представляет собой суперскалярный графический процессор с тензорными CUDA-ядрами, Gaudi2 специально спроектирован для ускорения генеративного ИИ и больших языковых моделей (LLM). В тестах приняли участие пары кластеров, которые в сумме обеспечивали по 16 тех или ускорителей, а проводились тесты с постоянным размером батча (число тренировочных объектов) в 16 на каждый ускоритель (всего 256). Системы на Intel Gaudi2 оказались способны генерировать 927 изображений в секунду по сравнению с 595 изображениями для ускорителей H100 и 381 изображением в секунду для массива A100.

 Источник изображения: Stability AI

Источник изображения: Stability AI

При увеличении количества кластеров до 32, а числа ускорителей до 256 и размере батча 16 на ускоритель (общий размер 4096), массив Gaudi2 генерирует 12 654 изображения в секунду или 49,4 изображения в секунду на ускоритель, по сравнению с 3992 изображениями в секунду или 15,6 изображениями в секунду на устройство у массива A100 Ampere.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Необходимо отметить, что производительность ускорителей ИИ измерялась с использованием фреймворка PyTorch, а в случае применения оптимизации TensorRT чипы A100 создают изображения до 40 % быстрее, чем Gaudi2. Тем не менее, исследователи Stability AI ожидают, что при дальнейшей оптимизации Gaudi2 превзойдёт A100. Компания полагает, что более быстрый интерконнект и больший объем памяти (96 Гбайт) делают решения Intel вполне конкурентоспособными и планирует использовать ускорители Gaudi2 в Stability Cloud.

 Источник изображения: techpowerup.com

Источник изображения: techpowerup.com

По сообщению Stability AI, в более ранних тестах модели Stable Diffusion XL с использованием фреймворка PyTorch ускоритель Intel Gaudi2 генерирует при 30 шагах изображение размером 1024 × 1024 за 3,2 секунды по сравнению с 3,6 секунды для PyTorch на Nvidia A100 и 2,7 секунды при использовании оптимизации TensorRT на Nvidia А100.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Соболезную фанатам, которые ждали так долго»: новый трейлер Vampire: The Masquerade — Bloodlines 2 подтвердил дату релиза и разозлил игроков 3 ч.
Разработчики Black Myth: Wukong анонсировали фэнтезийный боевик Black Myth: Zhong Kui, но «путешествие на Запад ещё не окончено» 4 ч.
Новая статья: Vampire: The Masquerade — Bloodlines 2 — у крови странный привкус. Предварительный обзор 4 ч.
Авторы Ghostrunner анонсировали Valor Mortis — экшен от первого лица в стиле Dark Souls про восставшего из мёртвых солдата армии Наполеона 6 ч.
Первый геймплейный трейлер Call of Duty: Black Ops 7 подтвердил утечку даты выхода и «бесконечный» эндгейм сюжетной кампании 6 ч.
Спасать BioShock 4 из производственного ада доверили экс-руководителю Diablo 7 ч.
Phison пообещала разобраться с ломающим SSD обновлением Windows 11 24H2 7 ч.
Adobe представила Acrobat Studio — платформу на базе ИИ для работы со множеством разношёрстных файлов 7 ч.
Nvidia выпустила драйвер с поддержкой Smooth Motion и глобальными настройками DLSS Override для карт RTX 40-й серии 7 ч.
Dragon Age: The Veilguard, возвращение Persona 4 Golden и новые релизы: Microsoft раскрыла, какие игры пополнят Game Pass в конце августа 8 ч.
NVIDIA готовит для Китая урезанный ИИ-ускоритель на архитектуре Blackwell 4 ч.
Foxconn будет производить ИИ-оборудование для проекта Stargate на заводе, который она продала SoftBank 5 ч.
LG представила 49-дюймовый монитор UltraWide 49U950A-W — DWQHD, 144 Гц и зарядка на 90 Вт 5 ч.
Google почти бесплатно обогреет жителей целого города в Финляндии «мусорным» теплом дата-центра 6 ч.
Asus представила геймерские мониторы с панелями Tandem OLED и разгоном до 720 Гц 6 ч.
Xbox Ally получит всего четыре ядра Zen 2 — не ровня Xbox Ally X с восьмёркой Zen 5 6 ч.
Каждый россиянин теперь тратит на мобильную связь в среднем более 1100 рублей в месяц 7 ч.
SoftBank рассматривала поглощение Intel Foundry, но в итоге ограничилась инвестициями в $2 млрд 8 ч.
Asus представила ROG Matrix GeForce RTX 5090 30th Anniversary Limited Edition с четырьмя вентиляторами и TDP до 800 Вт 8 ч.
«Комета Дьявола» укрепила теорию о внеземном происхождении воды на Земле 10 ч.