Сегодня 24 июня 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-ускоритель Intel Gaudi2 оказался на 55 % быстрее Nvidia H100 в тестах Stable Diffusion 3, но есть нюанс

Компания Stability AI, разработчик популярной модели генеративного ИИ Stable Diffusion, сравнила производительность модели Stable Diffusion 3 на популярных ускорителях вычислений для центров обработки данных, включая Nvidia H100 Hopper, A100 Ampere и Intel Gaudi2. По утверждению Stability AI, Intel Gaudi2 продемонстрировал производительность примерно на 56 % выше, чем Nvidia H100.

 Источник изображения: Intel

Источник изображения: Intel

В отличие от H100, который представляет собой суперскалярный графический процессор с тензорными CUDA-ядрами, Gaudi2 специально спроектирован для ускорения генеративного ИИ и больших языковых моделей (LLM). В тестах приняли участие пары кластеров, которые в сумме обеспечивали по 16 тех или ускорителей, а проводились тесты с постоянным размером батча (число тренировочных объектов) в 16 на каждый ускоритель (всего 256). Системы на Intel Gaudi2 оказались способны генерировать 927 изображений в секунду по сравнению с 595 изображениями для ускорителей H100 и 381 изображением в секунду для массива A100.

 Источник изображения: Stability AI

Источник изображения: Stability AI

При увеличении количества кластеров до 32, а числа ускорителей до 256 и размере батча 16 на ускоритель (общий размер 4096), массив Gaudi2 генерирует 12 654 изображения в секунду или 49,4 изображения в секунду на ускоритель, по сравнению с 3992 изображениями в секунду или 15,6 изображениями в секунду на устройство у массива A100 Ampere.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Необходимо отметить, что производительность ускорителей ИИ измерялась с использованием фреймворка PyTorch, а в случае применения оптимизации TensorRT чипы A100 создают изображения до 40 % быстрее, чем Gaudi2. Тем не менее, исследователи Stability AI ожидают, что при дальнейшей оптимизации Gaudi2 превзойдёт A100. Компания полагает, что более быстрый интерконнект и больший объем памяти (96 Гбайт) делают решения Intel вполне конкурентоспособными и планирует использовать ускорители Gaudi2 в Stability Cloud.

 Источник изображения: techpowerup.com

Источник изображения: techpowerup.com

По сообщению Stability AI, в более ранних тестах модели Stable Diffusion XL с использованием фреймворка PyTorch ускоритель Intel Gaudi2 генерирует при 30 шагах изображение размером 1024 × 1024 за 3,2 секунды по сравнению с 3,6 секунды для PyTorch на Nvidia A100 и 2,7 секунды при использовании оптимизации TensorRT на Nvidia А100.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Амбициозная ролевая песочница Hytale в духе Minecraft спустя десять лет разработки отменена, а студия будет расформирована 2 ч.
Суд обязал OpenAI хранить даже удалённые чаты, но пользователи считают это тотальной слежкой 5 ч.
Конгресс США запретил сотрудникам пользоваться высокорискованным WhatsApp 12 ч.
«Продолжаем держать курс на крутые обновления»: создатели «Мира танков» и «Мира кораблей» нацелены обжаловать решение суда 13 ч.
Одна платформа, чтоб править всеми: в библиотеку Xbox на ПК скоро можно будет добавить игры из Steam, Battle.net и «других ведущих магазинов» 13 ч.
Точки восстановления в Windows 11 теперь живут всего 60 дней 14 ч.
Штраф в €500 млн подействовал: Apple изменит политику App Store, но не для всех 14 ч.
Фольклорный хоррор «Лихо одноглазое» от создателей «Чёрной книги» получил дату выхода в Steam и новый трейлер 15 ч.
Календарь релизов — 23 – 29 июня: Death Stranding 2 и System Shock 2: 25th Anniversary Remaster 16 ч.
Dune: Awakening установила рекорд по скорости продаж для Funcom — более 800 тысяч смертей от Шаи-Хулуда и другие достижения игроков 17 ч.
В MIT придумали бустер для CPU и GPU — крошечный дискретный GaN-транзистор «дайлет» 13 мин.
Китай пообещал сотню прорывов в сфере ИИ, сопоставимых с выходом DeepSeek 23 мин.
Samsung заманивает инженеров на американские фабрики огромными зарплатами — в 1,5–2 раза выше, чем у Intel и TSMC 2 ч.
Процессор в составе новейшего ноутбука Huawei MateBook Fold выпускается по прежней 7-нм технологии 4 ч.
Владельцы «параллельно ввезённых» машин Lixiang до конца июня могут бесплатно получить мастер-аккаунт в РФ 7 ч.
Новая статья: Обзор ноутбука HONOR MagicBook Pro 14 (FMB-P) на платформе Core Ultra второго поколения 10 ч.
Акции Tesla подскочили на 8 % после запуска роботакси в Техасе 11 ч.
Huawei выпустит раскладушку Pocket 2 Premium Edition, которая будет дешевле оригинала 11 ч.
Новая статья: Обзор и тестирование Zalman P40 Prism White: корпус-призма 11 ч.
Yeston выпустила компактную GeForce RTX 5060 Cute Pet с милым оформлением 12 ч.