Сегодня 21 мая 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → intel gaudi2

ИИ-ускоритель Intel Gaudi2 оказался на 55 % быстрее Nvidia H100 в тестах Stable Diffusion 3, но есть нюанс

Компания Stability AI, разработчик популярной модели генеративного ИИ Stable Diffusion, сравнила производительность модели Stable Diffusion 3 на популярных ускорителях вычислений для центров обработки данных, включая Nvidia H100 Hopper, A100 Ampere и Intel Gaudi2. По утверждению Stability AI, Intel Gaudi2 продемонстрировал производительность примерно на 56 % выше, чем Nvidia H100.

 Источник изображения: Intel

Источник изображения: Intel

В отличие от H100, который представляет собой суперскалярный графический процессор с тензорными CUDA-ядрами, Gaudi2 специально спроектирован для ускорения генеративного ИИ и больших языковых моделей (LLM). В тестах приняли участие пары кластеров, которые в сумме обеспечивали по 16 тех или ускорителей, а проводились тесты с постоянным размером батча (число тренировочных объектов) в 16 на каждый ускоритель (всего 256). Системы на Intel Gaudi2 оказались способны генерировать 927 изображений в секунду по сравнению с 595 изображениями для ускорителей H100 и 381 изображением в секунду для массива A100.

 Источник изображения: Stability AI

Источник изображения: Stability AI

При увеличении количества кластеров до 32, а числа ускорителей до 256 и размере батча 16 на ускоритель (общий размер 4096), массив Gaudi2 генерирует 12 654 изображения в секунду или 49,4 изображения в секунду на ускоритель, по сравнению с 3992 изображениями в секунду или 15,6 изображениями в секунду на устройство у массива A100 Ampere.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Необходимо отметить, что производительность ускорителей ИИ измерялась с использованием фреймворка PyTorch, а в случае применения оптимизации TensorRT чипы A100 создают изображения до 40 % быстрее, чем Gaudi2. Тем не менее, исследователи Stability AI ожидают, что при дальнейшей оптимизации Gaudi2 превзойдёт A100. Компания полагает, что более быстрый интерконнект и больший объем памяти (96 Гбайт) делают решения Intel вполне конкурентоспособными и планирует использовать ускорители Gaudi2 в Stability Cloud.

 Источник изображения: techpowerup.com

Источник изображения: techpowerup.com

По сообщению Stability AI, в более ранних тестах модели Stable Diffusion XL с использованием фреймворка PyTorch ускоритель Intel Gaudi2 генерирует при 30 шагах изображение размером 1024 × 1024 за 3,2 секунды по сравнению с 3,6 секунды для PyTorch на Nvidia A100 и 2,7 секунды при использовании оптимизации TensorRT на Nvidia А100.


window-new
Soft
Hard
Тренды 🔥
Китайские техногиганты снизили цены на доступ к своим моделям ИИ 21 мин.
Microsoft добавила в Paint ИИ-генератор изображений по текстовому описанию или наброскам 2 ч.
«Прямиком из "Чёрного зеркала"»: пользователи раскритиковали функцию записи действий Recall в Windows 11 2 ч.
Спустя девять лет после релиза The Witcher 3: Wild Hunt на ПК получила редактор модов REDkit и поддержку «Мастерской Steam» 2 ч.
Авторы Norco выпустят «микроприключение» Silenus про андроида на населённом ИИ заводе — в Steam вышло необычное демо 3 ч.
Ethereum взлетел более чем на 20 % и продолжает расти на фоне слухов об одобрении спотовых Ethereum-ETF 3 ч.
Senua's Saga: Hellblade II не оставила критиков равнодушными — первые оценки одного из главных эксклюзивов Xbox в 2024 году 4 ч.
Скарлетт Йоханссон запретила использовать свой голос для ChatGPT — OpenAI не послушалась и пытается договориться 4 ч.
ИИ-помощник Copilot появится в Minecraft, а следом и в других играх на Xbox 6 ч.
Календарь релизов — 20–26 мая: Senua’s Saga: Hellblade II, Song of Conquest и Ships At Sea 6 ч.
Noctua вышла за рамки ПК: представлены вентиляторы и аксессуары Home для дома и офиса 5 мин.
Объём производства российского оптоволокна сократился 38 мин.
«Джеймс Уэбб» приблизил учёных к разгадке тайны пухлой экзопланеты с плотностью хлопка 43 мин.
Китайские SMIC и CXMT активизировали работу по импортозамещению расходных материалов для выпуска чипов 3 ч.
Первый в мире коммерческий космический самолет Dream Chaser прибыл во Флориду для последних тестов перед полётом на МКС 3 ч.
HP перестанет выпускать компьютеры Spectre, Envy и Pavilion — их заменят Omni и Elite 3 ч.
Операционный директор Apple провёл тайные переговоры с TSMC по поводу выпуска ИИ-чипов 3 ч.
Neuralink разрешили вживить мозговой имплант в мозг второму пациенту 4 ч.
Samsung представила Arm-ноутбуки Galaxy Book4 Edge — их покупателям подарят 50" 4К-телевизоры 4 ч.
Google рассчитывает потратить €1 млрд на расширение основного ЦОД в Финляндии, который заодно обогреет дома местных жителей 4 ч.