Процессоры и память

Обзор процессора AMD Ryzen Threadripper 3990X: контрольный выстрел

⇣ Содержание

#Описание тестовых систем и методики тестирования

В тестировании 64-ядерного Threadripper 3990X мы решили повторить методику, которая была применена при тестах его младших собратьев. Ещё до того, как мы приступили к тестированию, казалось, что конкурентов у Threadripper 3990X попросту не существует, но знакомство с реальными результатами тестов показало, что на самом деле не всё так просто, и этот процессор на голову превосходит флагманские предложения других семейств далеко не всегда. Иными словами, сравнение Threadripper 3990X с системами, основанными на старших процессорах для других платформ, – отнюдь не пустая трата времени. Поэтому 64-ядерной HEDT-новинке AMD были противопоставлены 8-ядерный Intel Core i9-9900KS для платформы LGA1151v2, 18-ядерный Intel Core i9-10980XE для платформы LGA2066, 16-ядерный AMD Ryzen 9 3950X для платформы Socket AM4, а также 24- и 32-ядерные Threadripper для платформы Socket sTR4, которые мы подробно протестировали несколько дней назад.

Стоит отметить, что тестирование Threadripper 3990X оказалось совсем не таким простым процессом, как того хотелось бы. Установить этот CPU в настроенную систему, где мы уже испытывали Threadripper 3970X и 3960X, и сразу же прогнать набор бенчмарков не удалось. Дело в том, что полной поддержки 64-ядерника во многих Socket sTR4-материнских платах пока нет, и это выражается в невозможности запустить систему с памятью, работающей в каком-нибудь достаточно скоростном режиме. AMD уверяет, что эта проблема будет исправлена в ближайшее время, а нам пришлось заменить материнскую плату на MSI Creator TRX40, для которой, к счастью, оптимизированная для Threadripper 3990X бета-версия прошивки была подготовлена заранее.

Кроме того, при тестировании Threadripper 3990X пришлось перейти на использование иного комплекта памяти. Как оказалось, 32 Гбайт для 64-ядерного процессора – слишком мало: каждый поток хочет хранить необходимые ему данные в памяти, и когда таких потоков 128 – им действительно нужно значительно больше памяти, чем в обычных системах. Поэтому конфигурация на базе Threadripper 3990X тестировалась с комплектом 8 × 16 Гбайт DDR4-3600 производства Corsair, которым до этого мы ещё не пользовались.

В конечном итоге список задействованных в тестировании комплектующих получился таким:

  • Процессоры:
    • AMD Ryzen Threadripper 3990X (Castle Peak, 64 ядра + SMT, 2,9-4,3 ГГц, 256 Мбайт L3);
    • AMD Ryzen Threadripper 3970X (Castle Peak, 32 ядра + SMT, 3,7-4,5 ГГц, 128 Мбайт L3);
    • AMD Ryzen Threadripper 3960X (Castle Peak, 24 ядра + SMT, 3,8-4,5 ГГц, 128 Мбайт L3);
    • AMD Ryzen 9 3950X (Matisse, 16 ядер + SMT, 3,5-4,6 ГГц, 64 Мбайт L3);
    • Intel Core i9-10980XE (Cascade Lake-X, 18 ядер + HT, 3,0-4,8 ГГц, 24,75 Мбайт L3);
    • Intel Core i9-9900KS (Coffee Lake Refresh, 8 ядер + HT, 4,0-5,0 ГГц, 16 Мбайт L3).
  • Процессорный кулер: СЖО NZXT Kraken X62.
  • Материнские платы:
    • ASRock X570 Taichi (Socket AM4, AMD X570);
    • ASRock Z390 Taichi (LGA1151v2, Intel Z390);
    • ASUS ROG Strix X299-E Gaming II (LGA2066, Intel X299);
    • ASUS ROG Strix TRX40-E Gaming (Socket sTR4, AMD TRX40);
    • MSI Creator TRX40 (Socket sTR4, AMD TRX40).
  • Память:
    • 4 × 8 Гбайт DDR4-3600 SDRAM, 16-16-16-36 (G.Skill Trident Z RGB F4-360016Q-32GTZR);
    • 4 × 16 Гбайт DDR4-3600 SDRAM, 16-18-18-36 (Corsair Dominator Platinum RGB CMT64GX4M4Z3600C16).
  • Видеокарта: NVIDIA GeForce RTX 2080 Ti (TU102, 1350/14000 МГц, 11 Гбайт GDDR6 352-бит).
  • Дисковая подсистема: Samsung 970 EVO Plus 2TB (MZ-V7S2T0BW).
  • Блок питания: Thermaltake Toughpower DPS G RGB 1000W Titanium (80 Plus Titanium, 1000 Вт).

Все сравниваемые процессоры тестировались с настройками, принятыми производителями плат «по умолчанию». Это значит, что для платформ Intel обозначенные в спецификациях ограничения по энергопотреблению игнорируются, и используются предельно возможные частоты с целью получения максимальной производительности. Стоит подчеркнуть, что в таком режиме эксплуатирует процессоры подавляющее большинство пользователей, поскольку включение лимитов по тепловыделению и энергопотреблению требует специальной настройки параметров BIOS.

Процессор Threadripper 3990X был протестирован дважды: с включённой и выключенной технологией SMT, то есть в режиме, когда его 128 логических ядер представлены в ОС двумя процессорными группами, и когда он выглядит в системе как привычный многоядерный CPU с 64 логическими ядрами без поддержки многопоточности.

Тестирование выполнялось в операционной системе Microsoft Windows 10 Pro (v1909) Build 18363.476 с использованием следующего комплекта драйверов:

  • AMD Chipset Driver 2.01.15.2138;
  • Intel Chipset Driver 10.1.1.45;
  • Intel Management Engine Interface Driver 11.7.0.1017;
  • NVIDIA GeForce 441.87 Driver.

Список использовавшихся для измерения вычислительной производительности инструментов:

  • Adobe Photoshop Lightroom Standard с тестовым пакетом PugetBench 0.8;
  • Adobe Premiere Pro 2020 с тестовым пакетом PugetBench 0.8;
  • Blackmagic Design Davinci Resolve Studio 16.1.2 с тестовым пакетом Puget Systems Benchmark 0.61;
  • Blender 2.81a со стандартным набором тестовых сцен Blender Benchmark 2.0.4;
  • Corona 1.3 Benchmark для тестирования производительности рендера Corona;
  • Dassault Systemes Solidworks 2019 SP4.0 с тестовым пакетом SPECapc 1.3.2;
  • Microsoft Visual Studio 2019 для тестирования скорости компиляции исходного кода интернет-браузера Chromium 81.0.4038.2;
  • OBS Studio 24.0.3 для тестирования производительности и гладкости потоковой трансляции игрового контента. В тестировании использовались следующие настройки видеопотока: кодер x264, разрешение 1080p@60fps, битрейт 6 Мбит/с, CPU Usage Preset = slowest.
  • Pov-Ray 2.7.1 со стандартной тестовой сценой benchmark.pov;
  • SPECworkstation 3.02 – тестовый пакет, направленный на определение производительности рабочих станций в профессиональных приложениях научной, медицинской, энергетической и инженерной направленности;
  • V-Ray Benchmark Next 4.10.07 для тестирования производительности рендера V-Ray;

Также в тестах были задействованы игры:

  • Assassin’s Creed Odyssey. Разрешение 1920 × 1080: Graphics Quality = Ultra High. Разрешение 3840 × 2160: Graphics Quality = Ultra High.
  • Far Cry 5. Разрешение 1920 × 1080: Graphics Quality = Ultra, HD Textures = On, Anti-Aliasing = TAA, Motion Blur = On. Разрешение 3840 × 2160: Graphics Quality = Ultra, Anti-Aliasing = Off, Motion Blur = On.
  • Shadow of the Tomb Raider. Разрешение 1920 × 1080: DirectX12, Preset = Highest, Anti-Aliasing = TAA. Разрешение 3840 × 2160: DirectX12, Preset = Highest, Anti-Aliasing = Off.

В игровых тестах в качестве результатов приводится среднее количество кадров в секунду, а также 0,01-квантиль (первая перцентиль) для значений FPS. Использование 0,01-квантиля вместо показателей минимального FPS обусловлено стремлением очистить результаты от случайных всплесков производительности, которые были спровоцированы не связанными напрямую с работой основных компонентов платформы причинами.

#Производительность при рендеринге

Рендеринг – это словно та самая разновидность нагрузки, для которой и был создан Threadripper 3990X изначально. Здесь этот 64-ядерный монстр рвёт и мечет, демонстрируя примерно полуторакратное улучшение результатов по сравнению с Threadripper 3970X. Впрочем в том, что производительность рендеринга отлично масштабируется с наращиванием числа ядер, известно очень давно, поэтому столь блистательное выступление Threadripper 3990X в этой категории нагрузки сюрпризом для нас не стало.

#Производительность при обработке видео

Выступление Threadripper 3990X при обработке видео в Premiere Pro 2020 выглядит уже не таким убедительным. Фактически, применять здесь дорогой 64-ядерный процессор не имеет особого смысла, он почти не быстрее вдвое более дешёвого 32-ядерного собрата. Немного улучшить выступление 64-ядерника можно за счёт отключения SMT, но в целом Premiere Pro 2020, кажется, попросту не может эффективно масштабировать свою производительность на такое количество ядер, даже если вести речь не только о интерактивной работе с приложением, но и о процессе финального экспорта.

Примерно то же самое мы увидели и в Davinci Resolve Studio. Масштабируемость производительности имеется, но она явно не соответствует той разнице в количестве ядер и цене, которая есть у Threadripper 3990X и Threadripper 3970X.

#Производительность при обработке фото

С Photoshop Lightroom ситуация достаточно забавная. Дело в том, что это приложение не умеет распараллеливать свою работу на более чем 64 ядра, но с Threadripper 3990X оно показывает существенно лучшие результаты при пассивной пакетной обработке массивов фотографий. Выигрыш достигается за счёт увеличения объёма кеш-памяти, который у 64-ядерника разрослась до впечатляющего объёма – 288 Мбайт (32 Мбайт L2 и 256 Мбайт L3).

#Производительность при инженерном проектировании

Как видно из результатов теста, Solidworks 2019 не умеет обращаться с «процессорными группами», поэтому 128-поточный Threadripper 3990X в его исходном виде для этого пакета подходит плохо. Но стоит отключить SMT, то есть сделать из процессора с 128 логическими ядрами процессор с 64 ядрами, ситуация в корне меняется. А значит, Threadripper 3990X может быть действительно полезен при работе с популярной системой автоматизированного проектирования разработки Dassault Systemes.

#Производительность при компиляции

Компиляция – ещё один пример отличной масштабируемости производительности при росте количества вычислительных ядер. Threadripper 3990X может стать востребованной платформой при разработке масштабных программных продуктов, поскольку позволяет получить очень заметный выигрыш во времени компиляции исходного кода. Даже по сравнению с 32-ядерным Threadripper 3970X флагманская 64-ядерная модель HEDT-процессора AMD справляется с задачей по сборке браузера Chromium на треть быстрее.

#Производительность при научных расчётах

В этом достаточно объёмном разделе мы приводим результатов тестирования в специализированных научных пакетах. Используемые сценарии:

  • CalculiX – решение линейных и нелинейных трёхмерных задач механики сплошной среды с помощью метода конечных элементов в пакете Calculix. В тесте моделируется внутренняя температура турбины реактивного двигателя.
  • WPCcfd – моделирование процессов горения с турбулентностью, проводимое с привлечением пакета вычислительной гидродинамики OpenFOAM и стандартного решателя XiFoam.
  • rodiniaCFD и rodiniaLifeSci – части стандартного бенчмарка Rodinia для тестирования гетерогенных платформ в задачах гидро- и термодинамики, моделирования движения заряженных частиц и научной визуализации.
  • Lammps – решение задачи классической молекулярной динамики при помощи специализированного пакета LAMMPS.
  • Namd – ещё один пакет для молекулярной динамики для симуляции больших систем (миллионы атомов). Для целей тестирования моделируются различные молекулярные взаимодействия.
  • Python36 – математический бенчмарк для Phyton 3.6, в котором задействуются библиотеки numpy и scipy и выполняются операции линейной алгебры. 

Во время тестирования 24- и 32-ядерных моделей Threadripper третьего поколения мы пришли к выводу, что многие научные пакеты отлично масштабируют производительность, если они выполняются в платформах с многоядерными процессорами. Однако с Threadripper 3990X ничего подобного уже не наблюдается. Библиотеки, используемые в научной среде, понятия не имеют о «процессорных группах», а потому в системе с 64-ядерником работают откровенно плохо.

Но как и в случае с Solidworks, проблему зачастую можно преодолеть. Отключение SMT уполовинивает число логических ядер, и позволяет приложениям общаться с ними в привычном и устоявшемся стиле. Производительность Threadripper 3990X в пакетах, которые не имеют поддержки «процессорных групп», в таком случае может возвращаться на должный уровень. Таким образом даже неоптимизированные приложения способны получать выигрыш в производительности при переносе на флагманский 64-ядерник AMD. Правда, к сожалению, это может потребовать дополнительной настройки системы, и гарантии стопроцентной результативности такого процесса нет.

#Производительность при архивации и перекодировании видео

Обычные общеупотребительные алгоритмы вряд ли способны получить выигрыш от переноса на неукротимый 64-ядерник AMD. Столь развитая многопоточность в привычных десктопных приложениях, естественно, не реализуется. Но в ряде случаев Threadripper 3990X всё-таки может похвастать преимуществом над своими младшими собратьями. Однако превосходство это достигается не за счёт ядер, а из-за более ёмкой кеш-памяти.

#Производительность в играх

Факультативный раздел про игры нужен лишь для того, чтобы убедиться, что игры на Threadripper 3990X идут не хуже, чем на других представителях семейства. Невысокая частота кадров наблюдается лишь в Far Cry 5, потому что движок Dunia Engine 2, мягко говоря, находится в недоумении от такого количества ядер и не может адекватно распределить по ним нагрузку. Зато другие игровые приложения умудряются даже показывать на Threadripper 3990X более высокую производительность, чем в системах с другими процессорами с микроархитектурой Zen 2. Сказывается гигантский L3-кеш.

Для полноты картины попутно ответим и на ещё один смежный вопрос: смогут ли новые Threadripper вытянуть стриминг силами процессора при использовании максимально возможного профиля качества. Для проверки мы воспользовались игрой Far Cry 5. За кодирование видеопотока отвечало популярное приложение Open Broadcasting System (OBS) Studio. В нём использовался программный кодер x264. Тестовая трансляция проводилась в разрешении 1920 × 1080 при частоте кадров 60 FPS и фиксированном битрейте 6 Мбит/с. В настройках кодирования выбирался профиль настроек качества slower.

Даже 64-ядерный Threadripper 3990X не может обеспечить трансляцию с максимальным качеством с профилем slower. Но ничего другого и не ожидалось: OBS Studio, как и большинство потребительских приложений, не поддерживает более 64 потоков, и простое увеличение ядер тут не помогает – для профиля slowest нужны либо процессоры с более высокой тактовой частотой, либо с более совершенной микроархитектурой. Отключение SMT позволяет немного улучшить ситуацию, но для кодирования потока без потерь этого всё равно мало.

#Энергопотребление

Для 64-ядерного Threadripper 3990X установлен тот же тепловой пакет, что и для его собратьев с меньшим числом ядер, причём граница в 280 Вт подтверждена величиной PPT (Package Power Tracking). Поэтому более 280 Вт под нагрузкой 64-ядерник забрать попросту не в состоянии: если он попытается это сделать, его частота будет принудительна снижена технологией Precision Boost 2. Это значит, что под нагрузкой Threadripper 3990X должен потреблять ровно столько же, сколько и Threadripper 3970X или 3960X. На практике всё это подтверждается, в чём вы можете убедиться по представленным диаграммам общего потребления систем.

Используемый нами в тестовой системе цифровой блок питания серии Thermaltake Toughpower DPS G позволяет контролировать потребляемую и выдаваемую электрическую мощность, чем мы и пользуемся для измерений. На графиках ниже приводится полное потребление систем (без монитора), измеренное «после» блока питания и представляющее собой сумму энергопотребления всех задействованных в системе компонентов. КПД самого блока питания в данном случае не учитывается.

Однако втиснуться в 280-ваттные рамки Threadripper 3990X удаётся с заметным усилием. Напомним, его частота при полной многопоточной нагрузке снижается до 2,9 ГГц, при которых им используется крайне невысокое напряжение питания порядка 0,85 В. Потребление отдельных ядер в таком режиме составляет всего лишь 2,7-2,8 Вт, что фантастически мало на фоне того, что в Threadripper 3970X ядра при полной многопоточной нагрузке потребляют по 6-7 Вт. Между тем, при однопоточной нагрузке потребление Threadripper 3990X оказывается на фоне конкурентов довольно значительным, что, похоже, связано с какими-то недоработками в схеме управления питанием.

Но в целом мы всё равно просто обязаны восхититься выдающейся энергоэффективностью Threadripper 3990X. По удельной производительности на ватт он превосходит старший HEDT-процессор конкурента, Core i9-10980X, примерно в два с половиной раза!

#Выводы

То, что мы увидели сегодня во время тестирования Threadripper 3990X, производит неизгладимое впечатление. Но дело тут даже не в том, что этот процессор может затмить любого конкурента своей вычислительной мощностью, особенно если речь идёт о решении какой-то хорошо распараллеливаемой и оптимизированной задачи. Гораздо большее восхищение вызывает то, насколько гладко и чётко работает чиплетный подход, придуманный и воплощенный компанией AMD в процессорах поколения Zen 2. Мы успели познакомиться с вариантами CPU, в которых используется один вычислительный чиплет, два чиплета, четыре чиплета, и вот сейчас перед нами оказался процессор с восемью чиплетами. И каждая такая разновидность демонстрировала не только совершенно предсказуемый набор свойств и прекрасную производительность в своём классе, но и была лишена каких-то заметных слабых мест.

Всё это в равной степени распространяется и на Threadripper 3990X, который можно охарактеризовать как максимум того, на что способна AMD в данный момент. Компания уже несколько лет активно толкает отрасль в сторону развития многоядерности и многопоточности, и появление 64-ядерного и 128-поточного процессора для сегмента HEDT представляется вполне закономерным развитием событий. Но в то же время эта единоличная ядерная гонка завела AMD в достаточно парадоксальную ситуацию, когда Threadripper 3990X не только оторвался от конкурирующих предложений на недосягаемое расстояние, но и опередил развитие программного обеспечения. Существенная часть доступного в настоящее время ПО попросту не может работать с более чем 64 потоками, поэтому в ряде случаев потенциал Threadripper 3990X не получится раскрыть вообще, а в ряде ситуаций ему придётся отключать технологию SMT.

Но Threadripper 3990X и не претендует на то, чтобы быть процессором для всех и каждого, это – вариант для высококвалифицированных профессионалов и для решения специфических творческих задач. Как мы видели в тестах, для Threadripper 3990X можно найти довольно большое число вариантов использования, где его применение может быть совершенно оправдано. Это и рендеринг, и создание визуальных эффектов, и разработка программного обеспечения, и даже некоторые виды научных расчётов. Поэтому нет никаких сомнений в том, что Threadripper 3990X найдёт свою аудиторию даже несмотря на стоимость на уровне четырёх тысяч долларов. В конце концов, это – высококачественный рабочий инструмент, и многие профессионалы могут быть заинтересованы в том, чтобы иметь на рабочем столе столь значительную вычислительную мощность, особенно если учесть, что благодаря ей они могут увеличить свою продуктивность.

В заключение нельзя удержаться от того, чтобы не напомнить, что компания Intel в настоящее время не в состоянии предложить подобные Threadripper 3990X решения ни в каком виде, даже если взять в расчёт серверные и двухпроцессорные системы. И такая ситуация сохранится ещё достаточно долго, что даёт AMD хороший шанс закрепиться в сегменте высокопроизводительных рабочих станций. Вслед за выпуском набора выдающихся по характеристикам и производительности процессоров Threadripper третьего поколения она теперь должна сделать и второй шаг, и добиться проникновения таких процессоров не только в самосборные системы, но и в готовые рабочие станции. Например, в те же Apple Mac Pro, где сейчас применяются явно уступающие им по характеристикам процессоры Xeon W с 28 ядрами.

 
← Предыдущая страница
⇣ Содержание
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
⇣ Комментарии
Прежде чем оставить комментарий, пожалуйста, ознакомьтесь с правилами комментирования. Оставляя комментарий, вы подтверждаете ваше согласие с данными правилами и осознаете возможную ответственность за их нарушение.
Все комментарии премодерируются.
Комментарии загружаются...
window-new
Soft
Hard
Тренды 🔥