Процессоры и память

Эксперимент: 12-ядерный процессор в десктопе

⇣ Содержание

#Описание тестовых систем и методики тестирования

Производительность 12-ядерного Xeon E5-4650 v3, работающего в составе десктопной платформы на базе материнской платы ASUS X99-Deluxe с DDR4-2133-памятью, мы сравнили со скоростью той же самой платформы, укомплектованной традиционным для неё восьмиядерным процессором Core i7-5960X. А это значит, что список задействованных в тестировании аппаратных компонентов един для обоих случаев и выглядит следующим образом:

  • Процессоры:
    • Intel Core i7-5960X Extreme Edition (Haswell-E, 8 ядер + HT, 3,0-3,5 ГГц, 20 Мбайт L3);
    • Intel Xeon E5-4650 v3 (Haswell-EP, 12 ядер + HT, 2,0-2,6 ГГц, 30 Мбайт L3).
  • Процессорный кулер: Noctua NH-D15.
  • Материнская плата: ASUS X99-Deluxe (LGA2011-v3, Intel X99);
  • Память: 4 × 4 Гбайт DDR4-2133 SDRAM, 15-15-15-35 (G.Skill [Ripjaws 4] F4-2133C15Q-16GRR).
  • Видеокарта: NVIDIA GeForce GTX 980 (4 Гбайт/256-бит GDDR5, 1127-1216/7012 МГц).
  • Дисковая подсистема: Crucial M550 512 GB (CT512M550SSD1).
  • Блок питания: Seasonic Platinum SS-760XP2 (80 Plus Platinum, 760 Вт).

Тестирование выполнялось в операционной системе Microsoft Windows 8.1 Professional x64 with Update с использованием следующего комплекта драйверов:

  • Intel Chipset Driver 10.0.20;
  • Intel Management Engine Driver 10.0.0.1204;
  • Intel Rapid Storage Technology 13.2.4.1000;
  • NVIDIA GeForce 347.88 Driver.

Процессор Core i7-5960X испытывался дважды – не только при работе в номинальном режиме, но и при стабильном, подходящем для долговременного использования разгоне до 4,2 ГГц, который достижим с применяемым нами охлаждением при увеличении напряжения до 1,2 В. Сопоставляемый с ним Xeon E5-4650 v3, напомним, имеет заблокированный коэффициент умножения, поэтому он был протестирован лишь в своём паспортном режиме быстродействия.

Поскольку упор в данном тестировании делался на исследование работы серверного многоядерного процессора в десктопной среде, для измерения производительности применялись типичные для настольных систем бенчмарки и приложения. Правда, среди наших традиционных тестовых инструментов мы постарались выбрать те, которые создают наиболее тяжёлую нагрузку.

Бенчмарки:

  • Futuremark PCMark 8 Professional Edition 2.3.293 — тестирование в сценариях Home (обычное домашнее использование PC), Creative (использование PC для развлечений и для работы с мультимедийным контентом) и Work (использование PC для типичной офисной работы).
  • Futuremark 3DMark Professional Edition 1.4.828 — тестирование в сценах Sky Driver, Cloud Gate и Fire Strike.

Приложения:

  • ABBYY FineReader 12.0 – при тестировании в системе распознавания текста мы проводим перевод объёмного, предварительно просканированного документа, содержащего большое количество формул и графической информации, в текстовый формат.
  • Adobe After Effects CC 2014 — тестирование скорости рендеринга методом трассировки лучей. Измеряется время, затрачиваемое системой на обсчёт в разрешении 1920 × 1080@30fps заранее подготовленного видеоролика.
  • Adobe Photoshop CC 2014 — тестирование производительности при обработке графических изображений. Измеряется среднее время выполнения тестового скрипта, представляющего собой творчески переработанный Retouch Artists Photoshop Speed Test, который включает типичную обработку четырёх 24-мегапиксельных изображений, сделанных цифровой камерой.
  • Adobe Photoshop Lightroom 5.7.1 – тестирование производительности при пакетной обработки серии изображений в RAW-формате. Тестовый сценарий включает постобработку и экспорт в JPEG с разрешением 1920 × 1080 и максимальным качеством двухсот 12-мегапиксельных изображений в RAW-формате, сделанных цифровой камерой Nikon D300
  • Adobe Premiere Pro CC 2014 — тестирование производительности при нелинейном видеомонтаже. Измеряется время рендеринга в формат H.264 Blu-Ray проекта, содержащего HDV 1080p25 видеоряд с наложением различных эффектов.
  • Autodesk 3ds max 2015 — тестирование скорости финального рендеринга. Измеряется время, затрачиваемое на рендеринг в разрешении 1920 × 1080 с применением рендерера mental ray одного кадра стандартной сцены Space_Flyby из тестового пакета SPEC.

  • Maxon Cinebench R15 — измерение быстродействия фотореалистичного трёхмерного рендеринга в анимационном пакете CINEMA 4D. Применяемая в бенчмарке сцена содержит порядка 2 тысяч объектов и состоит из 300 тысяч полигонов.

  • WinRAR 5.1 — тестирование скорости архивации. Измеряется время, затрачиваемое архиватором на сжатие директории с различными файлами общим объёмом 1,7 Гбайт. Используется максимальная степень компрессии.
  • x264 r2491 — тестирование скорости транскодирования видео в формат H.264/AVC. Для оценки производительности используется исходный 1080p@50FPS AVC-видеофайл, имеющий битрейт около 30 Мбит/с.
  • X265 1.5+446 8bpp — тестирование скорости транскодирования видео в перспективный формат H.265/HEVC. Для оценки производительности используется тот же видеофайл, что и в тесте скорости транскодирования кодером x264.

Игры:

  • Battlefield 4. Настройки для разрешения 1280 × 800: Graphics Quality = Custom, Texture Quality = Ultra, Texture Filtering = Ultra, Lighting Quality = Ultra, Effects Quality = Ultra, Post Process Quality = Ultra, Mesh Quality = Ultra, Terrain Quality = Ultra, Terrain Decoration = Ultra, Antialiasing Deferred = Off, Antialiasing Post = High, Ambient Occlusion = HBAO. Настройки для разрешения 1920 × 1080: Graphics Quality = Ultra.
  • Civilization: Beyond Earth. Настройки для разрешения 1280 × 800: DirectX11, Ultra Quality, Anti-aliasing = Off, Multithreaded rendering = On. Настройки для разрешения 1920 × 1080: DirectX11, Ultra Quality, 8x MSAA, Multithreaded rendering = On.
  • Hitman: Absolution. Настройки для разрешения 1280 × 800: Ultra Quality, MSAA = Off, High Texture Quality, 16x Texture Aniso, Ultra Shadows, High SSAO, Global Illumination = On, High Reflections, FXAA = On, Ultra Level of Detail, High Depth of Field, Tesselation = On, Normal Bloom. Настройки для разрешения 1920 × 1080: Ultra Quality, 8x MSAA, High Texture Quality, 16x Texture Aniso, Ultra Shadows, High SSAO, Global Illumination = On, High Reflections, FXAA = On, Ultra Level of Detail, High Depth of Field, Tesselation = On, Normal Bloom.
  • Metro: Last Light Redux. Настройки для разрешения 1280 × 800: DirectX 11, High Quality, Texture Filtering = AF 16X, Motion Blur = Normal, SSAA = Off, Tessellation = High, Advanced PhysX = Off. Настройки для разрешения 1920 × 1080: DirectX 11, Very High Quality, Texture Filtering = AF 16X, Motion Blur = Normal, SSAA = On, Tessellation = High, Advanced PhysX = Off. При тестировании используется сцена Scene 1.

#Производительность в комплексных тестах

PCMark 8 2.0 моделирует действия пользователя в общеупотребительных приложениях для дома, офиса или для создания контента. И хотя, безусловно, существуют отдельные примеры таких приложений, хорошо оптимизированных под многоядерные процессоры, большинство из них довольствуется распараллеливанием нагрузки на пару-тройку потоков — и не более того. Поэтому 12-ядерный процессор Xeon смотрится в этом тесте хуже восьмиядерного Core i7. Львиная доля ядер и того и другого процессора значительную часть времени банально простаивает, и определяющее влияние на результат оказывает тактовая частота, которая у десктопного процессора выше. Всё это означает лишь одно: использовать серверные многоядерные процессоры для ординарных настольных систем никакого смысла нет. Обычные десктопные CPU и стоят существенно меньше, и выдают при таких нагрузках ощутимо лучшую производительность.

Производительность в приложениях

Для этого раздела мы специально выбрали оптимизированные под многопоточные среды приложения, которые обычно хорошо воспринимают увеличение количества доступных процессорных ядер.

Судя по всему, 12 ядер – это перебор для десктопных систем даже в том случае, когда речь идёт о работе с ресурсоёмкими приложениями. Восьмиядерный Core i7-5960X оказывается быстрее 12-ядерного Xeon E5-4650 v3 даже при создании и обработке контента. Более высокая частота оказывается лучше, чем огромный массив вычислительных ядер, что представляет собой отличную практическую иллюстрацию закона Амдала. Можно выделить лишь две задачи, для решения которых имеет смысл привлекать серверные многоядерные процессоры, – перекодирование видео и финальный рендеринг. Однако даже в этих, наиболее благоприятных для 12-ядерного Xeon E5 v3, случаях Core i7-5960X в конечном итоге всё равно оказывается эффективнее. Десктопный процессор можно разогнать, и в результате не остаётся ни одной программы, в которой Xeon E5-4650 v3 оказался бы лучшим вариантом. В целом при работе в номинальном режиме усреднённое превосходство Core i7-5960X в производительности составляет порядка 15 процентов, а этот же процессор с увеличенной до 4,2 ГГц частотой обгоняет Xeon E5-4650 v3 уже на 37 процентов. А это значит, что процессоры с числом ядер более восьми для настольных компьютеров на современном этапе подходят очень и очень плохо.

Производительность в играх

Совершенно очевидно, что если уж 12-ядерный процессор Xeon E5-4650 v3 не смог продемонстрировать сколь-нибудь приемлемых результатов в большинстве многопоточных приложений, то хорошим геймерским вариантом он заведомо не окажется. Тем не менее ради полноты картины мы провели несколько тестов и такого рода.

Тестирование в реальных играх предваряют результаты синтетического бенчмарка 3DMark, который выдаёт некую усреднённую метрику игровой 3D-производительности систем.

Как мы знаем по результатам тестов шести- и восьмиядерных процессоров, 3DMark хорошо оптимизирован под многопоточные среды. Однако 12 ядер, которые может предложить Xeon E5-4650 v3, – это чересчур даже для данного бенчмарка. Из-за того, что серверный процессор имеет сравнительно невысокую тактовую частоту, его результаты оказываются заметно хуже, чем у флагманского десктопного Core i7-5960X. Вывод вполне очевиден: в то время как увеличение частоты гарантированно обеспечивает пропорциональное улучшение производительности, добавление в процессор вычислительных ядер масштабирует быстродействие по гораздо более сложному закону с отрицательным значением второй производной.

Тестирование в реальных играх редко когда позволяет выявить принципиальные различия между высокопроизводительными процессорами. При современной игровой нагрузке узким местом становятся не вычислительные ресурсы платформы, а её графическая подсистема. Именно поэтому в большинстве случаев совершенно безразлично, какой из процессоров используется в той или иной геймерской платформе. Количество FPS, скорее всего, от этого зависеть будет крайне незначительно. Тем не менее отказываться от тестирования в играх это повода не даёт. Просто для лучшей иллюстративности вместе с измерением игровой производительности в типичном Full HD-разрешении 1920 × 1080 с включённым полноэкранным сглаживанием мы делаем замеры и в разрешении 1280 × 800. Результаты в первом случае показывают тот уровень FPS, который можно получить в реальных условиях прямо сейчас, второй же вариант тестирования позволяет оценить теоретическую игровую производительность процессоров, которая, возможно, будет раскрыта в перспективе, если в нашем распоряжении появятся более быстрые варианты графической подсистемы.

Тесты в Full HD-разрешении:

Ничего хорошего для 12-ядерного Xeon E5-4650 v3 на приведённых диаграммах нет. Игровая производительность у этого процессора ниже, чем у Core i7-5960X, и это видно даже в «тяжёлых» графических режимах, где, по идее, процессор почти никогда не становится узким местом. Для современных игр совершенно не нужно то запредельное количество ядер, которое есть у этого процессора. Кроме того, более сложное внутреннее строение с двумя кольцевыми шинами и буферизирующим коммутатором хорошо подходит для одновременного многопоточного доступа к данным, а в обычных задачах лишь создаёт ненужные накладные расходы, снижающие скорость работы подсистемы памяти. Всё это тоже не лучшим образом сказывается на производительности в играх и вновь подводит нас к выводу о том, что многоядерные серверные процессоры – неудачный выбор для настольных и уж тем более для геймерских систем.

Тесты в уменьшенном разрешении:

Здесь всё, о чём мы говорили выше, проявляется ещё сильнее. «Сложные» варианты Haswell-EP с дизайном, явно оптимизированным под решение многопоточных задач, в приложениях, которые порождают сравнительно небольшое число потоков (к ним, например, относятся современные игры), работают хуже, чем более простой Haswell-E. Поэтому случаев удачного применения процессоров вроде Xeon E5-4650 v3 в геймерских системах попросту не бывает. Серверные CPU могут быть эффективными в ресурсоёмких счётных приложениях, но в игровых системах им явно не место.

Энергопотребление

Измерение энергопотребления – не менее интересная часть тестирования Xeon E5-4650 v3, чем исследование его производительности. Дело в том, что, хотя этот 22-нм процессор и обладает 12 вычислительными ядрами с микроархитектурой Haswell, его расчётное тепловыделение составляет всего 105 Вт. Это на четверть меньше потребления восьмиядерного процессора Core i7-5960X. Поскольку Xeon E5-4650 v3 ориентирован на применение в четырёхпроцессорных серверах, Intel понизила его напряжение питания до 0,89 В, что и дало такой эффект. Конечно, попутно пришлось сбавить и тактовую частоту, тем не менее поверить в то, что 12-ядерный LGA2011-3-процессор, основанный на гигантском полупроводниковом кристалле, может потреблять лишь чуть больше энергии, нежели четырёхъядерник LGA1150, достаточно тяжело. Что ж, проверим.

На следующих ниже графиках приводится полное потребление систем (без монитора), измеренное на выходе из розетки, в которую подключен блок питания тестовой системы, и представляющее собой сумму энергопотребления всех задействованных в системе компонентов. В суммарный показатель автоматически включается и КПД самого блока питания, однако с учетом того, что используемая нами модель БП, Seasonic Platinum SS-760XP2, имеет сертификат 80 Plus Platinum, его влияние должно быть минимальным. Для правильной оценки энергопотребления мы активировали режим Turbo Boost и все имеющиеся энергосберегающие технологии.

В состоянии простоя система на базе Xeon E5-4650 v3 потребляет немного больше, чем аналогичные системы с десктопным Haswell-E. Это – отражение более сложной внутренней конструкции Haswell-EP.

Любопытно, что при перекодировании видео кодером x265 система с Xeon E5-4650 v3 оказывается экономичнее аналогичной платформы с Core i7-5960X. Выше, в тестах производительности, мы видели, что системы с этими процессорами выдают примерно одинаковое быстродействие при решении данной задачи. Следовательно, Xeon E5-4650 v3 предлагает заметно лучшую энергоэффективность: по этой характеристике его преимущество перед флагманским десктопным CPU составляет около 22 процентов. Таким образом, наращивание количества процессорных ядер – это ещё один путь к энергоэффективным вычислениям, правда, применимый лишь для очень хорошо распараллеливаемых задач.

При измерении максимального потребления при нагрузке, создаваемой 64-битной версией утилиты LinX 0.6.5, Xeon E5-4650 v3 вновь проявляет свою относительную экономичность. Разница в потреблении одной и той же платформы с серверным 12-ядерным и десктопным восьмиядерным CPU составляет 50 Вт. Иными словами, попавший в наши руки Haswel-EP может обеспечить очень заметную экономию. Однако следует иметь в виду, что среди серверных процессоров есть и очень прожорливые модели, TDP которых может доходить до 145 или даже 160 Вт.

#Выводы

Изначально использование серверного многоядерного процессора в составе настольной платформы представлялось очень интересной и здравой затеей. Производители процессоров давно пытаются приучить нас к мысли о том, что количество вычислительных ядер – это одна из важнейших характеристик, оказывающих самое непосредственное влияние на быстродействие системы. При этом самый старший из LGA2011-3-процессоров для настольных систем обладает восемью ядрами, а его серверные собратья могут предложить до 18 ядер. Поэтому на первый взгляд кажется, что, использовав многоядерный Xeon E5 v3, нетрудно собрать более производительную конфигурацию, чем позволяют получить флагманские чипы семейства Haswell-E.

Но реальность идёт вразрез с ожиданиями. Протестированная нами конфигурация на базе 12-ядерного Xeon E5 v3 оказалась очень похожей на троллейбус из буханки. Никаких особых ухищрений для её воплощения в жизнь действительно не нужно, но практическая ценность результата вызывает очень серьёзные сомнения.

С одной стороны, серверные процессоры Haswell-EP без каких-либо проблем работают в обычных десктопных материнских платах с разъёмом LGA2011-3, построенных на базе набора системной логики Intel X99. Всё что нужно от платы – это поддержка Xeon E5 v3 на уровне BIOS, и такая поддержка имеется в большинстве флагманских материнских плат ведущих производителей.

Однако с другой стороны, работая в составе настольных персональных компьютеров, многоядерные Haswell-EP чувствуют себя явно не в своей тарелке. Во-первых, при увеличении количества вычислительных ядер свыше 6-8 штук масштабирование быстродействия серьёзно замедляется, и у серверных Xeon E5 v3 получается обогнать по скорости Core i7-5960X лишь в очень небольшом числе общеупотребительных приложений. Это – прямое следствие наличия в коде почти любых десктопных программ участков нераспараллеливаемого кода. Во-вторых, внедрённый в Haswell-EP дизайн «кластер-на-ядре» глубоко оптимизирован именно под многопоточные нагрузки, поэтому в обычных для настольных компьютеров задачах его ресурсы используются неоптимально, вызывая дополнительное снижение производительности при обмене данными с памятью. Ярким примером такой ситуации выступают игры, где в глаза бросается странное отставание серверного процессора от десктопного даже в режимах с максимальным качеством изображения. И в-третьих, в Xeon E5 v3 полностью заблокированы все возможности для оверклокинга. Десктопные же процессоры для платформы LGA2011-3 неплохо разгоняются и в умелых руках могут серьёзно увеличивать свою производительность, чего их серверные собратья попросту не умеют.

В сумме же получается, что если вы хотите построить высокоэффективную настольную систему с максимально возможной на сегодняшний день производительностью, обращать внимание на какие-то экзотические варианты вроде рассмотренного в этом материале никакого смысла нет. Intel нас не обманывает: десктопные процессоры серии Core i7-5xx0 – наилучший на данный момент выбор для энтузиастов.

 
← Предыдущая страница
⇣ Содержание
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
⇣ Комментарии
window-new
Soft
Hard
Тренды 🔥