⇣ Содержание
Опрос
|
реклама
Самое интересное в новостях
Эксперимент: 12-ядерный процессор в десктопе
⇡#Описание тестовых систем и методики тестирования Производительность 12-ядерного Xeon E5-4650 v3, работающего в составе десктопной платформы на базе материнской платы ASUS X99-Deluxe с DDR4-2133-памятью, мы сравнили со скоростью той же самой платформы, укомплектованной традиционным для неё восьмиядерным процессором Core i7-5960X. А это значит, что список задействованных в тестировании аппаратных компонентов един для обоих случаев и выглядит следующим образом:
Тестирование выполнялось в операционной системе Microsoft Windows 8.1 Professional x64 with Update с использованием следующего комплекта драйверов:
Процессор Core i7-5960X испытывался дважды – не только при работе в номинальном режиме, но и при стабильном, подходящем для долговременного использования разгоне до 4,2 ГГц, который достижим с применяемым нами охлаждением при увеличении напряжения до 1,2 В. Сопоставляемый с ним Xeon E5-4650 v3, напомним, имеет заблокированный коэффициент умножения, поэтому он был протестирован лишь в своём паспортном режиме быстродействия. Поскольку упор в данном тестировании делался на исследование работы серверного многоядерного процессора в десктопной среде, для измерения производительности применялись типичные для настольных систем бенчмарки и приложения. Правда, среди наших традиционных тестовых инструментов мы постарались выбрать те, которые создают наиболее тяжёлую нагрузку. Бенчмарки:
Приложения:
Игры:
⇡#Производительность в комплексных тестах PCMark 8 2.0 моделирует действия пользователя в общеупотребительных приложениях для дома, офиса или для создания контента. И хотя, безусловно, существуют отдельные примеры таких приложений, хорошо оптимизированных под многоядерные процессоры, большинство из них довольствуется распараллеливанием нагрузки на пару-тройку потоков — и не более того. Поэтому 12-ядерный процессор Xeon смотрится в этом тесте хуже восьмиядерного Core i7. Львиная доля ядер и того и другого процессора значительную часть времени банально простаивает, и определяющее влияние на результат оказывает тактовая частота, которая у десктопного процессора выше. Всё это означает лишь одно: использовать серверные многоядерные процессоры для ординарных настольных систем никакого смысла нет. Обычные десктопные CPU и стоят существенно меньше, и выдают при таких нагрузках ощутимо лучшую производительность. Производительность в приложениях Для этого раздела мы специально выбрали оптимизированные под многопоточные среды приложения, которые обычно хорошо воспринимают увеличение количества доступных процессорных ядер. Судя по всему, 12 ядер – это перебор для десктопных систем даже в том случае, когда речь идёт о работе с ресурсоёмкими приложениями. Восьмиядерный Core i7-5960X оказывается быстрее 12-ядерного Xeon E5-4650 v3 даже при создании и обработке контента. Более высокая частота оказывается лучше, чем огромный массив вычислительных ядер, что представляет собой отличную практическую иллюстрацию закона Амдала. Можно выделить лишь две задачи, для решения которых имеет смысл привлекать серверные многоядерные процессоры, – перекодирование видео и финальный рендеринг. Однако даже в этих, наиболее благоприятных для 12-ядерного Xeon E5 v3, случаях Core i7-5960X в конечном итоге всё равно оказывается эффективнее. Десктопный процессор можно разогнать, и в результате не остаётся ни одной программы, в которой Xeon E5-4650 v3 оказался бы лучшим вариантом. В целом при работе в номинальном режиме усреднённое превосходство Core i7-5960X в производительности составляет порядка 15 процентов, а этот же процессор с увеличенной до 4,2 ГГц частотой обгоняет Xeon E5-4650 v3 уже на 37 процентов. А это значит, что процессоры с числом ядер более восьми для настольных компьютеров на современном этапе подходят очень и очень плохо. Производительность в играх Совершенно очевидно, что если уж 12-ядерный процессор Xeon E5-4650 v3 не смог продемонстрировать сколь-нибудь приемлемых результатов в большинстве многопоточных приложений, то хорошим геймерским вариантом он заведомо не окажется. Тем не менее ради полноты картины мы провели несколько тестов и такого рода. Тестирование в реальных играх предваряют результаты синтетического бенчмарка 3DMark, который выдаёт некую усреднённую метрику игровой 3D-производительности систем. Как мы знаем по результатам тестов шести- и восьмиядерных процессоров, 3DMark хорошо оптимизирован под многопоточные среды. Однако 12 ядер, которые может предложить Xeon E5-4650 v3, – это чересчур даже для данного бенчмарка. Из-за того, что серверный процессор имеет сравнительно невысокую тактовую частоту, его результаты оказываются заметно хуже, чем у флагманского десктопного Core i7-5960X. Вывод вполне очевиден: в то время как увеличение частоты гарантированно обеспечивает пропорциональное улучшение производительности, добавление в процессор вычислительных ядер масштабирует быстродействие по гораздо более сложному закону с отрицательным значением второй производной. Тестирование в реальных играх редко когда позволяет выявить принципиальные различия между высокопроизводительными процессорами. При современной игровой нагрузке узким местом становятся не вычислительные ресурсы платформы, а её графическая подсистема. Именно поэтому в большинстве случаев совершенно безразлично, какой из процессоров используется в той или иной геймерской платформе. Количество FPS, скорее всего, от этого зависеть будет крайне незначительно. Тем не менее отказываться от тестирования в играх это повода не даёт. Просто для лучшей иллюстративности вместе с измерением игровой производительности в типичном Full HD-разрешении 1920 × 1080 с включённым полноэкранным сглаживанием мы делаем замеры и в разрешении 1280 × 800. Результаты в первом случае показывают тот уровень FPS, который можно получить в реальных условиях прямо сейчас, второй же вариант тестирования позволяет оценить теоретическую игровую производительность процессоров, которая, возможно, будет раскрыта в перспективе, если в нашем распоряжении появятся более быстрые варианты графической подсистемы. Тесты в Full HD-разрешении: Ничего хорошего для 12-ядерного Xeon E5-4650 v3 на приведённых диаграммах нет. Игровая производительность у этого процессора ниже, чем у Core i7-5960X, и это видно даже в «тяжёлых» графических режимах, где, по идее, процессор почти никогда не становится узким местом. Для современных игр совершенно не нужно то запредельное количество ядер, которое есть у этого процессора. Кроме того, более сложное внутреннее строение с двумя кольцевыми шинами и буферизирующим коммутатором хорошо подходит для одновременного многопоточного доступа к данным, а в обычных задачах лишь создаёт ненужные накладные расходы, снижающие скорость работы подсистемы памяти. Всё это тоже не лучшим образом сказывается на производительности в играх и вновь подводит нас к выводу о том, что многоядерные серверные процессоры – неудачный выбор для настольных и уж тем более для геймерских систем. Тесты в уменьшенном разрешении: Здесь всё, о чём мы говорили выше, проявляется ещё сильнее. «Сложные» варианты Haswell-EP с дизайном, явно оптимизированным под решение многопоточных задач, в приложениях, которые порождают сравнительно небольшое число потоков (к ним, например, относятся современные игры), работают хуже, чем более простой Haswell-E. Поэтому случаев удачного применения процессоров вроде Xeon E5-4650 v3 в геймерских системах попросту не бывает. Серверные CPU могут быть эффективными в ресурсоёмких счётных приложениях, но в игровых системах им явно не место. Энергопотребление Измерение энергопотребления – не менее интересная часть тестирования Xeon E5-4650 v3, чем исследование его производительности. Дело в том, что, хотя этот 22-нм процессор и обладает 12 вычислительными ядрами с микроархитектурой Haswell, его расчётное тепловыделение составляет всего 105 Вт. Это на четверть меньше потребления восьмиядерного процессора Core i7-5960X. Поскольку Xeon E5-4650 v3 ориентирован на применение в четырёхпроцессорных серверах, Intel понизила его напряжение питания до 0,89 В, что и дало такой эффект. Конечно, попутно пришлось сбавить и тактовую частоту, тем не менее поверить в то, что 12-ядерный LGA2011-3-процессор, основанный на гигантском полупроводниковом кристалле, может потреблять лишь чуть больше энергии, нежели четырёхъядерник LGA1150, достаточно тяжело. Что ж, проверим. На следующих ниже графиках приводится полное потребление систем (без монитора), измеренное на выходе из розетки, в которую подключен блок питания тестовой системы, и представляющее собой сумму энергопотребления всех задействованных в системе компонентов. В суммарный показатель автоматически включается и КПД самого блока питания, однако с учетом того, что используемая нами модель БП, Seasonic Platinum SS-760XP2, имеет сертификат 80 Plus Platinum, его влияние должно быть минимальным. Для правильной оценки энергопотребления мы активировали режим Turbo Boost и все имеющиеся энергосберегающие технологии. В состоянии простоя система на базе Xeon E5-4650 v3 потребляет немного больше, чем аналогичные системы с десктопным Haswell-E. Это – отражение более сложной внутренней конструкции Haswell-EP. Любопытно, что при перекодировании видео кодером x265 система с Xeon E5-4650 v3 оказывается экономичнее аналогичной платформы с Core i7-5960X. Выше, в тестах производительности, мы видели, что системы с этими процессорами выдают примерно одинаковое быстродействие при решении данной задачи. Следовательно, Xeon E5-4650 v3 предлагает заметно лучшую энергоэффективность: по этой характеристике его преимущество перед флагманским десктопным CPU составляет около 22 процентов. Таким образом, наращивание количества процессорных ядер – это ещё один путь к энергоэффективным вычислениям, правда, применимый лишь для очень хорошо распараллеливаемых задач. При измерении максимального потребления при нагрузке, создаваемой 64-битной версией утилиты LinX 0.6.5, Xeon E5-4650 v3 вновь проявляет свою относительную экономичность. Разница в потреблении одной и той же платформы с серверным 12-ядерным и десктопным восьмиядерным CPU составляет 50 Вт. Иными словами, попавший в наши руки Haswel-EP может обеспечить очень заметную экономию. Однако следует иметь в виду, что среди серверных процессоров есть и очень прожорливые модели, TDP которых может доходить до 145 или даже 160 Вт. Изначально использование серверного многоядерного процессора в составе настольной платформы представлялось очень интересной и здравой затеей. Производители процессоров давно пытаются приучить нас к мысли о том, что количество вычислительных ядер – это одна из важнейших характеристик, оказывающих самое непосредственное влияние на быстродействие системы. При этом самый старший из LGA2011-3-процессоров для настольных систем обладает восемью ядрами, а его серверные собратья могут предложить до 18 ядер. Поэтому на первый взгляд кажется, что, использовав многоядерный Xeon E5 v3, нетрудно собрать более производительную конфигурацию, чем позволяют получить флагманские чипы семейства Haswell-E. Но реальность идёт вразрез с ожиданиями. Протестированная нами конфигурация на базе 12-ядерного Xeon E5 v3 оказалась очень похожей на троллейбус из буханки. Никаких особых ухищрений для её воплощения в жизнь действительно не нужно, но практическая ценность результата вызывает очень серьёзные сомнения. С одной стороны, серверные процессоры Haswell-EP без каких-либо проблем работают в обычных десктопных материнских платах с разъёмом LGA2011-3, построенных на базе набора системной логики Intel X99. Всё что нужно от платы – это поддержка Xeon E5 v3 на уровне BIOS, и такая поддержка имеется в большинстве флагманских материнских плат ведущих производителей. Однако с другой стороны, работая в составе настольных персональных компьютеров, многоядерные Haswell-EP чувствуют себя явно не в своей тарелке. Во-первых, при увеличении количества вычислительных ядер свыше 6-8 штук масштабирование быстродействия серьёзно замедляется, и у серверных Xeon E5 v3 получается обогнать по скорости Core i7-5960X лишь в очень небольшом числе общеупотребительных приложений. Это – прямое следствие наличия в коде почти любых десктопных программ участков нераспараллеливаемого кода. Во-вторых, внедрённый в Haswell-EP дизайн «кластер-на-ядре» глубоко оптимизирован именно под многопоточные нагрузки, поэтому в обычных для настольных компьютеров задачах его ресурсы используются неоптимально, вызывая дополнительное снижение производительности при обмене данными с памятью. Ярким примером такой ситуации выступают игры, где в глаза бросается странное отставание серверного процессора от десктопного даже в режимах с максимальным качеством изображения. И в-третьих, в Xeon E5 v3 полностью заблокированы все возможности для оверклокинга. Десктопные же процессоры для платформы LGA2011-3 неплохо разгоняются и в умелых руках могут серьёзно увеличивать свою производительность, чего их серверные собратья попросту не умеют. В сумме же получается, что если вы хотите построить высокоэффективную настольную систему с максимально возможной на сегодняшний день производительностью, обращать внимание на какие-то экзотические варианты вроде рассмотренного в этом материале никакого смысла нет. Intel нас не обманывает: десктопные процессоры серии Core i7-5xx0 – наилучший на данный момент выбор для энтузиастов.
⇣ Содержание
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
|