Когда AMD представляла первоначальную версию HEDT-платформы (High-End Desktop)Threadripper, она преподносила её как некое экспериментальное и нишевое решение для настольных систем премиального уровня. Однако то, насколько тепло её встретили пользователи, превзошло самые смелые ожидания. Процессоры Ryzen Threadripper смогли предложить то, чего не было и нет у Intel: относительно доступный по цене процессор с большим массивом мощных вычислительных ядер. Количество потребителей, которых такие процессоры заинтересовали по роду их деятельности, вышло настолько значительным, что продолжение экспансии в сегмент высокопроизводительных десктопов и рабочих станций AMD сделала одной из основных своих задач. Шутка ли, развитие Ryzen Threadripper даже рассинхронизировалось с обновлением аналогичных по конструкции процессоров EPYC, и второе поколение Threadripper, продажи представителей которого начинаются с сегодняшнего дня, убежало вперёд от своих серверных собратьев.
Интерес к новым Ryzen Threadripper обусловлен не только тем, что это – первые многоядерные CPU, построенные на 12-нм микроархитектуре Zen+. Вместе с модернизацией на микроуровне AMD решила усилить своё HEDT-семейство принципиально. Теперь пользователи, которые занимаются созданием и обработкой цифрового контента, не толькосмогут выбирать среди 12- и 16-ядерных моделей Threadripper, но и получат куда более внушительные 24- и 32-ядерные варианты. Это значит, что Ryzen Threadripper второго поколения привлекательнее интеловских альтернатив не только с точки зрения цен, но и по «грубой силе», ведь доступные сегодня старшие Core i9 для платформы LGA2066 имеют в своём распоряжении лишь 18 ядер.
Впрочем, это вовсе не значит, что AMD попутно не стала ничего менять в ценообразовании. На момент выпуска процессоров Threadripper первого поколения компания ориентировалась на удельную цену порядка $62 за ядро. Уже тогда это было очень щедрое предложение, поскольку в HEDT-процессорах Intel стоимость ядра определена в $100. Но второе поколение Threadripper идёт ещё дальше, и стоимость ядра теперь снижается до $56. Таким образом, в армии сторонников многоядерных процессоров AMD класса HEDT может появиться большая группа новобранцев.
Однако в случае с Ryzen Threadripper мы хотели бы предостеречь от принятия быстрых эмоциональных решений. Как бы круто ни выглядели 32 ядра с ценой $1800, у новых HEDT-процессоров AMD, как и у всей платформы TR4 в целом есть немало серьёзных проблем, начиная с высокого тепловыделения и закачивая не совсем очевидной ситуацией с масштабированием производительности. Обо всём этом мы подробно поговорим в данном материале.
⇡#Модельный ряд Ryzen Threadripper второго поколения
Начнём с главного: во втором поколении своей HEDT-платформы AMD решила разделить модельный ряд на две части. Если раньше Ryzen Threadripper позиционировались в качестве универсальных процессоров высокой производительностидля энтузиастов, то теперь компания стала дробить целевую аудиторию на более узкие сообщества.
К первой группе потенциальных покупателей Ryzen Threadripper были отнесены те пользователи, которые просто хотят получить в своё распоряжение исключительную вычислительную мощность и собираются использовать её для решения задач различного профиля. В качестве примера AMD, в частности, говорит о таких энтузиастах, которые в рабочее время имеют дело с обработкой или созданием цифрового контента, а досуг посвящают компьютерным играм. Им компания предлагает продолжать ориентироваться на процессоры серии X – чипы с 12 и 16 вычислительными ядрами, которые были доступны и в первом поколении Ryzen Threadripper, но с выходом второго поколения улучшили свои частотные характеристики и приобрели дополнительные возможности.
Во вторую группу AMD выделила профессионалов, которым нужна максимальная вычислительная производительность любой ценой. В понимании компании это 3D-дизайнеры, разработчики игр, видеомонтажёры, научные работники и тому подобные специалисты, имеющие дело с творческими задачами, порождающими высокие вычислительные нагрузки. Для них теперь предлагаются специальные версии Ryzen Threadripper серии WX, получившие 24 и 32 вычислительных ядра. Но нужно иметь в виду, что это на самом деле – не привилегированное предложение. Такие процессоры, несмотря на внушительное количество ядер, не универсальны: в отличие от представителей серии X они хорошо справляются лишь с легко распараллеливаемыми вычислительными задачами и плохо подходят для неоднородных нагрузок.
Таким образом, модельный ряд Ryzen Threadripper увеличивается в два с лишним раза: к трём моделям первого поколения добавляется сразу четыре новых процессора.
|
Ядра/ Потоки |
Базовая частота, ГГц |
Макс. частота, ГГц |
L3-кеш, Мбайт |
Поддержка памяти |
Линии PCIe |
TDP, Вт |
Цена |
Threadripper 2990WX |
32/64 |
3,0 |
4,2 |
64 |
4 × DDR4-2933 |
60 |
250 |
$1799 |
Threadripper 2970WX |
24/48 |
3,0 |
4,2 |
64 |
4 ×DDR4-2933 |
60 |
250 |
$1299 |
Threadripper 2950X |
16/32 |
3,5 |
4,4 |
32 |
4 ×DDR4-2933 |
60 |
180 |
$899 |
Threadripper 2920X |
12/24 |
3,5 |
4,3 |
32 |
4 ×DDR4-2933 |
60 |
180 |
$649 |
Threadripper 1950X |
16/32 |
3,4 |
4,0 |
32 |
4 ×DDR4-2667 |
60 |
180 |
$779 |
Threadripper 1920X |
12/24 |
3,5 |
4,0 |
32 |
4 ×DDR4-2667 |
60 |
180 |
$485 |
Threadripper 1900X |
8/16 |
3,8 |
4,0 |
16 |
4 ×DDR4-2667 |
60 |
180 |
$319 |
С учётом того, что у AMD теперь сосуществует два типа Ryzen Treadripper, флагманов среди процессоров второго поколения получилось тоже два.
Самым мощным процессором в семействе выступает 32-ядерный Threadripper 2990WX стоимостью $1 800, который, исходя из цены, противопоставляется интеловскому максимальному предложению для десктопов – 18-ядерному Core i9-7980XE. Характерно, что для маркировки этого процессора AMD использует суффикс WX, который давно прижился в сегменте профессиональной графики, где для рабочих станций предлагаются видеокарты Radeon Pro WX.
Умопомрачительное количество ядер в Threadripper 2990WX обеспечивается тем, что в отличие от предшественников и собратьев серии X этот процессор строится не на двух, а на четырёх 12-нм кристаллах Zen+ Zeppelin, и благодаря этому он стал ещё сильнее похож на серверные процессоры EPYC. Вместе с удвоившимся числом вычислительных ядер Threadripper 2990WX получил и увеличенный L3-кеш суммарным объёмом 64 Мбайт. Но в остальном старший Threadripper сохраняет большинство характеристик в привычных рамках: он полностью совместим с экосистемой Socket TR4 и потому поддерживает четыре канала памяти и 60 линий PCI Express 3.0. Немного удивляет разве только расчётное тепловыделение, доведённое до 250 Вт. Оно обусловлено тем, что вместе с 32 ядрами Threadripper 2990WX предлагает и относительно высокие рабочие частоты, которые согласно спецификации лежат в диапазоне от 3,0 до 4,2 ГГц. К тому же делать горячие процессоры для AMD совсем не в новинку: вспомним хотя бы про FX-9590, тепловыделение которого старший Threadripper превзошёл всего на 30 Вт. Но, как уверяет AMD, с энергетическими аппетитами 32-ядерного процессора никаких проблем быть не должно. Даже в TR4-материнские платы, выпущенные одновременно с первыми Threadripper, был заложен необходимый запас прочности.
Второй флагман среди Ryzen Threadripper второго поколения – это 16-ядерный Threadripper 2950X, процессор, приходящий на смену Threadripper 1950X. В отличие от Threadripper 2990WX эта новинка продолжает использовать в своей основе два 12-нм кристалла Zen+ Zeppelin, и поэтому она структурно близка к прошлогоднему Threadripper 1950Х. Но хотя вычислительных ядер и L3-кеша в новинке ровно столько же, выглядит она заметно лучше за счёт поднявшихся рабочих частот, которые теперь лежат в диапазоне 3,5-4,4 ГГц против 3,4-4,0 в 16-ядерном процессоре прошлого поколения. Кроме того, не стоит забывать, что характерной особенностью процессоров с микроархитектурой Zen+ выступают технологии Precision Boost 2 (PB2) и Extended Frequency Range 2 (XFR2), способные подстраивать частоту под имеющуюся нагрузку куда агрессивнее, чем это происходило ранее. В результате преимущество в производительности может оказаться даже более явным, чем это кажется при взгляде на паспортные характеристики. Вместе с тем никаких заметных изменений в тепловыделении Threadripper 2950X не произошло: характеристика TDP у нового 16-ядерника установлена в стандартную для платформы Socket TR4 величину 180 Вт.
Что же касается оснащённости Threadripper 2950X внешними интерфейсами, то в этом отношении 16-ядерник не отличается от 32-ядерного Threadripper 2990WX. Процессор предлагает те же четыре канала DDR4-2933 и 60 линий PCI Express 3.0. Но по сравнению с Threadripper 1950X появилась поддержка более скоростной памяти — раньше официально гарантировалась лишь совместимость с модулями DDR4-2666.
Несмотря на произошедшие перемены, процессоры Ryzen Threadripper второго поколения остаются совместимы с уже имеющейся платформой Socket TR4 без каких-либо ограничений. AMD специально подчёркивает, что все имеющиеся на рынке материнские платы, выпущенные для Threadripper 1920Х и 1950X, совместимы с новыми CPU после обновления BIOS. Иными словами, AMD придерживается выбранного курса на сохранение сквозной совместимости не только в массовой платформе Socket AM4, но и в системах класса HEDT. Но в отличие от массовых систем, где вместе с Ryzen двухтысячной серии появились улучшенные наборы системной логики, для процессоров Threadripper второго поколения продолжает предлагаться тот же чипсет X399, что и раньше.
Благодаря тому, что в Ryzen Threadripper поддерживается 60 линий PCI Express 3.0, большинство критически важных функций, таких как поддержка видеокарт и накопителей, реализуется без участия чипсета. Микросхема X399 фактически отвечает лишь за интерфейсы SATA и USB, а также за реализацию второстепенных линков PCI Express 2.0. Поэтому в обновлении она и не нуждается.
Зато за счёт программного обновления и старые, и новые материнские платы на базе X399 получили поддержку технологии StoreMI, которая позволяет строить производительные комплексные дисковые подсистемы, объединяющие в одном томе механические и твердотельные жёсткие диски, а также расположенный в оперативной памяти кеш. Прилагаемые к такому массиву интеллектуальные алгоритмы оптимизируют расположение файлов таким образом, чтобы гарантировать максимальную скорость доступа к наиболее часто используемым данным.
Оба новых флагманских HEDT-процессора, и Threadripper 2990WX, и Threadripper 2950X, поступят в продажу в самое ближайшее время: 32-ядерный чип можно купить начиная с сегодняшнего дня, а старший 16-ядерник серии X второго поколения поступит в магазины 31 августа. Что же касается двух других процессоров с 24 и 12 ядрами, то они выйдут несколько позднее, ориентировочно в октябре. Впрочем, по этому поводу вряд ли у кого-то возникнут особые переживания. Фактически Threadripper 2970WX и Threadripper 2920X представляют собой удешевлённые аналоги старших моделей Threadripper 2990WX и Threadripper 2950X, но с отключённой парой вычислительных ядер в каждом входящем в состав процессоров кристалле Zeppelin.
Отдельно стоит подчеркнуть, что 8-ядерная модель среди Threadripper второго поколения не предусмотрена. И это закономерно: продажи Threadripper 1900X были невысоки, и модернизировать эту модель не было никакого смысла. В конце концов, с ролью входного билета в платформу Socket TR4 вполне может справиться и недорогой процессор годичной давности.
⇡#Улучшения микроархитектуры
Как уже стало понятно к этому моменту, модельный ряд процессоров Threadripper второго поколения отличается двумя ключевыми признаками. Во-первых, в нём появились процессоры, которые собраны на основе четырёх, а не двух полупроводниковых кристаллов Zeppelin. И во-вторых, сами эти кристаллы получили более новый дизайн Zen+, который обзавёлся некоторыми усовершенствованиями. О том, чем Zen+ отличается от первоначальной микроархитектуры Zen, мы подробно говорили в обзоре Ryzen 7 2700X. Однако основные моменты заслуживают того, чтобы повторить их в контексте Threadripper.
Самое главное: Zen+ – это архитектура, получившаяся при переводе производства изначального дизайна Zen на более совершенный технологически процесс GlobalFoundries 12LP (Leading Performance) с 12-нм нормами. Однако в честь улучшения разрешения техпроцесса AMD не стала делать даже «оптический» редизайн своего кремния, поэтому и строение, и площадь, и компоновка полупроводникового кристалла остались ровно теми же, что и были до того. Тем не менее, даже несмотря на это, новая производственная технология позволила на 10-15 % улучшить производительность транзисторов, что стало хорошим фундаментом для корректировки зависимости тактовой частоты от напряжения питания.
В конечном итоге это позволило в среднем на 200 МГц поднять рабочие частоты новых процессоров, снизив им напряжение питания на 80-120 мВ. И в сумме же вышло так, что с новыми Threadripper более высокая производительность стала доступна без какого-либо роста практического энергопотребления и тепловыделения.
Вторая часть усовершенствований Zen+ затрагивает задержки подсистемы кеш-памяти. Правда, в случае Threadripper они не так заметны, как были заметны в процессорах Ryzen второго поколения.
Дело в том, что версия кристаллов, которая применялась в HEDT-процессорах первого поколения уже содержала часть улучшений относительно первоначальной версии дизайна. Поэтому для Threadripper имеют место лишь достаточно скромное сокращение задержек:
- латентность L3-кеша снизилась на 15 %;
- латентность L2-кеша снизилась на 9 %;
- латентность L1-кеша снизилась на 8 %;
- латентность памяти снизилась на 2 %.
К этому стоит добавить появление в Threadripper второго поколения официальной поддержки DDR4-2933, что отражает произошедший качественный скачок в оптимизации библиотек AGESA. И теперь AMD гарантирует, что на частоте 2933 МГц заработает любая память, установленная в количестве одного модуля на канал. Однако в случае использования в системе восьми модулей DIMM одновременно всё ещё действуют жёсткие ограничения, вплоть до того, что с двухранговыми модулями AMD гарантирует работоспособность памяти лишь в режиме DDR4-1866.
Кроме того, не стоит забывать и о появлении в Zen+ технологий динамического изменения частоты PB2 и XFR2. Они в полной мере присутствуют и в Threadripper второго поколения, что позволяет им очень гибко подстраивать свою частоту в зависимости от нагрузки. При этом PB2 – это достаточно самобытная реализация турборежима, которая не предусматривает никаких чётких рамок по частоте процессора в зависимости от нагрузки, а рабочий режим подбирается интерактивно с шагом в 25 МГц, исходя из показаний внутриядерных датчиков токов и потребления.
XFR2 же добавляет в формулу моментальной частоты ещё и температуру, позволяя процессору автоматически разгоняться на дополнительные 10-15 %, если его тепловой режим не внушает никаких опасений. По этой причине производительность процессоров Threadripper, как и Ryzen второго поколения, приобрела заметную зависимость от качества системы охлаждения. И этот момент необходимо иметь в виду.
⇡#Threadripper WX ≠ 2 × Threadripper X
Появление в семействе Threadripper двух различных классов процессоров, WX и X, – это отнюдь не вопрос маркетинга. Различия начинаются на уровне структуры и затрагивают как алгоритмы работы подсистемы памяти, так и схему взаимодействия ядер между собой, что в конце концов приводит к тому, что 32-ядерный и 16-ядерный Threadripper – это два принципиально различных по сути продукта.
Основной строительный блок в современных процессорах AMD – это полупроводниковый кристалл Zeppelin, в котором объединены восемь распределённых по двум CCX (CPU Complex) вычислительных ядер. Таким образом, для создания 16-ядерных процессоров достаточно двух таких чипов: этот подход использовался в Threadripper первого поколения, по такому же принципу построены и новые 16-ядерные решения серии X. Несмотря на то, что упаковка любых процессоров Threadripper унифицирована с серверными EPYC и рассчитана на размещение внутри четырёх кристаллов Zeppelin, в продуктах серии X лишь два кристалла рабочие, а два других представляют собой кремниевые заглушки, необходимые для обеспечения механической прочности конструкции.
Объединённые в одно целое на текстолитовой подложке кристаллы на логическом уровне соединяются посредством фирменной высокоскоростной шины AMD Infinity Fabric. В дизайне Zeppelin заложено четыре внешних двунаправленных линка Infinity Fabric шириной 32 бита, но в случае собранных из двух составных частей 16-ядерных процессоров для соединения кристаллов используется по два линка. Шина Infinity Fabric синхронизирована с контроллером памяти, и, при условии использования в системе DDR4-2933, соединение кристаллов в 16-ядерных Threadripper X получает суммарную пропускную способность 93,9 Гбайт/с.
В случае же Threadripper WX схема построения процессора приобретает более сложный вид. Для создания 32-ядерного процессора требуется уже четыре чипа Zeppelin, каждый из которых связывается тремя линками Infinity Fabric с тремя другими кристаллами. Это значит, что пропускная способность попарных соединений между кристаллами в Threadripper WX ниже, чем в Threadripper X, и при работе памяти в режиме DDR4-2933 достигает лишь 46,9 Гбайт/с.
Но главная причина, по которой Threadripper WX нельзя воспринимать как простое удвоение потенциала Threadripper X, заключается даже не в этом. Есть гораздо более значимый фактор, который делает из 32-ядерного CPU не совсем привычный для десктопного окружения продукт. Этот фактор – организация подсистемы памяти. AMD захотела вписать собранный из четырёх кристаллов 32-ядерный процессор в уже имеющуюся инфраструктуру Socket TR4, и это привело к тому, что подсистема памяти у Threadripper WX получилась неравномерной.
Дело в том, что платформа Socket TR4 изначально проектировалась под процессоры с числом ядер не больше 16, поэтому она предполагает наличие внешних интерфейсов только у двух кристаллов Zeppelin, составляющих процессор. В результате пара «дополнительных» кристаллов в Threadripper WX никаких связей с внешним миром не может иметь по определению. Для того чтобы убрать это ограничение, AMD могла бы перепроектировать платформу, сблизив её по свойствам с серверной Socket SP3, но выбор был сделан в пользу совместимости новых процессоров с уже имеющейся инфраструктурой. В результате в 32-ядерном процессоре фактически соседствуют две функционально различные разновидности кристаллов: два полноценных чипа и два кристалла с урезанной функциональностью, которые AMD называет вычислительными, – не имеющие собственной памяти и лишённые собственных линий PCI Express.
Получается, что память в системах на базе Threadripper WX распределена между ядрами неравноправно, и четыре канала DDR4 SDRAM относятся лишь к двум кристаллам Zeppelin – по два канала на кристалл. А это в свою очередь влечёт за собой невозможность реализации обычной для настольных систем однородной модели памяти с равноправным доступом UMA (Uniform Memory Access). Поэтому в то время как 16-ядерные Threadripper X по умолчанию работают со всей своей памятью в четырёхканальном режиме, синхронно раскладывая все обращения по двум контроллерам памяти в разных кристаллах, и за счёт этого всегда демонстрируют одинаковую скорость доступа, в Threadripper WX пришлось реализовать более сложную модель NUMA (Non-Uniform Memory Access), где память жёстко привязана к кристаллам и время доступа к ней зависит от местоположения данных по отношению к инициирующему обращение ядру.
По сути, Threadripper WX единым процессором с четырехканальной памятью и не является, он больше похож на собранную на единой текстолитовой подложке четырёхпроцессорную систему, в которой два узла имеют собственную двухканальную память, а два других – лишены памяти вовсе. И такая подсистема памяти работает не совсем очевидно. Пиковая пропускная способность памяти в 32-ядерных Threadripper WX в любом случае оказывается вдвое ниже, чем в 16-ядерных, где контроллеры памяти работают в комбинированном четырёхканальном режиме, но зато, если кристалл Zeppelin взаимодействует с собственным контроллером памяти, достигается заметный выигрыш в латентности. AMD даёт такую оценку: латентность памяти при работе ядра с собственным контроллером DDR4 SDRAM, находящимся в том же кристалле, составляет 64 нс, в то время как при обращениях к данным через контроллер соседнего кристалла она возрастает до 105 нс.
Такое различие в латентности не имело бы неприятных последствий, если бы данные находились поблизости от ядра, обращающегося к памяти, с высокой долей вероятности. Но к сожалению, гарантировать это невозможно, хотя планировщики в современных операционных системах, и в Windows в том числе, и стараются строить работу с NUMA-системами таким образом, чтобы создаваемые одним приложением вычислительные потоки оставались по возможности в рамках одного узла и не порождали необходимость в перекрёстном обмене данными между ядрами в разных кристаллах.
Но с Threadripper WX случай особый: половина его ядер своей памяти не имеет вовсе, поэтому, так или иначе, массово гонять данные по внутрипроцессорным линкам Infinity Fabric в этих процессорах всё равно приходится. Кроме того, напомним, речь идёт о решении для рабочих станций, и в такой среде приложения, которые бы не стремились занять нагрузкой более восьми вычислительных ядер одного кристалла Zeppelin и могли бы изолированно работать в рамках одного кристалла-узла, встречаются не так часто. Поэтому работа с памятью в Threadripper WX – катастрофически слабое место. Такой процессор целесообразно использовать либо для запуска армады малопоточных приложений, не требовательных к пропускной способности памяти, либо для задач, которые хорошо распараллеливаются, но не требуют для своей работы больших объёмов данных. В противном случае вся внутренняя структура процессора будет перегружена и станет узким местом, серьёзно ограничивающим производительность.
Кстати, подобная ситуация в Threadripper WX складывается не только с памятью, но и с распределением линий PCI Express. Они также относятся лишь к двум из четырёх процессорных кристаллов, и интенсивная работа с графическими картами или скоростными NVMe-накопителями тоже может стать для этого процессора определённой проблемой. Иными словами, любые пересылки данных для Threadripper WX противопоказаны. Полностью «забить» потоком данных внутренние линки Infinity Fabric могут не только обращения к памяти через контроллер соседнего кристалла, но и даже элементарные обращения ко внешним устройствам – видеокартам и NVMe-накопителям.
Именно поэтому Threadripper WX и позиционируется AMD особым образом. Этот процессор – решение не для всех не столько из-за высокой цены, сколько из-за того, что подходит он исключительно для определённых задач. В тех случаях, когда его несимметричная NUMA-архитектура плохо ложится на характер нагрузки, а это может происходить достаточно часто, производительность 32-ядерного монстра может оказаться категорически разочаровывающей. Располагающий 16 ядрами и подсистемой памяти с UMA-архитектурой Threadripper X подобных проблем решён, и универсальным многоядерным решением следует считать именно его, а не специфический Threadripper WX.
⇡#Ryzen Threadripper 2990WX в подробностях
Итак, Ryzen Threadripper 2990WX – это пусть и несколько своеобразный, но всё равно эпический процессор с 32 вычислительными ядрами и поддержкой SMT, дающей возможность одновременного исполнения 64 потоков. Как уже было сказано выше, этот процессор собран на основе четырёх кристаллов Zen+ Zeppelin, что означает, что в его конструкции принимает участие восемь модулей CCX, которые в общей сложности дают L3-кеш общим объёмом 64 Мбайт. Столь мощных по оснащению конфигураций, направленных на десктопы, мы ещё не видели, и было бы совершенно неудивительно, если бы подобный монстр не смог бы похвастать высокими тактовыми частотами.
Но ничего подобного: инженеры AMD смогли выжать из Threadripper 2990WX очень достойные частотные характеристики. Новый 12-нм техпроцесс, который используется в производстве строительных блоков Threadripper второго поколения, а также строгий отбор наиболее удачных кремниевых заготовок, из-за которого в них может попасть не более 5 процентов из сходящих с конвейера кристаллов, позволили определить номинальную частоту Threadripper 2990WX в 3,0 ГГц. Причём в большинстве случаев этот процессор будет работать гораздо быстрее: максимальная частота в турборежиме может доходить до 4,2 ГГц.
На следующем графике мы попытались отобразить, как выглядит реальная частота Threadripper 2990WX при нагрузке различной интенсивности. Выполняя тестирование производительности этого процессора в номинальном режиме в Cinebench R15 при задействовании различного числа вычислительных потоков, мы фиксировали выбранную процессором частоту. Её распределение в зависимости от загрузки процессора приобрело следующий вид.
Несмотря на то, что в качестве базового уровня для Threadripper 2990WX заявлена частота 3,0 ГГц, в реальности этот процессор почти всегда работает быстрее. И даже при рендеринге в Cinebench R15 на всех ядрах мы наблюдали частоту 3,2-3,3 ГГц, что как минимум на 10 % превосходит базовый уровень.
Threadripper 2990WX представляет собой NUMA-систему с четырьмя узлами, где каждый узел – это отдельный кристалл. При этом сами узлы различаются между собой: два – располагают двухканальными контроллерами памяти, а два – работают вообще без собственной памяти. В отличие от Threadripper прошлого поколения, совместную кооперативную работу двух контроллеров памяти в Threadripper 2990WX включить невозможно, и NUMA-архитектура для него – это навсегда.
Распределение ядер по узлам NUMA выглядит следующим образом.
К приведённой иллюстрации нужно добавить, что контроллеры памяти и PCI Express расположены в узлах с номерами 0 и 2, а узлы 1 и 3 – чисто вычислительные и внешних интерфейсов лишены. Именно поэтому ядра имеют не совсем естественную нумерацию: AMD присвоила первые 16 номеров тем ядрам, которые имеют возможность работать с памятью более быстро, в надежде на то, что планировщик операционной системы первоначально будет размещать нагрузку именно на них, а ядра без прямого доступа к памяти пойдут в дело лишь во вторую очередь.
Впрочем, на практике это помогает далеко не всегда. В Windows 10 порой случается, что приложения «уезжают» на дальние ядра, работающие с памятью через дополнительные линки Infinity Fabric. Поэтому иногда бывает так, что приложение раз за разом работает с разной производительностью в зависимости от того, получилось у него разместиться на ядрах, расположенных в кристаллах с контроллером памяти, или не получилось.
Чтобы проиллюстрировать сказанное, достаточно посмотреть на то, как меняется скорость работы с памятью в зависимости от того, идут ли обращения к ней через контроллер памяти, находящийся в том же кристалле Zeppelin, или же через соседний. В следующих таблицах приведена практическая латентность и пропускная способность, развиваемая NUMA-узлами при работе с собственной памятью и памятью соседних NUMA-узлов (процессор работает на фиксированной частоте 3,8 ГГц, в подсистеме памяти используется DDR4-3200, измерения выполнены при помощи Intel Memory Latency Checker).
Результаты весьма показательны. Задержки при обращении ядер одного процессорного кристалла к «чужой» памяти, относящейся к контроллеру памяти другого кристалла, вырастают сразу на 75 процентов, а пропускная способность из-за ограниченности полосы пропускания коммутирующей кристаллы Zeppelin шины Infinity Fabric оказывается меньше почти вдвое. Иными словами, работа с данными, находящимися вне одного NUMA-узла, происходит в Threadripper 2990WX с достаточно низкой эффективностью.
Для полноты картины стоит взглянуть и на задержки, возникающие при пересылках данных между ядрами.
Естественно, низкие задержки — на уровне 43-44 нс — обеспечиваются лишь при тех пересылках данных, которые происходят между ядрами в рамках одного CCX-модуля. Если же отправитель и получатель находятся в разных CCX, но в одном кристалле, то латентность всё равно сразу же возрастает в три с половиной раза. А если данные требуется передавать ещё дальше – в соседний кристалл, то латентность таких межъядерных обменов увеличивается до более чем 200 нс. Любопытно, что те вычислительные ядра, которые расположены в кристаллах без собственного контроллера памяти, порождают при пересылках данных дополнительные задержки, в результате чего латентность межъядерных обменов может доходить до внушительной величины в 245 нс. Очевидно, шина Infinity Fabric загружена в них сильнее, чем в обычных кристаллах Zeppelin.
Ещё одна тонкость, связанная с эксплуатацией Threadripper 2990WX, касается впечатляющего тепловыделения этого процессора. В официальной спецификации говорится о тепловом пакете в 250 Вт, и это вызывает сразу два вопроса: смогут ли потянуть 32-ядерник уже выпущенные TR4-материнские платы, изначально рассчитанные на 180-ваттные Threadripper первого поколения, и какой кулер потребуется для отвода такого количества тепловой энергии.
К счастью для потенциальных покупателей Threadripper 2990WX, никаких шокирующих ответов на эти вопросы AMD не даёт. Утверждается, что платы первого поколения с новым 32-ядерником вполне совместимы после обновления BIOS. И какие-то проблемы со схемами питания могут возникать разве только при разгоне. Впрочем, флагманские платформы вроде ASUS Zenith Extreme дадут возможность разогнать Threadripper 2990WX до максимума, несмотря на свой возраст. Единственное, что может потребоваться, — это дополнительное охлаждение схемы питания на материнской плате. Для тех же пользователей, которые всё же сомневаются в полной совместимости, производители подготовили несколько «усиленных» Socket TR4-материнок второго поколения. Например, MSI MEG X399 Creation, на базе которой мы проводили тесты для этого обзора.
Не требуются для Threadripper 2990WX и никакие особенные системы охлаждения. Те кулеры, которые подходили для Threadripper первого поколения, скорее всего, справятся и с 32-ядерным флагманом. Более того, сама AMD по-прежнему рекомендует использовать с новым старшим HEDT-процессором системы жидкостного охлаждения, сделанные Asetek, и даже комплектует 2990WX совместимым креплением для стандартного цилиндрического водоблока.
Впрочем, жидкостное охлаждение необходимостью не является, вполне можно обойтись даже воздушным кулером. Например, вместе с Threadripper второго поколения AMD в сотрудничестве с Cooler Master выпустила специальный кулер Wraith Ripper, представляющий собой двухсекционную башню с одним 120-мм вентилятором и семью тепловыми трубками.
Но есть важный момент: этот кулер имеет большую подошву, которая покрывает крышку Threadripper полностью. И это, как показывает практика, заметно улучшает теплоотвод от процессора. В качестве примера мы сравнили максимальную температуру Threadripper 2990WX при прохождении нагрузочного тестирования в Prime95 при использовании нового Wraith Ripper, системы жидкостного охлаждения Corsair Hydro Series H115i с водоблоком стандартного размера и системы жидкостного охлаждения Enermax Liqtech 240 TR4 со специальным водоблоком для Threadripper, который полностью закрывает поверхность этого CPU.
AMD Ryzen Threadripper 2990WX |
|
Температура Tdie в Prime95 (макс.), °C |
Частота в Prime95 (мин.), МГц |
Cooler Master Wraith Ripper |
64,3 |
3025 |
Corsair Hydro Series H115i |
63,8 |
3050 |
Enermax Liqtech 240 TR4 |
54,9 |
3100 |
Как следует из проведённого экспресс-тестирования, полное покрытие системой охлаждения всей поверхности теплорассеивающей крышки процессора – очень весомый фактор. Благодаря большой площади основания воздушный кулер получает возможность сравниться по эффективности даже с достаточно неплохой системой жидкостного охлаждения. А система охлаждения с большим водоблоком выигрывает у «водянки» Corsair/Asetek с водоблоком стандартного размера почти десять градусов, несмотря на то, что она располагает радиатором меньшего размера.
Иными словами, вывод очевиден: для систем с 250-ваттным Threadripper 2990WX лучше подбирать такой кулер, который имеет большую подошву, подогнанную по размеру для Socket TR4-процессора. Это важно ещё и потому, что от температуры процессора зависит работа технологии XFR2, и лучшее охлаждение даёт процессору возможность автоматически выходить на более высокие частоты и показывать лучшую производительность.
⇡#Ryzen Threadripper 2950X в подробностях
Рассказ про 16-ядерный и 32-поточный Threadripper 2950X будет заметно короче. Этот процессор выступает простым инкрементным обновлением Threadripper 1950X годичной давности, а потому с точки зрения архитектуры ничего нового не приносит. Разница есть лишь в частотах, которые увеличились благодаря использованию 12-нм, а не 14-нм кремниевых кристаллов. Так, базовая частота Threadripper 2950X выросла на 100 МГц – до 3,5 ГГц, а максимальная частота в турборежиме увеличилась сразу на 400 МГц – до 4,4 ГГц.
В реальном использовании частоты в зависимости от нагрузки распределяются примерно так, как показано на следующем графике, на котором задокументировано поведение Threadripper 2950X в номинальном режиме в Cinebench R15 при задействовании различного количества ядер.
Как и в случае Threadripper 2990WX, хорошо прослеживается работа технологии PB2, которая тонко подстраивает рабочую частоту под параметры нагрузки и текущего энергопотребления. Не стоит забывать и про XFR2 – технологию, дополнительно наращивающую частоту процессора в благоприятном температурном режиме. Благодаря этому при условии качественного охлаждения Threadripper 2950X удаётся удерживать реальную частоту выше 4,0 ГГц при загрузке вплоть до 12 ядер.
Threadripper 2950X собран на основе двух, а не четырёх, как Threadripper 2990WX, полупроводниковых кристаллов Zen+ Zeppelin. Из-за этого у него не только вдвое меньше вычислительных ядер, но и вдвое меньше суммарный объём L3-кеша. Но большое преимущество заключается в том, что оба кристалла в нём равноценны, и благодаря этому никакой муторной и накладной для десктопного CPU реализации NUMA-архитектуры не требуется.
Threadripper 2950X использует более естественную модель памяти UMA, то есть вся установленная в системе память для всех ядер равнозначна. Физически это реализуется за счёт объединения двух имеющихся в кристаллах Zeppelin двухканальных контроллеров в один четырёхканальный и равномерного распределения по четырём каналам всех обращений к памяти. В результате Threadripper 2950X может предложить более высокую пропускную способность при работе с памятью. Однако если сравнивать с обычными процессорами Ryzen, то работа с памятью у Threadripper 2950X происходит с более высокими задержками, связанными с постоянной необходимостью переадресации части запросов в контроллер памяти соседнего кристалла.
Помимо модели памяти UMA, которая для Threadripper 2950X является основной, этот процессор можно переключить и в режим NUMA, что может быть интересно для каких-то чувствительных к латентности памяти малопоточных приложений, ярким примером которых выступают отдельные 3D-игры. Переключение осуществляется программно, при помощи утилиты AMD Ryzen Master, в которой предусмотрена специальная настройка.
Режим работы памяти: D (Distributed) = UMA; L (Local) = NUMA
В NUMA-режиме контроллеры памяти Threadripper 2950X разделяются, и каждый из кристаллов Zeppelin работает со своей собственной памятью независимо, обращаясь к соседнему контроллеру лишь по мере необходимости. Но, к сожалению, изменение модели работы с памятью происходит не «на лету». Для перехода от UMA к NUMA и обратно требуется перезагрузка, что делает пользование имеющимся в AMD Ryzen Master переключателем не слишком удобным.
Зато существование возможности переключения режимов позволяет нам наглядно показать разницу в пропускной способности и латентности памяти, возникающую при использовании Threadripper 2950X в конфигурации с NUMA- и UMA-памятью. Измерения сделаны при помощи утилиты Intel Memory Latency Checker, частота процессора – 3,8 ГГц, память работает в режиме DDR4-3200.
Результаты вполне логичны. В NUMA-режиме у Threadripper 2950X скорость работы с памятью в рамках одного узла (кристалла Zeppelin) похожа на ту скорость, которую обеспечивают обычные процессоры Ryzen. Однако если процессорному ядру требуется достучаться до памяти, подключённой к соседнему кристаллу, латентности возрастают на 75 процентов, а пропускная способность падает почти вдвое.
Чтобы не сталкиваться с подобным разбросом в скоростных параметрах, как раз и существует режим UMA. В нём пропускная способность памяти за счёт четырёхканальности заметно выше, чем у обычных Ryzen, но придётся смириться с высокими задержками, которые получаются даже выше, чем в самом худшем случае в NUMA-режиме. Впрочем, несмотря на это, AMD всё равно считает UMA-режим более подходящим вариантом для Threadripper 2950X: в приложениях для создания и обработки цифрового контента высокая пропускная способность важнее.
Поскольку Threadripper 2950X – более простой по сравнению с Threadripper 2990WX процессор, его тепловыделение типично для платформы Socket TR4 — 180 Вт. Это значит, что в случае 16-ядерного CPU никаких проблем с платами и системами охлаждения быть не должно. Для этого процессора заведомо сгодится то же самое оснащение, которое предлагалось производителями для предыдущего поколения процессоров Threadripper.
⇡#Разгон
Маловероятно, что пользователи процессоров класса Threadripper, нацеленных на применение в рабочих станциях, будут часто прибегать к разгону. Однако мы всё же не стали обходить эту тему стороной, ведь оверклокинг позволяет не только увидеть скрытый частотный потенциал, но и проверить запас прочности платформы в целом, который в случае появления процессоров с TDP 250 Вт вызывает некоторые опасения.
Однако начать эксперименты мы все же решили не с тяжеловеса Threadripper 2990WX, а более скромного в плане потребления энергетических ресурсов Threadripper 2950X. Подобный процессор первого поколения, Threadripper 1950X, мы в своё время смогли разогнать до 3,9 ГГц. Но Threadripper 2950X должен быть более податлив, ведь он собран на основе 12-нм кристаллов, главным преимуществом которых называется как раз увеличенный частотный потенциал. Тем более что процессоры Ryzen поколения Zen+ разгоняются до 4,0-4,2 ГГц, а для сборки процессоров класса Threadripper компания AMD отбирает наилучшие полупроводниковые кристаллы.
Кроме того, теперь в нашем распоряжении появилась новая система жидкостного охлаждения Enermax Liqtech 240 TR4, которая обладает водоблоком, полностью покрывающим теплораспределительную крышку Threadripper. А это, как мы уже убедились, позволяет существенно поднять эффективность теплоотвода, даже несмотря на сравнительно небольшой радиатор, который используется в этой системе охлаждения.
И в целом Threadripper 2950X не разочаровал. Полная стабильность тестового процессора была получена на максимальной частоте 4,1 ГГц.
После установки напряжения питания 1,3 В процессор, работающий на частоте 4,1 ГГц, успешно проходил тестирование в Prime95, а максимальные температуры ядер при этом не выходили за пределы 78 градусов. Энергопотребление разогнанного процессора во время теста, согласно данным внутреннего мониторинга, составляло порядка 290 Вт. Потребление же системы в целом достигало 390 Вт. Иными словами, с разгоном Threadripper 2950X всё оказалось вполне предсказуемо и прошло без каких-либо эксцессов.
Чего нельзя сказать о разгоне Threadripper 2990WX. Откровенно говоря, идея дополнительно увеличить частоту и напряжение процессору с расчётным тепловыделением 250 Вт без применения каких-либо продвинутых методов теплоотвода вызывает определённый скепсис. И как показала практика, совсем не зря. При оверклокерских экспериментах с Threadripper 2990WX возникает сразу две серьёзных проблемы. Во-первых, тепловыделение разогнанного процессора, построенного на четырёх кристаллах Zeppelin, лихо перешагивает через границу в 500 Вт, и отвести такое количество тепла на самом деле не так уж и просто даже с помощью системы жидкостного охлаждения. Во-вторых, в этом случае на конвертер питания на материнской плате ложится очень высокая нагрузка, в результате чего обеспечить его бесперебойную работу становится даже сложнее, чем совладать с тепловыделением процессора.
Например, оверклокерские тесты Threadripper 2990WX мы проводили в системе на базе новой Socket TR4-материнской платы MSI MEG X399 Creation, в которой реализован мощный 19-фазный преобразователь напряжения (16 каналов на процессор и 3 – на SoC). Но, даже организовав на тестовом стенде дополнительный обдув зоны VRM двумя 120-мм вентиляторами, мы всё равно столкнулись с перегревом преобразователя выше 110 градусов и срабатыванием его защиты. Похоже, что граница в 500 Вт – это тот критический предел энергопотребления процессора, после прохождения которого нужно серьёзно задумываться в том числе и о модернизации охлаждения на плате. А без этого разгон Threadripper 2990WX ограничивается скорее возможностями платформы, чем собственным потенциалом.
В конечном итоге, чтобы избежать срабатывания защиты в схеме преобразования питания, нам пришлось ограничить повышение напряжения на процессоре величиной 1,29 В. И в этом случае максимальная частота, при которой оказалась возможна стабильная работа Threadripper 2990WX, составила 3,9 ГГц. Впрочем, в любом случае работающий на такой частоте 32-ядерный процессор, — это настоящий монстр.
Никаких проблем с прохождением тестов стабильности в Prime95 работающим на 3,9 ГГц процессором Threadripper 2990WX не возникло. Максимальная температура процессора составила 84 градуса, его максимальное потребление – 458 Вт. Потребление тестовой системы целиком при нагрузочном тестировании не превышало 630 Вт.
⇡#Описание тестовых систем и методики тестирования
Для проведения тестирования мы получили от компании AMD оба флагманских процессора Threadripper второго поколения. И поскольку это – уникальные многоядерные продукты, какие CPU стоит выбрать для них в качестве соперников, долго думать не пришлось. Если исходить из объявленной официальной стоимости, 32-ядерный Threadripper 2990WX противопоставляется компанией AMD 18-ядерному Core i9-7980XE, а 16-ядерный Threadripper 2950X следует рассматривать как альтернативу 10-ядерному Core i9-7900X. Именно эта четвёрка и стала основным участником тестов.
А чтоб ей было не скучно, на диаграммы мы добавили результаты прошлого 16-ядерного Threadripper 1950X, а также показатели производительности флагманских процессоров для массовых платформ Socket AM4 и LGA1151v2.
В конечном итоге список задействованных в тестировании комплектующих получился таким:
- Процессоры:
- AMD Ryzen 7 2700X (Pinnacle Ridge, 8 ядер + SMT, 3,7-4,3 ГГц, 16 Мбайт L3);
- AMD Ryzen Threadripper 1950X (Whitehaven, 16 ядер + SMT, 3,4-4,0 ГГц, 32 Мбайт L3);
- AMD Ryzen Threadripper 2950X (Colfax, 16 ядер + SMT, 3,5-4,4 ГГц, 32 Мбайт L3);
- AMD Ryzen Threadripper 2990WX (Colfax, 32 ядра + SMT, 3,0-4,2 ГГц, 64 Мбайт L3);
- Intel Core i7-8700K (Coffee Lake, 6 ядер + HT, 3,7-4,7 ГГц, 12 Мбайт L3);
- Intel Core i9-7900X (Skylake-X, 10 ядер + HT, 3,3-4,3 ГГц, 13,75 Мбайт L3);
- Intel Core i9-7980XE (Skylake-X, 18 ядер + HT, 2,6-4,2 ГГц, 24,75 Мбайт L3).
- Процессорные кулеры:
- Corsair Hydro Series H115i;
- Enermax Liqtech 240 TR4.
- Материнские платы:
- ASUS ROG Crosshair VII Hero (Socket AM4, AMD X470);
- ASUS ROG Maximus X Hero (LGA1151 v2, Intel Z370);
- ASUS Prime X299-Deluxe (LGA2066, Intel X299);
- MSI MEG X399 Creation (Socket TR4, AMD X399).
- Память:
- 2 × 8 Гбайт DDR4-3200 SDRAM, 14-14-14-34 (G.Skill Trident Z RGB F4-3200C14D-16GTZR);
- 4 × 8 Гбайт DDR4-3200 SDRAM, 14-14-14-34 (G.Skill Trident Z RGB F4-3200C14Q-32GTZR).
- Видеокарта: NVIDIA Titan X (GP102, 12 Гбайт/384-бит GDDR5X, 1417-1531/10000 МГц).
- Дисковая подсистема: Samsung 960 PRO 1TB (MZ-V6P1T0BW).
- Блок питания: Thermaltake Toughpower DPS G RGB 1000W Titanium (80 Plus Titanium, 1000 Вт).
Текущие рекомендованные цены на процессоры, принявшие участие в тестировании, представлены в таблице, однако стоит иметь в виду, что процессоры AMD, особенно относящиеся к прошлому поколению, часто продаются дешевле официально обозначенных цен:
AMD |
|
Intel |
|
$1 979 |
Core i9-7980XE |
Ryzen Threadripper 2990WX |
$1 799 |
|
|
$989 |
Core i9-7900X |
Ryzen Threadripper 2950X |
$899 |
|
Ryzen Threadripper 1950X |
$779 |
|
|
$359 |
Core i7-8700K |
Ryzen 7 2700X |
$299 |
|
Тестирование выполнялось в операционной системе Microsoft Windows 10 Enterprise (v1709) Build 16299 с использованием следующего комплекта драйверов:
- AMD Chipset Driver 18.10;
- Intel Chipset Driver 10.1.1.45;
- Intel Management Engine Interface Driver 11.7.0.1017;
- NVIDIA GeForce 398.82 Driver.
Описание использовавшихся для измерения вычислительной производительности инструментов:
Комплексные бенчмарки:
- Futuremark PCMark 10 Professional Edition 1.0.1275 – тестирование в сценариях Essentials (обычная работа среднестатистического пользователя: запуск приложений, сёрфинг в интернете, видеоконференции), Productivity (офисная работа с текстовым редактором и электронными таблицами), Digital Content Creation (создание цифрового контента: редактирование фотографий, нелинейный видеомонтаж, рендеринг и визуализация 3D-моделей). Аппаратное ускорение OpenCL в тестировании было отключено.
- Futuremark 3DMark Professional Edition 2.4.4264 — тестирование в сцене Time Spy Extreme 1.0.
Приложения:
- 7-zip 18.05 — тестирование скорости архивации. Измеряется время, затрачиваемое архиватором на сжатие директории с различными файлами общим объёмом 3,1 Гбайт. Используется алгоритм LZMA2 и максимальная степень компрессии.
- Adobe After Effects CC 2018 15.1.0 – тестирование скорости рендеринга анимационного ролика. Измеряется время, затрачиваемое системой на обсчёт в разрешении 1920 × 1080@30fps заранее подготовленного видеоролика.
- Adobe Photoshop CC 2018 19.1.3 — тестирование производительности при обработке графических изображений. Измеряется среднее время выполнения тестового скрипта, представляющего собой творчески переработанный Retouch Artists Photoshop Speed Test, который включает типичную обработку четырёх 24-мегапиксельных изображений, сделанных цифровой камерой.
- Adobe Photoshop Lightroom Classic СС 7.3 – тестирование производительности при пакетной обработке серии изображений в RAW-формате. Тестовый сценарий включает постобработку и экспорт в JPEG с разрешением 1920 × 1080 и максимальным качеством двухсот 16-мегапиксельных изображений в RAW-формате, сделанных цифровой камерой Fujifilm X-T1.
- Adobe Premiere Pro CC 2018 12.1.0 — тестирование производительности при нелинейном видеомонтаже. Измеряется время рендеринга в формат YouTube 4K проекта, содержащего HDV 2160p30 видеоряд с наложением различных эффектов.
- Blackmagic DaVince Resolve Studio 15 Beta 8 – тестирование производительности при монтаже видеоконтента с его постобработкой. Измеряется время рендеринга в формат IMF (Interoperable Master Format) Dolby Vision UHD небольшого проекта, построенного на базе снятого на 8K-камеру видеоряда.
- Blender 2.79b – тестирование скорости финального рендеринга в одном из популярных свободных пакетов для создания трёхмерной графики. Измеряется продолжительность построения финальной модели из Blender Cycles Benchmark rev4.
- Corona 1.3 – тестирование скорости рендеринга при помощи одноимённого рендерера. Измеряется скорость построения стандартной сцены BTR, используемой для измерения производительности.
- CryptoNightV7 – измеряется производительность расчёта хеш-функций при майнинге криптовалюты Monero с помощью программного обеспечения JCE Miner 0.32h.
- Microsoft Visual Studio 2017 (15.1) – измерение времени компиляции крупного MSVC-проекта – профессионального пакета для создания трёхмерной графики Blender версии 2.79b.
- Stockfish 9 – тестирование скорости работы популярного шахматного движка. Измеряется скорость перебора вариантов в позиции «1q6/1r2k1p1/4pp1p/1P1b1P2/3Q4/7P/4B1P1/2R3K1 w».
- V-Ray 3.57.01 – тестирование производительности работы популярной системы рендеринга при помощи стандартного приложения V-Ray Benchmark;
- VeraCrypt 1.22.9 – тестирование криптографической производительности. Используется встроенный в программу бенчмарк, задействующий тройное шифрование Kuznyechik-Serpent-Camellia.
- x264 r2851 — тестирование скорости транскодирования видео в формат H.264/AVC. Для оценки производительности используется исходный 2160p@24FPS AVC-видеофайл, имеющий битрейт около 42 Мбит/с.
- x265 2.4+14 8bpp — тестирование скорости транскодирования видео в перспективный формат H.265/HEVC. Для оценки производительности используется тот же видеофайл, что и в тесте скорости транскодирования кодером x264.
Игры:
- Ashes of Singularity. Разрешение 1920 × 1080: DirectX 11, Quality Profile = High, MSAA=2x. Разрешение 3840 × 2160: DirectX 11, Quality Profile = Extreme, MSAA=Off.
- Assassin’s Creed: Origins. Разрешение 1920 × 1080: Graphics Quality = Very High. Разрешение 3840 × 2160: Graphics Quality = Very High.
- Kingdom Come: Deliverance. Разрешение 1920 × 1080: Overall Image Quality = Ultra High. Разрешение 3840 × 2160: Overall Image Quality = Ultra High.
- The Witcher 3: Wild Hunt. Разрешение 1920 × 1080: Graphics Preset = Ultra, Postprocessing Preset = High. Разрешение 3840 × 2160: Graphics Preset = Ultra, Postprocessing Preset = High.
- Watch Dogs 2. Разрешение 1920 × 1080: Field of View = 70°, Pixel Density = 1.00, Graphics Quality = Ultra, Extra Details = 100%. Разрешение 3840 × 2160: Field of View = 70°, Pixel Density = 1.00, Graphics Quality = Ultra, Extra Details = 100%.
Во всех игровых тестах в качестве результатов приводится среднее количество кадров в секунду, а также 0,01-квантиль (первая перцентиль) для значений fps. Использование 0,01-квантиля вместо показателей минимального fps обусловлено стремлением очистить результаты от случайных всплесков производительности, которые были спровоцированы не связанными напрямую с работой основных компонентов платформы причинами.
⇡#Производительность в комплексных бенчмарках
Вполне очевидно, что многоядерные процессоры, подобные Ryzen Threadripper, приобретаются отнюдь не для того, чтобы ускорить работу в обычных общеупотребительных приложениях. Они для этой цели практически бесполезны, и большой массив вычислительных ядер в таком случае – явно избыточный ресурс. Именно это и показывают результаты Futuremark PCMark 10: для типичной повседневной нагрузки лучше выбирать, во-первых, процессоры из массового сегмента и, во-вторых, решения серии Intel Core.
Немного иная картина наблюдается лишь в сценарии Digital Content Creation, для которого в бенчмарке используются творческие приложения. Здесь достаточно неплохо выступает новый 16-ядерный Ryzen Threadripper 2950X, которому удаётся обогнать и своего прямого конкурента Core i7-7900X, и почти все остальные процессоры, за исключением интеловского 18-ядерника.
А вот старший 32-ядерный Ryzen Threadripper 2990WX показывает низкую производительность даже здесь. Его тянет на дно NUMA-архитектура и ядра, не имеющие прямого доступа в память. Из этого можно сделать вывод о том, что старший HEDT-процессор компании AMD – несколько своеобразное решение, оценивать которое нужно, принимая во внимание особенности его внутреннего строения и не рассчитывая, что 32-ядерный массив сможет справиться с какой бы то ни было вычислительной нагрузкой.
В Futuremark 3DMark, где моделируется гипотетическая игровая нагрузка, мы пользуемся сценой Time Spy Extreme, которая отличается значительной ресурсоёмкостью и качественной оптимизацией под многопоточные процессоры. Поэтому гораздо более успешное, чем в PCMark 10, выступление Ryzen Threadripper второго поколения кажется здесь вполне закономерным. Особенно хорошее впечатление производит Ryzen Threadripper 2950X: при цене в $900 он может похвастать процессорным показателем производительности, почти вдвое превосходящим результат шестиядерного Core i7-8700K, и на четверть – результат 10-ядерного Core i9-7900X.
При этом Ryzen Threadripper 2990WX, к сожалению, столь же безукоризненной работой похвастать не может. Несмотря на то, что AMD позиционирует его как соперника 18-ядерного Core i9-7980XE, до интеловского флагмана он всё-таки не дотягивает. И на первом месте в 3DMark тем не менее оказывается флагманский HEDT-процессор Intel с 11-процентным отрывом от старшего 32-ядерного Threadripper второго поколения.
⇡#Производительность в ресурсоёмких приложениях
Уже по результатам тестов в синтетических бенчмарках было понятно, что Threadripper 2990WX и Threadripper 2950X – два процессора с принципиально различными повадками. И 32-ядерный монстр совсем не вдвое лучше, чем 16-ядерный HEDT-процессор. Изучение производительности в ресурсоёмких приложениях позволяет понять характер практического различия между флагманскими предложениями AMD глубже и оценить, где лучше подойдёт Threadripper серии X, а где – серии WX.
Если говорить о Threadripper 2950X, то это – действительно универсальный высокопроизводительный вариант для решения практически любых ресурсоёмких задач. Благодаря переходу на дизайн Zen+, он получил преимущество в размере 5-8 процентов по сравнению с первым 16-ядерным Threadripper 1950X. И в результате убедительное превосходство Threadripper 2950X над 10-ядерным процессором Core i9-7900X, который компания Intel предлагает за такую же цену, можно наблюдать почти во всех ситуациях. Средневзвешенное преимущество составляет внушительные 25 процентов, но в отдельных случаях, например при 3D-рендеринге, оно может достигать и 40 процентов.
В то же время 32-ядерный Threadripper 2990WX на фоне своего 16-ядерного собрата выглядит по меньшей мере странно. Системы с архитектурой памяти NUMA хорошо работают в серверах, но для рабочих станций широкого назначения – это крайне неоптимальный вариант. Действительно, если при решении той или иной задачи приложение начинает обращаться к заметным объёмам данных, производительность Threadripper 2990WX резко падает. И, судя по представленным результатам, происходит такое в реальной жизни очень и очень часто. Существует даже целый класс приложений, связанных с обработкой медиаконтента, в которых 32-ядерный Threadripper 2990WX проигрывает 16-ядерному Threadripper 2950X. Фактически новый 32-ядерник AMD смотрится достойно лишь в двух случаях: либо при финальном 3D-рендеринге, либо в несложных и хорошо распараллеливаемых счётных задачах вроде анализа шахматных позиций или майнинга.
Иными словами, если на Threadripper 2950X без каких-либо сомнений могут положиться все энтузиасты высокой производительности, то Threadripper 2990WX – это узкоспециализированная «числодробилка», принципиально проигрывающая интеловскому Core i9-7980XE в том случае, если от компьютера требуется нечто большее, чем просто рендерить 3D-сцены. Совершенно неудивительно, что AMD вынесла это предложение в отдельную серию WX. Как и видеокарты Radeon WX, Threadripper WX – очень дорогое, но совершенно бесполезное для подавляющего большинства пользователей решение.
Рендеринг:
Обработка фото:
Работа с видео:
Перекодирование видео:
Компиляция:
Архивация:
Шифрование:
Шахматы:
Майнинг:
⇡#Производительность в играх. Тесты в разрешении FullHD
Говоря об игровой производительности, в первую очередь необходимо ещё раз напомнить, что процессоры класса Threadripper не относятся к разряду игрового железа. Поэтому представленные в этом разделе результаты тестов не стоит принимать слишком близко к сердцу. Тем более что с игровой производительностью у самых дорогих процессоров AMD всё далеко не идеально.
Если говорить о той частоте кадров, которую обеспечивает Threadripper 2950X, то она похожа на игровую производительность Ryzen 7 2700X и, следовательно, несколько хуже того уровня, который предлагают интеловские процессоры. Ничего неожиданного в этом нет, это – вполне привычная особенность микроархитектуры Zen. Впрочем, HEDT-процессоры Intel, переведённые c кольцевой шины на решётку межъядерных соединений, тоже не отличаются высоким быстродействием в играх, в результате чего разница в скорости между Threadripper 2950X и Core i9-7900X составляет всего лишь единицы процентов.
Но зато флагманский Threadripper 2990WX смог просто ошеломить своей производительностью, причём чувства, возникающие при знакомстве с его быстродействием, далеко не из приятных. Иначе как фиаско его выступление при игровой нагрузке не назовёшь, потому что 32-ядерный флагман катастрофически проигрывает и интеловским процессорам, и 16-ядерному собрату, и Ryzen 7 2700X. Реализованная в нём схема многоядерности с соединением в один процессор четырёх восьмиядерных кристаллов и NUMA-архитектурой памяти совершенно не соответствует требованиям игровых приложений. К тому же пропускной способности соединяющей кристаллы в Threadripper 2990WX шины Infinity Fabric, похоже, катастрофически не хватает для того, чтобы обеспечить своевременную доставку данных между ядрами, памятью и устройствами PCI Express. Всё это и выливается в воистину удручающие показатели fps, которые и можно наблюдать на диаграммах ниже.
⇡#Тесты в разрешении 4K
К счастью для процессоров AMD, современные графические карты пока не обладают достаточной мощностью для того, чтобы открыть миру невысокую игровую производительность микроархитектуры Zen в 4K. Благодаря этому даже Threadripper 2990WX при переходе в сверхвысокие разрешения демонстрирует вполне приемлемый результат. Но не стоит забывать, что в скором времени флагманские видеокарты совершат шаг вперёд, и сохранится ли такое же положение дел пару месяцев спустя, сегодня предугадать невозможно.
К результатам игровых тестов необходимо добавить, что Ryzen Threadripper или Core i9 – это в первую очередь профессиональные решения, нацеленные на создание и обработку контента. И использовать их для систем, предназначенных исключительно для игр, не имеет никакого смысла. Гораздо более дешёвый Core i7-8700K или даже Core i5-8600K за счёт более приспособленной для игровой нагрузки внутренней конструкции способны обеспечить в играх заметно лучшую кадровую частоту.
⇡#Игровой режим
Ситуация с низкой игровой производительностью систем на базе Ryzen Threadripper 2990WX беспокоит и саму AMD, поэтому компания придумала, каким образом от этого процессора можно добиться лучших показателей частоты кадров. Элегантностью это решение, правда, отнюдь не отличается и больше похоже на какой-то «костыль», однако возложенную задачу оно всё-таки решает, и с его помощью производительность в играх действительно можно заметно увеличить.
Представляет оно собой специальный «игровой режим», в котором на многоядерном процессоре Threadripper эмулируется обычный восьмиядерный Ryzen. Идея заключается в отключении всех вычислительных ядер, которые расположены за пределами одного из обладающих собственным контроллером памяти кристаллов Zeppelin. При этом 32-ядерный (или 16-ядерный – для него эта функция тоже работает) процессор превращается в 8-ядерный, но зато он перестаёт страдать от высоких задержек при работе с памятью, которые в обычном режиме обрушивают игровую производительность.
Включение игрового режима выполняется через утилиту AMD Ryzen Master, после его активации необходима перезагрузка.
Включение игрового режима: 1/2 – блокировка 16 ядер, 1/4 – блокировка 24 ядер
Заметьте, для 32-ядерного процессора в утилите доступен и дополнительный промежуточный режим, в котором Ryzen Threadripper 2990WX можно превратить в 16-ядерный процессор путём отключения изолированных от внешнего мира кристаллов Zeppelin. И хотя перевод подсистемы памяти в UMA-режим в этом случае всё равно остаётся невозможен, в каких-то специфических случаях для Threadripper 2990WX может быть актуально и включение такого состояния.
Для практической проверки того, как работают игровые режимы у Threadripper 2990WX, а заодно и у Threadripper 2950X, мы провели дополнительный тест игровой производительности во всех имеющихся вариантах «пониженной функциональности» – при выключении либо половины, либо трёх четвертей от числа имеющихся ядер.
Как видно из представленных результатов, деактивация ядер действительно помогает поднять частоту кадров в игровых приложениях до типичного для актуальных процессоров AMD Ryzen уровня. Что вполне закономерно, исходя из того, как реализованы игровые режимы.
Однако исчерпывающим решением проблемы с низким быстродействием Threadripper в играх в реальном мире это вряд ли станет. То, что для включения игрового режима требуется перезагрузка системы, сразу перечёркивает большинство жизненных сценариев, в которых пользователь может захотеть оперативно переключиться из рабочего приложения в игру в качестве кратковременной разрядки. Кроме того, построенные таким образом игровые режимы не дадут воспользоваться преимуществами многоядерности Threadripper и не позволят, например, запустить какую-то ресурсоёмкую задачу вроде рендеринга фоновым процессом, а на время её решения отвлечься на игровую активность.
Иными словами, сценариев, в которых такой изолированный игровой режим действительно может быть полезен, не так уж и много, и хорошим вариантом увеличения частоты кадров в играх мы его не считаем.
⇡#Энергопотребление
В последнее время наблюдается отчётливая тенденция: десктопные процессоры становятся всё прожорливее и прожорливее. Связано это, очевидно, с ростом в них числа вычислительных ядер, который происходит без существенных изменений в полупроводниковых процессах. В HEDT-сегменте никого уже не удивляют CPU, имеющие TDP в районе 160-180 Вт, а жидкостное охлаждение прочно вошло в обиход у энтузиастов. Но с новым 32-ядерным Ryzen Threadripper 2990WX компания AMD взяла новые рубежи: расчётное тепловыделение этого процессора достигло 250 Вт. Сколько же электроэнергии для такой четырёхкристальной сборки потребуется на практике?
Мы подготовили ответ на этот вопрос. Используемый нами в тестовой системе цифровой блок питания серии Thermaltake Toughpower DPS G позволяет контролировать потребляемую и выдаваемую электрическую мощность, чем мы и пользуемся для измерений. На графиках ниже приводится полное потребление систем (без монитора), измеренное «после» блока питания и представляющее собой сумму энергопотребления всех задействованных в системе компонентов. КПД самого блока питания в данном случае не учитывается.
Новый 16-ядерный процессор Ryzen Threadripper 2950X по своему потреблению мало отличается от предшественника. Рост тактовых частот действительно компенсировался переходом на более «тонкий» техпроцесс. И в результате Ryzen Threadripper 2950X оказывается даже экономичнее интеловского десятиядерника Core i9-7900X, который формально имеет на 15 Вт более низкое потребление.
В то же время с точки зрения энергопотребления 32-ядерный Ryzen Threadripper 2990WX действительно бьёт все ранее установленные рекорды. Работающая в простом номинальном режиме система с таким процессором при многопоточной вычислительной нагрузке может требовать до 350 Вт. И это заметно больше потребления любого другого варианта HEDT-платформы. Впрочем, несмотря на то, что Threadripper 2990WX состоит из четырёх кристаллов Zeppelin, его аппетиты превышают потребление Ryzen 7 2700X всего лишь вдвое. И это значит, что инженерам AMD удалось достаточно эффективно умерить аппетиты своего максимального предложения. Ситуация могла бы быть гораздо хуже.
⇡#Выводы
Изначально процессоры семейства Ryzen Threadripper были задуманы компанией AMD как решения для самых производительных настольных компьютеров. Однако год назад, на первом этапе, они имели характер пробной платформы, с помощью которой AMD совершала вылазку в неизведанный для себя сегмент – HEDT. Но по факту попытка эта вышла удачной, и процессоры Threadripper первого поколения оказались востребованы рынком и нашли немало сторонников.
Что, надо сказать, было вполне закономерно. Ведь AMD, в отличие от конкурента, не стала дозировать характеристики флагманских CPU, а предложила энтузиастам высокой производительности всё и сразу – 16 ядер, 4 канала памяти, 60 линий PCI Express – причём по привлекательной цене порядка $62 за ядро. В ответ Intel даже не сразу нашлась, что противопоставить такому неожиданному выпаду, и 18-ядерный флагман семейства Skylake-X смог выйти лишь через несколько месяцев после появления Threadripper.
Сегодня AMD пытается повторить прошлогодний манёвр и хочет снова поднять планку HEDT на недосягаемый для конкурента уровень. Второе поколение Ryzen Threadripper удваивает ставки и предлагает для настольных компьютеров не только обновлённые 16-ядерные процессоры, но и немыслимые доселе решения, оснащённые сразу 32 вычислительными ядрами.
Эпическая победа?
Хм, что-то непохоже. Из нового 32-ядерного Ryzen Threadripper 2990WX получился претенциозный и весьма своеобразный продукт. AMD, конечно, может гордиться тем, что уместила в десктопный процессор 32 ядра намного раньше конкурента, у которого на эту тему даже нет никаких чётких планов, но достигнутый при этом результат скорее наглядно показывает, что выбранный при конструировании метод с NUMA-архитектурой – это путь в никуда. Четырёхкристальная сборка, в которой половина ядер не имеет доступа к памяти и вынуждена обращаться к памяти и внешним устройствам через сложную систему внутренних линков, – совершенно неподходящий для использования в высокопроизводительных настольных компьютерах вариант.
Конечно, справедливости ради стоит отметить, что в определённых случаях Ryzen Threadripper 2990WX всё же может оказаться полезен. Например, этот процессор лучше любых других справляется с задачами рендеринга, поэтому его может быть целесообразно применять в графических рабочих станциях для 3D-моделирования. Но беда в том, что вариантов достойного применения для Ryzen Threadripper 2990WX значительно меньше, чем ситуаций, в которых он демонстрирует полную или частичную несостоятельность.
AMD наверняка и сама понимает, что Threadripper 2990WX – это нишевое решение с узкой сферой применимости, а потому этот процессор представлен в отдельной серии WX. В базовой же для Threadripper серии X, которая имеет более массовую направленность, тоже произошли важные изменения. И пусть перемены здесь не производят столь же неизгладимого впечатления, а новые процессоры серии X не делают никаких громких заявок на лидерство, в конечном итоге обновление получилось очень удачным.
Новый Ryzen Threadripper 2950X второго поколения, как и предшествующий Threadripper 1950X, по-прежнему предлагает 16 ядер, но за счёт перехода на свежие полупроводниковые кристаллы Zen+ Zeppelin имеет на 100-400 МГц более высокие тактовые частоты и усовершенствованные технологии динамического разгона PB2 и XFR2. Всего этого вкупе с пониженной до уровня $56 за ядро официальной ценой с лихвой хватает для того, чтобы в своём сегменте Threadripper 2950X смог предложить наилучшее сочетание характеристик, практически по всем параметрам превзойдя интеловский процессор сравнимой стоимости, Core i9-7900X.
Более того, по результатам тестирования именно Ryzen Threadripper 2950X показался нам одним из лучших процессоров в HEDT-сегменте, который хорошо подходит для разнообразных ресурсоёмких нагрузок. Именно его, а не спорный Threadripper 2990WX мы и будем рекомендовать энтузиастам высокой производительности для максимально нафаршированных сборок.
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.