Оригинал материала: https://3dnews.ru/1002791

Обзор процессоров AMD Ryzen Threadripper 3970X и Threadripper 3960X: тотальное доминирование

Технические характеристики и особенности

Благодаря внедрению микроархитектуры Zen 2 компания AMD в прошлом году смогла добиться существенного усиления своих позиций на процессорном рынке, о чём мы подробно говорили, когда подводили итоги года. Самыми впечатляющими новинками, вне всяких сомнений, стали 64-ядерные процессоры EPYC и Threadripper, у которых на сегодняшний день нет даже близких аналогов по вычислительной мощности. Однако и 64-ядерные серверные EPYC, и 64-ядерные Threadripper для рабочих станций далеки от массового пользователя как в силу высокой стоимости, так и из-за достаточно узкой сферы применения. Более того, официальные продажи 64-ядерного Threadripper 3990X пока даже не начинались – они, если всё пойдёт по плану, стартуют лишь неделей позже.

Но это вовсе не значит, что AMD покорила рынок высокопроизводительных процессоров исключительно бумажными анонсами. Под конец прошлого года компания выпустила Threadripper 3960X и 3970X – два HEDT-процессора третьего поколения, которые несложно купить и которые на данный момент могут с полным правом считаться самыми мощными предложениями на рынке для рабочих станций. Ещё бы, обладая 24 и 32 вычислительными ядрами, они существенно превосходят по характеристикам старший процессор Intel для того же рыночного сегмента, Core i9-10980XE, который наделён только 18 ядрами.

Такой внушительный успех AMD основан на двух инновациях: переводе производства на передовую 7-нм технологию и внедрении чиплетной конструкции процессоров, позволяющей компоновать решения на базе нескольких полупроводниковых чипов. Раньше мы уже видели, как, используя эти приёмы, AMD смогла втиснуть в массовую платформу 12- и 16-ядерные процессоры, а теперь с их помощью компания выводит на новый уровень свою платформу HEDT.

Технически 32-ядерный и 64-поточный Threadripper 3970X и 24-ядерный и 48-поточный Threadripper 3960X не предлагают увеличенное количество ядер и потоков по сравнению с процессорами второго поколения Threadripper 2970WX и 2990WX. Однако это не мешает им быть принципиально лучше не только за счёт более новой версии микроархитектуры, но и благодаря более естественной топологии. В новом дизайне Castle Peak контроллер памяти и контроллер PCI Express 4.0 вынесены в отдельный чиплет, благодаря чему все процессорные ядра имеют равноправный доступ ко всей памяти и ко всем устройствам расширения. И именно это делает Threadripper 3970X и 3960X высокопроизводительными процессорами с широкой сферой применимости, на голову превосходящими предыдущие предложения компании, которые могли раскрыть свой потенциал лишь в отдельных задачах.

Кстати говоря, запланированный к выходу в ближайшее время Threadripper 3990X получит такую же топологию, как и его собратья, а это значит, что планка HEDT поднимется так высоко, как никогда ранее. Но сегодня мы пока будем говорить лишь о «более простых» процессорах Threadripper 3970X и 3960X, к которым прилагается обновлённая платформа TRX40. Даже несмотря на то, что в ближайшее время звание самых производительных процессоров десктопного применения у Threadripper 3970X и 3960X будет отобрано, они всё равно представляют огромный интерес для тех пользователей, которые профессионально работают над созданием цифрового контента. И именно этому аспекту будет уделено особое внимание в данном материале. Мы протестируем Threadripper 3970X и 3960X в приложениях, часто используемых на рабочих станциях, и посмотрим, насколько хорошо они смотрятся на фоне старших процессоров для массовых платформ, а также на фоне последней новинки Intel – 18-ядерного HEDT-процессора Core i9-10980XE.

#Топология Ryzen Threadripper третьего поколения

Концептуально своим появлением процессоры Threadripper третьего поколения обязаны переносу в сегмент HEDT всех новых технологий AMD, которые компания планомерно внедряла в серверном и массовом сегменте в прошлом году. Ключевым моментом здесь выступает перевод производства основных составных частей для этих CPU на передовой технологический процесс TSMC с нормами 7 нм с одновременным внедрением микроархитектуры Zen 2. Именно за счёт этого новые Threadripper смогли как нарастить производительность, так и улучшить энергоэффективность, что в конечном итоге проявилось и в более высоких рабочих частотах, и в увеличении числа вычислительных ядер, и в росте объёма кеш-памяти.

Подобно Ryzen 3000, процессоры Threadripper третьего поколения основываются на стандартных восьмиядерных чиплетах CCD (Zen 2), вычислительные ядра в которых по сравнению с ядрами Zen и Zen+ предлагают на 15-18 % лучшую удельную производительность. Однако, в отличие от процессоров серии Ryzen, где максимальное количество вычислительных чиплетов ограничивалось двумя, в процессорах Threadripper 3970X и 3960X их устанавливается по четыре штуки, а во флагманском Threadripper 3990X – даже восемь. Именно за счёт этого Threadripper в два или даже в четыре раза превосходят флагманские процессоры Ryzen по количеству предлагаемых ядер и исполняемых потоков.

Второе важное преимущество HEDT-процессоров по сравнению с массовыми собратьями заключается в использовании четырёхканальной, а не двухканальной памяти и в поддержке большего числа линий PCI Express. И здесь нас ждёт ещё одно принципиальное усовершенствование. В отличие от Threadripper прошлого поколения, которые собирались из полнофункциональных процессорных кристаллов Zeppelin, в 7-нм вычислительных чиплетах CCD теперь нет собственных контроллеров памяти и шины PCI Express. Все эти функции вынесены в отдельный 12-нм центральный чиплет ввода-вывода (IOD), к которому CCD-чиплеты подключены специализированной шиной Infinity Fabric. А это означает, что AMD в Threadripper третьего поколения совершила переход от распределённой к централизованной реализации контроллера памяти и контроллера PCI Express.

Аналогичный подход имеет место и в Ryzen 3000, но в новых Threadripper применяется иной кристалл IOD, который обладает значительно более богатыми функциональными возможностями. Технически чиплет ввода-вывода в Threadripper аналогичен кристаллу IOD серверного предназначения из процессоров EPYC поколения Rome. Однако в HEDT-варианте этот чиплет урезан по возможностям: в составе Threadripper в нём активно два двухканальных контроллера DDR4 SDRAM и два контроллера PCI Express 4.0 на 32 линии каждый.

IOD-чиплет EPYC и Threadripper. Фото - Fritzchens Fritz

IOD-чиплет EPYC и Threadripper. Фото — Fritzchens Fritz

Таким образом, Threadripper 3970X и 3960X собираются из пяти полупроводниковых кристаллов: четырёх стандартных CCD-чиплетов Zen 2 и серверного чиплета IOD. В состав каждого восьмиядерного 7-нм чиплета CCD входит порядка 3,9 млрд транзисторов, в то время как центральный 12-нм чиплет IOD насчитывает 8,34 млрд транзисторов. Таким образом, общий транзисторный бюджет Threadripper 3970X и 3960X составляет почти 24 млрд транзисторов, которые в общей сложности занимают суммарную площадь порядка 712 мм2.

CCD-чиплет Zen2. Фото - Fritzchens Fritz

CCD-чиплет Zen2. Фото — Fritzchens Fritz

Применённая в Threadripper третьего поколения схема объединения составных частей в одно целое существенно отличается от того, как кристаллы Zeppelin формировали HEDT-процессоры компании AMD в прошлом. Дело в том, что вычислительные чиплеты теперь не имеют прямых соединяющих их линков, и всё взаимодействие происходит через центральный IOD-чиплет, к которому CCD-чиплеты подключены по шине Infinity Fabric. Впрочем, связи между вычислительными чиплетами больше не имеют такого значения, как раньше, поскольку контроллеры памяти и PCI Express переехали из процессорных кристаллов в центральный чиплет IOD, и обращения к памяти теперь не порождают трафик между ядрами.

Иными словами, каждое из процессорных ядер в новых Threadripper имеет совершенно равноправный доступ ко всей памяти и любым внешним устройствам, что в конечном итоге делает задержки не просто предсказуемыми, а ещё и более низкими. В то время как процессоры Threadripper прошлого поколения фактически строились из нескольких NUMA-узлов, что вызывало заметные проблемы при их практическом использовании в творческом программном обеспечении, Threadripper третьего поколения стали похожи на обычные десктопные CPU, где время доступа к какой-то области памяти не зависит от её местонахождения по отношению к конкретному процессорному ядру.

Преимущества нового централизованного подхода особенно очевидны, если вспомнить, как были устроены 24- и 32-ядерные HDET-процессоры AMD до этого. Дело в том, что половина процессорных ядер в Threadripper 2970WX и 2990WX вообще не имела доступа к памяти. Два процессорных кристалла из четырёх, входившие в эти процессоры, были лишены собственных контроллеров памяти, и все их обращения к данным маршрутизировались через соседние кристаллы Zeppelin, вызывая как минимум полуторакратный рост задержек. В новых Threadripper 3970X и 3960X такое неравноправие искоренено, и это должно стать ещё одной причиной превосходства новых HEDT-процессоров AMD над предшественниками.

Чтобы проиллюстрировать логическую монолитность новых Threadripper, мы провели традиционное измерение латентностей при пересылке данных между различными ядрами процессора. (Измерения выполнены для 32-ядерного Threadripper 3970X на частоте 4,0 ГГц с шиной Infinity Fabric, работающей на частоте 1800 МГц).

Результаты этого эксперимента показывают, что скорость межъядерного взаимодействия в Threadripper третьего поколения примерно одинакова как для ядер, находящихся в одном кристалле, так и для ядер из различных CCD-чиплетов. Более низкую латентность при межъядерном взаимодействии можно увидеть лишь для ядер внутри каждого четырёхъядерного CCX-комплекса, поскольку в таком случае обмен данными происходит через разделяемый L3-кеш, а не путём обращения к шине Infinity Fabric. Все же остальные ядра друг для друга находятся на примерно одинаковом «расстоянии», хотя при более пристальном взгляде можно заметить, что соседние CCD общаются между собой с немного меньшими задержками. Тем не менее никакой кратной разницы в латентности и задержек до нескольких сотен наносекунд, как в прошлых Threadripper, больше нет, и это – огромное преимущество новой топологии, реализованной AMD в архитектуре Zen 2.

#Threadripper 3970X и 3960X в подробностях

Хотя новые процессоры Threadripper 3970X и 3960X не увеличивают количество вычислительных ядер по сравнению с тем, что предлагали старшие модели Threadripper второго поколения, стоят они больше. В частности, 32-ядерный процессор Threadripper 3970X оценён в $1 999, в то время как Threadripper 2990WX на старте стоил $1 799, а Threadripper 3960X получил официальную цену $1 399, что на $100 больше первоначальной цены Threadripper 2970WX. В результате вышло так, что стоимость одного ядра Zen 2 у современных HEDT-процессоров AMD установилась в районе $60, и это заметно превосходит удельную стоимость ядра старших представителей серии Ryzen 3000: там она находится на уровне $40.

Рассуждая о высокой стоимости HEDT-платформы AMD, нельзя забывать и о том, что Threadripper 3970X и 3960X требуют новых материнских плат на базе набора системной логики TRX40. Стоимость таких плат начинается с отметки в $400. Очевидно, что AMD вместе с партнёрами сочла возможным попросить потенциальных покупателей раскошелиться на более заметную сумму, поскольку новые Threadripper получились не только очень мощными, но и универсальными, то есть подходящими для любой модели использования, где требуется высочайший уровень быстродействия.

Именно подчёркивая универсальность, маркетинговый отдел AMD лишил новые модификации Threadripper окончания «WX» в модельных номерах. Теперь весь ряд HEDT-процессоров компании помечен одной литерой «X», которая у AMD указывает лишь на приоритет производительности над энергоэффективностью в характеристиках и не говорит о каком-то специальном предназначении CPU. В списке тех, кого компания видит в числе потенциальных пользователей Threadripper 3970X и 3960X, перечисляются 3D-моделлеры, разработчики ПО, видеомонтажёры и прочие профессионалы в различных отраслях, готовые тратить на высокопроизводительное оборудование значительные средства.

Помимо Threadripper 3970X и 3960X, платформа TRX40, в которой используется процессорный разъём Socket sTRX4, сможет принять также и 64-ядерную модель Threadripper 3990X – она появится на рынке в ближайшее время. Таким образом, полный модельный ряд свежих HEDT-процессоров AMD выглядит следующим образом:

Ядра/ потокиЧастота, ГГцL3-кеш, МбайтПамятьЛинии PCIeTDP, ВтЦена
Threadripper 3990X 64/128 2,9-4,3 256 4 × DDR4-3200 64 280 $3999
Threadripper 3970X 32/64 3,7-4,5 128 4 × DDR4-3200 64 280 $1999
Threadripper 3960X 24/48 3,8-4,5 128 4 × DDR4-3200 64 280 $1399

Пока мы оставим Threadripper 3990X в стороне, потому что на подробные сведения о нём распространяется информационное эмбарго. Старшей же из рассматриваемых сегодня моделей Threadripper будет 3970X: это 32 ядерный процессор с поддержкой технологии SMT, общим объёмом кеша 144 Мбайт (из них 128 Мбайт – кеш третьего уровня), базовой частотой 3,7 ГГц и возможностью автоматического разгона до 4,5 ГГц в турборежиме. Младший процессор, Threadripper 3960X, имеет сокращённое до 24 количество ядер, но в остальном он не уступает 32-ядерному собрату. Более того, его базовая частота увеличена до 3,8 ГГц.

 

Если сравнить Threadripper 3970X и 3960X с предшествующими им процессорами с аналогичным количеством ядер, то становится понятно, что на этот раз речь идёт о предложении совершенно иного класса. В новых Threadripper используется микроархитектура Zen 2, превосходящая Zen+ по показателю IPC (числу исполняемых за такт инструкций) примерно на 15 %. И это – не единственное их преимущество. Расширение рамок TDP на 30 Вт вместе с переходом на 7-нм техпроцесс позволило примерно на 20 % подтянуть тактовые частоты. Кроме того, дополнительный прирост производительности обеспечивает также удвоение объёма L3-кеша и переход на централизованный контроллер памяти. В сумме эти факторы делают Threadripper 3970X и 3960X процессорами, у которых никогда не было и нет даже близких аналогов.

И кстати, это ещё далеко не всё. Threadripper третьего поколения поддерживают по 64 линии PCI Express, из которых в распоряжение пользователя предоставляется 56 линий, а оставшиеся 8 линий предназначены для сопряжения CPU с чипсетом. Причём речь тут идёт о линиях PCI Express 4.0, обладающих вдвое более высокой пропускной способностью по сравнению с привычными PCI Express 3.0. Благодаря этому современные TRX40-системы предоставляют дополнительные конкурентные преимущества, когда рабочей станции необходимы разветвлённые конфигурации из нескольких GPU или высокопроизводительные системы хранения данных.

Все представители новой серии Threadripper имеют по четыре канала памяти с официальной поддержкой DDR4-3200 (при использовании четырёх DIMM). При этом в Threadripper применяются точно такие же контроллеры памяти, что и в Ryzen 3000, а это значит, что память в HEDT-системах AMD нового поколения способна покорять высокие частоты. В частности, режим DDR4-3600, который считается оптимальным в Ryzen 3000 из-за синхронной работы контроллера памяти и шины Infinity Fabric, для Threadripper 3970X и 3960X тоже вполне доступен.

Производительность четырёхканальной подсистемы памяти новых Threadripper с точки зрения пропускной способности оказывается примерно вдвое лучше по сравнению c тем, что могут предложить Ryzen 3000, и лишь немного уступает по латентности. (Измерения выполнены для процессоров на частоте 4,0 ГГц с памятью в режиме DDR4-3600 16-16-16-36.)

Ryzen 9 3950X – 2 × DDR4-3600

Ryzen 9 3950X – 2 × DDR4-3600

 
Threadripper 3970X – 4 × DDR4-3600

Threadripper 3970X – 4 × DDR4-3600

Контроллер DDR4 SDRAM новых Threadripper поддерживает модули DDR4 ёмкостью до 32 Гбайт, следовательно, максимальный объём памяти достигает 256 Гбайт. Формально в Threadripper есть и поддержка модулей памяти с ECC, но для полноценной работы коррекции ошибок потребуется также поддержка со стороны конкретной материнской платы, а здесь ситуация отдана на откуп производителям.

То, что Threadripper 3970X и 3960X похожи по характеристикам, совсем неудивительно. Эти процессоры сконструированы совершенно одинаково – в каждом из них используется по четыре CCD-чиплета и один и тот же чиплет IOD. Разница же в числе ядер возникает из-за того, что в младшей версии процессора в каждом четырёхъядерном CCX-комплексе отключено по одному ядру, поэтому Threadripper 3960X предлагает только 24 ядра из 32 возможных. Но, как и в случае с Ryzen 3900X, недостающие ядра физически присутствуют в кристаллах CCD, правда, лишь в «мёртвом» виде: как показывает весь прошлый опыт, вернуть их к жизни возможным не представляется.

Нельзя не заметить, что в результате появления третьего поколения Threadripper компания AMD отняла у Intel звание производителя самых дорогих CPU не только для настольных систем, но и для сегмента HEDT. Старший LGA2066-процессор Intel сейчас стоит $979, но это всего лишь 18-ядерный Core i9-10980XE, и совершенно закономерно, что значительно превосходящие его по числу ядер Threadripper 3970X и 3960X намного дороже.

Правда, среди предложений Intel формально присутствуют 28-ядерные Xeon W для экосистемы LGA3647, которые тоже можно было бы рассматривать в качестве процессоров для рабочих станций. Но мы этого делать не станем, потому что на данный момент они распространены крайне слабо как ввиду запредельной стоимости самих CPU такого типа и материнских плат для них, так и по причине их малой доступности на рынке.

Иными словами, сопоставлять Threadripper 3970X и 3960X нам приходится именно с Core i9-10980XE, и процессор Intel тут проигрывает по многим ключевым параметрам, включая и количество ядер, и размер L3-кеша, и поддержку PCI Express и памяти.

Core i9-10980XEThreadripper 3960XThreadripper 3970X
Ядра/потоки 18/36 24/48 32/64
Базовая частота, ГГц 3,0 3,8 3,7
Макс. частота турбо, ГГц 4,8 4,5 4,5
L2-кеш, Мбайт 18 12 16
L3-кеш, Мбайт 24,75 128 128
Память 4 × DDR4-2933 4 × DDR4-3200 4 × DDR4-3200
Линии PCIe 48 56 56
TDP, Вт 165 280 280
Цена $979 $1399 $1999

#Частота и турборежим в Ryzen Threadripper третьего поколения

Ещё одной важной особенностью процессоров Threadripper 3970X и 3960X стало то, что AMD для них прямо на уровне спецификации декларирует разное качество кристаллов вычислительных чиплетов. Ранее на примере старших Ryzen 3000 мы видели, что турборежим у носителей микроархитектуры Zen 2 работает особым образом. Каждое ядро имеет свой индивидуальный потолок частоты, который определяется качеством кремния, и предполагается, что планировщик операционной системы должен в первую очередь загружать работой более удачные ядра, которые способны функционировать на более высокой частоте. Эта схема кардинально отличается от применявшегося раньше подхода, когда максимальная частота в турборежиме определялась лишь числом загруженных работой ядер, но не их конкретным выбором.

В отношении Threadripper 3970X и 3960X производитель говорит, что самым качественным чиплетом в них должен быть четвёртый – CCD4, и именно он имеет в своём арсенале два отборных ядра, способных выходить на максимальную для процессоров частоту 4,5 ГГц. Предполагается, что, благодаря специальным алгоритмам, заставляющим согласованно работать BIOS, драйверы и планировщик задач Windows, малопоточные нагрузки отправляются именно на эти ядра. И именно благодаря им процессоры Threadripper третьего поколения имеют столь высокие максимальные тактовые частоты.

Стоит отметить, что наличие именно двух скоростных ядер является в этой схеме важным моментом, поскольку планировщик задач Windows в обязательном порядке ротирует нагрузку, чтобы избежать локального перегрева кристалла. С учётом того, что в микроархитектуре Zen 2 кеш третьего уровня разбит на независимые части по 16 Мбайт для каждого четырёхъядерного CCX-комплекса, предпочтительно, чтобы при перебросе нагрузки использовались ядра в рамках одного CCD и одного CCX. AMD обещает, что в процессорах Threadripper это условие в обязательном порядке будет выполняться.

Между тем практическая проверка имеющегося в нашей лаборатории экземпляра Threadripper 3970X показала, что всё обстоит не совсем так, как говорит AMD. Наиболее удачным CCD-чиплетом в нашем случае оказался CCD3, но даже в нём лучшие ядра на частоте 4,5 ГГц работать не смогли. Следующая таблица иллюстрирует возможности разных ядер протестированного Threadripper 3970X: для каждого из них приведена максимальная зафиксированная частота при однопоточной нагрузке в Cinebench R20, необходимое для достижения такой частоты напряжение питания и наблюдающееся энергопотребление этого ядра.

Как можно заметить, процессор Threadripper 3970X собирается из сравнительно энергоэффективных кристаллов CCD. Ядер с потреблением 12-13 Вт, которые мы видели, например, в составе Ryzen 3950X, тут уже нет. Все выбранные для HEDT-процессора компоненты являются отборными по параметру энергопотребления, что и позволяет этим многоядерным HEDT-процессорам укладываться в рамки 280 Вт. При этом и качество разных CCD в Threadripper различается не слишком заметно: разброс в их рабочих параметрах не выходит за пределы 5-7 %, а разница в максимальной частоте самого лучшего и самого худшего ядра процессора составляет всего 150 МГц.

Но в целом новым Threadripper будут присущи те же проблемы с частотой, что и процессорам Ryzen 3000, – на заявленные в спецификации турбочастоты они выходят крайне неохотно даже в случае малопоточных нагрузок. Например, экспериментируя с Threadripper 3970X, увидеть обещанную частоту 4,5 ГГц в однопоточном режиме нам так и не удалось. В целом же кривая зависимости частоты от нагрузки для нашего экземпляра 32-ядерного процессора получилась следующей.

На графике приведена частота, наблюдавшаяся в Cinebench R20 при выполнении рендеринга с разным числом активных потоков. В однопоточном режиме реальная частота Threadripper 3970X вместо 4,5 ГГц лишь приближается к отметке 4,45 ГГц. Но зато при максимальной нагрузке процессор работает на частоте около 3,75 ГГц, что примерно на 50 МГц выше установленного в спецификации базового значения. Впрочем, не стоит забывать, что частотная формула процессоров AMD регулируется технологией Precision Boost 2 «по месту», поэтому нельзя исключать, что для других экземпляров Threadripper 3970X интервал рабочих частот может быть немного смещён как в одну, так и в другую сторону.

#Новый набор системной логики TRX40

Процессоры Threadripper третьего поколения получили в нагрузку новый набор системной логики TRX40, который пришёл на смену прошлому чипсету X399. Хотя в целом AMD придерживается политики преемственности платформ, в данном случае ей пришлось сделать исключение. Новые Threadripper 3970X и 3960X c платами для прошлых HEDT-процессоров компании несовместимы. Одна причина этого состоит в росте энергетических аппетитов новых процессоров. Вторая – в полном переводе платформы на поддержку PCI Express 4.0, что потребовало нарастить пропускную способность соединения между процессором и чипсетом в четыре раза (c 3,94 до 15,75 Гбайт/с) с тем, чтобы устройства, за работу которых отвечает чипсет, получали достаточную полосу пропускания.

При этом новые AMD Ryzen Threadripper 3970X и Threadripper 3960X сохранили и старый форм-фактор, и LGA-исполнение c 4096 контактами. То есть физически матрица контактов осталась той же, но некоторые выводы получили новые роли. В результате, новые Ryzen Threadripper не могут работать в X399-платах, а платы на базе TRX40 не могут функционировать с процессорами Ryzen Threadripper первых двух поколений. При этом AMD по какой-то неведомой причине не стала менять размеры и конфигурацию самого гнезда Socket SP3 (sTR4) и даже сохранила нетронутым расположение «ключей» на рамке сокета. Вышло так, что механически процессоры разных поколений взаимозаменяемы, а несовместимость существует лишь на логическом и электрическом уровне. К счастью, установка Ryzen Threadripper в материнскую плату неправильного поколения не должна приводить ни к каким печальным последствиям. Система просто не будет стартовать, но ни процессор, ни плата из строя не выйдут.

Поскольку в новом наборе системной логики TRX40 оказалось сконцентрировано большое число скоростных интерфейсов, производство этих микросхем было возложено на GlobalFoundries, где для этой цели применяется сравнительно современная 14-нм технология. В результате в чипсет получилось заложить поддержку 16 линий PCI Express 4.0, которые можно использовать для подключения дополнительных устройств. Эти линии при необходимости могут быть переведены в режим SATA для поддержки старых накопителей, но в общей сложности системы на базе новых Ryzen Threadripper могут предложить пользователю 72 линии PCI Express 4.0 – 56 процессорных и 16 чипсетных.

Другим важным улучшением TRX40 по сравнению с X399 стало увеличение количества 10-Гбит/с портов USB 3.2 Gen 2. На уровне чипсета теперь предлагается восемь таких портов, в то время как ранее в X399 их было лишь два. Помимо этого, в TRX40 реализовано четыре порта USB 2.0, которые могут подойти для устройств, не требовательных к пропускной способности. Любопытно, что вместе с этим AMD вообще отказалась от добавления в свой новый набор системной логики 5-Гбит/с портов USB 3.2 Gen 1. Реализация таких портов на новых материнских платах для Ryzen Threadripper третьего поколения возможна только путём применения дополнительных контроллеров.

TRX40X399
Процессоры Ryzen Threadripper третьего поколения Ryzen Threadripper первого и второго поколения
Линк с процессором PCIe x8 PCIe x4
Версия PCI Express 4.0 3.0
Число внешних линий PCI Express 16 8
Порты USB 3.2 Gen2 8 2
Порты USB 3.2 Gen1 0 4
Порты USB 2.0 4 6
SATA 4 8
TDP 15 Вт 5 Вт

После выхода процессоров Ryzen третьего поколения мы уже готовы к тому, что наборы системной логики AMD, в которых появляется поддержка шины PCI Express 4.0, получают непривычно высокое тепловыделение. TRX40 не стал исключением, и для него заявляется тепловой пакет 15 Вт, что даже выше расчётного тепловыделения Socket AM4-набора системной логики X570. Это означает, что в новых платах для процессоров Ryzen Threadripper должно применяться активное охлаждение чипсета, без которого удавалось обходиться ранее.

Производители материнских плат с энтузиазмом встретили обновление HEDT-платформы Socket sTRX4. На данный момент существует уже 12 моделей материнских плат для Threadripper 3970X и 3960X, и очевидно, что с появлением в продаже Threadripper 3990X их количество увеличится.

Расстраивает лишь одно — высокая стоимость таких материнок: средняя плата для Threadripper третьего поколения обойдётся примерно в $500.

Результаты тестов. Выводы

#Описание тестовых систем и методики тестирования

При знакомстве с 24- и 32-ядерными процессорами семейства Threadripper мы решили несколько изменить подход к тестированию. Совершенно очевидно, что системы на базе таких мощных и дорогих CPU будут использоваться исключительно для профессиональной обработки или создания цифрового контента, поэтому мы решили опираться на тестовые пакеты, которые считаются отраслевым стандартом при оценке производительности рабочих станций. Иными словами, сегодняшнее тестирование будет иметь явный уклон в сторону профессионального использования сравниваемых платформ, хотя для получения разносторонней картины мы всё-таки померили и скорость работы новых многоядерных CPU в нескольких популярных играх.

Для сравнения с Threadripper 3970X и 3960X при этом были выбраны системы, основанные на флагманских моделях процессоров в актуальных модельных рядах. В результате HEDT-новинкам AMD противостояли 8-ядерный Intel Core i9-9900KS для платформы LGA1151v2 и 18-ядерный Intel Core i9-10980XE для платформы LGA2066, а также 16-ядерный AMD Ryzen 9 3950X для платформы Socket AM4 и 24- и 32-ядерные Threadripper 2970WX и 2990WX прошлого поколения для платформы Socket TR4.

В конечном итоге список задействованных в тестировании комплектующих получился таким:

  • Процессоры:
    • AMD Ryzen Threadripper 3970X (Castle Peak, 32 ядра + SMT, 3,7-4,5 ГГц, 128 Мбайт L3);
    • AMD Ryzen Threadripper 3960X (Castle Peak, 24 ядра + SMT, 3,8-4,5 ГГц, 128 Мбайт L3);
    • AMD Ryzen 9 3950X (Matisse, 16 ядер + SMT, 3,5-4,6 ГГц, 64 Мбайт L3);
    • AMD Ryzen Threadripper 2990WX (Colfax, 32 ядра + SMT, 3,0-4,2 ГГц, 64 Мбайт L3);
    • AMD Ryzen Threadripper 2970WX (Colfax, 24 ядра + SMT, 3,5-4,4 ГГц, 64 Мбайт L3);
    • Intel Core i9-10980XE (Cascade Lake-X, 18 ядер + HT, 3,0-4,8 ГГц, 24,75 Мбайт L3);
    • Intel Core i9-9900KS (Coffee Lake Refresh, 8 ядер + HT, 4,0-5,0 ГГц, 16 Мбайт L3).
  • Процессорный кулер: СЖО NZXT Kraken X62.
  • Материнские платы:
    • ASRock X570 Taichi (Socket AM4, AMD X570);
    • ASRock Z390 Taichi (LGA1151v2, Intel Z390);
    • ASUS ROG Strix X299-E Gaming II (LGA2066, Intel X299);
    • ASUS ROG Strix TRX40-E Gaming (Socket sTR4, AMD TRX40);
    • MSI MEG X399 Creation (Socket TR4, AMD X399).
  • Память: 4 × 8 Гбайт DDR4-3600 SDRAM, 16-16-16-36 (G.Skill Trident Z RGB F4-360016Q-32GTZR).
  • Видеокарта: NVIDIA GeForce RTX 2080 Ti (TU102, 1350/14000 МГц, 11 Гбайт GDDR6 352-бит).
  • Дисковая подсистема: Samsung 970 EVO Plus 2TB (MZ-V7S2T0BW).
  • Блок питания: Thermaltake Toughpower DPS G RGB 1000W Titanium (80 Plus Titanium, 1000 Вт).

Все сравниваемые процессоры тестировались с настройками, принятыми производителями плат по умолчанию. Это значит, что для платформ Intel обозначенные в спецификациях ограничения по энергопотреблению игнорируются и используются предельно возможные частоты в целях получения максимальной производительности. Стоит подчеркнуть, что в таком режиме эксплуатирует процессоры подавляющее большинство пользователей, поскольку включение лимитов по тепловыделению и энергопотреблению требует специальной настройки параметров BIOS.

Все сравниваемые процессоры были протестированы с памятью, работающей в режиме DDR4-3600 с настройками таймингов по XMP. Исключение составили Ryzen Threadripper второго поколения, которые с используемым нами комплектом в таком режиме не работают из-за ограничений контроллера памяти. Для этих процессоров использовался более медленный режим — DDR4-3200 с таймингами 14-14-14-32.

Также нужно осознавать, что процессоры, принимающие участие в тестировании, имеют существенно разную стоимость. Для справки в следующей таблице мы приводим либо рекомендованную производителем, либо реальную (если она значительно отличается от официальной) стоимость CPU.

ПроцессорЧисло ядер/потоковСтоимость
AMD Ryzen Threadripper 3970X 32/64 $1 999
AMD Ryzen Threadripper 3960X 24/48 $1 399
AMD Ryzen 9 3950X 16/32 $749
AMD Ryzen Threadripper 2990WX 32/64 $1 599 (розница)
AMD Ryzen Threadripper 2970WX 24/48 $1 249 (розница)
Intel Core i9-10980XE 18/36 $979
Intel Core i9-9900KS 8/16 $513

Тестирование выполнялось в операционной системе Microsoft Windows 10 Pro (v1909) Build 18363.476 с использованием следующего комплекта драйверов:

  • AMD Chipset Driver 2.01.15.2138;
  • Intel Chipset Driver 10.1.1.45;
  • Intel Management Engine Interface Driver 11.7.0.1017;
  • NVIDIA GeForce 441.87 Driver.

Список использовавшихся для измерения вычислительной производительности инструментов:

  • Adobe Photoshop Lightroom Standard с тестовым пакетом PugetBench 0.8;
  • Adobe Premiere Pro 2020 с тестовым пакетом PugetBench 0.8;
  • Blackmagic Design Davinci Resolve Studio 16.1.2 с тестовым пакетом Puget Systems Benchmark 0.61;
  • Blender 2.81a со стандартным набором тестовых сцен Blender Benchmark 2.0.4;
  • Corona 1.3 Benchmark для тестирования производительности рендера Corona;
  • Dassault Systemes Solidworks 2019 SP4.0 с тестовым пакетом SPECapc 1.3.2;
  • Microsoft Visual Studio 2019 для тестирования скорости компиляции исходного кода интернет-браузера Chromium 81.0.4038.2;
  • OBS Studio 24.0.3 для тестирования производительности и гладкости потоковой трансляции игрового контента. В тестировании использовались следующие настройки видеопотока: кодер x264, разрешение 1080p@60fps, битрейт 6 Мбит/с, CPU Usage Preset = slowest.
  • Pov-Ray 2.7.1 со стандартной тестовой сценой benchmark.pov;
  • SPECworkstation 3.02 – тестовый пакет, ориентированный на определение производительности рабочих станций в профессиональных приложениях научной, медицинской, энергетической и инженерной направленности;
  • V-Ray Benchmark Next 4.10.07 для тестирования производительности рендера V-Ray;

Также в тестах были задействованы игры:

  • Assassin’s Creed Odyssey. Разрешение 1920 × 1080: Graphics Quality = Ultra High. Разрешение 3840 × 2160: Graphics Quality = Ultra High.
  • Far Cry 5. Разрешение 1920 × 1080: Graphics Quality = Ultra, HD Textures = On, Anti-Aliasing = TAA, Motion Blur = On. Разрешение 3840 × 2160: Graphics Quality = Ultra, Anti-Aliasing = Off, Motion Blur = On.
  • Shadow of the Tomb Raider. Разрешение 1920 × 1080: DirectX12, Preset = Highest, Anti-Aliasing = TAA. Разрешение 3840 × 2160: DirectX12, Preset = Highest, Anti-Aliasing = Off.

В игровых тестах в качестве результатов приводится среднее количество кадров в секунду, а также 0,01-квантиль (первая перцентиль) для значений FPS. Использование 0,01-квантиля вместо показателей минимального FPS обусловлено стремлением очистить результаты от случайных всплесков производительности, которые были спровоцированы не связанными напрямую с работой основных компонентов платформы причинами.

#Производительность при рендеринге

AMD любит хвастаться производительностью своих свежих предложений при финальном рендеринге. И понятно почему: архитектура её процессоров отлично подходит для хорошо распараллеливаемых вычислительных нагрузок. Поэтому нет причин удивляться подавляющему превосходству Threadripper 3970X и 3960X над остальными участниками теста. Даже младшая, 24-ядерная модель Threadripper третьего поколения превосходит старший HEDT-процессор конкурента, Core i9-10980X, в среднем на 45 %. Отрыв же флагманского 32-ядерника ещё убедительнее – он достигает 80 %.

#Производительность при обработке видео

Процессоры Threadripper 3970X и 3960X также будут лучшим вариантом для работы в программах нелинейного видеомонтажа. Однако нужно иметь в виду, что тут их преимущество будет проявляться в первую очередь при рендениринге и экспорте видео. При работе же со средой редактирования, по крайней мере если говорить о Adobe Premiere Pro, Threadripper превосходят прочие альтернативы не столь заметно.

Неплохо смотрятся новые многоядерные Threadripper и в Davinci Resolve Studio, даже несмотря на то, что эта программная система для постпродакшна во многом опирается на вычислительные возможности GPU, особенно если речь идёт про шумоподавление или OpenFX. Более того, Threadripper 3970X и 3960X оказываются в числе лидеров даже в пакете Fusion, который не требует от процессора огромного количества вычислительных ядер и куда более чуток к однопоточной производительности и пропускной способности подсистемы памяти.

#Производительность при обработке фото

Высокая производительность Threadripper третьего поколения хорошо видна в Photoshop Lightroom. Но нужно иметь в виду, что разветвлённая многоядерность, которую предлагают эти процессоры, гораздо сильнее помогает в пассивных сценариях, то есть при импорте, экспорте, генерации превью, создании панорам и HDR-изображений. В активных задачах, решаемых, как правило, в модуле Develop, ядра играют не столь существенную роль, но Threadripper 3970X и 3960X всё равно как минимум не уступают процессорам конкурента.

#Производительность при инженерном проектировании

Производительность в популярной системе автоматизированного проектирования Solidworks 2019 достаточно сильно зависит от мощности процессора, несмотря на то, что для визуализации моделей она задействует GPU. Тем не менее влияние CPU проявляется в ней не только при построении финальных изображений через новый рендерер Visualize, но и при обычной интерактивной работе со средой проектирования. Правда, преимущество Threadripper 3970X и 3960X видно только при рендеринге, потому что в остальном Solidworks до сих пор опирается на однопоточные алгоритмы.

#Производительность при компиляции

Компиляция программного обеспечения тоже даёт Threadripper 3970X и 3960X хороший шанс блеснуть своей производительностью. Как видно по представленным ниже результатам, новые HEDT-процессоры AMD серьёзно сокращают время, затрачиваемое на сборку крупных проектов (в этой роли в данном случае мы использовали браузер Chromium). Даже 24-ядерный Threadripper 3960X справляется с этой задачей почти в полтора раза быстрее, чем Core i9-10980XE.

#Производительность при научных расчётах

В этом достаточно объёмном разделе мы приводим результатов тестирования в специализированных научных пакетах. Используемые сценарии:

  • CalculiX – решение линейных и нелинейных трёхмерных задач механики сплошной среды с помощью метода конечных элементов в пакете Calculix. В тесте моделируется внутренняя температура турбины реактивного двигателя.
  • WPCcfd – моделирование процессов горения с турбулентностью, проводимое с привлечением пакета вычислительной гидродинамики OpenFOAM и стандартного решателя XiFoam.
  • rodiniaCFD и rodiniaLifeSci – части стандартного бенчмарка Rodinia для тестирования гетерогенных платформ в задачах гидро- и термодинамики, моделирования движения заряженных частиц и научной визуализации.
  • Lammps – решение задачи классической молекулярной динамики при помощи специализированного пакета LAMMPS.
  • Namd – ещё один пакет для молекулярной динамики для симуляции больших систем (миллионы атомов). Для целей тестирования моделируются различные молекулярные взаимодействия.
  • Python36 – математический бенчмарк для Phyton 3.6, в котором задействуются библиотеки numpy и scipy и выполняются операции линейной алгебры. 

Многие (хотя и не все) алгоритмы и пакеты, используемые при физических расчётах, отлично распараллеливаются. И это позволяет процессорам Threadripper демонстрировать впечатляющее преимущество перед любыми альтернативами. Таким образом, новую платформу AMD для рабочих станций можно рекомендовать не только для обработки контента, но и для научной работы.

#Производительность при архивации и перекодировании видео

Процессоры Threadripper 3970X и 3960X с честью справляются со сложными нагрузками в любых ресурсоёмких приложениях. Поэтому нет ничего удивительного в том, что в 7-Zip или Handbrake их производительность тоже оказывается на высоте. Это в очередной раз говорит о том, что топология Threadripper нового поколения куда более универсальна и не имеет столь очевидных слабых мест, которые обнаруживались у Threadripper 2970WX и 2990WX.

#Производительность в играх

Тестирование игровой производительности – факультативная часть обзора, поскольку очевидно, что HEDT-системы, построенные на процессорах с 24 и 32 вычислительными ядрами, для таких задач заведомо не предназначены. Однако посмотреть на то, какую кадровую частоту смогут обеспечить Threadripper 3970X и 3960X, всё-таки интересно, тем более что у их предшественников с этим была явная проблема.

Как показывают тесты, топология новых Threadripper с централизованным контроллером памяти эффективно решает многие проблемы прошлого поколения CPU. Частота кадров, которая получается в системах с Threadripper 3970X и 3960X, отличается от частоты кадров в системе с Ryzen 9 3950X не слишком заметно. То есть платформы на HEDT-процессорах AMD с микроархитектурой Zen 2 действительно универсальны почти полностью, вплоть до способности выдавать приемлемую частоту кадров в играх. Но исключения всё же бывают: например, в Far Cry 5 производительность Threadripper 3970X и 3960X оказывается неожиданно низкой. Правда, в данном случае это скорее проблема конкретного игрового движка, который «путается в ядрах», поскольку в других похожих ситуациях ничего подобного не наблюдается.

Здесь уместно будет напомнить, что для получения высоких значений FPS в играх одной только процессорной мощности недостаточно. Требуется ещё и подсистема памяти с низкой латентностью, и высокая скорость межъядерного взаимодействия, а по этим показателям Threadripper уступают как Ryzen, так и LGA1151-процессорам Core. Поэтому Threadripper 3970X и 3960X игровыми решениями считаться не могут не только из-за их неприступной для большинства геймеров цены.

Для полноты картины попутно ответим и ещё на один смежный вопрос: смогут ли новые Threadripper вытянуть стриминг силами процессора при использовании максимально возможного профиля качества. Для проверки мы воспользовались игрой Far Cry 5. За кодирование видеопотока отвечало популярное приложение Open Broadcasting System (OBS) Studio. В нём использовался программный кодер x264. Тестовая трансляция проводилась в разрешении 1920 × 1080 при частоте кадров 60 FPS и фиксированном битрейте 6 Мбит/с. В настройках кодирования выбирался профиль настроек качества slower.

Как мы уже знаем из предыдущих обзоров, более «простой» профиль slow «вытягивают» любые современные процессоры с числом ядер от 12 и более. Но профиль slower до сих пор не давался никому. Не хватает для него и мощности Threadripper 3970X и 3960X, которые не могут обеспечить кодирование видеопотока с постоянной кадровой частотой 60 FPS. Как следует из приведённой диаграммы, даже с этими процессорами с невиданной доселе мощностью (по меркам десктопных систем) теряется до 40 % кадров.

#Энергопотребление

Запредельная производительность – это, безусловно, хорошо, но что насчёт потребляемой мощности? Мы установили, что новые Threadripper собираются на базе энергоэффективных кристаллов, однако, несмотря на это, для них заявлен устрашающий тепловой пакет 280 Вт, которым до сих пор не обладал ни один из десктопных процессоров. Что это значит на практике?

Используемый нами в тестовой системе цифровой блок питания серии Thermaltake Toughpower DPS G позволяет контролировать потребляемую и выдаваемую электрическую мощность, чем мы и пользуемся для измерений. На графиках ниже приводится полное потребление систем (без монитора), измеренное «после» блока питания и представляющее собой сумму энергопотребления всех задействованных в системе компонентов. КПД самого блока питания в данном случае не учитывается.

Threadripper 3970X и 3960X оказываются прожорливее других флагманских процессоров, однако никаких ужасающих аппетитов они не демонстрируют. Максимальное потребление Socket sTRX4-системы при сколь угодно серьёзной нагрузке ограничивается величиной 380 Вт, из которых на процессор приходится не более 280 Вт. Именно это ограничение заложено в установленный спецификацией предел PPT (Package Power Tracking), ограничивающий фактическое потребление Threadripper 3970X и 3960X. Если же CPU при каких-то условиях пытается превысить эту величину – его частота автоматически снижается.

В заключение хочется обратить внимание на забавный факт: при AVX-нагрузке 24- и 32-ядерные процессоры Threadripper 3970X и 3960X, собранные из четырёх 7-нм чиплетов, показывают примерно такое же энергопотребление, как и 14-нм монолитный восьмиядерник Core i9-9900KS. Получается, что новые многоядерные Threadripper весьма энергоэффективны и предлагают очень хорошее удельное быстродействие на ватт.

Тем не менее не стоит забывать, что Threadripper нуждаются в хорошем охлаждении. Сама AMD в комплекте с ними не предлагает никаких кулеров, однако на своём сайте она рекомендует качественные СЖО, укомплектованные как минимум радиатором форм-фактора 240 мм.

#Выводы

Обычно, подводя итоги тестирования новых процессоров, мы стараемся проанализировать основные плюсы и минусы каждого из рассмотренных CPU и выстроить предположения, насколько удачно они впишутся в сложившийся рыночный ландшафт. Однако AMD Threadripper 3970X и 3960X лишили нас необходимости вдаваться в какие-либо рассуждения и делать какие-либо оценки. С ними всё понятно сразу: новые AMD Threadripper обладают такой мощью, что почти в каждой ресурсоёмкой задаче они не оставляют никаких шансов любой из представленных на рынке HEDT-альтернатив.

AMD в прошлом году перехватила технологическое лидерство на процессорном рынке, и Threadripper третьего поколения служат самой убедительной тому иллюстрацией. Они предлагают впечатляющий по составу и быстродействию массив из процессорных ядер Zen 2 с высоким IPC и достаточной тактовой частотой, который не пасует ни перед однопоточной, ни перед многопоточной нагрузкой, и не имеют никаких затруднений при работе с памятью. А это значит, что для профессионалов, которые действительно нуждаются в производительных системах, Threadripper 3970X и 3960X способны стать самым очевидным и беспроигрышным выбором.

Недовольство в свой адрес новые HEDT-процессоры AMD могут вызвать лишь одним – довольно высокой ценой. Компания Intel, устанавливавшая в прошлом на свои многоядерные процессоры цены под две тысячи долларов, зачастую подвергалась за это жёсткой критике. Но как только место лидера в этом сегменте перехватила AMD, она поступила точно так же, в полтора раза повысив удельную стоимость ядра для тех своих предложений, которые на данный момент уникальны.

Впрочем, ни это, ни цена новых материнских плат, необходимых для Threadripper третьего поколения, очевидно, не станут препятствием для проникновения таких процессоров в высокопроизводительные рабочие станции, используемые профессионалами. При одном лишь взгляде на тот уровень быстродействия, который продемонстрировали 32-ядерный Threadripper 3970X и 24-ядерный Threadripper 3960X при создании и обработке цифрового контента, в задачах 3D-проектирования или в научных расчётах, становится понятно, что их нельзя назвать переоценёнными. И даже более того, мы настоятельно рекомендуем специалистам, продуктивность работы которых напрямую связана с производительностью используемых рабочих станций, не откладывая запланировать переход на предложенную AMD платформу Socket sTRX4: это настоящий прорыв в сегменте HEDT, и открывшимися возможностями просто грех не воспользоваться в своих целях, если финансы позволяют.

3DNews рекомендует!


Оригинал материала: https://3dnews.ru/1002791