Оригинал материала: https://3dnews.ru/1003181

Обзор процессора AMD Ryzen Threadripper 3990X: контрольный выстрел

Технические характеристики и особенности

Компании AMD уже не нужно ничего никому доказывать, тем более в сегменте HEDT, но несмотря на это она решила не ограничиваться выпуском лишь 24- и 32-ядерных представителей семейства Threadripper третьего поколения. Сегодня начинаются продажи ещё более монструозного Threadripper 3990X с 64 вычислительными ядрами. И это – совершенно уникальный процессор, который позволяет получить в настольной рабочей станции такое количество ядер, которое не могут предоставить даже серверные двухпроцессорные системы конкурента.

Вычислительная мощь, заложенная в Threadripper 3990X, будоражит воображение. Подумать только, исходя из имеющегося арсенала ядер, этот зверь в одиночку может столько же, сколько восемь процессоров вроде Ryzen 7 3800X или четыре процессора Ryzen 9 3950X. Кажется, что Threadripper 3990X должны быть по плечу многие ресурсоёмкие задачи, для решения которых раньше приходилось прибегать к помощи специальных вычислительных серверов или ферм. А это значит, появление такого предложения может принципиально изменить привычные процедуры работы с контентом высокого разрешения или с визуальными эффектами кинематографического качества.

В ознакомительном обзоре мы не сможем дать однозначного ответа, подойдёт ли Threadripper 3990X для каких-то конкретных задач, с которыми сталкиваются профессионалы в различных отраслях. Проблемы, стоящие перед такими специалистами, в большинстве случаев комплексны и индивидуальны, и применять какие-то обобщённые подходы оценки производительности в этом случае было бы не совсем корректно. Однако оценить относительное быстродействие Threadripper 3990X в популярных приложениях для создания и обработки контента и изучить все тонкости, сопряжённые с его использованием, мы, безусловно, способны.

Тем более, что всяких нюансов с новым 64-ядерником будет явно больше, чем в случае рассмотренных нами недавно Threadripper 3970X и Threadripper 3960X. Недаром AMD так старательно создаёт вокруг Threadripper 3990X ореол исключительности, говоря о нём как о «HEDT-процессоре специального назначения» и «элитарном предложении для специальных нужд».

#Подробнее о Threadripper 3990X

Threadripper 3990X – это первый в истории 64-ядерный процессор, который предназначен для использования в высокопроизводительных настольных системах. До недавних пор предложения с таким количеством ядер существовали лишь в серверном сегменте, но теперь AMD решила уровнять в правах серверы и рабочие станции и предложить обоим рынкам примерно одно и то же, но в немного различной обёртке. Фактически, Threadripper 3990X – это HEDT-аналог EPYC 7702P поколения Rome, но с четырьмя, а не с восемью, каналами памяти, уполовиненным числом поддерживаемых линий PCI Express, отрезанными серверными функциями безопасности, но зато с расширенными рамками TDP и увеличенными тактовыми частотами.

Очевидно, что такой процессор появился в модельном ряду AMD главным образом потому, что компания просто могла его сделать. В сложившейся конкурентной обстановке, когда максимальный процессор Intel для сегмента HEDT оснащён лишь 18 ядрами, Threadripper с 24 и 32 ядрами прекрасно справились с тем, чтобы поднять планку производительности на недостижимую для соперника высоту. Но в том-то и прелесть чиплетной компоновки: она позволяет очень легко масштабировать решения, и поэтому 64-ядерный Threadripper 3990X – вполне логичное продолжение модельного ряда. Тем более, что в этом процессоре используются уже имеющиеся в арсенале AMD строительные блоки, которые в данном случае просто пересобраны по несколько иной схеме.

В состав Threadripper 3990X входит восемь стандартных 7-нм вычислительных чипсетов Zen 2, идентичных чиплетам, которые AMD применяет во всех остальных процессорах своего актуального поколения. Роль же центрального звена, объединяющего вычислительные чиплеты в единое целое, в этой схеме играет 12-нм чиплет ввода-вывода, который, как и в случае более простых моделей Threadripper третьего поколения, унифицирован с серверными процессорами EPYC Rome. Таким образом, в сумме в состав Threadripper 3990X входит около 39,5 млрд транзисторов, которые распределены по девяти полупроводниковым кристаллам.

Как всё это располагается на процессорной плате и в упаковке CPU, можно увидеть на фотографии.

Очевидно, что Threadripper 3990X собран на такой же плате, что и процессоры семейства EPYC, и в этом нет ничего странного. Производители по возможности стараются унифицировать между собой серверные и HEDT-процессоры, и 32- и 24-ядерные Threadripper, для которых была сделана специальная плата под четыре вычислительных чиплета, – это скорее исключение из общего правила.

Отличия между Threadripper 3990X и следующим в модельном ряду 32-ядерным Threadripper 3970X заключаются не только в двукратном расхождении в числе чиплетов и ядер. AMD относит своего 64-ядерного монстра к несколько иному классу «HEDT-процессоров специального назначения». И это отчасти объясняется разницей в частотной формуле «обычных» и 64-ядерных представителей семейства Threadripper.

Дело в том, что за двукратным увеличением числа ядер в Threadripper 3990X не стоит роста энергетических аппетитов. Тепловой пакет 64-ядерника ограничен величиной 280 Вт, как и у 32- и 24-ядерного процессоров. Причём, это же значение используется и для значения PPT (Package Power Tracking), то есть технология Precision Boost 2 попросту не даёт потреблению процессора выйти во время работы за 280-ваттную границу. Все подобные попытки жёстко пресекаются снижением частоты и напряжения. Поэтому AMD не смогла заявить для Threadripper 3990X столь же высокие тактовые частоты, как для его собратьев.

Ядра/ потокиЧастота, ГГцL3-кеш, МбайтПамятьЛинии PCIeTDP, ВтЦена
Threadripper 3990X 64/128 2,9-4,3 256 4 x DDR4-3200 64 280 $3999
Threadripper 3970X 32/64 3,7-4,5 128 4 x DDR4-3200 64 280 $1999
Threadripper 3960X 24/48 3,8-4,5 128 4 x DDR4-3200 64 280 $1399

Базовая частота, на которой Threadripper 3990X должен работать при полной 128-поточной нагрузке, составляет 2,9 ГГц против 3,7-3,8 ГГц у родственных процессоров с меньшим числом ядер. Максимальная частота в турборежиме по спецификации составляет 4,3 ГГц, в то время как для Threadripper 3970X/3960X заявляется авторазгон до 4,5 ГГц. Справедливости ради стоит заметить, что Threadripper 3990X действительно достигает заявленной максимальной частоты. Более того, при однопоточной нагрузке он, бывает, прыгает даже до отметки в 4,35 ГГц.

В целом же практическая кривая зависимости частоты от нагрузки для нашего экземпляра 64-ядерного процессора получилась следующей.

На графике приведена частота, наблюдавшаяся в Cinebench R20 при выполнении рендеринга с разным числом активных потоков. Любопытно, что частоты выше 4,0 ГГц выдерживаются процессором Threadripper 3990X вплоть до нагрузки на 20 ядер (по одному потоку на ядро). Примерно такую же картину мы видели с частотами Threadripper 3970X, что косвенно указывает на примерно одинаковое качество чиплетов, используемых во всей серии новых HEDT-процессоров AMD. Более того, если в Threadripper 3990X одновременно работает 32 ядра, его частота тоже оказывается примерно такой же, как у Threadripper 3970X и находится в районе 3,8 ГГц.

Тем не менее в целом считать Threadripper 3990X процессором, который предлагает по сравнению с Threadripper 3970X удвоенную мощность, не получится. Правило «x2» распространяется на число ядер и потоков и на объём L3-кеша, разросшийся у 64-ядерной новинки до 256 Мбайт. Но не распространяется ни на частоту, ни на линии PCI Express, ни на контроллер памяти. Рабочие частоты у Threadripper 3990X всё-таки ниже, а контроллер памяти и контроллер PCI Express имеют абсолютно идентичные с младшими моделями характеристики. В Threadripper 3990X поддерживается до 64 линий PCI Express 4.0 и четырёхканальная DDR4-3200, что, впрочем, вряд ли кого-то удивит, поскольку IOD-чиплет, а следовательно и контроллеры PCI Express и памяти, во всех Threadripper третьего поколения совершенно одинаковы.

Несмотря на всё это, AMD беззастенчиво применила правило «x2» к цене, которая для Threadripper 3990X установлена в $3999. Откровенно говоря, хочется даже назвать её заградительной – совершенно очевидно, что столь дорогие процессоры могут оттолкнуть даже некоторых профессионалов. Однако AMD, похоже, сознательно отсеивает таким образом сколько-нибудь массового покупателя. И дело тут даже не в том, что Threadripper 3990X достаточно сложен в производстве, потому что на него расходуется сразу восемь высококачественных 7-нм чиплетов Zen 2, а в том, что такой процессор в действительности хорош лишь строго в определённых задачах. Дальше мы подробнее расскажем, какие проблемы могут возникнуть у обладателя системы с 64-ядерным процессором, но для начала хочется обратить внимание на следующий слайд из презентации.

В нём AMD указывает, кому может быть нужен 64-ядерный Threadripper 3990X. Как указывает производитель, этот процессор уже нельзя рассматривать как CPU общего назначения, он может подойти лишь узкой прослойке профессионалов, создающих контент и имеющих особые потребности в части вычислительных мощностей. В первую очередь это – специалисты, занимающиеся созданием кинематографических визуальных эффектов, мастерингом видео в сверхвысоких разрешениях или разработчики ПО, создающие какие-то масштабные проекты. Утверждается, что Threadripper 3990X позволяет перенести традиционную «серверную» обработку контента на рабочий стол. Но при этом, в отличие от привычных серверных процессоров, Threadripper 3990X предлагает в том числе и отличную однопоточную производительность вместе с однородным доступом к памяти, что позволяет в системах на его основе эффективно работать с творческим ПО в интерактивном режиме.

Поскольку Threadripper 3990X не отличается от младших собратьев ни по внешним интерфейсам, ни по характеристикам энергопотребления и тепловыделения, он может без проблем использоваться в сложившейся экосистеме Socket sTR4-материнских плат, основанных на наборе логики TRX40.

От них потребуется лишь совместимость с новинкой на уровне BIOS, но все производители уже успели пообещать оперативно обновить прошивки своих платформ и внедрить в них полноценную поддержку 64-ядерника.

#Что не так с Threadripper 3990X

Когда AMD начинает заводить разговоры про «уникальное предложение для узкой прослойки профессиональных пользователей», сразу начинаешь подозревать какой-то подвох. Ведь именно так и было, когда компания выпустила Threadripper 2970WX и 2990WX – 24- и 32-ядерные процессоры на базе четырёх кристаллов Zeppelin, два из которых не имели собственных контроллеров DDR4 SDRAM. Тогда за рассказами о уникальности AMD пыталась скрыть то, что в реальности такие CPU демонстрировали достойную производительность исключительно в узком круге задач, не требовательных к задержкам подсистемы памяти, а во множестве распространённых приложений, пусть даже и способных к распараллеливанию нагрузки, уступали не только более простому 16-ядерному Threadripper 2950X, а иногда даже и обычным Ryzen.

Впрочем, в случае с Threadripper 3990X повторения той ситуации, конечно же, не будет. Сейчас, когда AMD перешла на топологию с централизованным чиплетом ввода-вывода, все ядра имеют совершенно равноправный доступ к контроллеру памяти и PCI Express, и это избавляет многоядерные процессоры компании от многих проблем, досаждавших в прошлом.

По своему строению Threadripper 3990X похож на Threadripper 3970X, только восьмиядерных CCD-чиплетов к центральному IOD-чиплету в нём подключено вдвое больше. А это значит, что как и в других процессорах с микроархитетктурой Zen 2, никаких соединений между вычислительными чиплетами здесь не предусмотрено, и всё взаимодействие между ядрами происходит через коммутатор Infinity Fabric, находящийся в чиплете ввода-вывода. Эта схема подтвердила свою эффективность сначала в Ryzen 3000, а потом и в 24- и 32-ядерных HEDT-процессорах, поэтому нет причин подозревать, что она не будет работать и в Threadripper 3990X.

Но подвох, который делает Threadripper 3990X не таким уж и всеядным CPU, какими оказались его младшие собратья с 24 и 32 ядрами, всё-таки существует, просто он имеет совершенно иную природу. Проблема на этот раз состоит в том, что существующие операционные системы, включая любые версии Windows, не умеют вот так запросто адресовать более 64 потоков. И это – не какая-то недоработка Microsoft, а глобальное ограничение архитектуры x86-64, связанное с максимальной разрядностью целого числа, которым кодируется привязка потоков к логическим ядрам – affinity.

Выход из этой ситуации давно придуман, но он не отличается особым изяществом. В операционных системах, начиная с Windows 7 и Windows Server 2008 R2, Microsoft предусмотрела понятие «процессорных групп» – подмножеств логических ядер, для каждого из которых привязка процессов (affinity) происходит независимо. Каждая из таких групп получает свои собственные 64 потока, и в итоге операционная система может управляться со сколь угодно многопоточными процессорами, но ценой кластеризации их возможностей.

Так Threadripper 3990X представляется в Windows: две группы по 64 ядра

Так Threadripper 3990X представляется в Windows: две группы по 64 ядра

На практике это означает, что все ядра Threadripper 3990X в операционной системе видны и доступны в двух процессорных группах по 64 потока. Однако чтобы задействовать обе группы сразу могли и приложения, в них тоже должна быть добавлена поддержка соответствующей функциональности. В противном случае задача будет исполняться лишь в рамках какой-то одной 64-поточной группы.

И как это обычно бывает, когда программная инфраструктура не поспевает за аппаратной, с поддержкой процессорных групп в приложениях на данном этапе наблюдаются явные проблемы. Поскольку столь развитая многопоточность – явление относительно новое, соответствующие возможности внедрены далеко не повсеместно. Поэтому заметное число ресурсоёмких программ попросту не сможет получить выигрыш от переноса на процессоры, подобные Threadripper 3990X, потому что они будут выполняться лишь в рамках одной группы – на 64 логических ядрах, оставляя вторую половину ядер без работы. Более того, как показывает практика, в ряде случаев с неоптимизированным ПО можно наблюдать даже какие-то совсем непонятные коллизии и заметное падение производительности.

Обычные приложения нагружают у Threadripper 3990X только 64 логических ядра

Обычные приложения нагружают у Threadripper 3990X только 64 логических ядра

В этой связи сама AMD предлагает ориентироваться на оптимизированные программы, число которых, особенно в свете выхода 128-поточного Threadripper 3990X, будет постепенно увеличиваться. Но есть и другой неплохой выход – попросту отключить технологию SMT, сделав из Threadripper 3990X 64-ядерный и 64-поточный процессор, с которым операционная система сможет совладать без всяких «костылей». И честно говоря, при существующим положении дел мы бы рекомендовали AMD отключать SMT для Threadripper 3990X в настройках по умолчанию – это решило бы массу проблем с совместимостью и непредсказуемой масштабируемостью производительности.

При этом любые редакции Windows 10 за исключением Home работают с 64-ядерным процессором Threadripper 3990X совершенно одинаково. 128 потоков полноценно поддерживается даже в обычной версии Pro, поэтому использовать совместно с Threadripper 3990X редакции Pro for Workstations или Enterprise нет никакой нужды. Необходимо лишь обновить систему как минимум до версии 18362.535, чтобы она правильно определяла Socket sTR4-платформу как систему с одним сокетом. Алгоритмы же планировщика в редакциях Pro, Pro for Workstations и Enterprise не отличается, и поэтому производительность Threadripper 3990X в них идентична.

Уместно будет напомнить и о том, что с многоядерными процессорами существуют и другие проблемы, из-за которых рост производительности при увеличении количества доступных в системе ядер постепенно становится меньше и меньше. В общем виде эту закономерность описывает закон Амдала, объясняя, что ускорение выполнения программы за счёт распараллеливания в любом случае ограничено временем, необходимым для выполнения её последовательных инструкций. Поэтому 64-ядерный процессор не обязательно будет заметно быстрее 32-ядерного, особенно с учётом того, что добавление ядер в рамках постоянного теплового пакета приводит к снижению тактовой частоты.

Не нужно упускать из вида и другие факторы, способные сдерживать рост производительности Threadripper 3990X. Например, увеличение числа параллельно исполняемых потоков усиливает нагрузку на полосу пропускания четырёхканальной памяти, которой может банально не хватать для своевременного обеспечения данными всех 128 потоков. Неожиданные узкие места в рабочей станции с процессором Threadripper 3990X способны возникать и в других подсистемах. Например, в дисковой, которая может попросту не успевать справляться с сохранением результатов выполняемого процесса с должной скоростью.

Именно поэтому конфигурация систем на базе Threadripper 3990X должна быть особенно тщательно сбалансирована. Сама AMD советует придерживаться при подборе комплектующих следующих принципов: объём оперативной памяти должен подбираться из расчёта 1-2 Гбайт на каждый логический процессор, а накопители должны быть выбраны из числа наиболее производительных NVMe-моделей вроде Samsung 970 EVO Plus или WD Black SN750 (PCIe 4.0-накопители AMD не советует, и мы знаем, почему), причём желательно разделять SSD, с которых осуществляется чтение и запись данных.

С учётом всего сказанного, придуманная AMD для Threadripper 3990X метафора «HEDT-процессор специального назначения» приобретает особый смысл. Кажется, маркетинговый отдел компании совершенно напрасно отбросил из модельного номера 3990X литеру «W». В данном случае она была бы более чем уместна, потому что явно указывала бы на непростой характер этого CPU и подчёркивала, что ожидаемая масштабируемость производительности у 64-ядерника проявляется лишь в ограниченном круге задач.

Результаты тестов. Выводы

#Описание тестовых систем и методики тестирования

В тестировании 64-ядерного Threadripper 3990X мы решили повторить методику, которая была применена при тестах его младших собратьев. Ещё до того, как мы приступили к тестированию, казалось, что конкурентов у Threadripper 3990X попросту не существует, но знакомство с реальными результатами тестов показало, что на самом деле не всё так просто, и этот процессор на голову превосходит флагманские предложения других семейств далеко не всегда. Иными словами, сравнение Threadripper 3990X с системами, основанными на старших процессорах для других платформ, – отнюдь не пустая трата времени. Поэтому 64-ядерной HEDT-новинке AMD были противопоставлены 8-ядерный Intel Core i9-9900KS для платформы LGA1151v2, 18-ядерный Intel Core i9-10980XE для платформы LGA2066, 16-ядерный AMD Ryzen 9 3950X для платформы Socket AM4, а также 24- и 32-ядерные Threadripper для платформы Socket sTR4, которые мы подробно протестировали несколько дней назад.

Стоит отметить, что тестирование Threadripper 3990X оказалось совсем не таким простым процессом, как того хотелось бы. Установить этот CPU в настроенную систему, где мы уже испытывали Threadripper 3970X и 3960X, и сразу же прогнать набор бенчмарков не удалось. Дело в том, что полной поддержки 64-ядерника во многих Socket sTR4-материнских платах пока нет, и это выражается в невозможности запустить систему с памятью, работающей в каком-нибудь достаточно скоростном режиме. AMD уверяет, что эта проблема будет исправлена в ближайшее время, а нам пришлось заменить материнскую плату на MSI Creator TRX40, для которой, к счастью, оптимизированная для Threadripper 3990X бета-версия прошивки была подготовлена заранее.

Кроме того, при тестировании Threadripper 3990X пришлось перейти на использование иного комплекта памяти. Как оказалось, 32 Гбайт для 64-ядерного процессора – слишком мало: каждый поток хочет хранить необходимые ему данные в памяти, и когда таких потоков 128 – им действительно нужно значительно больше памяти, чем в обычных системах. Поэтому конфигурация на базе Threadripper 3990X тестировалась с комплектом 8 × 16 Гбайт DDR4-3600 производства Corsair, которым до этого мы ещё не пользовались.

В конечном итоге список задействованных в тестировании комплектующих получился таким:

  • Процессоры:
    • AMD Ryzen Threadripper 3990X (Castle Peak, 64 ядра + SMT, 2,9-4,3 ГГц, 256 Мбайт L3);
    • AMD Ryzen Threadripper 3970X (Castle Peak, 32 ядра + SMT, 3,7-4,5 ГГц, 128 Мбайт L3);
    • AMD Ryzen Threadripper 3960X (Castle Peak, 24 ядра + SMT, 3,8-4,5 ГГц, 128 Мбайт L3);
    • AMD Ryzen 9 3950X (Matisse, 16 ядер + SMT, 3,5-4,6 ГГц, 64 Мбайт L3);
    • Intel Core i9-10980XE (Cascade Lake-X, 18 ядер + HT, 3,0-4,8 ГГц, 24,75 Мбайт L3);
    • Intel Core i9-9900KS (Coffee Lake Refresh, 8 ядер + HT, 4,0-5,0 ГГц, 16 Мбайт L3).
  • Процессорный кулер: СЖО NZXT Kraken X62.
  • Материнские платы:
    • ASRock X570 Taichi (Socket AM4, AMD X570);
    • ASRock Z390 Taichi (LGA1151v2, Intel Z390);
    • ASUS ROG Strix X299-E Gaming II (LGA2066, Intel X299);
    • ASUS ROG Strix TRX40-E Gaming (Socket sTR4, AMD TRX40);
    • MSI Creator TRX40 (Socket sTR4, AMD TRX40).
  • Память:
    • 4 × 8 Гбайт DDR4-3600 SDRAM, 16-16-16-36 (G.Skill Trident Z RGB F4-360016Q-32GTZR);
    • 4 × 16 Гбайт DDR4-3600 SDRAM, 16-18-18-36 (Corsair Dominator Platinum RGB CMT64GX4M4Z3600C16).
  • Видеокарта: NVIDIA GeForce RTX 2080 Ti (TU102, 1350/14000 МГц, 11 Гбайт GDDR6 352-бит).
  • Дисковая подсистема: Samsung 970 EVO Plus 2TB (MZ-V7S2T0BW).
  • Блок питания: Thermaltake Toughpower DPS G RGB 1000W Titanium (80 Plus Titanium, 1000 Вт).

Все сравниваемые процессоры тестировались с настройками, принятыми производителями плат «по умолчанию». Это значит, что для платформ Intel обозначенные в спецификациях ограничения по энергопотреблению игнорируются, и используются предельно возможные частоты с целью получения максимальной производительности. Стоит подчеркнуть, что в таком режиме эксплуатирует процессоры подавляющее большинство пользователей, поскольку включение лимитов по тепловыделению и энергопотреблению требует специальной настройки параметров BIOS.

Процессор Threadripper 3990X был протестирован дважды: с включённой и выключенной технологией SMT, то есть в режиме, когда его 128 логических ядер представлены в ОС двумя процессорными группами, и когда он выглядит в системе как привычный многоядерный CPU с 64 логическими ядрами без поддержки многопоточности.

Тестирование выполнялось в операционной системе Microsoft Windows 10 Pro (v1909) Build 18363.476 с использованием следующего комплекта драйверов:

  • AMD Chipset Driver 2.01.15.2138;
  • Intel Chipset Driver 10.1.1.45;
  • Intel Management Engine Interface Driver 11.7.0.1017;
  • NVIDIA GeForce 441.87 Driver.

Список использовавшихся для измерения вычислительной производительности инструментов:

  • Adobe Photoshop Lightroom Standard с тестовым пакетом PugetBench 0.8;
  • Adobe Premiere Pro 2020 с тестовым пакетом PugetBench 0.8;
  • Blackmagic Design Davinci Resolve Studio 16.1.2 с тестовым пакетом Puget Systems Benchmark 0.61;
  • Blender 2.81a со стандартным набором тестовых сцен Blender Benchmark 2.0.4;
  • Corona 1.3 Benchmark для тестирования производительности рендера Corona;
  • Dassault Systemes Solidworks 2019 SP4.0 с тестовым пакетом SPECapc 1.3.2;
  • Microsoft Visual Studio 2019 для тестирования скорости компиляции исходного кода интернет-браузера Chromium 81.0.4038.2;
  • OBS Studio 24.0.3 для тестирования производительности и гладкости потоковой трансляции игрового контента. В тестировании использовались следующие настройки видеопотока: кодер x264, разрешение 1080p@60fps, битрейт 6 Мбит/с, CPU Usage Preset = slowest.
  • Pov-Ray 2.7.1 со стандартной тестовой сценой benchmark.pov;
  • SPECworkstation 3.02 – тестовый пакет, направленный на определение производительности рабочих станций в профессиональных приложениях научной, медицинской, энергетической и инженерной направленности;
  • V-Ray Benchmark Next 4.10.07 для тестирования производительности рендера V-Ray;

Также в тестах были задействованы игры:

  • Assassin’s Creed Odyssey. Разрешение 1920 × 1080: Graphics Quality = Ultra High. Разрешение 3840 × 2160: Graphics Quality = Ultra High.
  • Far Cry 5. Разрешение 1920 × 1080: Graphics Quality = Ultra, HD Textures = On, Anti-Aliasing = TAA, Motion Blur = On. Разрешение 3840 × 2160: Graphics Quality = Ultra, Anti-Aliasing = Off, Motion Blur = On.
  • Shadow of the Tomb Raider. Разрешение 1920 × 1080: DirectX12, Preset = Highest, Anti-Aliasing = TAA. Разрешение 3840 × 2160: DirectX12, Preset = Highest, Anti-Aliasing = Off.

В игровых тестах в качестве результатов приводится среднее количество кадров в секунду, а также 0,01-квантиль (первая перцентиль) для значений FPS. Использование 0,01-квантиля вместо показателей минимального FPS обусловлено стремлением очистить результаты от случайных всплесков производительности, которые были спровоцированы не связанными напрямую с работой основных компонентов платформы причинами.

#Производительность при рендеринге

Рендеринг – это словно та самая разновидность нагрузки, для которой и был создан Threadripper 3990X изначально. Здесь этот 64-ядерный монстр рвёт и мечет, демонстрируя примерно полуторакратное улучшение результатов по сравнению с Threadripper 3970X. Впрочем в том, что производительность рендеринга отлично масштабируется с наращиванием числа ядер, известно очень давно, поэтому столь блистательное выступление Threadripper 3990X в этой категории нагрузки сюрпризом для нас не стало.

#Производительность при обработке видео

Выступление Threadripper 3990X при обработке видео в Premiere Pro 2020 выглядит уже не таким убедительным. Фактически, применять здесь дорогой 64-ядерный процессор не имеет особого смысла, он почти не быстрее вдвое более дешёвого 32-ядерного собрата. Немного улучшить выступление 64-ядерника можно за счёт отключения SMT, но в целом Premiere Pro 2020, кажется, попросту не может эффективно масштабировать свою производительность на такое количество ядер, даже если вести речь не только о интерактивной работе с приложением, но и о процессе финального экспорта.

Примерно то же самое мы увидели и в Davinci Resolve Studio. Масштабируемость производительности имеется, но она явно не соответствует той разнице в количестве ядер и цене, которая есть у Threadripper 3990X и Threadripper 3970X.

#Производительность при обработке фото

С Photoshop Lightroom ситуация достаточно забавная. Дело в том, что это приложение не умеет распараллеливать свою работу на более чем 64 ядра, но с Threadripper 3990X оно показывает существенно лучшие результаты при пассивной пакетной обработке массивов фотографий. Выигрыш достигается за счёт увеличения объёма кеш-памяти, который у 64-ядерника разрослась до впечатляющего объёма – 288 Мбайт (32 Мбайт L2 и 256 Мбайт L3).

#Производительность при инженерном проектировании

Как видно из результатов теста, Solidworks 2019 не умеет обращаться с «процессорными группами», поэтому 128-поточный Threadripper 3990X в его исходном виде для этого пакета подходит плохо. Но стоит отключить SMT, то есть сделать из процессора с 128 логическими ядрами процессор с 64 ядрами, ситуация в корне меняется. А значит, Threadripper 3990X может быть действительно полезен при работе с популярной системой автоматизированного проектирования разработки Dassault Systemes.

#Производительность при компиляции

Компиляция – ещё один пример отличной масштабируемости производительности при росте количества вычислительных ядер. Threadripper 3990X может стать востребованной платформой при разработке масштабных программных продуктов, поскольку позволяет получить очень заметный выигрыш во времени компиляции исходного кода. Даже по сравнению с 32-ядерным Threadripper 3970X флагманская 64-ядерная модель HEDT-процессора AMD справляется с задачей по сборке браузера Chromium на треть быстрее.

#Производительность при научных расчётах

В этом достаточно объёмном разделе мы приводим результатов тестирования в специализированных научных пакетах. Используемые сценарии:

  • CalculiX – решение линейных и нелинейных трёхмерных задач механики сплошной среды с помощью метода конечных элементов в пакете Calculix. В тесте моделируется внутренняя температура турбины реактивного двигателя.
  • WPCcfd – моделирование процессов горения с турбулентностью, проводимое с привлечением пакета вычислительной гидродинамики OpenFOAM и стандартного решателя XiFoam.
  • rodiniaCFD и rodiniaLifeSci – части стандартного бенчмарка Rodinia для тестирования гетерогенных платформ в задачах гидро- и термодинамики, моделирования движения заряженных частиц и научной визуализации.
  • Lammps – решение задачи классической молекулярной динамики при помощи специализированного пакета LAMMPS.
  • Namd – ещё один пакет для молекулярной динамики для симуляции больших систем (миллионы атомов). Для целей тестирования моделируются различные молекулярные взаимодействия.
  • Python36 – математический бенчмарк для Phyton 3.6, в котором задействуются библиотеки numpy и scipy и выполняются операции линейной алгебры. 

Во время тестирования 24- и 32-ядерных моделей Threadripper третьего поколения мы пришли к выводу, что многие научные пакеты отлично масштабируют производительность, если они выполняются в платформах с многоядерными процессорами. Однако с Threadripper 3990X ничего подобного уже не наблюдается. Библиотеки, используемые в научной среде, понятия не имеют о «процессорных группах», а потому в системе с 64-ядерником работают откровенно плохо.

Но как и в случае с Solidworks, проблему зачастую можно преодолеть. Отключение SMT уполовинивает число логических ядер, и позволяет приложениям общаться с ними в привычном и устоявшемся стиле. Производительность Threadripper 3990X в пакетах, которые не имеют поддержки «процессорных групп», в таком случае может возвращаться на должный уровень. Таким образом даже неоптимизированные приложения способны получать выигрыш в производительности при переносе на флагманский 64-ядерник AMD. Правда, к сожалению, это может потребовать дополнительной настройки системы, и гарантии стопроцентной результативности такого процесса нет.

#Производительность при архивации и перекодировании видео

Обычные общеупотребительные алгоритмы вряд ли способны получить выигрыш от переноса на неукротимый 64-ядерник AMD. Столь развитая многопоточность в привычных десктопных приложениях, естественно, не реализуется. Но в ряде случаев Threadripper 3990X всё-таки может похвастать преимуществом над своими младшими собратьями. Однако превосходство это достигается не за счёт ядер, а из-за более ёмкой кеш-памяти.

#Производительность в играх

Факультативный раздел про игры нужен лишь для того, чтобы убедиться, что игры на Threadripper 3990X идут не хуже, чем на других представителях семейства. Невысокая частота кадров наблюдается лишь в Far Cry 5, потому что движок Dunia Engine 2, мягко говоря, находится в недоумении от такого количества ядер и не может адекватно распределить по ним нагрузку. Зато другие игровые приложения умудряются даже показывать на Threadripper 3990X более высокую производительность, чем в системах с другими процессорами с микроархитектурой Zen 2. Сказывается гигантский L3-кеш.

Для полноты картины попутно ответим и на ещё один смежный вопрос: смогут ли новые Threadripper вытянуть стриминг силами процессора при использовании максимально возможного профиля качества. Для проверки мы воспользовались игрой Far Cry 5. За кодирование видеопотока отвечало популярное приложение Open Broadcasting System (OBS) Studio. В нём использовался программный кодер x264. Тестовая трансляция проводилась в разрешении 1920 × 1080 при частоте кадров 60 FPS и фиксированном битрейте 6 Мбит/с. В настройках кодирования выбирался профиль настроек качества slower.

Даже 64-ядерный Threadripper 3990X не может обеспечить трансляцию с максимальным качеством с профилем slower. Но ничего другого и не ожидалось: OBS Studio, как и большинство потребительских приложений, не поддерживает более 64 потоков, и простое увеличение ядер тут не помогает – для профиля slowest нужны либо процессоры с более высокой тактовой частотой, либо с более совершенной микроархитектурой. Отключение SMT позволяет немного улучшить ситуацию, но для кодирования потока без потерь этого всё равно мало.

#Энергопотребление

Для 64-ядерного Threadripper 3990X установлен тот же тепловой пакет, что и для его собратьев с меньшим числом ядер, причём граница в 280 Вт подтверждена величиной PPT (Package Power Tracking). Поэтому более 280 Вт под нагрузкой 64-ядерник забрать попросту не в состоянии: если он попытается это сделать, его частота будет принудительна снижена технологией Precision Boost 2. Это значит, что под нагрузкой Threadripper 3990X должен потреблять ровно столько же, сколько и Threadripper 3970X или 3960X. На практике всё это подтверждается, в чём вы можете убедиться по представленным диаграммам общего потребления систем.

Используемый нами в тестовой системе цифровой блок питания серии Thermaltake Toughpower DPS G позволяет контролировать потребляемую и выдаваемую электрическую мощность, чем мы и пользуемся для измерений. На графиках ниже приводится полное потребление систем (без монитора), измеренное «после» блока питания и представляющее собой сумму энергопотребления всех задействованных в системе компонентов. КПД самого блока питания в данном случае не учитывается.

Однако втиснуться в 280-ваттные рамки Threadripper 3990X удаётся с заметным усилием. Напомним, его частота при полной многопоточной нагрузке снижается до 2,9 ГГц, при которых им используется крайне невысокое напряжение питания порядка 0,85 В. Потребление отдельных ядер в таком режиме составляет всего лишь 2,7-2,8 Вт, что фантастически мало на фоне того, что в Threadripper 3970X ядра при полной многопоточной нагрузке потребляют по 6-7 Вт. Между тем, при однопоточной нагрузке потребление Threadripper 3990X оказывается на фоне конкурентов довольно значительным, что, похоже, связано с какими-то недоработками в схеме управления питанием.

Но в целом мы всё равно просто обязаны восхититься выдающейся энергоэффективностью Threadripper 3990X. По удельной производительности на ватт он превосходит старший HEDT-процессор конкурента, Core i9-10980X, примерно в два с половиной раза!

#Выводы

То, что мы увидели сегодня во время тестирования Threadripper 3990X, производит неизгладимое впечатление. Но дело тут даже не в том, что этот процессор может затмить любого конкурента своей вычислительной мощностью, особенно если речь идёт о решении какой-то хорошо распараллеливаемой и оптимизированной задачи. Гораздо большее восхищение вызывает то, насколько гладко и чётко работает чиплетный подход, придуманный и воплощенный компанией AMD в процессорах поколения Zen 2. Мы успели познакомиться с вариантами CPU, в которых используется один вычислительный чиплет, два чиплета, четыре чиплета, и вот сейчас перед нами оказался процессор с восемью чиплетами. И каждая такая разновидность демонстрировала не только совершенно предсказуемый набор свойств и прекрасную производительность в своём классе, но и была лишена каких-то заметных слабых мест.

Всё это в равной степени распространяется и на Threadripper 3990X, который можно охарактеризовать как максимум того, на что способна AMD в данный момент. Компания уже несколько лет активно толкает отрасль в сторону развития многоядерности и многопоточности, и появление 64-ядерного и 128-поточного процессора для сегмента HEDT представляется вполне закономерным развитием событий. Но в то же время эта единоличная ядерная гонка завела AMD в достаточно парадоксальную ситуацию, когда Threadripper 3990X не только оторвался от конкурирующих предложений на недосягаемое расстояние, но и опередил развитие программного обеспечения. Существенная часть доступного в настоящее время ПО попросту не может работать с более чем 64 потоками, поэтому в ряде случаев потенциал Threadripper 3990X не получится раскрыть вообще, а в ряде ситуаций ему придётся отключать технологию SMT.

Но Threadripper 3990X и не претендует на то, чтобы быть процессором для всех и каждого, это – вариант для высококвалифицированных профессионалов и для решения специфических творческих задач. Как мы видели в тестах, для Threadripper 3990X можно найти довольно большое число вариантов использования, где его применение может быть совершенно оправдано. Это и рендеринг, и создание визуальных эффектов, и разработка программного обеспечения, и даже некоторые виды научных расчётов. Поэтому нет никаких сомнений в том, что Threadripper 3990X найдёт свою аудиторию даже несмотря на стоимость на уровне четырёх тысяч долларов. В конце концов, это – высококачественный рабочий инструмент, и многие профессионалы могут быть заинтересованы в том, чтобы иметь на рабочем столе столь значительную вычислительную мощность, особенно если учесть, что благодаря ей они могут увеличить свою продуктивность.

В заключение нельзя удержаться от того, чтобы не напомнить, что компания Intel в настоящее время не в состоянии предложить подобные Threadripper 3990X решения ни в каком виде, даже если взять в расчёт серверные и двухпроцессорные системы. И такая ситуация сохранится ещё достаточно долго, что даёт AMD хороший шанс закрепиться в сегменте высокопроизводительных рабочих станций. Вслед за выпуском набора выдающихся по характеристикам и производительности процессоров Threadripper третьего поколения она теперь должна сделать и второй шаг, и добиться проникновения таких процессоров не только в самосборные системы, но и в готовые рабочие станции. Например, в те же Apple Mac Pro, где сейчас применяются явно уступающие им по характеристикам процессоры Xeon W с 28 ядрами.



Оригинал материала: https://3dnews.ru/1003181