Оригинал материала: https://3dnews.ru/956770

Обзор процессоров AMD Ryzen Threadripper 1950X и 1920X: превентивный ядерный удар

Особенности конструкции

То, какое решительное наступление смогла развить за короткий срок компания AMD на процессорном рынке, действительно поражает. С марта, когда были представлены первые процессоры Ryzen, основанные на новой микроархитектуре Zen, прошло всего пять месяцев. Но за это время компания презентовала не просто полноценный модельный ряд массовых десктопных процессоров стоимостью от $100 до $500, но и всю сопутствующую экосистему.

Это кажется тем более удивительным, потому что первоначально вывод процессоров Ryzen 7 на рынок производил впечатление плохо подготовленного и поспешного проекта. Материнские платы и кулеры были в дефиците, совместимость со скоростной DDR4-памятью оставляла желать лучшего. Вызывал серьёзные недовольства и низкий уровень производительности, который новые процессоры показывали в целом ряде приложений, особенно игровых. Однако все эти «детские» проблемы компании AMD удалось быстро и эффективно устранить. Тесная работа с партнёрами привела к тому, что ассортимент материнских плат для Ryzen стал весьма обширен, а популярные системы охлаждения быстро получили необходимую совместимость с Socket AM4. Решены были и многие вопросы, связанные с производительностью. Выпуск оптимизированного профиля управления питанием для Windows 10 смог снизить время реакции процессоров при малопоточной нагрузке, а обновления внутренних библиотек AGESA позволили поднять эффективность контроллера памяти и придать ему значительно более широкие возможности работы с различными скоростными модулями DDR4 DIMM.

В результате достаточно быстро платформа Socket AM4 превратилась из экспериментального продукта с неясными перспективами в весьма соблазнительный вариант для тех потребителей, которые ищут выгодные многоядерные решения с хорошим сочетанием цены и производительности. И такое предложение уже успели по достоинству оценить многие энтузиасты. Популярность процессоров Ryzen стала быстро расти.

Но AMD не останавливается на достигнутом. Предложив вполне конкурентоспособное решение для массового рынка, компания задумала замахнуться на сегмент, в который она не заглядывала последние лет десять – на процессоры для десктопов премиального уровня – HEDT (High-End Desktop). Как оказалось, новая микроархитектура Zen может прекрасно подойти и для таких продуктов, ведь она предлагает достойную удельную производительность, которая хорошо раскрывается в приложениях для создания и обработки цифрового контента. И, более того, ядра Zen легко собираются в крупные кластеры, позволяя без обременительных накладных расходов создавать процессоры с большим числом вычислительных ядер.

Именно эти особенности Zen и сподвигли AMD на создание Ryzen Threadripper – новой элитарной платформы, в рамках которой будут существовать в два раза более мощные по сравнению с обычными Ryzen процессоры, способные предоставить пользователям до 16 вычислительных ядер, работающих на сравнительно высоких тактовых частотах. Это, безусловно, недешёвый и нишевый проект, и, судя по всему, с его помощью компания не планирует бить рекорды продаж, а собирается решать несколько иную задачу стратегического характера. Ryzen Threadripper должен показать общественности, что AMD действительно вернулась в высшую лигу процессорного рынка и ей вполне по силам создание процессоров, способных превосходить интеловские чипы в любом сегменте.

С этой точки зрения момент для выпуска Ryzen Threadripper оказался выбран очень удачно. На данный момент в модельном ряду интеловских HEDT-процессоров происходит смена архитектур, и отсутствуют модели с числом ядер более десяти. В результате у AMD появился реальный шанс на некоторое время перехватить статус разработчика, предлагающего самые быстрые процессоры для настольных компьютеров. В данном обзоре мы проверим, смогла ли AMD воспользоваться открывшейся возможностью и заинтересуют ли новые процессоры Ryzen Threadripper энтузиастов высокой производительности, традиционно отдававших предпочтение процессорам серии Intel Core Extreme Edition.

#Особенности конструкции Ryzen Threadripper

Стремление компании AMD попасть в сегмент высокопроизводительных настольных систем (HEDT) трудно назвать неожиданным. Коль скоро в её распоряжении появилась конкурентоспособная микроархитектура, которая позволяет проектировать не только десктопные, но и серверные решения, попытка оккупировать настольные компьютеры премиального класса – само собой разумеющийся следующий шаг. Intel уже многие годы занимается тем, что для сегмента HEDT адаптирует свои серверные CPU, и это даёт нормальные результаты и не кажется чем-то противоестественным. У AMD же теперь тоже есть очень достойные процессоры EPYC, ориентированные на дата-центры, поэтому логично, что компания решила попытаться сделать на их основе решения, которые могут заинтересовать  любителей и профессионалов,нуждающихся в высоких вычислительных мощностях.

Впрочем, сразу же следует отметить, что подход у AMD в отношении высокопроизводительной платформы не совсем такой, как у Intel. В то время как микропроцессорный гигант действительно использует для своих процессоров Core i9 полностью аналогичную серверным CPU полупроводниковую базу, Ryzen Threadripper и EPYC имеют между собой много меньше общего. Но связано это не с тем, что инженеры AMD решили заняться проектированием специальных полупроводниковых чипов для энтузиастов, а с тем, что AMD проповедует в принципе иной подход к построению продуктов разных классов.

Действительно, основой любых современных процессоров с микроархитектурой Zen выступает один и тот же восьмиядерный полупроводниковый кристалл Zeppelin, в котором содержится два CCX – четырёхъядерных CPU-комплекса. Этот кристалл используется во всех Ryzen с числом ядер от четырёх до восьми, что может даже показаться неким расточительством, однако на самом деле им не является, ведь должна же AMD иметь возможность куда-то реализовывать полупроводниковые кристаллы с браком. Zeppelin лежит и в основе серверных EPYC с числом ядер до 32, где такие кристаллы комбинируются на одной процессорной плате в кластеры по четыре штуки.

Ryzen Threadripper с точки зрения базовой конструкции представляет собой нечто среднее между EPYC и обычным Ryzen. Такие процессоры для энтузиастов высокой производительности должны иметь до 16 вычислительных ядер, так что для их сборки достаточно двух кристаллов Zeppelin. Поэтому в действительности Threadripper – это, грубо говоря, и есть двухпроцессорная система из пары Ryzen, собранная на единой процессорной подложке и выглядящая как один цельный процессор.

Однако на самом деле на уровне физического исполнения это не совсем так. Для того чтобы упростить себе жизнь и не тратиться на организацию производства хоть и дорогостоящих, но всё же нишевых продуктов, AMD решила по возможности унифицировать Ryzen Threadripper с серверными EPYC. В конечном итоге они очень похожи внешне, и для них используется процессорное гнездо с одинаковой конфигурацией и 4096 контактами. Более того, как показали эксперименты со вскрытием крышки на образцах процессоров Ryzen Threadripper, внутри у них находится не по два, а по четыре полупроводниковых кристалла – точно так же, как и у новых серверных CPU компании AMD. Но это всё же не означает, что Threadripper – это производная от EPYC. Два «лишних» кристалла внутри этого процессора представляют собой простые полупроводниковые болванки, и они нужны лишь для правильного распределения механических усилий на процессорную сборку при её установке в сокете.

AMD Ryzen Threadripper со снятой крышкой. Фото Der8auer

AMD Ryzen Threadripper со снятой крышкой. Фото Der8auer

В конечном итоге, Ryzen Threadripper – это не урезанный EPYС, а просто его половина, сделанная из двух кристаллов Zeppelin. Это прослеживается во всех характеристиках, включая число ядер, объём кеш-памяти, количество каналов DDR4 SDRAM, возможности расширения и проч. Кроме того, в Threadripper нет никаких сугубо серверных штук вроде встроенного аппаратного криптографического движка и поддержки регистровой памяти. То есть, данный процессор, как и обычные Ryzen, ориентирован на потребительский сегмент.

Использование двух кристаллов Zeppelin означает, что внутри Ryzen Threadripper используется четыре CCX-комплекса, в каждом из которых имеется по 8 Мбайт разделяемой кеш-памяти. В сумме это даёт 32-мегабайтный L3-кеш, что ровно вдвое больше, чем предлагается в обычных Ryzen.

Помимо 16 вычислительных ядер Ryzen Threadripper может предложить четырёхканальный контроллер памяти с официальной поддержкой DDR4-2667 (здесь, как и раньше, есть определённые нюансы, касающиеся разной максимальной скорости с модулями DDR4 разной организации).

КаналыРанги DRAMDIMM на каналЧисло DIMMСкорость
Четыре канала Одноранговая 1 4 из 8 DDR4-2667
Четыре канала Одноранговая 2 8 из 8 DDR4-2133
Четыре канала Двухранговая 1 4 из 8 DDR4-2400
Четыре канала Двухранговая 2 8 из 8 DDR4-1866

Естественно, поддерживается и разгон модулей DDR4 SDRAM выше номинальных частот. К настоящему моменту компании AMD удалось отладить работу своего контроллера памяти, поэтому проблем несовместимости отдельных модулей с процессорами Ryzen Threadripper уже быть не должно. Фактически можно рассчитывать на то, что контроллер памяти в новых HEDT-процессорах работает так же, как контроллер в Ryzen после обновления библиотек AGESA до версии 1.0.0.6.

Общий объём памяти, который теоретически может адресовать Threadripper, достигает 2 Тбайт. Однако за неимением в данный момент на рынке небуферизированных модулей DDR4 SDRAM объёмом более 16 Гбайт, получить в системе на базе Ryzen Threadripper более 128 Гбайт не выйдет. Кроме того, не следует забывать и об ограничениях со стороны операционной системы. Более 128 Гбайт памяти, например, не поддерживается в Windows 10 Home, а версии Pro и Enterprise не могут работать с объёмами памяти более 512 Гбайт.

Подобным образом дело обстоит и с линиями PCI Express. EPYC в общей сложности имеют 128 линий PCI Express, а процессоры Threadripper предлагают вдвое меньше – до 64 линий PCI Express, которые могут дробиться или собираться произвольным образом. В то же время существует лишь единственное ограничение: общее число PCIe-устройств (видеокарт, NVMe-накопителей и проч.), подключенных к Threadripper, не должно превышать восьми штук. Правда, одно PCIe x4-устройство в системах на базе Ryzen Threadripper есть всегда – это набор логики X399, поэтому пользователю в конечном итоге достаётся 60 линий PCI Express, которые можно поделить на семь устройств.

При этом на работу памяти и PCIe-устройств определённый отпечаток накладывает двухкомпонентное строение Ryzen Threadreaper. Поддержка четырёхканальной памяти и шины PCI Express в данном случае не совсем такая, как в HEDT-процессорах Intel, где применяется монолитный полупроводниковый базис. У AMD она оказывается не равномерной, а распределённой по двум кристаллам Zeppelin. Четырёхканальный контроллер памяти в Ryzen Threadripper на самом деле представляет собой два независимых двухканальных контроллера DDR4 SDRAM, а работа 64 линий PCI Express обеспечивается двумя корневыми хабами PCI Express, которые физически находятся в разных кристаллах.

Но даже несмотря на всё это, думать о Ryzen Threadripper как о собранной в одной упаковке двухпроцессорной системе всё-таки не следует. Дело в том, что объединение двух кристаллов Zeppelin в единое устройство выполнено с использованием передовых технологий, способных обеспечить высокую пропускную способность и низкие латентности взаимодействий, получить которые в классических системах с двумя сокетами было бы нереально. Речь идёт о шине Infinity Fabric – дальнейшем развитии HyperTransport, которое широко применяется AMD в том числе и внутри кристаллов Zeppelin для коммуникации между процессорными CCX-комплексами.

Шина Infinity Fabric, связывающая кристаллы в Ryzen Threadripper, имеет точно такую же пропускную способность, что и шина, пролегающая внутри Zeppelin. А это значит, что она синхронизирована по частоте с контроллерами памяти и может обеспечить передачу 32 байт данных за каждый такт в каждую сторону. При использовании памяти DDR4-2667 это даёт, например, полосу пропускания в 85 Гбайт/с. Правда, в отличие от внутренней шины Infinity Fabric, внешняя шина применяется не только для межъядерных соединений и обслуживания доступа в память, но и для нужд контроллеров PCI Express, SATA и проч. Поэтому некоторая часть пропускной способности оказывается не всегда доступна. Кроме того, при использовании межкристалльной Infinity Fabric задержки получаются выше – здесь отличие от внутренней шины примерно в 1,5-2 раза. Таким образом, процессор Ryzen Threadripper всё равно оказывается архитектурой с неравномерным доступом к памяти, что приводит к необходимости учитывать некоторые особенности. Поговорим о них подробнее.

#Производительность межъядерного взаимодействия

Для того чтобы проиллюстрировать тот факт, что ядра в Ryzen Threadripper по скорости взаимного обмена данными подразделяются на «ближайшие» (находящиеся в одном CCX), «средние» (находящиеся в одном кристалле Zeppelin, но в разных CCX) и «дальние» (разнесённые по разным кристаллам), мы провели традиционный эксперимент по измерению латентностей при передаче данных от одного ядра к другому.

Приведённые в таблице числа относятся к Ryzen Threadripper 1950X, работающему с DDR4-3200 SDRAM.

Результаты очень показательны. Латентность взаимодействия между ядрами, размещенными внутри одного CCX-комплекса, находится на очень хорошем уровне. Порядка 40 нс – это даже лучше задержки, которую даёт интеловская кольцевая шина, так что процессоры AMD позволяют передавать данные между ядрами внутри одного CCX-комплекса быстрее, чем это могут делать лучшие интеловские процессоры. К тому же появившаяся в Skylake-X ячеистая сеть по сравнению с кольцевой шиной ухудшила латентности межъядерного взаимодействия, и теперь новые HEDT-процессоры Intel демонстрируют возросшие до 75-80 нс задержки при передаче данных между ядрами.

Однако о прогрессивности выбранного AMD варианта межъядерного взаимодействия можно говорить лишь до тех пор, покуда речь не заходит о совместной работе с данными ядер из разных CCX-комплексов. Даже для пары ядер, находящихся в одном кристалле, но в разных CCX, латентность при взаимодействии возрастает более чем втрое и составляет уже более 150 нс. Если же обмен данными идёт между ядрами в различных кристаллах, то задержки оказываются ещё на треть выше.

Но справедливости ради стоит отметить, что различия практических латентностей при переходе от обмена данными между разными CCX, находящимися в одном или в соседних кристаллах, на самом деле не столь вопиющи. И это служит наглядной иллюстрацией того факта, что шина Infinity Fabric, связывающая кристаллы Zeppelin внутри Ryzen Threadripper со своей ролью справляется достаточно неплохо: такой собранный из двух частей процессор действительно не похож на ординарную систему с двумя CPU.

#Режимы работы подсистемы памяти

Но дело не только в межъядерном взаимодействии, но и в контроллерах памяти, имеющихся в каждом кристалле Zeppelin. Эти контроллеры двухканальные, и максимальную пропускную способность они могут обеспечить лишь при согласованной многопоточной работе. Однако если речь идёт об однопоточных обращениях к памяти, то скорость доступа, очевидно, зависит от того, в одном или в разных кристаллах находятся контроллер памяти и инициирующее транзакцию ядро. А это значит, что Ryzen Threadripper представляет собой классическое воплощение NUMA-архитектуры (Non-Uniform Memory Architecture). Массив памяти, обслуживаемый этим процессором, получается неравномерным по скорости работы.

Для серверных систем такая организация массива памяти не представляет серьёзной проблемы. Там NUMA-архитектура применяется давно и повсеместно, поэтому программное обеспечение создаётся с учётом особенностей такого строения подсистемы памяти: данные по возможности хранятся как можно ближе к ядру, которое с ними работает. Однако для обычных массовых программ такой оптимизации не делается. Настольные системы всегда оперировали однородной памятью, поэтому подавляющее большинство приложений, с которыми пользователи сталкиваются на десктопах, спроектировано в предположении, что подсистема памяти имеет одинаковые скоростные характеристики в любой своей области. К сожалению, такое предположение может создать определённые проблемы для систем на базе Ryzen Threadripper из-за которых эффективность работы и производительность будет снижаться вследствие непреднамеренного использования областей памяти с большими задержками.

Для того, чтобы как-то обойти эту потенциальную сложность, AMD определила для контроллера памяти Threadripper два различных режима работы: распределённый и локальный.

В распределённом (distributed) режиме (в терминах AMD он также носит название Creator Mode) на первое место ставится пропускная способность памяти. В нём подсистема памяти обслуживается как обычный равноправный массив (UMA), а все запросы к данным равномерно распределяются по всем доступным каналам, вне зависимости от того, к какому из кристаллов процессора они относятся. Такой режим хорош в том случае, когда приложение задействует большие объёмы данных и не чувствительно к латентности.

Для того же случая, когда латентности для скорости работы важнее, предлагается локальный (local) режим. В нём транзакции в первую очередь отдаются тому двухканальному контроллеру, который находится в одном кристалле Zeppelin с ядром, их инициировавшим (эмуляция NUMA). Это в большинстве случаев понижает задержки, однако приложения не получают доступа к полной пропускной способности четырёхканальной памяти, фактически довольствуясь лишь двухканальным режимом.

Разницу между этими режимами нетрудно проиллюстрировать результатами измерений. С помощью бенчмарка CacheMem из пакета AIDA64 мы замерили производительность подсистемы памяти, составленной из четырёх идентичных модулей DDR4-3200 SDRAM (14-14-14-34) в системе с процессором Ryzen Threadripper, при её работе в локальном и распределённом режимах.

Распределённый режим работы памяти (UMA)

Распределённый режим работы памяти (UMA)

Локальный режим работы памяти (NUMA)

Локальный режим работы памяти (NUMA)

Практические различия между режимами оказываются огромны. Как и было обещано, локальный режим действительно позволяет выиграть в практических задержках при обращении к памяти. Кажется, что он лучше и с точки зрения пропускной способности, однако такая картина наблюдается лишь потому, что бенчмарк памяти в AIDA64 измеряет многопоточную производительность подсистемы памяти, загружая работой все доступные ядра и инициируя независимую и одновременную загрузку контроллеров памяти обоих кристаллов Zeppelin, а затем суммирует результаты. То есть, если говорить о том, какую пропускную способность памяти будет получать в своё распоряжение один поток, то представленные для локального режима показатели надо делить пополам. И в конечном итоге именно распределённый режим даст заметное преимущество в полосе пропускания.

AMD по умолчанию активирует локальный режим (эмуляцию NUMA), поскольку он, по мнению компании, обеспечивает лучшую производительность в большем числе случаев. Насколько это справедливо, сказать трудно, но некоторые приложения, которые не используют весь многопоточный потенциал Ryzen Threadripper, но требуют при этом интенсивной межъядерной синхронизации, действительно получают заметный выигрыш. Однако нужно понимать, что в этом случае Ryzen Threadripper практически не пользуется преимуществами четырёх каналов, и этот режим больше подходит для игровых, а не для рабочих приложений. Поэтому существование большого числа приложений для создания цифрового контента, которые в распределённом режиме функционируют явно эффективнее, удивлять не должно.

Для примера ниже приводятся результаты тестов Ryzen Threadripper 1950X в приложениях при работе с четырёхканальным массивом DDR4-3200 SDRAM (14-14-14-34) в распределённом (UMA) и локальном (NUMA) режимах.

Получается, единого и универсального подхода не существует. В некоторых случаях выгоднее один режим, в других ситуациях – иной. К сожалению, переключение между локальным и распределённым режимами работы контроллера памяти выполняется в BIOS материнской платы, что не слишком удобно, так как требует перезагрузки системы. Существует и другой путь – через фирменную утилиту AMD Ryzen Master, где для процессоров Ryzen Threadripper доступен соответствующий переключатель.

Но и он ничего не упрощает. Активация необходимого алгоритма работы с памятью через утилиту тоже требует перезагрузки, поэтому в реальной жизни частое переключение режимов контроллера памяти в зависимости от решаемых задач вряд ли способно стать удобным и популярным подходом.

Но в целом для ресурсоёмких приложений для создания и обработки цифрового контента более оптимальным представляется распределённый режим, а не локальный, который выбирает по умолчанию AMD.

#Игровой режим Ryzen Threadripper

AMD хочет позиционировать свои процессоры Ryzen Threadripper не только как решения для создателей контента, но и в качестве бескомпромиссной игровой платформы. Однако тут существует серьёзная проблема, связанная с тем, что многие игры чрезвычайно чувствительны к латентности памяти и скорости межъядерного взаимодействия, из-за чего, в частности, обычные Ryzen выступают в приложениях такого рода хуже интеловских процессоров Kaby Lake. Но с Ryzen Threadripper ситуация рискует оказаться ещё хуже, ведь у них существуют варианты распределения потоков и данных таким образом, что задержки будут ещё выше, чем у обычных Ryzen.

Казалось бы, проблему могла бы решить активация локального режима контроллера памяти, при котором данные по возможности располагаются в той части памяти, которая относится к кристаллу, исполняющему соответствующий процесс. Однако некоторые многопоточные игры могут легко разрушить этот принцип и захотеть занять большее число ядер, чем присутствует в одном кристалле Threadripper, что приведёт к попаданию части данных в память, относящуюся к «дальнему» контроллеру. К тому же не стоит забывать и про существование смежных потоков, например, DirectX и графического драйвера, которые вполне могут переехать исполняться в соседний кристалл, и тем самым затормозить весь процесс рендеринга кадров в игре. Чтобы такого не происходило, разработчики AMD реализовали ещё один режим – игровой (или режим совместимости).

AMD Ryzen Threadripper 1950X в игровом режиме

AMD Ryzen Threadripper 1950X в игровом режиме

Суть данного режима состоит в полном отключении всех вычислительных ядер, которые относятся ко второму кристаллу Zeppelin в Threadripper. Это – жёсткий метод привязки всех потоков к одному кристаллу, который действительно позволяет быть уверенным в первоочередном использовании части памяти с наименьшими задержками. Однако такое принудительное превращение многоядерного Threadripper в простой Ryzen – далеко не самый рациональный шаг, пойти на который может заставить лишь крайняя необходимость. К тому же, получающаяся конфигурация оказывается по своим параметрам всё равно хуже обычной Socket AM4-системы на базе Ryzen, так как половина памяти остаётся подключенной к «дальнему» контроллеру. Поэтому, если игра захочет использовать больше памяти, чем есть в первых двух каналах, с высокими задержками столкнуться всё же придётся.

А это значит, что единственный способ добиться того, чтобы вся память могла работать с низкой латентностью, заключается в активации игрового режима с одновременной физической перестановкой всех модулей DDR4 SDRAM в слоты, относящиеся к первому кристаллу Zeppelin. Но не проще ли всё же в игровых системах использовать процессоры, которые подходят для них без подобных странных ухищрений?

Тем не менее, игровой режим в Ryzen Threadripper всё-таки существует, и активизировать его можно специальным переключателем в утилите AMD Ryzen Master. Впрочем, для окончательного включения потребуется ещё и перезагрузка, так что удобным такую реализацию назвать вряд ли возможно.

Сравнение игрового режима с обычным локальным показывает, что он позволяет выгадать дополнительные несколько процентов игровой производительности не повсеместно, а лишь в некоторых случаях. Приведённые далее результаты тестов проведены в системе с Ryzen Threadripper 1950X, памятью DDR4-3200 SDRAM (14-14-14-34) и видеокартой NVIDIA Titan X (Pascal).

По представленным данным хорошо видно, что заметное преимущество игровой режим даёт лишь в отдельных случаях. То есть, универсальным средством увеличения частоты кадров в играх он не является. Если его включение и помогает, то чаще всего это почти незаметно, а в некоторых ситуациях можно наблюдать, напротив, даже снижение быстродействия. Поэтому скорее всего реальные пользователи будут прибегать к включению игрового режима лишь в каких-то исключительных обстоятельствах.

Сама AMD приводит лишь небольшой список игр, для которых активация игрового режима имеет смысл с точки зрения наблюдаемой частоты кадров. Он включает: Civilization VI, Call of Duty: Modern Warfare Remastered, Heroes of the Storm, Gears of War Ultimate, DOTA 2, Watch Dogs, Thief, Hitman: Absolution и Fallout 4. Однако существует и ряд игр, в которых без игрового режима обойтись невозможно, поскольку они попросту не запускаются в системах с более чем 20 логическими процессорами. Среди популярных игр, имеющих такую проблему, нужно упомянуть DiRT Rally, Far Cry Primal, Far Cry, F1 2016 и GTA V.

В утилите Ryzen Master игровой режим носит название режима совместимости, и это хорошо передаёт его суть. Фактически он играет роль «средства последней надежды», к которому имеет смысл прибегать лишь тогда, когда всё остальное не помогает, и работа Threadripper в его стандартном состоянии с каким-то приложением становится совершенно неудовлетворительной. Причём максимум, что может сделать игровой режим, это лишь приблизить быстродействие Ryzen Threadripper к скорости обычного Ryzen. То есть, никакой панацеей в плане улучшения игровой производительности процессоров AMD он не является.

К сказанному стоит добавить и то, что Ryzen Threadripper может оказаться не слишком удачным вариантом для формирования мощных игровых конфигураций не только из-за распределённой по двум контроллерам памяти, но и из-за аналогичной реализации шин PCI Express, что может стать критичным в случае использования нескольких видеокарт, соединённых в массив по технологиям SLI или CrossfireX. Пара (или большее число) GPU в этом случае окажется подключена к корневым хабам, расположенным в разных кристаллах Zeppelin, поэтому их взаимные коммуникации получат увеличенные латентности. В конечном итоге это может сделать доступный в платформе Threadripper режим PCI Express x16 + x16 даже более медленным вариантом, чем PCI Express x8 + x8 в случае обычных Ryzen, но это соображение ещё нуждается в дополнительной проверке.

#Платформа Socket sTR4 и набор системной логики X399

Ryzen Threadripper используют процессорное гнездо Socket sTR4 с 4096 контактами, которое до сих пор нигде и никогда не встречалось. Однако полностью новым его назвать всё же нельзя – сам разъём в смысле его конструкционного исполнения позаимствован у процессорной платформы EPYC и имеет точно такой же форм-фактор и конструкцию, как и серверный Socket SP3. Скорее всего, между этими разъёмами есть и частичная электрическая совместимость, а отличие состоит лишь в том, что в Socket sTR4 остаётся незадействованной часть контактов, которая отвечает за пятый-восьмой каналы памяти, за межсокетные соединения Infinity Fabric и за дополнительные линии PCI Express, которые есть у EPYC.

Тем не менее, если смотреть на Socket sTR4 глазами пользователя десктопных систем, то выглядит он совершенно безумно. Во-первых, он сразу же поражает своими габаритами: ещё бы, ведь в этом разъёме к процессору подводится более четырёх тысяч контактов, и это даже больше, чем используется в последнем поколении Xeon SP, не говоря уже о двукратном превосходстве над интеловскими CPU для HEDT-сегмента. Во-вторых, Socket sTR4 предполагает LGA-исполнение процессоров, которое компания AMD ранее никогда не использовала в своих продуктах для настольных компьютеров. И в-третьих, фиксация процессора внутри сокета происходит не привычными подпружиненными рычагами, а тремя винтами, которые обеспечивают более надёжный прижим и равномерное распределение механических усилий.

В результате установка процессора в Socket sTR4 превращается в целую эпопею, проиллюстрировать которую лучше всего может следующая схема.

Обратите внимание: непосредственно в Socket sTR4 процессор вставлять не требуется. Вместо этого он вдвигается в появившиеся внутри сокета специальные направляющие полозья, причём корпус CPU остаётся заключён в оранжевую пластиковую монтажную рамку, которая теперь сопровождает процессор на всём протяжении его жизненного цикла.

Для платформы Socket sTR4 компания AMD предлагает и собственный набор системной логики, получивший название X399. Однако на самом деле новым он не является, это простое переименование чипсета X370, используемого с Socket AM4-процессорами Ryzen. И в этом нет ничего удивительного: кристаллы Zeppelin, из которых собирается Ryzen Threadripper, содержат элементы южного моста. Поэтому многие возможности для подключения внешних устройств легко реализуются без каких-либо дополнительных микросхем, а чип X399 нужен лишь для добавления отдельных дополнительных портов.

Так, сами Ryzen Threadripper помимо 64 линий PCI Express 3.0 обеспечивают поддержку четырёх портов SATA и восьми портов USB 3.0. Микросхема же X399 подключается к процессору по четырём линиям PCI Express 3.0 и выступает дополнительным интегральным концентратором, который добавляет к имеющимся в самом Ryzen Threadripper возможностям поддержку двух портов USB 3.1, шести портов USB 3.0, шести портов USB 2.0, восьми SATA-портов и восьми линий PCI Express 2.0. В результате, платформа Socket sTR4 приобретает вполне достаточный на данном этапе набор характеристик, в котором не хватает разве только поддержки RAID-массивов, составленных из NVMe-накопителей.

Остающиеся в распоряжении пользователя после подсоединения к процессору чипсета 60 процессорных линий PCI Express 3.0 могут дробиться или собираться в любые наборы, но общее число поддерживаемых PCIe-устройств ограничено семью. Учитывая это, AMD приводит разные варианты систем, в которых эти линии тем или иным методом распределяются по различным устройствам. Компания указывает на возможность формирования не только игровых систем с несколькими видеокартами, но и компьютеров для рендеринга, рабочих станций для научных расчётов или систем для обработки видеоконтента. В качестве примера максимальной конфигурации, в частности, приводится сборка с четырьмя видеокартами и тремя NVMe накопителями, на которую, несмотря на грандиозность, ресурсов процессора хватает без каких-либо ограничений.

С HEDT-процессорами Intel аналогичная системы была бы невозможна, так как даже у премиальных процессоров семейства Core i9 число линий PCI Express 3.0, контролируемых процессором, ограничено 44.

Также нужно отметить и тот факт, что Ryzen Threadripper унаследовали от своих младших собратьев все способности к разгону. Коэффициент умножения в HEDT-процессорах AMD не заблокирован, а материнские платы на базе X399 обладают всеми привычными для пользователей Ryzen настройками для изменения частот, напряжений и параметров памяти.

Работает с Ryzen Threadripper и оверклокерская утилита Ryzen Master, которую можно применять для мониторинга и настройки параметров процессора в среде операционной системы Windows.

Несмотря на то, что Socket sTR4 – это принципиально новая экосистема, компании AMD вместе с партнёрами удалось неплохо подготовиться к запуску Ryzen Threadripper. Все основные производители материнских плат спроектировали и запустили серийное производство необходимых Socket sTR4-плат. Не остались в стороне и производители систем охлаждения. Иными словами, никакой неподготовленности инфраструктуры, как наблюдалась при запуске Ryzen 7, на этот раз не будет.

Сегодня, в день начала продаж Ryzen Threadripper, в магазинах должны появиться как минимум шесть разных Socket sTR4-плат компаний ASUS, Gigabyte, MSI и ASRock, а концу месяца ассортимент платформ расширится до более чем десятка разных вариантов.

Не должно быть проблем и с подходящими кулерами. Несмотря на то, что площадь поверхности теплораспределительной крышки процессоров Ryzen Threadripper очень велика, AMD считает возможным использование с ними уже имеющихся на рынке замкнутых систем жидкостного охлаждения Asetek, для полной совместимости с которыми в комплекте поставки Threadripper имеется необходимая система крепления. Это значит, что многие популярные СВО, продающиеся под марками Arctic, Cooler Master, Corsair, NZXT, Thermaltake и т. п., без каких-либо проблем встанут и на Ryzen Threadripper.

То же, что подошва водоблоков таких систем покрывает поверхность CPU далеко не полностью, причиной для переживаний быть не должно. Теплораспределительная крышка процессоров AMD сделана из медного сплава с высокой теплопроводностью и качественно снимает и передаёт дальше тепло с процессорных кристаллов благодаря тому, что в качестве внутреннего термоинтерфейса в Threadripper используется эффективный припой на основе индия.

#Модельный ряд Ryzen Threadripper

На данный момент компания AMD анонсировала три модели Ryzen Threadripper, отличающихся друг от друга в первую очередь количеством ядер. В семейство входят 16-, 12- и 8-ядерная версии. Базовые характеристики процессоров приведены в таблице.

Ядра/ потокиБазовая частота/ турбо, ГГцТехнология XFRL3-кеш, МбайтTDP, ВтЦена
Ryzen Threadripper 1950X 16/32 3,4/4,0 +200 МГц 32 180 $999
Ryzen Threadripper 1920X 12/24 3,5/4,0 +200 МГц 32 180 $799
Ryzen Threadripper 1900X 8/16 3,8/4,0 +200 МГц 16 180 $549

Сегодня, 10 августа, на рынок выходят первые две модели с 16 и 12 ядрами, 8-ядерная же модель будет выпущена 31 августа. Кроме того, есть информация, что в модельном ряду со временем появятся дополнительные версии Threadripper без литеры «X» на конце, которые будут отличаться пониженными частотами и тепловыделением на уровне 140 Вт, но пока это официальными источниками не подтверждается.

Все версии Threadripper основываются на одном и том же полупроводниковом базисе: двух кристаллах Zeppelin, объединённых в единое целое посредством шины Infinity Fabric. Соответственно, структура Threadripper включает четыре четырёхъядерных CCX-комплекса. Модификации процессоров с числом ядер, меньшим 16, получаются отключением одинакового количества ядер в каждом CCX. Иными словами, в 12-ядерном процессоре каждый CCX имеет по три активных ядра, а в 8-ядерном – по два. Кроме того, в восьмиядерной модели Ryzen Threadripper 1900X инженеры AMD собираются деактивировать половину кеш-памяти третьего уровня.

Зато в отношении всех остальных характеристик AMD настроена очень либерально. Все объявленные версии Ryzen Threadripper имеют схожие тактовые частоты, достигаемые в турбо-режиме, все они имеют также и достаточно агрессивную технологию XFR, способную на дополнительные 200 МГц увеличивать рабочую частоту процессоров в благоприятном температурном режиме. Отличия есть лишь в базовой частоте, что обусловлено рамками 180-ваттного теплового пакета. Впрочем, к частотам старших процессоров какие-то претензии предъявить очень сложно: 12-ядерный Ryzen Threadripper 1920X по этому параметру похож на старший восьмиядерник Ryzen 7 1800X, а 16-ядерный Ryzen Threadripper 1950X как минимум не уступает в рабочих частотах другому восьмиядернику, Ryzen 7 1700X. Причём, максимальные турбо-частоты процессоры семейства Ryzen Threadripper могут развивать при нагрузке на четыре ядра, в то время как Ryzen 7 способны на максимальный авторазгон при задействовании в работе лишь пары ядер.

Столь впечатляющие по частотам режимы работы AMD обеспечивает за счёт специального отбора для процессоров Threadripper наиболее удачных полупроводниковых кристаллов. Лишь только один из двадцати кристаллов Zeppelin оказывается достаточно хорош для того, чтобы попасть во флагманские HEDT-процессоры по параметрам частотного потенциала и тепловыделения, поэтому Ryzen Threadripper – это отборные и элитарные процессоры в прямом смысле этих эпитетов.

Важно отметить, что помимо числа ядер, частот и размера кеш-памяти, никаких других различий между моделями Threadripper нет. Intel дополнительно дифференцирует свои HEDT-процессоры путём урезания в младших моделях числа доступных линий PCI Express и искусственного снижения скорости исполнения AVX-512-инструкций. Члены же модельного рада Ryzen Threadripper никаких дополнительных или скрытых различий между собой не имеют: все они обладают полным набором из 64 линий PCI Express 3.0 и поддерживают по четыре канала DDR4 SDRAM с максимальной официальной частотой 2667 МГц.

Если ко всему этому прибавить весьма привлекательные цены, которые не выходят за 1000-долларовую планку, то кажется, что интеловская HEDT-платформа LGA2066 находится под серьёзным ударом. В частности, если исходить из стоимости, то 16-ядерный Ryzen Threadripper 1950X можно сопоставлять с 10-ядерным Core i9-7900X, у которого предложение AMD выигрывает не только по числу ядер, но и по другим характеристикам: немного – по базовой частоте, существенно – по общему объёму кеш-памяти и ощутимо – по числу линий PCI Express. Более того, выгодно на фоне Core i9-7900X выглядит даже 12-ядерный Ryzen Threadripper 1920X. Он не только на 20 процентов дешевле и обладает более развитыми средствами многопоточности, но так же как и Ryzen Threadripper 1950X, обходит интеловский десятиядерник по частотам, объёму кеш-памяти и возможностям контроллера PCI Express.

#Ryzen Threadripper 1950X и Ryzen Threadripper 1920X

Для знакомства с платформой Threadripper мы получили от компании AMD обе модели HEDT-процессоров, выход которых назначен на сегодня.

Спецификации моделей:

 Ryzen Threadripper 1950XRyzen Threadripper 1920X
Внутренняя топология Два кристалла Zeppelin: 4+4 и 4+4 Два кристалла Zeppelin: 3+3 и 3+3
L2-кеш 512 Кбайт на ядро
8 Мбайт суммарно
512 Кбайт на ядро
6 Мбайт суммарно
L3-кеш 8 Мбайт на CCX
32 Мбайт суммарно
Базовая частота 3,4 ГГц 3,5 ГГц
Турбо-режим До 3,7 ГГц при нагрузке на 16 ядер
До 4,0 ГГц при нагрузке на 4 ядра До 4,2 ГГц при активации XFR (4 ядра)
Поддержка SMT Есть
Линии PCI Express 3.0 64 (4 линии зарезервировано на чипсет)
Каналы DDR4 SDRAM 4
Частота памяти До DDR4-2666 (Single Rank, 1 DIMM на канал)
Поддержка ECC Есть
TDP 180 Вт
Процессорное гнездо Socket sTR4

В работе эти процессоры выглядят так. 16-ядерный Ryzen Threadripper 1950X:

Частота такого процессора при полной ресурсоёмкой нагрузке на все ядра составляет порядка 3,3 ГГц, что даже ниже номинального значения, определённого в спецификациях. Зато при этом процессор сохраняет весьма невысокую рабочую температуру. При использовании системы жидкостного охлаждения Corsair Hydro Series H115i нагрев не превышал 58 градусов.

Снижение сложности накладываемой на процессор нагрузки ожидаемо приводит к увеличению тактовой частоты. Например, при запуске тестирования Prime95 29.2 в однопоточном режиме, Ryzen Threadripper 1950X работает на частоте порядка 4,1 ГГц, а при исполнении четырёх потоков реальная частота «гуляет» в районе 3,95-4,0 ГГц. Впрочем нужно понимать, что частота корректируется технологией XFR, а она опирается на температуры. Поэтому на практике разные экземпляры процессоров, работающие с разными системами охлаждения, могут показывать слегка отличающиеся результаты.

Как и в случае обычных Ryzen, термодатчик Ryzen Threadripper (Tctl) возвращает значения температуры процессора со значительным смещением, составляющим 27 градусов. По словам AMD, оно нужно для правильной настройки профилей работы систем охлаждения. Однако свежие версии популярной утилиты HWINFO64 уже учитывают эту особенность и отображают не только значение Tctl, но и скорректированное значение Tdie, на которое можно ориентироваться для оценки температурного режима.

12-ядерный Ryzen Threadripper 1920X:

При максимальной нагрузке, производимой Prime95 29.2, процессор работает на частоте около 3,55 ГГц. Системе жидкостного охлаждения при полной нагрузке на CPU удавалось удерживать его температуру в пределах 66 градусов. Снижение нагрузки позволяло процессору постепенно увеличивать свою реальную частоту вплоть до величин порядка 4,15 ГГц в случае исполнения одного потока.

Как видно по приведённым скриншотам, в основе процессоров Ryzen Threadripper лежат абсолютно те же самые ядра Zeppelin степпинга B1, которые применяются в массовых процессорах Ryzen. Поэтому в целом от многоядерных новинок никаких сюрпризов ждать не приходится: они по своим повадкам должны быть похожи на младших собратьев.

#Разгон

Разгон процессоров Ryzen Threadripper в целом похож на разгон обычных Ryzen, что, в общем-то, совершенно закономерно. Никаких специальных, свойственных лишь платформе Socket sTR4, настроек в данном случае не предлагается, и для увеличения частоты выше номинальных значений можно пользоваться привычным методом – простым наращиванием коэффициента умножения CPU с одновременной прибавкой в напряжении питания. Правда, в случае с HEDT-платформой AMD заметно большие, чем обычно, неприятности приносит чрезмерный нагрев процессора. Суммарное тепловыделение двух кристаллов Zeppelin, упрятанных внутри Ryzen Threadripper, при разгоне нарастает очень быстро, и именно это ограничивает максимальные частоты, до которых можно добраться, не прибегая к каким-то экстремальным методам теплоотвода. Иными словами, качественное охлаждение – это ключ к покорению оверклокерских вершин.

Максимально допустимая температура Ryzen Threadripper, при которой активируется троттлинг, составляет 85 градусов для 16-ядерного процессора и 87 градусов – для процессора с 12 ядрами. Используемая нами в тестовой платформе замкнутая система жидкостного охлаждения Corsair Hydro Series H115i, опирающаяся на 280-миллиметровый радиатор, если ориентироваться на тяжёлую вычислительную нагрузку, создаваемую утилитой Prime95 29.2, оказалась способна не допускать перегрева и троттлинга Ryzen Threadripper лишь в том случае, если напряжение питания таких CPU не превышает уровень в 1,325-1,375 В. И именно данный фактор стал главным барьером в разгоне: ни о каких 1,4-1,45 В, которые можно было беспрепятственно выбирать при оверклокерских экспериментах с Ryzen 7, теперь речь не идёт.

Предельный уровень напряжения, который позволял работать нашему экземпляру старшего 16-ядерного Ryzen Threadripper 1950X без перегрева в тестах стабильности, составил всего лишь 1,325 В. Тем не менее, даже с таким питанием нам удалось добиться прохождения процессором полного цикла тестирования в Prime95 29.2 на частоте 3,9 ГГц, что является вполне нормальным результатам разгона даже по меркам восьмиядерных Ryzen 7.

Как видно по скриншоту, температура при проверке стабильности приближалась к критическим значениям, но троттлинга, при активации которого частота отдельных ядер Ryzen Threadripper сбрасывается до 600 МГц, избежать удалось.

Второй тестовый процессор, 12-ядерный Ryzen Threadripper 1920X, получилось разогнать немного лучше. Возможно, нам повезло с конкретным экземпляром, но по сравнению с 16-ядерной моделью он не перегревался и при существенно более высоком напряжении питания. Благодаря этому выше оказалась и финальная частота: с напряжением питания 1,375 В процессор стабильно работал при любой нагрузке на частоте 4,0 ГГц.

Естественно, температура в Prime95 29.2 при этом находилась «на грани» и достигала в пике 85,5 градусов, однако никаких проблем со стабильностью или падений частоты из-за этого не возникало.

В конечном же итоге можно сказать, что разгон процессоров серии Ryzen Threadripper в смысле достижимых частот приносит примерно те же результаты, что и разгон обычных Ryzen 7. Если делать ставку на обычные имеющиеся в продаже системы жидкостного охлаждения, то похоже, что вполне можно рассчитывать на получение частот порядка 3,9-4,0 ГГц. Это не намного выше номинальных значений, установленных для Ryzen Threadripper, но таковы уж особенности применяемого для производства кристаллов Zeppelin LPP-техпроцесса с FinFET-транзисторами и 14-нм нормами, который в исполнении GlobalFoundries выдаёт продукцию именно такого качества.

Кроме того, определённый негатив в процесс разгона вероятно вносит и отсутствие систем охлаждения, разработанных непосредственно под Ryzen Threadripper. Высокий нагрев – это первая преграда, в которую упирается оверклокинг. Совместимые же с Ryzen Threadripper и рекомендованные AMD системы жидкостного охлаждения имеют водоблоки «старого образца», которые не закрывают процессор полностью. AMD считает, что это сказывается на теплоотводе не слишком критично, однако нам кажется, что с выходом специализированных систем охлаждения с водоблоками, полностью закрывающими теплораспределительную крышку процессора, предел разгона можно будет отодвинуть на 100-200 МГц дальше.

«Пятно контакта» водоблока Asetek с процессором AMD Ryzen Threadripper

«Пятно контакта» водоблока Asetek с процессором AMD Ryzen Threadripper

Впрочем, особых поводов для расстройства покорённые оверклокерские рубежи на самом деле на дают. Хотя близких частот получается добиться и с обычными Socket AM4-процессорами семейства Ryzen, в нашем случае речь фактически идёт о гораздо более сложном разгоне капризной двухпроцессорной системы, которая, несмотря на все «но», показывает почти такой же оверклокерский потенциал. Видимо производитель действительно отбирает для Ryzen Threadripper лучшие кристаллы Zeppelin. Тесты показали, что полупроводниковые устройства, составляющие HEDT-процессоры AMD, способны работать на частотах порядка 4,0 ГГц при сравнительно невысоком уровне напряжения, чего от обычных массовых процессоров Ryzen удаётся добиться крайне редко.

Тестирование. Выводы

#Описание тестовых систем и методики тестирования

Компания AMD приходит в сегмент HEDT-систем впервые, и сразу предлагает весьма оригинальный подход к созданию таких решений. В результате получается, что прямых конкурентов у Ryzen Threadripper нет. Даже имеющиеся у Intel на данный момент процессоры из той же ценовой категории заметно проигрывают новинкам по количеству предоставляемых в распоряжение пользователя вычислительных ядер. Микропроцессорный гигант только готовит свои многоядерные Core i9, которые смогут стать адекватным ответом на Ryzen Threadripper, и выйдут они в конце сентября. А пока сравнивать новые HEDT-процессоры AMD придётся с десятиядерным Skylake-X, а также с флагманскими процессорами массовых серий Core i7 и Ryzen 7.

В конечном итоге список задействованных в тестировании комплектующих получился таким:

  • Процессоры:
    • AMD Ryzen Threadripper 1950X (Threadripper, 16 ядер + SMT, 3,4-4,0 ГГц, 32 Мбайт L3);
    • AMD Ryzen Threadripper 1920X (Threadripper, 12 ядер + SMT, 3,5-4,0 ГГц, 32 Мбайт L3);
    • AMD Ryzen 7 1800X (Summit Ridge, 8 ядер + SMT, 3,6-4,0 ГГц, 16 Мбайт L3);
    • Intel Core i9-7900X (Skylake-X, 10 ядер + HT, 3,3-4,5 ГГц, 13,75 Мбайт L3);
    • Intel Core i7-7700K (Kaby Lake, 4 ядра + HT, 4,2-4,5 ГГц, 8 Мбайт L3);
    • Intel Core i7-6950X Extreme Edition (Broadwell-E, 10 ядер + HT, 3,0-4,0 ГГц, 25 Мбайт L3).
  • Процессорный кулер: СВО Corsair Hydro Series H115i.
  • Материнские платы:
    • ASUS Crosshair VI Hero (Socket AM4, AMD X370);
    • ASUS Maximus IX Hero (LGA 1151, Intel Z270);
    • ASUS Prime X299-Deluxe (LGA 2066, Intel X299);
    • ASUS X99-Deluxe (LGA 2011-v3, Intel X99);
    • ASUS Zenith Extreme (Socket sTR4, AMD X399).
  • Память: 4 × 8 Гбайт DDR4-3200 SDRAM, 14-14-14-34 (2 x G.Skill Trident Z RGB F4-3200C14D-16GTZR).
  • Видеокарта: NVIDIA Titan X (GP102, 12 Гбайт/384-бит GDDR5X, 1417-1531/10000 МГц).
  • Дисковая подсистема: Kingston HyperX Savage 480 GB (SHSS37A/480G).
  • Блок питания: Corsair RM850i (80 Plus Gold, 850 Вт).

Тестирование выполнялось в операционной системе Microsoft Windows 10 Enterprise Build 15063 с использованием следующего комплекта драйверов:

  • AMD Chipset Driver 17.10;
  • AMD IOMMU Driver 1.2.0.0030;
  • Intel Chipset Driver 10.1.1.38;
  • Intel Management Engine Interface Driver 11.6.0.1030;
  • Intel Turbo Boost Max 3.0 Technology Driver 1.0.0.1031;
  • NVIDIA GeForce 384.76 Driver.

Производительность процессоров Ryzen Threadripper исследовалась в двух режимах работы памяти: в локальном (NUMA), который включается по умолчанию, и распределённом (UMA).

Описание использовавшихся для измерения вычислительной производительности инструментов:

Комплексные бенчмарки:

  • BAPCo SYSmark 2014 SE – тестирование в сценариях Office Productivity (офисная работа: подготовка текстов, обработка электронных таблиц, работа с электронной почтой и посещение интернет-сайтов), Media Creation (работа над мультимедийным контентом — создание рекламного ролика с использованием предварительно отснятых цифровых изображений и видео), Data/Financial Analysis (обработка архива с финансовыми данными, их статистический анализ и прогнозирование инвестиций на основе некой модели) и Responsiveness (анализ отзывчивости системы при запуске приложений, открытии файлов, работе с интернет-браузером с большим количеством открытых вкладок, мультизадачности, копировании файлов, пакетных операциях с фотографиями, шифровании и архивации файлов и установке программ).
  • Futuremark 3DMark Professional Edition 2.2.3509 — тестирование в сцене Time Spy 1.0.

Приложения:

  • Adobe After Effects CC 2017 – тестирование скорости рендеринга методом трассировки лучей. Измеряется время, затрачиваемое системой на обсчёт в разрешении 1920 × [email protected] заранее подготовленного видеоролика.
  • Adobe Photoshop CC 2017 — тестирование производительности при обработке графических изображений. Измеряется среднее время выполнения тестового скрипта, представляющего собой творчески переработанный Retouch Artists Photoshop Speed Test, который включает типичную обработку четырёх 24-мегапиксельных изображений, сделанных цифровой камерой.
  • Adobe Photoshop Lightroom 6.8 – тестирование производительности при пакетной обработке серии изображений в RAW-формате. Тестовый сценарий включает постобработку и экспорт в JPEG с разрешением 1920 × 1080 и максимальным качеством двухсот 16-мегапиксельных изображений в RAW-формате, сделанных цифровой камерой Fujifilm X-T1.
  • Adobe Premiere Pro CC 2017 — тестирование производительности при нелинейном видеомонтаже. Измеряется время рендеринга в формат H.264 Blu-Ray проекта, содержащего HDV 1080p25 видеоряд с наложением различных эффектов.
  • Blender 2.78c – тестирование скорости финального рендеринга в одном из популярных свободных пакетов для создания трёхмерной графики. Измеряется продолжительность построения финальной модели из Blender Cycles Benchmark rev4.
  • Corona 1.3 – тестирование скорости рендеринга при помощи одноимённого рендерера. Измеряется скорость построения стандартной сцены BTR, используемой для измерения производительности.
  • Visual Studio 2017 (15.1) – измерение времени компиляции крупного MSVC-проекта – профессионального пакета для создания трёхмерной графики Blender версии 2.78c.
  • Stockfish 8 (240717) – тестирование скорости работы популярного шахматного движка. Измеряется скорость перебора вариантов в позиции «1q6/1r2k1p1/4pp1p/1P1b1P2/3Q4/7P/4B1P1/2R3K1 w»;
  • V-Ray 3.57.01 – тестирование производительности работы популярной системы рендеринга при помощи стандартного приложения V-Ray Benchmark;
  • WinRAR 5.50 — тестирование скорости архивации. Измеряется время, затрачиваемое архиватором на сжатие директории с различными файлами общим объёмом 1,7 Гбайт. Используется максимальная степень компрессии.
  • x264 r2851 — тестирование скорости транскодирования видео в формат H.264/AVC. Для оценки производительности используется исходный [email protected] AVC-видеофайл, имеющий битрейт около 30 Мбит/с.
  • x265 2.4+14 8bpp — тестирование скорости транскодирования видео в перспективный формат H.265/HEVC. Для оценки производительности используется тот же видеофайл, что и в тесте скорости транскодирования кодером x264.

Игры:

  • Ashes of Singularity. Разрешение 1920 × 1080: DirectX 11, Quality Profile = High, MSAA=2x. Разрешение 3840 × 2160: DirectX 11, Quality Profile = Extreme, MSAA=Off.
  • Battlefield 1. Разрешение 1920 × 1080, DirectX 11, Graphics Quality = Ultra. Разрешение 3840 × 2160, DirectX 11, Graphics Quality = Ultra.
  • Civilization VI. Разрешение 1920 × 1080, DirectX 11, MSAA = 4x, Performance Impact = Ultra, Memory Impact = Ultra. Разрешение 3840 × 2160, DirectX 11, MSAA = 4x, Performance Impact = Ultra, Memory Impact = Ultra.
  • Deus Ex: Mankind Divided. Разрешение 1920 × 1080: DirectX 11, Preset = Very High. Разрешение 3840 × 2160: DirectX 11, Preset = Very High.
  • Grand Theft Auto V. Разрешение 1920 × 1080: DirectX Version = DirectX 11, FXAA = Off, MSAA = x4, NVIDIA TXAA = Off, Population Density = Maximum, Population Variety = Maximum, Distance Scaling = Maximum, Texture Quality = Very High, Shader Quality = Very High, Shadow Quality = Very High, Reflection Quality = Ultra, Reflection MSAA = x4, Water Quality = Very High, Particles Quality = Very High, Grass Quality = Ultra, Soft Shadow = Softest, Post FX = Ultra, In-Game Depth Of Field Effects = On, Anisotropic Filtering = x16, Ambient Occlusion = High, Tessellation = Very High, Long Shadows = On, High Resolution Shadows = On, High Detail Streaming While Flying = On, Extended Distance Scaling = Maximum, Extended Shadows Distance = Maximum. Разрешение 3840 × 2160: DirectX Version = DirectX 11, FXAA = Off, MSAA = Off, NVIDIA TXAA = Off, Population Density = Maximum, Population Variety = Maximum, Distance Scaling = Maximum, Texture Quality = Very High, Shader Quality = Very High, Shadow Quality = Very High, Reflection Quality = Ultra, Reflection MSAA = x4, Water Quality = Very High, Particles Quality = Very High, Grass Quality = Ultra, Soft Shadow = Softest, Post FX = Ultra, In-Game Depth Of Field Effects = On, Anisotropic Filtering = x16, Ambient Occlusion = High, Tessellation = Very High, Long Shadows = On, High Resolution Shadows = On, High Detail Streaming While Flying = On, Extended Distance Scaling = Maximum, Extended Shadows Distance = Maximum.
  • Hitman™. Разрешение 1920 × 1080: DirectX 12, Super Sampling = 1.0, Level of Detail = Ultra, Anti-Aliasing = FXAA, Texture Quality = High, Texture Filter = Anisotropic 16x, SSAO = On, Shadow Maps = Ultra, Shadow Resolution = High. Разрешение 3840 × 2160: DirectX 12, Super Sampling = 1.0, Level of Detail = Ultra, Anti-Aliasing = Off, Texture Quality = High, Texture Filter = Anisotropic 16x, SSAO = On, Shadow Maps = Ultra, Shadow Resolution = High.
  • Total War: WARHAMMER. Разрешение 1920 × 1080: DirectX 11, Quality = Ultra. Разрешение 3840 × 2160: DirectX 11, Quality = Ultra.
  • Warhammer 40,000: Dawn of War III. Разрешение 1920 × 1080: Image Quality = Maximum, Texture Detail = Higher, Gameplay Resolution = 100%, Unit Occlusion = Enabled, Anti-Aliasing = On, Physics = High. Разрешение 3840 × 2160: Image Quality = Maximum, Texture Detail = Higher, Gameplay Resolution = 100%, Unit Occlusion = Enabled, Anti-Aliasing = On, Physics = High.
  • Watch Dogs 2. Разрешение 1920 × 1080: Field of View = 70°, Pixel Density = 1.00, Graphics Quality = Ultra, Extra Details = 100%. Разрешение 3840 × 2160: Field of View = 70°, Pixel Density = 1.00, Graphics Quality = Ultra, Extra Details = 100%.

Во всех игровых тестах в качестве результатов приводится среднее количество кадров в секунду, а также 0,01-квантиль (первая перцентиль) для значений fps. Использование 0,01-квантиля вместо показателей минимального fps обусловлено стремлением очистить результаты от случайных всплесков производительности, которые были спровоцированы не связанными напрямую с работой основных компонентов платформы причинами.

#Производительность в комплексных бенчмарках

SYSmark 2014 SE – главный комплексный тест, по которому можно судить о том, какую средневзвешенную производительность выдает та или иная система в самых распространённых и самых массовых приложениях. Задачи такого рода, решаемые на типичных персональных компьютерах, чувствительны к латентности подсистемы памяти и, начиная с какого-то предела, мало выигрывают от наращивания числа вычислительных ядер. Поэтому нет ничего удивительного в том, что процессоры Ryzen Threadripper не находятся во главе диаграммы, а проигрывают интеловским конкурентам. Но не будем делать из этого трагедии: всё-таки Threadripper – это особенная платформа, к проверке быстродействия которой обычные инструменты не слишком применимы.

Больше информации могут дать результаты, полученные в отдельных сценариях SYSmark 2014 SE.

По расшифровке результатов SYSmark 2014 SE практически сразу можно понять, где Ryzen Threadripper будут особенно сильны. Ресурсоёмкая вычислительная нагрузка – это весьма благоприятный сценарий для таких процессоров, способных предложить в распоряжение пользователя настольной системы беспрецедентный массив из ядер.

А вот результат Threadripper в сценарии, посвящённом работе с медиа-файлами, не слишком высок, хотя логично было бы, если бы мощность новинки AMD раскрылась бы и в нём. Многие существующие приложения для обработки изображений, видео и звука попросту не умеют обращаться с серьёзными многоядерными процессорами. Впрочем, нужно оговорится, что в SYSmark 2014 SE входит не самый современный набор приложений, а ситуация с поддержкой многопоточности постепенно меняется в лучшую сторону.

Похоже, что масштабированию с ростом числа ядер показателей производительности в 3DMark Time Spy постепенно наступает конец. Разница между 16-ядерным Ryzen Threadripper 1950X и 12-ядерным Ryzen Threadripper 1920X получается совсем небольшая, причём оба эти процессора уступают интеловскому 10-ядернику Core i9-7900X. Однако наиболее интересно в полученных результатах даже не это, а то, насколько большой прирост производительности может обеспечить включение распределённого режима обращений к подсистеме памяти. Благодаря включению UMA-архитектуры с полноценным четырёхканальным доступом к памяти результат теста CPU поднимается на 15-20 процентов.

#Производительность в ресурсоёмких приложениях

Рендеринг

Обработка фото

Обработка видео

Перекодирование видео

Архивация

Компиляция

Шахматы

В целом в ресурсоёмких приложениях производительность Ryzen Threadripper выглядит очень впечатляюще. Здесь такие многоядерные процессоры чувствуют себя явно на своем месте, поэтому в задачах рендеринга, при работе с видео, в компиляции и прочих хорошо распараллеливаемых счётных задачах Ryzen Threadripper удаётся установить новые рекорды быстродействия для настольных решений. По понятным причинам особенно выделяется своими результатами 16-ядерный Ryzen Threadripper 1950X: в благоприятных условиях ему удаётся превосходить старший интеловский HEDT-процессор на величину в 25-30 процентов. Впрочем, не ударяет лицом в грязь и 12-ядерный Ryzen Threadripper 1920X: его производительность в ресурсоёмких счётных задачах примерно соответствует уровню Core i9-7900X, что с учётом заметно более низкой цены – серьёзный аргумент.

Впрочем, тестирование позволяет выявить и ситуации, в которых быстродействие Ryzen Threadripper оказывается не таким блестящим. В частности, при архивации, работе с изображениями и при работе с кодером x265 новый 10-ядерный процессор Intel Core i9-7900X выдаёт более высокую производительность. Тем не менее, перевес в скорости работы находится на стороне старшего HEDT-процессора компании AMD явно в большем числе случаев.

Попутно отметим, что в случае HEDT-платформы компании AMD для творческих приложений, используемых для создания и обработки цифрового контента, лучше подходит распределённый UMA-режим работы с памятью. В среднем он позволяет поднять производительность на дополнительные 5-7 процентов.

#Производительность в играх

Говоря об игровой производительности в первую очередь необходимо отметить, что 16- и 12-ядерный процессоры класса Ryzen Threadripper не относятся к разряду игрового железа. Поэтому представленные в этом разделе результаты тестов не стоит воспринимать слишком близко к сердцу.

Тем не менее, среди наших читателей наверняка найдутся и такие, которые заинтересуются возможностью применения Ryzen Threadripper 1950X или Ryzen Threadripper 1920X именно в роли процессора для экстремальной геймерской системы, поэтому исключать из рассмотрения игры мы не стали. И более того, для полноты картины тесты были проведены в двух режимах: в разрешении Full HD, где процессорная составляющая производительности раскрывается более выпукло, и в 4K-разрешении, больше подходящем для использования в системах с процессорами HEDT-класса.

Тесты в разрешении Full HD:

Бескомпромиссным игровым процессором Ryzen Threadripper, естественно, стать не могут. Сама по себе архитектура Ryzen, предполагающая использование CCX-комплексов со сравнительно медленным межъядерным соединением, не даёт возможности процессорам AMD конкурировать со старшим четырёхъядерным Kaby Lake, оспорить лидерство которого не могут ни HEDT-платформы Intel, ни AMD.

Однако справедливости ради стоит заметить, что за прошедшие со времени появления первых процессоров Ryzen месяцы AMD смогла неплохо отполировать свою архитектуру через обновления AGESA и всевозможные патчи, и теперь Ryzen Threadripper на фоне интеловских решений выглядит не так удручающе, как поначалу смотрелся Ryzen 7 1800X.

Если же сравнивать игровую производительность 16-ядерного Ryzen Threadripper 1950X с со скоростью его прямого конкурента, 10-ядерного Core i9-7900X, то окажется, что превосходство предложения Intel, так где оно есть, составляет лишь единицы процентов. Впрочем, нужно понимать, что часть заслуги в таком положении вещей лежит на самой Intel, которая в своём процессорном дизайне Skylake-X внедрила более медленную ячеистую структуру межъядерных соединений, которая увеличила латентности.

Тесты в разрешении 4K:

В высоких разрешениях определяющую роль в игровой производительности начинает играть графическая карта, поэтому разница в результатах различных CPU высокого класса в глаза совсем не бросается. Любого из производительных CPU, представленных в тесте, для раскрытия флагманской видеокарты вполне хватает. И даже более того, в 4K-разрешении какого-либо отставания Ryzen Threadripper от интеловских конкурентов не наблюдается вообще. А это значит, что и Ryzen Threadripper 1950X, и Ryzen Threadripper 1920X предлагают вполне достаточный на современном этапе уровень игровой производительности.

Впрочем, необходимо ещё раз подчеркнуть, что приобретать тысячедолларовые процессоры уровня Ryzen Threadripper или Core i9-7900X для систем, предназначенных исключительно для игрового использования, не имеет никакого смысла. В разы более дешёвый четырёхъядерный Core i7-7700K способен при таком применении обеспечить как минимум не худшее быстродействие.

#Энергопотребление

Посмотреть на потребление Ryzen Threadripper очень любопытно. Это первые десктопные процессоры на нашей практике, которым приписывается 180-ваттный тепловой пакет. Причём, похоже под этим значением есть все основания, ведь Threadripper по сути – это пара Ryzen, старшие модели которых имеют расчётное тепловыделение на уровне 95 Вт.

Впрочем, мы уже успели познакомиться с десятиядерным Core i9-7900X поколения Skylake-X, которому, несмотря на установленную в 140 Вт характеристику TDP удалось поставить несколько антирекордов по потреблению. Поэтому ещё один интересный вопрос, на который должно дать ответ тестирование потребления, касается того, превосходят ли Ryzen Threadripper по своим энергетическим аппетитам HEDT-процессоры Intel в реальности.

Используемый нами в тестовой системе новый цифровой блок питания Corsair RM850i позволяет контролировать потребляемую и выдаваемую электрическую мощность, чем мы и пользуемся для измерений. На графике ниже приводится полное потребление систем (без монитора), измеренное «после» блока питания и представляющее собой сумму энергопотребления всех задействованных в системе компонентов. КПД самого блока питания в данном случае не учитывается.

В простое процессоры Ryzen Threadripper и платформа X399 демонстрирует сравнительно высокое потребление, занимая по данной характеристике лидирующее положение. Причём, честно говоря, 80 Вт без какой-либо полезной нагрузки кажутся чрезмерными не только в сравнении с другими процессорами, но и по абсолютному значению.

Любопытно, но при рендеринге старший 16-ядерный Ryzen Threadripper 1950X демонстрирует потребление ниже, чем 10-ядерный Core i9-7900X. Получается, что у AMD вышло сделать не просто высокопроизводительный процессор, но и решение с превосходной удельной производительностью на каждый затраченный ватт в своём классе.

Правда, справедливости ради стоит отметить, что в этот раз измеренное потребление Core i9-7900X оказалось выше значений, которые были зафиксированы нами в прошлый раз, в обзоре, посвящённом старшему Skylake-X. Причиной таких перемен стал тот факт, что в данном случае тесты выполнялись с серийным процессором, взятым в одном из розничных магазинов, а не с образцом, присланным Intel.

Ситуация не меняется и в случае использования утилиты Prime95 29.2, которая генерирует запредельно высокую вычислительную нагрузку. Как при использовании AVX-инструкций, так и без них, оба процессора Ryzen Threadripper оказываются экономичнее старшего десятиядерника Intel поколения Skylake-X.

В то же время системы на базе Ryzen Threadripper потребляют примерно в полтора раза больше по сравнению с платформами на базе Ryzen 7, что при одной только процессорной нагрузке приводит к необходимости предоставлять им более 250 Вт мощности. А это значит, что для конфигураций на базе HEDT-процессоров AMD рекомендуется использовать не только производительное охлаждение, но и высококлассные блоки питания.

#Выводы

Ещё год назад поверить в то, что AMD вернётся в самый верхний сегмент процессорного рынка, было совершенно невозможно. Но всё сложилось именно таким образом: микроархитектура Zen смогла, что называется «выстрелить», и на данный момент у компании есть прекрасный строительный материал, из которого она буквально штампует продукты самого разного уровня. Новая микроархитектура оказалась настолько универсальной, что к настоящему моменту она дала жизнь не только массовым чипам, но и дорогим высококлассным процессорам, ориентированным на применение в серверах и рабочих станциях. Но только лишь этим AMD ограничиваться не собирается. Сегодня в истории экспансии Zen поставлена ещё одна важная веха: компания возвращается в сегмент высокопроизводительных настольных систем, из которого она была вытеснена более десяти лет назад. Причём возвращается отнюдь не робко, а с дерзкой заявкой на лидерство, сразу же поднимая планку таких решений.

Выводя на рынок новое семейство процессоров Ryzen Threadripper, компания AMD предлагает не мелочится, и дать в руки энтузиастов высокой производительности процессоры сразу с 16 вычислительными ядрами. По мнению специалистов компании, программная экосистема уже вполне готова для того, чтобы суметь загрузить такой объём аппаратных ресурсов. И судя по всему, они не ошибаются. Тестирование показало, что многие популярные приложения для создания и обработки цифрового контента относятся к подобным гиперъядерным CPU вполне благосклонно. А поскольку у Intel в настоящее время есть HEDT-чипы лишь с числом ядер, не превышающим десять, Ryzen Threadripper моментально оказываются вариантом, претендующим на лидерство в соответствующем сегменте.

Причём во многих случаях его претензии вполне обоснованы. Микроархитектура Zen обеспечивает вполне конкурентный уровень удельной производительности, применяемая в современных многоядерных процессорах AMD схема межъядерных соединений при помощи фирменной шины Infinity Fabriс обеспечивает хорошую масштабируемость таких решений с минимальными накладными расходами, а 14-нм техпроцесс позволяет получающимся чипам работать на сравнительно высоких тактовых частотах. Всё это в комплексе действительно делает 16-ядерный Ryzen Threadripper 1950X самым быстродействующим процессором для решения творческих ресурсоёмких задач.

Финальный рендеринг и работа с видео – два основных направления, на которых Ryzen Threadripper предлагает заметное превосходство над любыми существующими альтернативами, включая и старший интеловский HEDT-процессор, Core i9-7900X. Конечно мы знаем, что, находясь под сильным впечатлением от новых процессоров AMD, компания Intel собирается через пару месяцев предложить и свои CPU премиального уровня со сравнимым числом ядер. Но у Threadripper есть и ещё один козырь, перебить который Intel судя по всему не сумеет. Это – цена, ведь с этой позиции 16-ядерник AMD противопоставляется 10-ядернику компании Intel. А значит, вне зависимости от дальнейших событий на рынке, Ryzen Threadripper сохранит звание процессора с наиболее выгодной стоимостью за ядро.

Мы очень редко даём какие-то конкретные рекомендации, но Ryzen Threadripper этого действительно заслуживает. Старшие процессоры данного семейства отлично подойдут всем тем, кто много и профессионально работает над производством контента, и вряд ли какие-то интеловские альтернативы в ближайшей перспективе смогут предложить близкое сочетание цены и производительности в задачах такого класса.

Но в заключение же всё же стоит предостеречь: несмотря на все сильные стороны Ryzen Threadripper – это не совсем универсальное высокопроизводительное решение. Во многих ситуациях его потенциал раскрывается не полностью, что связано со многими причинами: с несколько более низкой, чем у интеловских CPU, однопоточной производительностью; с относительно высокими задержками при межъядерной коммуникации; с особенностями строения контроллера памяти, разнесённого по разным кристаллам; и с другими тонкостями архитектуры. Но AMD постаралась сделать так, чтобы в профиле производительности Ryzen Threadripper не было явных провалов: и это у неё получилось. В конечном итоге с системой, построенной на такой многоядерной новинке, можно без каких-либо проблем играть в игры, ставить оверклокерские эксперименты или просто заниматься разнообразной деятельностью. А это значит, что попытка AMD закрепиться в сегменте премиальных настольных систем имеет хорошие шансы увенчаться успехом.

Hardcore


Оригинал материала: https://3dnews.ru/956770