Сегодня 22 декабря 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Процессоры и память

Ryzen 5000 (Zen 3) против Rocket Lake (Cypress Cove): что показал тест IPC

⇣ Содержание

Вопрос, ответу на который посвящена эта статья, носит скорее теоретический, чем прикладной характер. Тем не менее он нередко всплывает в различных сетевых спорах, а потому определённо нуждается в специальном разборе. Речь идёт о IPC (instructions per cycle) – характеристике удельной производительности, описывающей быстродействие той или иной микроархитектуры в отрыве от тактовой частоты.

AMD и Intel, выводя на рынок последние поколения десктопных процессоров, сделали особый акцент на том, что им удалось заметно улучшить эффективность используемых микроархитектур и увеличить удельную производительность используемых ядер в пересчёте на гигагерц. Так, для семейства процессоров Ryzen 5000, основанных на архитектуре Zen 3, компания AMD заявила о росте IPC по сравнению с прошлым поколением на 19 %. Это – немного оптимистичная оценка, но в собственном тестировании мы смогли подтвердить, что существенный прирост действительно имеет место. Только по нашим данным удельная производительность Zen 3 по сравнению с Zen 2 выросла на 11 % в ресурсоёмких приложениях и на 16 % в играх.

Не отстаёт от AMD и Intel. В недавно выпущенных процессорах Core 11-го поколения, основанных на дизайне Rocket Lake, почти такой же, как в Zen 3, прирост показателя IPC — на уровне 19 %. Мы не проверяли это утверждение собственными тестами напрямую, но, поскольку в основе Rocket Lake лежит микроархитектура Cypress Cove, которая представляет собой 14-нм порт мобильной микроархитектуры Sunny Cove, декларируемая величина вряд ли далека от истины. Процессоры Ice Lake, где используются ядра Sunny Cove, действительно заметно быстрее предшественников на микроархитектуре Skylake, несмотря на довольно близкие тактовые частоты.

Таким образом, и Zen 3, и Rocket Lake принесли с собой заметный прогресс не только по видимым в спецификациях численным характеристикам процессоров, но и по росту удельной производительности. Однако такие перемены вызывают дополнительные вопросы. Если предложения AMD и Intel стали заметно лучше по сравнению со своими предшественниками, то как они теперь соотносятся между собой? Частоты, количество ядер или размеры кеш-памяти разных процессоров сопоставлять очень просто, но как быть с эффективностью микроархитектур? Чтобы разобраться, нужны специальные тесты, и мы решили провести именно такое исследование. Им мы ответим на вопрос: который из производителей x86-процессоров – AMD или Intel – обладает сейчас наиболее эффективной микроархитектурой?

#Как выглядит противостояние Ryzen 5000 и Rocket Lake на первый взгляд

В обзорах новых процессоров Rocket Lake, Core i7-11700K и Core i9-11900K, мы пришли к выводу, что старшие представители этой серии могут соперничать по производительности с процессорами Ryzen 5000 толькосреднего уровня — например, с Ryzen 7 5800X. Так получается потому, что AMD сумела обойти Intel по степени интеграции своих решений. Современные десктопные CPU на базе микроархитектуры Zen 3 могут содержать до 16 вычислительных ядер, максимум же для Rocket Lake – это восемь ядер.

Преимущество AMD в числе ядер обуславливается двумя факторами: внедрением более современного техпроцесса и переходом на чиплетный дизайн. Процессоры семейства Ryzen 5000 для десктопов могут содержать внутри сразу два 7-нм полупроводниковых кристалла с восемью ядрами, что как раз и даёт в сумме до 16 ядер в старших модификациях. Каждый такой кристалл имеет площадь всего 81 мм2, то есть они значительно меньше площади восьмиядерного кристалла Rocket Lake, составляющей 276 мм2.

 Восьмиядерный Ryzen 5000 без крышки. Фото Fritzchens Fritz

Восьмиядерный Ryzen 5000 без крышки. Фото Fritzchens Fritz

Такой огромный разрыв в размерах обусловлен тем, что Intel для выпуска настольных процессоров продолжает использовать старую 14-нм технологию, которая была введена в обиход в далёком 2014 году. Именно производственный аспект не позволяет добавить в Rocket Lake свыше восьми ядер.

Восьмиядерный Rocket Lake без крышки. Фото Fritzchens Fritz

Но при сравнении размеров кристаллов нужно иметь в виду пару нюансов. Во-первых, архитектура процессоров Intel предполагает наличие в них интегрированного графического ядра, которое в рассматриваемых процессорах AMD не предусмотрено. Во-вторых, у Intel в процессорный кристалл включены также контроллеры памяти и PCIe, в то время как чиплетная компоновка процессоров Ryzen предполагает использование внешних контроллеров, располагающихся в отдельном чиплете, выпускаемом по 12-нм технологии. И это – одно из слабых мест дизайна современных Ryzen: внешний контроллер памяти работает с более высокими задержками по сравнению с контроллером памяти, расположенным по соседству с вычислительными ядрами на том же кристалле. В результате представители серии Rocket Lake выигрывают у Ryzen по эффективности работы с памятью, что может стать не менее весомым, чем число ядер, фактором для некоторых приложений — например, из числа современных игр.

Впрочем, зная о важности скорости доступа к данным, AMD приняла меры по компенсации более высоких задержек своего контроллера памяти. Эти меры – очень большой L3-кеш (так называемый GameCache), поместить который в Ryzen стало возможным благодаря всё тому же современному техпроцессу с нормами 7 нм. В результате Ryzen 5000 могут похвастать кеш-памятью третьего уровня суммарным объёмом 32 или даже 64 Мбайт, в то время как кеш в старших Rocket Lake имеет размер не более 16 Мбайт.

Но в совершенствовании ещё одной ключевой характеристики процессоров – тактовой частоты – 7-нм технология помогла AMD не слишком сильно. Процессоры серии Ryzen 5000 ограничены частотой 4,9 ГГц. Выше этой планки не может прыгнуть даже старший 16-ядерный Ryzen 9 5950X при нагрузке на одно-единственное ядро. Оппоненты же из числа Rocket Lake при нагрузке на одно ядро могут брать частоты 5,2-5,3 ГГц, причём величина 5,1 ГГц доступна старшей модели Core i9-11900K даже при нагрузке на все ядра. Иными словами, в каких-то случаях 14-нм технология Intel совсем не кажется устаревшей и неактуальной.

Тем не менее нельзя отрицать, что «толстый» техпроцесс создаёт существенные проблемы с тепловыделением и энергопотреблением. Старшие Rocket Lake отнесены производителем к тепловому пакету 125 Вт, но это – очень оптимистичная оценка. Как показали наши тесты, в реальности современные процессоры Intel могут затребовать при работе вдвое больше этой величины. Это не скрывает и сам производитель, заявляя для своих флагманов предел потребления PL2 на уровне 250 Вт. Что же касается AMD, то её процессоры с TDP, установленным в 105 Вт, прекрасно вписываются в 142-ваттные границы по энергопотреблению и тепловыделению.

В конечном итоге получается довольно неоднозначная картина. Старшие процессоры Ryzen 5000 определённо выигрывают у соперников по возможностям многопоточной обработки за счёт большего количества ядер. И для решения ресурсоёмких задач они, вне всяких сомнений, намного предпочтительней. Однако там, где более восьми ядер не нужно, выбор между Ryzen 5000 и Core 11-го поколения совсем не очевиден. Выше мы прошлись по основным количественным характеристикам обоих вариантов, и, как можно заметить, однозначного лидера определить невозможно.

Rocket LakeRyzen 5000
Микроархитектура Cypress Cove Zen 3
Технология производства, нм 14 7 + 12
Максимальное количество ядер 8 16
Максимальная тактовая частота, ГГц 5,3 4,9
L2-кеш, Кбайт на ядро 512 512
L3-кеш, Мбайт До 16 До 64
TDP, Вт 125 105
Предел потребления, Вт 250 142
Встроенная графика Есть Нет
PCIe 20 × Gen 4 24 × Gen 4
Поддержка памяти DDR4-3200 DDR4-3200

К сказанному можно добавить и ещё один штрих – поддержку в процессорах Rocket Lake инструкций набора AVX512, которой нет в конкурирующем семействе. Пока данный фактор не имеет большого практического значения, но в перспективе он может стать важным, поскольку эти инструкции будут внедряться в алгоритмах, построенных на нейронных сетях.

Иными словами, неопределённостей, возникающих при сопоставлении Ryzen 5000 и Core 11-го поколения, очень много, и спорить о преимуществе того или иного семейства можно очень долго. Но на висящий в воздухе вопрос о том, чья микроархитектура более эффективна по удельной производительности, мы можем ответить однозначно.

#Описание тестовой системы и методики тестирования

Для сравнения микроархитектур Zen 3 и Cypress Cove мы взяли два свежих восьмиядерных процессора, Ryzen 7 5800X и Core i7-11700K, и сопоставили их быстродействие при работе на одинаковой частоте, с одинаковой памятью и с одной и той же производительной видеокартой. В качестве такой опорной частоты было выбрано значение 4,0 ГГц – оно обусловлено нашим желанием добавить в тестирование пару более старых процессоров, Ryzen 7 3800XT и Core i7-10700K, заставить первый из которых стабильно работать на более высокой «круглой» частоте не представляется возможным. Пренебрегать же участием в тестах носителей микроархитектр Zen 2 и Skylake нам очень не хотелось, потому что оно позволяет проверить утверждения обоих производителей о величине роста показателя IPC при переходе к Zen 3 и Cypress Cove.

Для наглядности приведём таблицу с формальными характеристиками всех четырёх участников тестирования. Однако указанные в этой таблице частоты в контексте данного тестирования значения почти не имеют – большинство тестов выполнялось, когда все процессоры работают на фиксированной тактовой частоте и не пользуются никакими технологиями авторазгона, которые в обычной жизни гибко подстраивают частоты под нагрузку.

Core i7-11700KCore i7-10700KRyzen 7 5800XRyzen 7 3800XT
Платформа LGA1200 LGA1200 Socket AM4 Socket AM4
Микроархитектура Cypress Cove Skylake Zen 3 Zen 2
Техпроцесс, нм 14 14 7/12 7/12
Ядра/потоки 8/16 8/16 8/16 8/16
Частота (номинал/турбо), ГГц 3,6-5,0 3,8-5,1 3,8-4,7 3,9-4,7
L2-кеш, Кбайт 8 × 512 8 × 256 8 × 512 8 × 512
L3-кеш, Мбайт 16 16 32 2 × 16
AVX-512 Есть Нет Нет Нет
TDP, Вт 125 125 105 105
Память DDR4-3200 DDR4-2933 DDR4-3200 DDR4-3200
Линии PCIe 20 × Gen 4 16 × Gen 3 24 × Gen4 24 × Gen4
Встроенная графика UHD 750 UHD 630 Нет Нет
Цена $399 $387 $449 $399

В итоге в состав тестовой системы вошли следующие комплектующие:

  • Процессоры:
    • AMD Ryzen 7 5800X (Vermeer, 8 ядер + SMT, 3,8-4,7 ГГц, 32 Мбайт L3);
    • AMD Ryzen 7 3800XT (Matisse, 8 ядер + SMT, 3,8-4,7 ГГц, 32 Мбайт L3);
    • Intel Core i7-11700K (Rocket Lake, 8 ядер + HT, 3,6-5,0 ГГц, 16 Мбайт L3);
    • Intel Core i7-10700K (Comet Lake, 8 ядер + HT, 3,8-5,1 ГГц, 16 Мбайт L3).
  • Процессорный кулер: кастомная СЖО EKWB.
  • Материнские платы:
    • ASUS ROG Crosshair VIII Hero (Socket AM4, AMD X570);
    • ASUS ROG Maximus XIII Hero (Wi-Fi) (LGA1200, Intel Z590).
  • Память: 2 × 16 Гбайт DDR4-3600 SDRAM, 16-18-18-38 (Crucial Ballistix RGB BL2K16G36C16U4BL).
  • Видеокарта: NVIDIA GeForce RTX 3090 Founders Edition (GA102, 1395-1695/19500 МГц, 24 Гбайт GDDR6X 384-бит).
  • Дисковая подсистема: Intel SSD 760p 2 Тбайт (SSDPEKKW020T8X1).
  • Блок питания: Thermaltake Toughpower DPS G RGB 1000W Titanium (80 Plus Titanium, 1000 Вт).

Оперативная память в системах и AMD, и Intel работала в режиме DDR4-3600 с таймингами по XMP-профилю. Это также означает, что для процессоров Ryzen использовался синхронный режим контроллера памяти и частота Infinity Fabric, равная 1800 МГц, а для процессоров Core последнего поколения — режим Gear 1 и частота контроллера памяти 1800 МГц.

Тестирование выполнялось в операционной системе Microsoft Windows 10 Pro (20H2) Build 19042.572 с использованием следующего комплекта драйверов:

  • AMD Chipset Driver 2.13.27.501;
  • Intel Chipset Driver 10.1.31.2;
  • NVIDIA GeForce 466.47 Driver.

Описание использовавшихся для измерения вычислительной производительности инструментов:

Приложения:

  • 7-zip 21.02 — тестирование скорости архивации. Измеряется время, затрачиваемое архиватором на сжатие директории с различными файлами общим объёмом 3,1 Гбайт. Используется алгоритм LZMA2 и максимальная степень компрессии.
  • Adobe Photoshop Lightroom Classic 10.2 – тестирование производительности при пакетной обработке серии изображений в RAW-формате. Тестовый сценарий включает постобработку и экспорт в JPEG с разрешением 1920 × 1080 и максимальным качеством двухсот 26-мегапиксельных изображений в RAW-формате, сделанных цифровой камерой Fujifilm X-T4.
  • Adobe Premiere Pro 2021 15.2.0 — тестирование производительности при нелинейном видеомонтаже. Измеряется время рендеринга в формат YouTube 4K проекта, содержащего HDV 2160p30 видеоряд с наложением различных эффектов.
  • Blender 2.91.2 – тестирование скорости финального рендеринга в одном из популярных свободных пакетов для создания трёхмерной графики. Измеряется продолжительность построения финальной модели pavillon_barcelona_v1.2 из Blender Benchmark.
  • Cinebench R23 – стандартный бенчмарк для тестирования скорости рендеринга в Cinema 4D R23.
  • Microsoft Visual Studio 2017 (15.9.33) – измерение времени компиляции крупного MSVC-проекта – профессионального пакета для создания трёхмерной графики Blender версии 2.79b.
  • Stockfish 12 – тестирование скорости работы популярного шахматного движка. Измеряется скорость перебора вариантов в позиции «1q6/1r2k1p1/4pp1p/1P1b1P2/3Q4/7P/4B1P1/2R3K1 w».
  • Topaz Video Enhance AI v1.7.1 – тестирование производительности в основанной на ИИ программе для улучшения детализации видео. В тесте используется исходное видео в разрешении 640×360, которое увеличивается в два раза с использованием модели Artemis LQ v7.
  • V-Ray 5.00 – тестирование производительности работы популярной системы рендеринга при помощи стандартного приложения V-Ray Benchmark Next.
  • VeraCrypt 1.24 – тестирование криптографической производительности. Используется встроенный в программу бенчмарк, задействующий тройное шифрование Kuznyechik-Serpent-Camellia.
  • x264 r3059 — тестирование скорости транскодирования видео в формат H.264/AVC. Для оценки производительности используется исходный 2160p@24FPS AVC-видеофайл, имеющий битрейт около 42 Мбит/с.
  • x265 3.5+8 10bpp — тестирование скорости транскодирования видео в формат H.265/HEVC. Для оценки производительности используется исходный 2160p@24FPS AVC-видеофайл, имеющий битрейт около 42 Мбит/с.

Игры:

  • Assassin’s Creed Odyssey. Разрешение 1920 × 1080, Graphics Quality = Ultra High. Разрешение 3840 × 2160: Graphics Quality = Ultra High.
  • Borderlands 3. Разрешение 1920 × 1080, Graphics API = DirectX 12, Overall Quality = Badass.
  • Cyberpunk 2077. Разрешение 1920 × 1080, Quick Preset = Ray Tracing – Ultra.
  • Far Cry New Dawn. Разрешение 1920 × 1080, Graphics Quality = Ultra, HD Textures = On, Anti-Aliasing = TAA, Motion Blur = On.
  • Hitman 3. Разрешение 1920 × 1080, Super Sampling = 1.0, Level of Detail = Ultra, Texture Quality = High, Texture Filter = Anisotropic 16x, SSAO = Ultra, Shadow Quality = Ultra, Mirrors Reflection Quality = High, SSR Quality = High, Variable Rate Shading = Quality.
  • Horizon Zero Dawn. Разрешение 1920 × 1080, Preset = Ultimate Quality.
  • Metro Exodus Enhanced. Разрешение 1920 × 1080, Shading Quality = Ultra, Ray Tracing = Normal, Nvidia DLSS = Off, Reflections = Raytraced, Variable Rate Shading = 4x, Hairworks = Off, Advanced PhysX = Off, Tesselation = Off.
  • Shadow of the Tomb Raider. Разрешение 1920 × 1080, DirectX12, Preset = Highest, Anti-Aliasing = TAA.
  • A Total War Saga: Troy. Разрешение 1920 × 1080, DirectX 12, Quality = Ultra, Unit Size = Extreme.
  • Watch Dogs Legion. Разрешение 1920 × 1080, DirectX 12, Quality = Ultra, RTX = Off, DLSS = Off.

Во всех игровых тестах в качестве результатов приводится среднее количество кадров в секунду, а также 0,01-квантиль (первая перцентиль) для значений FPS. Использование 0,01-квантиля вместо показателей минимального FPS обусловлено стремлением очистить результаты от случайных всплесков производительности, которые были спровоцированы не связанными напрямую с работой основных компонентов платформы причинами.

Следующая страница →
 
⇣ Содержание
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.

window-new
Soft
Hard
Тренды 🔥
Прорывы в науке, сделанные ИИ в 2024 году: археологические находки, разговоры с кашалотами и сворачивание белков 6 ч.
Arm будет добиваться повторного разбирательства нарушений лицензий компанией Qualcomm 10 ч.
Поставки гарнитур VR/MR достигнут почти 10 млн в 2024 году, но Apple Vision Pro занимает лишь 5 % рынка 12 ч.
Первая частная космическая станция появится на два года раньше, но летать на неё будет нельзя 13 ч.
В США выпущены федеральные нормы для автомобилей без руля и педалей 14 ч.
Для невыпущенного суперчипа Tachyum Prodigy выпустили 1600-страничное руководство по оптимизации производительности 15 ч.
Зонд NASA «Паркер» пошёл на рекордное сближение с Солнцем 16 ч.
Китайская Agibot запустила серийное производство человекоподобных роботов раньше Tesla 18 ч.
Qualcomm выиграла в судебном разбирательстве с Arm — нарушений лицензий не было 20 ч.
Американских субсидий на сумму $6,75 млрд удостоятся Samsung, Texas Instruments и Amkor 22 ч.