Накопители

Действительно ли PCI Express 4.0 – важное преимущество Ryzen 3000? Проверяем на NVMe SSD

⇣ Содержание

#Как мы тестировали

Задачей, которая была поставлена перед этим исследованием, стало выяснение «реальной» производительности нового поколения накопителей, ориентированных на работу по интерфейсу PCI Express 4.0 x4. Основной вопрос, на который должны ответить тесты, звучит так: есть ли смысл выбирать для компьютеров с поддержкой PCI Express 4.0 (а это – системы на базе процессоров семейства Ryzen 3000) новомодные твердотельные накопители, построенные на контроллере Phison PS5016-E16, — или же флагманские модели NVMe SSD без поддержки PCI Express 4.0 могут предложить производительность не хуже.

Поставленная задача однозначно предопределила используемую в тестировании конфигурацию компьютера. Исследование проводилось в системе на базе Ryzen 7 3800X и материнской платы с чипсетом X570. Такая система хороша тем, что в ней интерфейс для подключения NVMe SSD (а мы пользовались линиями, за функционирование которых отвечает процессор) может работать как в режиме PCI Express 4.0, так и в режиме PCI Express 3.0. Соответственно, накопитель Gigabyte Aorus NVMe Gen4 SSD 2 Тбайт был протестирован дважды – в двух разных режимах работы шины, а Samsung 970 EVO Plus 2 Тбайт – единожды, со штатным вариантом работы интерфейса в режиме PCI Express 3.0.

Кроме того, заодно мы решили проверить производительность накопителей и в системе с процессором Core i9-9900K. Раньше платформа AMD серьёзно проигрывала платформе Intel в скорости работы твердотельных накопителей, но это было выяснено ещё в то время, когда процессоров Ryzen третьего поколения, как и чипсета X570, не существовало. Теперь же ситуация могла серьёзно поменяться, и участие в тестах платформы Intel позволит увидеть, как дело обстоит сейчас.

Таким образом, список используемых в этом тестировании аппаратных компонентов получился следующим:

  • Процессоры:
    • AMD Ryzen 7 3800X (Matisse, 8 ядер + SMT, 3,9-4,5 ГГц, 32 Мбайт L3);
    • Intel Core i9-9900K (Coffee Lake Refresh, 8 ядер + HT, 3,6-5,0 ГГц, 16 Мбайт L3).
  • Процессорный кулер: Noctua NH-D15.
  • Материнские платы:
    • ASUS ROG Crosshair VIII Formula (Socket AM4, AMD X570);
    • ASRock Z390 Taichi (LGA1151v2, Intel Z390).
  • Память: 2 × 8 Гбайт DDR4-3600 SDRAM, 16-16-16-36 (G.Skill Trident Z RGB F4-3600C16D-16GTZR).
  • Видеокарта: NVIDIA GeForce RTX 2080 Ti (TU102, 1350/14000 МГц, 11 Гбайт GDDR6 352-бит).
  • Накопители:
    • Gigabyte Aorus NVMe Gen4 SSD 2 Тбайт (GP-ASM2NE6200TTTD, прошивка EGFM10E3);
    • Samsung 970 EVO Plus 2 Тбайт (MZ-V7S2T0, прошивка 2B2QEXM7).
  • Блок питания: Thermaltake Toughpower DPS G RGB 1000W Titanium (80 Plus Titanium, 1000 Вт).

Тестирование выполнялось в операционной системе Microsoft Windows 10 Pro (v1903) Build 18362.175 с использованием следующего комплекта драйверов:

  • AMD Chipset Driver 1.9.27.1033;
  • Intel Chipset Driver 10.1.1.45;
  • Microsoft Windows NVMe Driver 10.0.18362.175;
  • NVIDIA GeForce 431.60 Driver;
  • Samsung NVM Express Driver 3.1.0.1901.

#Методика тестирования

Тестирование проводится в операционной системе Microsoft Windows 10 со всеми необходимыми драйверами, корректно распознающей и обслуживающей современные твердотельные накопители. Очистка буфера кеша записи в настройках тестируемого SSD отключена, все обновления безопасности, включая заплатки против уязвимостей Spectre, Spectre v4, Meltdown, Foreshadow, Spectre v3a, Lazy FPU, Spoiler и MDS установлены (в том числе поэтому результаты из этой статьи не стоит сравниваь с показателями в других наших материалах). Измерение производительности выполняется с накопителями в «использованном» состоянии, которое достигается их предварительным заполнением данными. Перед каждым тестом накопители очищаются и обслуживаются с помощью команды TRIM. Между отдельными тестами выдерживается 15-минутная пауза, отведённая для корректной отработки технологии сборки мусора. Во всех тестах используются рандомизированные несжимаемые данные.

Раздел, в пределах которого тестируется скорость операций, имеет размер 32 Гбайт, а продолжительность каждого теста составляет сорок секунд. Такие параметры, в частности, позволят получать более релевантные результаты для тех SSD, которые используют различные технологии SLC-кеширования.

Используемые приложения и тесты:

  • Iometer 1.1.0
    • Измерение скорости последовательного чтения и записи данных блоками по 128 Кбайт (наиболее типичный размер блока при последовательных операциях в десктопных задачах). Тестирование проводится при различной глубине очереди запросов, что позволяет оценивать как реалистичные, так и пиковые параметры быстродействия.
    • Измерение скорости и латентности случайного чтения и записи блоками размером 4 Кбайт (такой размер блока используется в подавляющем большинстве реальных операций). Тест проводится дважды — без очереди запросов и с очередью запросов глубиной 4 команды (типичной для десктопных приложений, активно работающих с разветвлённой файловой системой). Блоки данных выравниваются относительно страниц флеш-памяти накопителей.
    • Установление зависимости скоростей случайного чтения и записи при работе накопителя с 4-килобайтными блоками от глубины очереди запросов (в пределах от одной до 32 команд). Блоки данных выравниваются относительно страниц флеш-памяти накопителей.
    • Установление зависимости скоростей случайного чтения и записи при работе накопителя с блоками разного размера. Используются блоки объёмом от 512 байт до 256 Кбайт. Глубина очереди запросов в течение теста составляет 4 команды. Блоки данных выравниваются относительно страниц флеш-памяти накопителей.
    • Измерение производительности при смешанной многопоточной нагрузке и установление её зависимости от соотношения между операциями чтения и записи. Тест проводится дважды: для последовательных операций чтения и записи блоками объёмом 128 Кбайт, выполняемых в два независимых потока, и для случайных операций с блоками объёмом 4 Кбайт, которые выполняются в четыре независимых потока. В обоих случаях соотношение между операциями чтения и записи варьируется с шагом 20 процентов.
    • Исследование падения производительности SSD при обработке непрерывного потока операций случайной записи. Используются блоки размером 4 Кбайт и глубина очереди 32 команды. Блоки данных выравниваются относительно страниц флеш-памяти накопителей. Продолжительность теста составляет два часа, измерения моментальной скорости проводятся ежесекундно. По окончании теста дополнительно проверяется способность накопителя восстанавливать свою производительность до первоначальных величин за счёт работы технологии сборки мусора и после отработки команды TRIM.
  • CrystalDiskMark 7.0.0
    • Синтетический тест, выдающий типовые показатели производительности твердотельных накопителей, измеренные на 1-гигабайтной области диска «поверх» файловой системы. Из всего набора параметров, которые можно оценить с помощью этой утилиты, мы обращаем внимание на скорость последовательного чтения и записи, а также на производительность произвольных чтения и записи 4-килобайтными блоками без очереди запросов и с очередью глубиной 32 команды.
  • PCMark 8 Storage Benchmark 2.0
    • Тест, основанный на эмулировании реальной дисковой нагрузки, которая характерна для различных популярных приложений. На тестируемом накопителе создаётся единственный раздел в файловой системе NTFS на весь доступный объём, и в PCMark 8 проводится тест Secondary Storage 2.0. В качестве результатов теста учитывается как итоговая производительность, так и скорость выполнения отдельных тестовых трасс, сформированных различными приложениями.
  • Тесты реальной файловой нагрузки
    • Измерение скорости копирования директорий с файлами разного типа. Для копирования применяется стандартное средство Windows – утилита Robocopy, в качестве тестового набора используется рабочая директория, включающая офисные документы, фотографии и иллюстрации, pdf-файлы и мультимедийный контент общим объёмом 8 Гбайт.
    • Измерение скорости архивации файлов. Тест проводится с той же рабочей директорией, что и копирование, а в качестве инструмента для компрессии файлов избран архиватор 7-zip версии 9.22 beta. Для уменьшения влияния производительности процессора используется метод Deflate.
    • Исследование скорости разворачивания архива. Тест проводится с архивом, полученным при измерении скорости архивации.
    • Оценка скорости запуска игрового приложения. Измеряется производительность дисковой подсистемы при выполнении сценария, захваченного при запуске игры Far Cry 4 и загрузке в ней уровня с пользовательским сохранением. Для минимизации влияния производительности процессора и памяти все задержки, возникающие по их вине, из тестового сценария убраны.
    • Оценка скорости старта приложений, формирующих типичную рабочую пользовательскую среду. Измеряется производительность дисковой подсистемы при выполнении сценария, захваченного при запуске пакета приложений, который состоит из браузера Google Chrome, текстового редактора Microsoft Word, графического редактора Adobe Photoshop и видеоредактора Adobe Premiere Pro с рабочими файлами. Для минимизации влияния производительности процессора и памяти все задержки, возникающие по их вине, из тестового сценария убраны.

#Производительность последовательного чтения и записи

Самый первый тест, в котором мы измеряли скорость линейного чтения, преподносит сюрприз. Оказывается, контроллер Phison PS5016-E16 способен обеспечить высокую производительность чтения только в специально подобранных условиях, которые создаются в синтетических бенчмарках лишь при определённых настройках. Если же говорить о скорости реальной, которая наблюдается при невысокой глубине очереди запросов и последовательном чтении 128-килобайтными блоками, то Gigabyte Aorus NVMe Gen4 SSD не только не выходит за пропускную способность четырёх линий PCI Express 3.0, но и значительно отстаёт от Samsung 970 EVO Plus.

В повседневной жизни преимущества шины PCI Express 4.0 обладатели накопителя Gigabyte Aorus NVMe Gen4 SSD или его родственников с контроллером Phison PS5016-E16 смогут увидеть лишь при линейной записи. Здесь скоростные показатели таких накопителей действительно выше, чем у Samsung 970 EVO Plus, который действительно упирается в предел интерфейса PCI Express 3.0 x4.

Чтобы лучше было понятно, почему так получается, к диаграммам мы добавили графики зависимости линейных скоростей от глубины очереди запросов. На них для наглядности показаны лишь результаты, полученные для Gigabyte Aorus NVMe Gen4 SSD 2 Тбайт и Samsung 970 EVO Plus 2 Тбайт в платформе AMD при использовании максимально возможного для каждого накопителя режима PCI Express.

Диагноз очевиден: контроллер Phison PS5016-E16 страдает ровно теми же недостатками, что и его предшественники. Высокие скоростные показатели при линейных операциях чтения он может обеспечивать лишь при глубоких очередях запросов, а их при типовой десктопной нагрузке не возникает. Поэтому Gigabyte Aorus NVMe Gen4 SSD может сколько угодно щеголять пиковыми паспортными показателями, но в действительности шина PCI Express 4.0 ему особо-то и не нужна.

#Производительность произвольного чтения

В том, что Gigabyte Aorus NVMe Gen4 SSD, построенный на двухъядерном контроллере со сравнительно невысокой вычислительной мощностью, не сможет соперничать с Samsung 970 EVO Plus при операциях случайного чтения, у нас не было сомнений с самого начала. Тесты это только подтверждают. Обращение к произвольным блокам накопитель Samsung с шиной PCI Express 3.0 x4 обрабатывает в любом случае быстрее, чем новомодный накопитель, имеющий вдвое более быстрый интерфейс. Очевидно, что пропускная способность шины сама по себе ничего не решает — к ней должен прилагаться и сильный контроллер с хорошо оптимизированной микропрограммой, а их Phison своим партнёрам пока не предложила.

Кстати, стоит обратить внимание и на ещё одну интересную деталь: система, построенная на процессоре Ryzen 7 3800X, оказывается как минимум не хуже по производительности работы со скоростным носителем информации, чем система на базе флагманского CPU авторства Intel. А это значит, что времена, когда платформы AMD заведомо уступали в быстродействии дисковой подсистемы, наконец-то прошли.

#Производительность произвольной записи

Операции записи в SSD устроены алгоритмически проще, поэтому здесь Gigabyte Aorus NVMe Gen4 SSD имел неплохой шанс продемонстрировать производительность, за которую его разработчикам не пришлось бы краснеть. Но в реальности у накопителя на базе контроллера Phison E16 впечатляющего выступления не получилось. Он смог обойти Samsung 970 EVO Plus лишь в одном случае – при работе с блоками большого размера, когда случайные операции становятся похожи на последовательные. При распространённой же в десктопах мелкоблочной записи старый добрый накопитель Samsung, использующий шину PCI Express в режиме 3.0, оказывается заметно лучше.

#Производительность при смешанной нагрузке

Одновременное обслуживание разнонаправленных потоков операций – достаточно непростая задача, для эффективного решения которой накопителю необходим и мощный контроллер, и оптимизированная микропрограмма, и быстрый массив флеш-памяти. Сбалансированной совокупностью этих компонентов платформа Phison E16 похвастать не может, поэтому тут Gigabyte Aorus NVMe Gen4 SSD вновь заметно проигрывает своему сопернику, несмотря на использование более скоростного интерфейса.

Таким образом, PCI Express 4.0-накопитель на базе контроллера Phison PS5016-E16 оказался силён лишь при одном варианте нагрузки – при линейной записи. Во всех остальных случаях Gigabyte Aorus NVMe Gen4 SSD в той или иной степени слабее, чем Samsung 970 EVO Plus, в котором при этом поддержки PCI Express 4.0 нет.

#Производительность в PCMark 8 Storage Benchmark 2.0

К сожалению, тест PCMark 8 не защищён от «читерских» оптимизаций прошивки, которые встречаются в актуальных NVMe-накопителях на базе контроллеров Phison. Поэтому их результат здесь получается несколько завышенным, хотя, как видно по показателям, с увеличенной пропускной способностью внешнего интерфейса это никак не связано. Тем не менее всё выглядит так, как будто Gigabyte Aorus NVMe Gen4 SSD в реальных приложениях работает чуть быстрее, чем Samsung 970 EVO Plus.

Интегральный результат PCMark 8 нужно дополнить и показателями производительности, выдаваемыми накопителями при прохождении отдельных тестовых трасс, которые моделируют различные варианты реальной нагрузки. Дело в том, что при разноплановой нагрузке флеш-накопители могут вести себя каким-либо особым образом.

Любопытно, что PCMark 8 также говорит о лучшей производительности современных накопителей в платформе Intel, нежели в платформе AMD. И как следует из диаграммы выше, связано это в первую очередь с быстродействием дисковой подсистемы в Adobe Photoshop.

#Производительность при реальной нагрузке

С файловыми операциями Gigabyte Aorus NVMe Gen4 SSD справляется в целом неплохо. Здесь можно увидеть, что в ряде случаев этому накопителю действительно помогает более скоростной интерфейс, и если речь не идёт об архивировании файлов, то он немного опережает по быстродействию Samsung 970 EVO Plus. Очевидно, спасает накопитель на базе Phison PS5016-E16 здесь то, что он действительно обеспечивает достойную производительность при линейной записи.

Но с ролью хорошего системного накопителя, с которого предполагается запускать операционную систему и программы, Gigabyte Aorus NVMe Gen4 SSD совершенно не справляется. Для обслуживания таких нагрузок важна высокая скорость мелкоблочного чтения, а также способность накопителя переваривать разнонаправленные операции, но с тем и с другим у новейшего контроллера Phison большие проблемы. Поэтому в реальном использовании в персональном компьютере накопитель на платформе Phison E16 окажется заметно более медленным вариантом по сравнению с флагманскими продуктами лидеров рынка, и шина PCI Express 4.0 здесь никак не помогает. При запуске с Gigabyte Aorus NVMe Gen4 SSD игр и программ скорость загрузки в пределе оказывается на 30 % ниже, чем в случае с Samsung 970 EVO Plus.

#Проверка температурного режима

В заключение сказать необходимо пару слов про рабочие температуры накопителей с поддержкой PCI Express 4.0. Помните, AMD оправдывала необходимость активного охлаждения чипсета X570 тем, что высокочастотный контроллер новой шины не может быть холодным? А если так, то получается, что SSD с поддержкой PCI Express 4.0, как и флагманский чипсет под Ryzen, должны быть проблемными в смысле теплового режима компонентами.  И в этой связи совсем не удивляет, что все решения на контроллере Phison PS5016-E16, как Gigabyte Aorus NVMe Gen4 SSD, в обязательном порядке должны снабжаться крупными и достаточно эффективными радиаторами.

Но все подобные рассуждения легко опровергаются практикой. На самом деле PCI Express 4.0-накопитель Gigabyte греется ровно настолько, насколько быстро он работает. Иными словами, в деле SSD на контроллере Phison PS5016-E16 даже без какого-либо радиатора нагревается меньше, чем Samsung 970 EVO Plus. Следовательно, накопитель может быть горячим из-за высокой производительности, а формальная поддержка PCI Express 4.0 без реального улучшения быстродействия к принципиальному росту тепловыделения SSD не приводит.

На графиках ниже приводится температуры сравниваемых SSD при непрерывных последовательных операциях с глубиной очереди запросов в 32 команды. Измерения были проведены на открытом стенде, какой-либо дополнительный обдув SSD воздушным потоком не производился, оба накопителя эксплуатировались без каких-либо систем охлаждения.

При тестировании Gigabyte Aorus NVMe Gen4 SSD троттлинг не встретился нам ни при чтении, ни при записи. Максимальная температура составила 82 градуса, она была достигнута в тот момент, когда запись шла в SLC-кеш, но при записи напрямую в TLC-память накопитель уже так сильно не греется. В то же время Samsung 970 EVO Plus в тех же условиях примерно за минуту разогревается до температуры 83 градуса, после чего у него включается троттлинг, который сохраняется до полного снятия с накопителя нагрузки.

Поскольку Gigabyte Aorus NVMe Gen4 SSD не перегревается даже со снятым радиатором, то получается, что мощное охлаждение на накопителях с контроллером Phison PS5016-E16 в реальности не требуется, его основная роль – придание им солидности в глазах покупателей.

#Выводы

Начиналось всё многообещающе: Phison очень своевременно ввела в своих накопителях нового поколения поддержку шины PCI Express 4.0 и попала в единую струю с начавшими покорять рынок процессорами Ryzen 3000, которые летом текущего года внедрили эту шину в настольных системах. В результате возникло впечатление, что Phison действительно совершила рывок и теперь предлагает пользователям современных компьютеров на базе процессоров AMD твердотельные накопители с принципиально лучшей, чем у конкурентов, производительностью.

В формировании такого мнения помогла и сама AMD, которая при продвижении процессоров с микроархитектурой Zen 2 активно рекламировала NVMe-накопители на базе контроллера Phison PS5016-E16 как единственный правильный выбор, способный раскрыть преимущества PCI Express 4.0. Внесли свою лепту в возникший вокруг PS5016-E16 ажиотаж и фирмы Corsair, Gigabyte и Patriot, которые стали преподносить SSD на основе данного контроллера как премиальные и флагманские продукты.

Но как показала практическая проверка, вся эта бравада имеет очень отдалённое отношение к действительности, потому что на деле накопители Corsair MP600, Gigabyte Aorus NVMe Gen4, Patriot Viper VP4100 и им подобные – весьма средние по производительности варианты даже в том случае, если они используются в системах на базе процессоров Ryzen 3000 и работают через шину PCI Express 4.0 x4 с пропускной способностью до 7,9 Гбайт/с.

Хороший и производительный накопитель с интерфейсом PCI Express 4.0 x4 должен обладать сбалансированной конфигурацией, которая бы включала не только быстрый массив флеш-памяти, но также и контроллер с достаточной вычислительной мощностью, и оптимизированную микропрограмму. В платформе же, которую предложила Phison, контроллер слишком слаб для того, чтобы загрузить полосу пропускания PCI Express 4.0 x4, хотя используемая в ней BiCS4-память компании Toshiba имеет вполне достойные характеристики. Но ничего не поделаешь, чип PS5016-E16 базируется на процессоре лишь с двумя ARM-ядрами и фактически представляет собой обновлённую версию недорогого контроллера PS5012-E12, в котором внешний интерфейс заменили более скоростным.

А это автоматически означает, что потребительские PCI Express 4.0-накопители, которые основываются на платформе Phison E16 (а других сейчас попросту нет), стоило бы позиционировать как переходные решения начального уровня с новым интерфейсом. И в этом случае к их производительности не было бы особых претензий, а то, что они проигрывают флагманским моделям NVMe SSD с интерфейсом PCI Express 3.0 x4 почти при любой разновидности нагрузки, не вызвало бы никаких серьёзных вопросов.

Но Phison вместе с партнёрами явно решила подзаработать на хайпе вокруг PCI Express 4.0 — и ставит продукты на базе PS5016-E16 на одну ступень с Samsung 970 EVO Plus, а то и выше. На самом же деле это совершенно безосновательно. Результаты тестов однозначно показывают, что в производительности Corsair MP600, Gigabyte Aorus NVMe Gen4, Patriot Viper VP4100 и прочих SSD на базе Phison E16 нет никаких признаков премиальности, и они должны продаваться ощутимо дешевле хорошо известных нам флагманов с шиной PCI Express 3.0 x4. И пока это условие не соблюдено, мы не советуем приобретать накопители с контроллером Phison PS5016-E16 даже для современных систем на базе Ryzen 3000, где есть врождённая поддержка PCI Express 4.0. Проверенный временем Samsung 970 EVO Plus обеспечит лучшую производительность по более низкой цене, пусть и работая через вдвое более медленный интерфейс.

В итоге про пользу PCI Express 4.0 для современных накопителей можно сказать примерно то же, что и в случае с видеокартами. Формально эта шина значительно увеличивает пропускную способность, но пока на рынке нет таких устройств, для которых это было бы действительно необходимо.

 
← Предыдущая страница
⇣ Содержание
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
⇣ Комментарии
Прежде чем оставить комментарий, пожалуйста, ознакомьтесь с правилами комментирования. Оставляя комментарий, вы подтверждаете ваше согласие с данными правилами и осознаете возможную ответственность за их нарушение.
Все комментарии премодерируются.
Комментарии загружаются...
window-new
Soft
Hard
Тренды 🔥