Оригинал материала: https://3dnews.ru/1008824

Групповое тестирование видеокарт в Minecraft RTX: тяжелые кубики

Трассировка лучей и DLSS 2.0 в Minecraft. Методика и участники тестирования

Модификация Minecraft с буквами RTX в названии, которую NVIDIA продемонстрировала на прошлой выставке Gamescom, вошла в фазу бета-тестирования, открытого для всех владельцев игры под Windows 10. За полтора года, минувшие после дебюта ускорителей GeForce RTX с функциями аппаратной трассировки лучей, появилось немало игр, использующих рейтрейсинг для избранных графических эффектов, а сама технология застолбила место в консолях нового поколения (PlayStation 5 и Xbox Series X). Но до сих пор есть только два проекта, которые окончательно мигрировали с растеризации на трассировку, — Quake II RTX, а теперь и Minecraft. Однако Quake II, несмотря на все усовершенствования, остается игрой 20-летней давности — пусть даже это и не просто игра, а классика. Ну а Minecraft, наоборот, теперь можно смело называть самым популярным из всех проектов с трассировкой лучей. А вместе с тем — самым требовательным к производительности железа. Благо, чтобы облегчить задачу действующего поколения GPU, к выпуску Minecraft RTX созрела новая версия технологии масштабирования кадра DLSS, которая должна работать одновременно и быстрее, и качественнее первой.

#Трассировка лучей в Minecraft

Когда в 2018 году на рынке появились первые потребительские GPU с аппаратными блоками для трассировки лучей, никто не обещал, что игры в ближайшее время отбросят привычную растеризацию и будут использовать для рендеринга 3D-графики исключительно трассировку лучей. Действительно, все громкие проекты, появившиеся в сотрудничестве с NVIDIA, применяют рейтрейсинг лишь для создания избранных компонентов изображения — отражений, теней и глобального освещения (редко всех трех вместе — как в прошлогоднем Control), а основную нагрузку на GPU по-прежнему создает растеризация. Неспроста в условиях так называемого гибридного рендеринга трассировка лучей оказалась вполне по силам, пусть и оговорками, не только ускорителям серии GeForce RTX, но и высокопроизводительным моделям прошлого поколения — таким как GeForce GTX 1080 Ti.

Minecraft RTX — первая по-настоящему статусная игра (ведь Quake II RTX, по большому счету, был экспериментом, выросшим из разработки энтузиастов), в которой все освещение рассчитывается путем трассировки лучей. Если точнее, методом Path Tracing. Но, строго говоря, Path Tracing и Ray Tracing не являются взаимоисключающими понятиями. Трассировка лучей описывает фундаментальные принципы рендеринга, основанного на транспорте света (в отличие от растеризации, которая сама по себе может выполнить только проекцию трехмерной геометрии на плоскость, а освещение тем или иным образом симулируется): из точки обзора выходит множество лучей, которые пересекаются с объектами сцены, отражаются от них и в конечном счете останавливаются на первичных источниках света (или уходят в бесконечный фон). В свою очередь, Path Tracing — один из распространенных алгоритмов, опирающихся на трассировку лучей, который широко используется в «офлайновых» задачах: для создания фотореалистичных статических изображений и CGI-анимации в кино. Главное достоинство, которому Path Tracing обязан своей популярностью, состоит в том, что он лучше прочих методов решает проблему экспоненциального роста вычислительной сложности при расчете множественных отражений луча от поверхностей объектов.

Тем не менее использовать Path Tracing для рендеринга всей сцены в реальном времени по-прежнему слишком дорого, если только речь не идет об играх с относительно простой геометрией и шейдерами. Ведь, вопреки распространенному заблуждению, львиную долю нагрузки на GPU в условиях рейтрейсинга создает не собственно отслеживание траектории лучей, а необходимость выполнять шейдерные программы при каждом отражении. Не удивительно, что именно Minecraft сделали полигоном для испытаний новых технологий вслед за Quake II, ведь оба проекта по современным меркам выглядят одинаково просто.

За три десятка лет эволюции игры достигли таких высот в имитации света, что трассированные эффекты в Metro Exodus и Control уже воспринимаются не как откровение, а скорее как необязательная надстройка над графикой, и без того вполне фотореалистичной и чрезвычайно детализированной. А вот Minecraft, изначально лишенный сколь-либо развитых средств симуляции освещения, благодаря трассированному движку целиком преобразился. Достаточно взглянуть на снимки пяти примеров миров из каталога бета-версии.

RT выкл. (Crystal Palace)

RT вкл. (Crystal Palace)

RT выкл. (Imagination Island)

RT вкл. (Imagination Island)

RT выкл. (Imagination Island)

RT вкл. (Imagination Island)

RT выкл. (Neon District)

RT вкл. (Neon District)

RT выкл. (Of Temples and Totems)

RT вкл. (Of Temples and Totems)

RT выкл. (Aquatic Adventure)

RT вкл. (Aquatic Adventure)

RT выкл.

RT вкл.

RT выкл.

RT вкл.

Однако Path Tracing подходит Minecraft не только из-за того, что это идеальная морская свинка для экспериментов. В игре, которая существует только за счет широкого сообщества создателей миров, невозможно без трассировки лучей добиться такого же качества освещения, как в графике ААА-проектов, которая требует длительной ручной работы над «запеченными» в окружение эффектами. А вот в условиях глобальной трассировки лучей достаточно просто присвоить текстурам кубиков нужные параметры реакции на свет в дополнение к цветам текселов, а собственно переноску света от источников в камеру берет на себя алгоритм Path Tracing.

Большинство текстур в стандартном Minecraft состоят из двух карт — цвета и прозрачности, — и, как следствие, бесполезны для трассировки. Но в комплекте ресурсов для Minecraft RTX все текстуры имеют дополнительные карты: metallic, emissive (является ли источником света), шероховатость поверхности и карта нормалей (высот). Используя их, можно конструировать миры с физически достоверным освещением таким же образом, как раньше, без всяких дополнительных усилий.

Обычные текстуры

PBR

Обычные текстуры

PBR

Обычные текстуры

PBR

Два ключевых слагаемых — алгоритм Path Tracing (естественно, более изощренный, чем в нашем сжатом описании, и хорошо оптимизированный для рендеринга в реальном времени) и текстуры с «зашитыми» свойствами PBR (Physically Based Rendering) — ответственны за формирование развитых световых эффектов в Minecraft RTX. Это цветное глобальное освещение, полностью динамические отражения любых объектов (включая те, которых нет в поле прямого зрения), «объемные» лучи и преломление света в жидкостях.

Глобальное освещение (RT выкл.)

Глобальное освещение (RT вкл.)

Глобальное освещение (RT выкл.)

Глобальное освещение (RT вкл.)

Глобальное освещение (RT выкл.)

Глобальное освещение (RT вкл.)

Отражения (RT выкл.)

Отражения (RT вкл.)

Отражения (RT выкл.)

Отражения (RT вкл.)

Отражения (RT выкл.)

Отражения (RT вкл.)

Рефракция света в жидкостях (RT выкл.)

Рефракция света в жидкостях (RT вкл.)

Рефракция света в жидкостях (RT выкл.)

Рефракция света в жидкостях (RT вкл.)

Однако при всей кажущейся простоте графики Minecraft RTX, современное железо все еще не в состоянии обеспечить математически честный Path Tracing с такой же плотностью лучей, как при офлайновом рендеринге в программах для 3D-моделирования. Движок срезает углы на нескольких стадиях трассировки, используя кеш с аппроксимированными результатами непрямого освещения, искусственное увеличение шероховатости текстур при вторичном отражении лучей и прочее. Обязательным компонентом является развитый шумоподавляющий фильтр, который сглаживает изображение, изначально очень зернистое в условиях сравнительно низкой плотности лучей. Он же выполняет функцию временнóго полноэкранного сглаживания, так как опирается на данные нескольких последовательных кадров.

#DLSS 2.0

Несмотря на массу оптимизаций и компромиссных решений, заложенных в обновленный графический движок, Minecraft RTX не предназначен для графических процессоров без аппаратных средств трассировки лучей (к которым, по большому счету, относятся не только RT-блоки GPU семейства Turing, но и соответствующая архитектура вокруг шейдерных ALU). Насколько нам известно, финальная версия игры откроет двери всем ускорителям NVIDIA, у которых есть поддержка интерфейса программирования DXR в драйвере (модели GeForce GTX, начиная с 1660 и 6-гигабайтной версии 1060), но это еще не значит, что их владельцы могут рассчитывать на играбельную частоту смены кадров. Пожалуй, из моделей прошлого поколения только GeForce GTX 1080 Ti способен на такой подвиг, и то при короткой дистанции рендеринга объектов. Густой туман на горизонте (как в TES III: Morrowind образца 2002 года) — единственный способ снять нагрузку с железа прошлого поколения и мейнстримных предложений NVIDIA серии GeForce 16, и он наверняка появится и в грядущем издании Minecraft для Xbox Series X.

У видеокарт GeForce RTX есть другой способ решения этого вопроса: им доступен такой мощный инструмент, как масштабирование кадра из первоначально сниженного разрешения рендеринга в полное разрешение экрана с помощью нейросети (Deep Learning Super Sampling). Эта технология, которая идет рука об руку с трассировкой лучей в каждом игровом проекте, успешно компенсирует нехватку «сырого» быстродействия у современных GPU, а вот с точки зрения качества картинки едва ли можно сказать, что NVIDIA исполнила все обещания, данные геймерам. DLSS прошла долгий путь от, прямо скажем, отвратительных реализаций в Battlefield V и Metro Exodus до впечатляющих результатов в Control. Тем не менее в итоге разработчики признали, что изначально выбрали для DLSS неверное направление развития, когда для каждой отдельно взятой игры нужно тренировать собственную нейросеть.

В DLSS версии 2.0 подход сменили, и технология превратилась в универсальный алгоритм, созданный на основе полностью детерминированного массива тренировочных кадров, который сулит предсказуемое качество масштабирования и одновременно повышенное быстродействие. Так, DLSS 1.0 в большинстве случаев ориентируется на соотношение 1:1,5 между фактическим разрешением рендеринга и разрешением итогового кадра. Напротив, если взять в пример Minecraft RTX, то в рамках DLSS 2.0 старая пропорция применяется только в режиме 1920 × 1080, когда GPU выводит картинку размером 1280 × 720 (67 % от целевого разрешения). В свою очередь, кадр 2560 × 1440 выводится из оригинала 1484 × 835 (34 % пикселов), а для того, чтобы получить 4К (3840 × 2160), изображение масштабируется в четыре раза (из 1920 × 1080). Кроме того, DLSS 2.0 приспособлена к работе не только в трех самых ходовых, но и в любых нестандартных итоговых разрешениях, включая широкий формат 21:9. А главное, на качество масштабирования теперь действительно грех жаловаться. Кадр, пропущенный через нейросеть, порой даже лучше оригинала — посмотрите на линии башни в режиме 1080p.

Нативное разрешение (1920 × 1080)

DLSS 2.0 (1280 × 720 → 1920 × 1080)

Нативное разрешение (1920 × 1080)

DLSS 2.0 (1280 × 720 → 1920 × 1080)

Нативное разрешение (1920 × 1080)

DLSS 2.0 (1280 × 720 → 1920 × 1080)

Нативное разрешение (1920 × 1080)

DLSS 2.0 (1280 × 720 → 1920 × 1080)

Нативное разрешение (2560 × 1440)

DLSS 2.0 (1484 × 835 → 2560 × 1440)

Нативное разрешение (2560 × 1440)

DLSS 2.0 (1484 × 835 → 2560 × 1440)

Нативное разрешение (2560 × 1440)

DLSS 2.0 (1484 × 835 → 2560 × 1440)

Нативное разрешение (2560 × 1440)

DLSS 2.0 (1484 × 835 → 2560 × 1440)

Нативное разрешение (3840 × 2160)

DLSS 2.0 (1920 × 1080 → 3840 × 2160)

Нативное разрешение (3840 × 2160)

DLSS 2.0 (1920 × 1080 → 3840 × 2160)

Нативное разрешение (3840 × 2160)

DLSS 2.0 (1920 × 1080 → 3840 × 2160)

Нативное разрешение (3840 × 2160)

DLSS 2.0 (1920 × 1080 → 3840 × 2160)

#Тестовый стенд, методика тестирования

Тестовый стенд
CPU Intel Core i9-9900K (4,9 ГГц, 4,8 ГГц в AVX, фиксированная частота)
Материнская плата ASUS MAXIMUS XI APEX
Оперативная память G.Skill Trident Z RGB F4-3200C14D-16GTZR, 2 × 8 Гбайт (3200 МГц, CL14)
ПЗУ Intel SSD 760p, 1024 Гбайт
Блок питания Corsair AX1200i, 1200 Вт
Система охлаждения CPU Corsair Hydro Series H115i
Корпус CoolerMaster Test Bench V1.0
Монитор NEC EA244UHD
Операционная система Windows 10 Pro x64
ПО для GPU NVIDIA
Все видеокарты NVIDIA GeForce Game Ready Driver 445.87

Тестирование производительности выполнено с помощью утилиты OCAT в мире Crystal Palace с максимальной дальностью рендеринга объектов и частиц без полноэкранного сглаживания MSAA (которое просто нельзя активировать вместе с трассировкой лучей). Показатели средней и минимальной кадровых частот выводятся из массива времени рендеринга индивидуальных кадров, который программа записывает в файл результатов.

Средняя частота смены кадров на диаграммах является величиной, обратной среднему времени рендеринга кадра. Для оценки минимальной кадровой частоты вычисляется количество кадров, сформированных в каждую секунду теста. Из этого массива чисел берется значение, соответствующее 1-му процентилю распределения.

#Участники тестирования

Прим. В скобках после названий видеокарт указаны базовая и boost-частота согласно спецификациям каждого устройства.

Результаты тестирования. Выводы. Групповые тесты в других играх

#1920 × 1080

Глядя на результаты бенчмарков при условно-низком разрешении экрана, 1080p, можно понять, почему в Minecraft RTX на данном этапе нельзя активировать трассировку лучей на ускорителях, лишенных специализированной аппаратной логики. Единственной видеокартой, которая способна удержать среднюю частоту обновления кадров на уровне 60 FPS без масштабирования изображения с помощью DLSS, оказался действующий флагман потребительских устройств NVIDIA — GeForce RTX 2080 Ti. Что касается устройства базового уровня из серии GeForce RTX, то все, на что способна 2060-я модель, — не уронить фреймрейт ниже 30 FPS. А ведь карта Crystal Palace, которую мы выбрали для испытаний, — не самый сложный мир из каталога Minecraft RTX. Жаль только, что не удалось выяснить, как сильно трассировка лучей бьет по производительности по сравнению с Minecraft без RTX. Там даже при выключенной вертикальной синхронизации игра упирается в ограничение 180 FPS на любом GeForce 20-го семейства при любом разрешении вплоть до 4К. Если учесть, что стандартный Minecraft работает на самых завалящих компьютерах, лишь бы имелась совместимость с нужной версией Windows и Direct 3D, мы наверняка не ошибемся, если скажем, что разница в производительности между режимами «RTX выкл.» и «RTX вкл.» — это десятки раз.

К счастью, мы уже удостоверились в том, что алгоритм DLSS 2.0 в этой игре работает безукоризненно, поэтому к оценкам быстродействия видеокарт на практике можно смело прибавить еще 47–57 % FPS. По опыту тестирования первой версии DLSS в других играх мы помним, что масштабирование на основе нейросети не слишком эффективно в режиме 1080p. Но про DLSS 2.0 (по крайней мере в случае Minecraft RTX) этого не скажешь, хотя весь рендеринг до стадии масштабирования проходит с разрешением 720p, типичным для прошлых тайтлов, которые опирались на DLSS 1.0. Как следствие, уже на GeForce RTX 2060 SUPER средняя частота смены кадров достигает комфортного уровня в 60 FPS, а на RTX 2080 Ti перевалила за 90. Что касается минимальных показателей фреймрейта, полная замена растеризации трассировкой лучей привела к тому, что кадровая частота на любом железе под маркой RTX весьма устойчива в рамках тестовой последовательности, без резких пиков и просадок.

1920 × 1080
RT выкл. RT вкл. + DLSS 2.0 RT вкл.
NVIDIA GeForce RTX 2080 Ti FE (11 Гбайт) 180 (100%) 93,4 (-48%) 63,5 (-65%)
NVIDIA GeForce RTX 2080 SUPER (8 Гбайт) 180 (100%) 77,6 (-57%) 51,7 (-71%)
NVIDIA GeForce RTX 2080 FE (8 Гбайт) 180 (100%) 74,7 (-59%) 49,3 (-73%)
NVIDIA GeForce RTX 2070 SUPER (8 Гбайт) 180 (100%) 72,9 (-60%) 47,3 (-74%)
NVIDIA GeForce RTX 2070 FE (8 Гбайт) 180 (100%) 64 (-64%) 41,6 (-77%)
NVIDIA GeForce RTX 2060 SUPER (8 Гбайт) 180 (100%) 61 (-66%) 39,6 (-78%)
NVIDIA GeForce RTX 2060 FE (6 Гбайт) 180 (100%) 52,9 (-71%) 33,7 (-81%)

#2560 × 1440

Смена режима с 1920 × 1080 на 2560 × 1440 не сопряжена с радикальным ростом вычислительной нагрузки в большинстве современных игр, но в силу того, что Minecraft RTX уже в режиме 1080p требуется железо с функциями аппаратной трассировки лучей для игры с приемлемым фреймрейтом, повышенное разрешение рендеринга дисквалифицировало сразу три младших видеокарты серии GeForce RTX: на GeForce RTX 2060, RTX 2060 SUPER и RTX 2070 средняя частота смены кадров опустилась ниже минимально приемлемых 30 FPS. Если не снизить дальность прорисовки или не призвать на помощь DLSS, на плаву останутся только старшие модели, начиная с GeForce RTX 2070 SUPER, а планку 60 FPS не превзошел даже RTX 2080 Ti.

К счастью, DLSS 2.0 при «выходном» разрешении 2560 × 1440 действует еще эффективнее, нежели в 1920 × 1080. Алгоритм переходит в компромиссное положение между качеством и производительностью, когда GPU должен заполнить всего лишь 34 % пикселов (действительное разрешение рендеринга, напомним, составляет 1484 × 835), а остальное достраивает нейросеть. С таким подспорьем фреймрейт подскакивает сразу на 86–92 %. Впрочем, увы, этого по-прежнему недостаточно, чтобы младшие модели — от RTX 2060 до RTX 2070 SUPER — вернулись в зону 60 FPS и выше. Комфортную частоту смены кадров гарантируют только три разновидности GeForce RTX 2080 — стандартная, SUPER и Ti.

2560 × 1440
RT выкл. RT вкл. + DLSS 2.0 RT вкл.
NVIDIA GeForce RTX 2080 Ti FE (11 Гбайт) 180 (100%) 76,6 (-57%) 41,2 (-77%)
NVIDIA GeForce RTX 2080 SUPER (8 Гбайт) 180 (100%) 62,9 (-65%) 33,9 (-81%)
NVIDIA GeForce RTX 2080 FE (8 Гбайт) 180 (100%) 60 (-67%) 31,8 (-82%)
NVIDIA GeForce RTX 2070 SUPER (8 Гбайт) 180 (100%) 57,9 (-68%) 30,7 (-83%)
NVIDIA GeForce RTX 2070 FE (8 Гбайт) 180 (100%) 51,6 (-71%) 27 (-85%)
NVIDIA GeForce RTX 2060 SUPER (8 Гбайт) 180 (100%) 48,5 (-73%) 25,5 (-86%)
NVIDIA GeForce RTX 2060 FE (6 Гбайт) 180 (100%) 41,9 (-77%) 21,8 (-88%)

#3840 × 2160

После тестов при двух других разрешениях экрана не станет сюрпризом то, что уже ни одна современная видеокарта не может обойтись без помощи DLSS, чтобы гарантировать в Minecraft с трассировкой лучей терпимую кадровую частоту в 30 FPS, не говоря уже о 60, а на младших моделях GeForce RTX игра выдает немногим больше 10 кадров/с.

DLSS 2.0 в таких условиях ориентируется на агрессивное соотношение между итоговым и действительным разрешением рендеринга (1:4), которое не могла себе позволить ни одна игра с поддержкой первой версии технологии. Но работа нейросети сама по себе по-прежнему не бесплатна с точки зрения быстродействия. Так, если сравнить кадровую частоту в режиме 2160p, когда исходным разрешением для масштабирования кадра является 1080p, и прямой рендеринг в 1080p, DLSS 2.0 отнимает 17 % FPS. Однако если взять за точку отсчета 2160p без масштабирования, налицо громадный рост частоты смены кадров — в 2,5–2,7 раза. Благодаря DLSS можно насладиться Minecraft RTX в 4К на любой видеокарте 20-й серии, начиная с GeForce RTX 2060 SUPER. Но только при условии считать приемлемым фреймрейт ниже 60 FPS. Даже GeForce RTX 2080 Ti вынудит пойти на компромисс в дальности рендеринга объектов, иначе все, на что можно рассчитывать, — это 53 кадра/с. Но в конце концов, Minecraft RTX в своих требованиях к железу — далеко не исключение. Большинство других тайтлов с передовой графикой уже без всякого рейтрейсинга закрыли перспективу играть в 4К на максималках с кадровой частотой 60 FPS.

3840 × 2160
RT выкл. RT вкл. + DLSS 2.0 RT вкл.
NVIDIA GeForce RTX 2080 Ti FE (11 Гбайт) 180 (100%) 52,8 (-71%) 21,2 (-88%)
NVIDIA GeForce RTX 2080 SUPER (8 Гбайт) 180 (100%) 43,4 (-76%) 16,9 (-91%)
NVIDIA GeForce RTX 2080 FE (8 Гбайт) 180 (100%) 41,4 (-77%) 15,7 (-91%)
NVIDIA GeForce RTX 2070 SUPER (8 Гбайт) 180 (100%) 39,6 (-78%) 15 (-92%)
NVIDIA GeForce RTX 2070 FE (8 Гбайт) 180 (100%) 37,9 (-79%) 14,5 (-92%)
NVIDIA GeForce RTX 2060 SUPER (8 Гбайт) 180 (100%) 33 (-82%) 12,3 (-93%)
NVIDIA GeForce RTX 2060 FE (6 Гбайт) 180 (100%) 28,1 (-84%) 10,5 (-94%)

#Выводы

Своей технической стороной Minecraft RTX похожа на другую игру, которая стараниями NVIDIA полностью перешла с растеризации на трассировку лучей вместо гибридного рендеринга, применяющегося во всех остальных играх под флагом RTX On. Наши читатели сразу поймут, какой проект был первым (конечно же, Quake II RTX), а вот широкая публика его уже вряд ли вспомнит. Похоже, именно такого союзника, как Minecraft с его громадной популярностью, не хватало NVIDIA для того, чтобы все убедились в том, как выглядит будущее.

На первый взгляд, удивительно, почему Minecraft, изначально не имеющий сколь-либо существенных системных требований, сделали ареной для технических инноваций. Но если вдуматься, игре, которая целиком состоит из постройки и исследования разнообразных миров, апгрейд графики — от рудиментарной до самой передовой — принес больше дивидендов, чем любому ААА-проекту двух последних лет. Первые образцы, доступные в бета-версии Minecraft RTX, — это лишь начало. Самое интересное — то, что в будущем породит сообщество игроков, вооруженное новыми инструментами.

Увы, потребительское железо пока не справляется с полной трассировкой лучей грубой силой. GeForce RTX 2080 Ti — единственный ускоритель, который гарантирует в Minecraft RTX не меньше 60 FPS средней кадровой частоты при максимальной дальности рендеринга, да и то лишь в режиме 1080p. Прежде чем быстродействие видеокарт увеличится еще в несколько раз, им не обойтись без алгоритмов масштабирования кадра. К счастью, DLSS версии 2.0 здесь работает безупречно: нейросеть легко справляется с блочной архитектурой Minecraft без видной невооруженным глазом потери качества и увеличивает кадровую частоту не меньше чем в 1,5–2,5 раза (в зависимости от итогового разрешения). Как следствие, уже на GeForce RTX 2060 SUPER можно получить заветные 60 FPS при разрешении 1080p, а базовой версии GeForce RTX 2080 покорился режим 1440p. А вот игру в 4К придется оставить видеокартам следующего поколения: если не соглашаться на компромисс в дальности прорисовки, 60 FPS не светят даже GeForce RTX 2080 Ti.

#Групповые тесты видеокарт в других играх

3DNews регулярно проводит массовые тесты графических карт в популярных играх. Если вы хотите узнать, как современные модели и устройства прошлых поколений работают в других проектах, к вашим услугам архив бенчмарков за прошедший год:



Оригинал материала: https://3dnews.ru/1008824