Оригинал материала: https://3dnews.ru/986747

GeForce GTX против GeForce RTX в играх будущего

Введение. Методика тестирования. Результаты тестирования: Atomic Heart, Justice

Первая серия тестов трассировки лучей на ускорителях без аппаратных RT-блоков завершилась позитивными результатами для владельцев старших моделей GeForce GTX. В робких и до поры до времени немногочисленных попытках освоить гибридный рендеринг разработчики не жадничают с эффектами DXR и позволяют регулировать их качество в достаточной степени, чтобы продлить жизнь мощным GPU прошлого поколения. В итоге GeForce GTX 1080 Ti может поспорить с GeForce RTX 2060 по быстродействию в Battlefield V и Shadow of the Tomb Raider, обеспечивая уверенно высокую частоту смены кадров в режиме 1080p. Но результаты бенчмарков Metro Exodus дали понять, что это лишь временное положение вещей. К этой игре GeForce GTX 1080 Ti допущен на правах бедного родственника. 

Смогут ли графические процессоры, лишенные специализированных функций трассировки лучей, выжить в проектах следующей волны? Для того чтобы дать ответ на этот вопрос, мы не станем делать предсказания на основе результатов в уже выпущенных играх. К обновлению драйвера с поддержкой DXR на GPU архитектуры Pascal и младших чипах семейства Turing были опубликованы тестовые версии двух грядущих проектов, использующих гибридный рендеринг, — Atomic Heart и Justice. Кроме того, возможность приоткрыть завесу над будущим компьютерных игр предоставляют и бенчмарк 3DMark Port Royal, и деморолик Reflections на движке Unreal Engine 4. Эти тесты лежат далеко за пределом возможностей «Паскаля» и будут решать дальнейшую судьбу лучших видеокарт сегодняшнего дня — серии GeForce RTX.

Тестовый стенд, методика тестирования

Тестовый стенд
CPU Intel Core i9-9900K (4,9 ГГц, 4,8 ГГц в AVX, фиксированная частота)
Материнская плата ASUS MAXIMUS XI APEX
Оперативная память G.Skill Trident Z RGB F4-3200C14D-16GTZR, 2 × 8 Гбайт (3200 МГц, CL14)
ПЗУ Intel SSD 760p, 1024 Гбайт
Блок питания Corsair AX1200i, 1200 Вт
Система охлаждения CPU Corsair Hydro Series H115i
Корпус CoolerMaster Test Bench V1.0
Монитор NEC EA244UHD
Операционная система Windows 10 Pro x64
ПО для GPU NVIDIA
NVIDIA GeForce RTX 20 NVIDIA GeForce Game Ready Driver 419.67
NVIDIA GeForce GTX 10/16 NVIDIA GeForce Game Ready Driver 425.31

Показатели средней и минимальной частоты кадров выводятся из массива времени рендеринга индивидуальных кадров, созданного с помощью утилиты OCAT. Тест 3DMark Port Royal приводит собственную статистику средней кадровой частоты.

Средняя частота смены кадров на диаграммах является величиной, обратной среднему времени кадра. Для оценки минимальной кадровой частоты вычисляется количество кадров, сформированных в каждую секунду теста. Из этого массива чисел выбирается значение, соответствующее 1-му процентилю распределения.

Участники тестирования

В тестировании производительности приняли участие следующие видеокарты:

#Atomic Heart

Бенчмарк грядущей игры Atomic Heart не содержит каких бы то ни было настроек, помимо возможности включить масштабирование кадра с помощью DLSS, а максимальное разрешение экрана составляет 2560 × 1600 пикселов. Трассировка лучей здесь всегда активна. По той причине, что движок Atomic Heart использует DXR для рендеринга двух различных эффектов — теней и отражений света (включая множественную трассировку лучей между несколькими зеркальными поверхностями), тестовая сцена представляет собой серьезную задачу даже для ускорителей на чипах Turing с выделенными RT-ядрами. Старшие модели NVIDIA (GeForce RTX 2080 и RTX 2080 Ti) с запасом превосходят отметку 60 кадров/с в режиме 1080p, в то время как RTX 2060 и RTX 2070 зажаты в диапазоне 45–55 FPS. Напротив, при разрешении 1440p даже GeForce RTX 2080 Ti не достиг порогового значения 60 FPS, а результаты GeForce RTX 2060 упали ниже 30 FPS.

Финальная версия Atomic Heart наверняка позволит регулировать качество эффектов DXR, чтобы снизить нагрузку на графический процессор. Кроме того, у разработчиков еще есть несколько месяцев для всесторонней оптимизации движка. Но в существующем виде игра явно превосходит возможности любых ускорителей на графических процессорах Pascal. Все, на что способен GeForce GTX 1080 Ti, — это 26 FPS при разрешении 1080p и 15 FPS в режиме 1440p, что уж говорить о менее производительных устройствах серии GTX 10.

При столь высокой нагрузке, как в Atomic Heart, даже видеокарты GeForce GTX 1660 и GTX 1660 Ti, лишенные специализированных блоков трассировки лучей, имеют преимущество перед большинством моделей прошлого поколения. Оба новых ускорителя средней ценовой категории превосходят GeForce GTX 1080 — такого разгрома архитектуры Pascal мы еще не видели. Но как бы то ни было, для того, чтобы развить приемлемую частоту смены кадров, абсолютной вычислительной мощности чипа TU116 все еще совершенно недостаточно.

#Justice

Китайскую MMORPG Justice нельзя без оговорок назвать игрой будущего, ведь она была запущена еще в прошлом году. Но в ближайшее время разработчики намерены внедрить в Justice эффекты трассировки лучей и выпустили отдельный бенчмарк для оценки их производительности. В отличие от других тестов в сегодняшней подборке, движок Justice не настолько перегружен эффектами DXR, чтобы поставить на колени любые GPU, за исключением старших моделей семейства Turing. Ray Tracing здесь используется для рендеринга однократных отражений в зеркальных поверхностях, теней, а также преломления света в жидкой среде (caustics). Кроме того, без учета трассировки лучей Justice является довольно-таки нетребовательной игрой, как и положено любым соперникам World of Warcraft. А благодаря возможности отключить трассировку лучей в тесте Justice, мы провели базовую линию производительности участников теста и оценили воздействие RT на частоту смены кадров в процентном отношении.

Полученные данные вполне соответствуют той картине, которую мы наблюдали в других проектах с условно нетребовательными эффектами DXR (Battlefield V и Shadow of the Tomb Raider). Трассировка лучей в равной степени влияет на производительность игры при трех различных разрешениях экрана (1080p, 1440p и 2160p), если в кристалле GPU нет специализированной логики для расчетов траектории лучей. Так, «зеленые» видеокарты прошлого поколения в большинстве случаев теряют от 74 до 79 % средней кадровой частоты (только GeForce GTX 1080 Ti отделался 63 % в режиме 1080p). Новинки на чипе TU116 (GeForce GTX 1660 и GTX 1660 Ti) оказались в более выгодном положении за счет прогрессивной организации шейдерных ALU и пострадали лишь на 62–65 % FPS.

И разумеется, лучший результат продемонстрировали ускорители на чипах Turing с RT-ядрами. При разрешении 1080p быстродействие видеокарт серии GeForce RTX пострадало всего лишь на 18–27, в режиме 1440p — на 21–32, а в 2160p — на 31–33 %. Обратите внимание, как сильно в этой группе выделяется флагманская модель — GeForce RTX 2080 Ti понес заметно меньшие потери по сравнению с RTX 2060, RTX 2070 и RTX 2080 при разрешениях ниже 2160p. Впрочем, своими выдающимися результатами при условно низких разрешениях новые GPU обязаны не только архитектуре Turing, но и тому обстоятельству, что без эффектов DXR частота смены кадров в Justice ограничена быстродействием центрального процессора на уровне 126–127 FPS.

В абсолютных показателях частоты смены кадров Justice с трассировкой лучей легко дается всем видеокартам под маркой GeForce RTX при разрешении экрана 1080p и 1440p. GeForce RTX 2060 отступил на 3 кадра/с от критического значения 60 FPS в режиме 1440p, но старшие модели уверенно преодолели эту границу. А вот в режиме 4К даже GeForce RTX 2080 Ti не достиг 60 FPS, в то время как RTX 2060 опустился ниже 30.

Среди видеокарт на чипах Pascal нет ни одного устройства, способного вывести Justice на уровень 60 FPS. Ускорители серии GTX 10 прикованы к режиму 1080p, да и то лишь три старшие модели (GTX 1070 Ti, GTX 1080 и GTX 1080 Ti) по своим возможностям соответствуют минимальному критерию 30 FPS. То же относится к GeForce GTX 1660 и GTX 1660 Ti, хотя, к чести новинок NVIDIA, стоит признать, что в тесте Justice они снова выступили не хуже GeForce GTX 1080.

Justice
1920 × 1080
RT Off RT On
NVIDIA GeForce RTX 2080 Ti FE (11 Гбайт) 100% -18%
NVIDIA GeForce RTX 2080 FE (8 Гбайт) 100% -20%
NVIDIA GeForce RTX 2070 FE (8 Гбайт) 100% -21%
NVIDIA GeForce RTX 2060 FE (6 Гбайт) 100% -27%
NVIDIA GeForce GTX 1660 Ti (6 Гбайт) 100% -65%
NVIDIA GeForce GTX 1660 (6 Гбайт) 100% -64%
NVIDIA GeForce GTX 1080 Ti (11 Гбайт) 100% -63%
NVIDIA GeForce GTX 1080 (8 Гбайт) 100% -74%
NVIDIA GeForce GTX 1070 Ti (8 Гбайт) 100% -74%
NVIDIA GeForce GTX 1070 (8 Гбайт) 100% -77%
NVIDIA GeForce GTX 1060 (6 Гбайт) 100% -77%
Justice
2560 × 1440
RT Off RT On
NVIDIA GeForce RTX 2080 Ti FE (11 Гбайт) 100% -21%
NVIDIA GeForce RTX 2080 FE (8 Гбайт) 100% -30%
NVIDIA GeForce RTX 2070 FE (8 Гбайт) 100% -33%
NVIDIA GeForce RTX 2060 FE (6 Гбайт) 100% -32%
NVIDIA GeForce GTX 1660 Ti (6 Гбайт) 100% -65%
NVIDIA GeForce GTX 1660 (6 Гбайт) 100% -64%
NVIDIA GeForce GTX 1080 Ti (11 Гбайт) 100% -76%
NVIDIA GeForce GTX 1080 (8 Гбайт) 100% -77%
NVIDIA GeForce GTX 1070 Ti (8 Гбайт) 100% -77%
NVIDIA GeForce GTX 1070 (8 Гбайт) 100% -78%
NVIDIA GeForce GTX 1060 (6 Гбайт) 100% -79%
Justice
3840 × 2160
RT Off RT On
NVIDIA GeForce RTX 2080 Ti FE (11 Гбайт) 100% -31%
NVIDIA GeForce RTX 2080 FE (8 Гбайт) 100% -23%
NVIDIA GeForce RTX 2070 FE (8 Гбайт) 100% -33%
NVIDIA GeForce RTX 2060 FE (6 Гбайт) 100% -33%
NVIDIA GeForce GTX 1660 Ti (6 Гбайт) 100% -63%
NVIDIA GeForce GTX 1660 (6 Гбайт) 100% -62%
NVIDIA GeForce GTX 1080 Ti (11 Гбайт) 100% -77%
NVIDIA GeForce GTX 1080 (8 Гбайт) 100% -78%
NVIDIA GeForce GTX 1070 Ti (8 Гбайт) 100% -77%
NVIDIA GeForce GTX 1070 (8 Гбайт) 100% -78%
NVIDIA GeForce GTX 1060 (6 Гбайт) 100% -79%

Результаты тестирования: 3DMark Port Royal, UE4 Reflections. Выводы

#3DMark Port Royal

В отличие от других разделов пакета 3DMark, синтетический тест гибридного рендеринга Port Royal состоит из единственной сцены, поэтому итоговая оценка в баллах, которую получили видеокарты, прямо пропорциональна средней частоте смены кадров. Если представить себе игру с настолько высокой плотностью эффектов DXR, как в Port Royal (а здесь на Ray Tracing основаны все главные компоненты освещения), то лишь один из протестированных ускорителей обладает подходящим для нее уровнем быстродействия — GeForce RTX 2080 Ti. Да и то все, на что оказался способен флагманский GPU нового поколения, — это перешагнуть отметку 30 FPS в стандартном для Port Royal разрешении 1440p.

Вместе с тем 3DMark наглядно продемонстрировал преимущество архитектуры Turing перед графическими процессорами Pascal, которое распространяется на весь арсенал моделей GeForce RTX. Если в современных играх с поддержкой трассировки лучей старшие представители серии GeForce 10 (GTX 1080 и GTX 1080 Ti) могут поспорить с GeForce RTX 2060, то здесь флагман прошлого поколения ровно в два раза уступает младшему Turing по средней кадровой частоте.

Если двигаться вниз по модельному ряду GeForce 10, то отставание GeForce GTX 1070 от GeForce RTX 2060 достигает трехкратного значения, а у GeForce GTX 1060 дефицит вычислительных ресурсов переходит в критическую фазу, когда видеокарте требуется несколько секунд, чтобы сформировать единственный кадр. И дело вовсе не в объеме оперативной памяти GPU, ведь GeForce GTX 1660 и GTX 1660 Ti, оснащенные 6 Гбайт RAM, не уступают своим ближайшим аналогам на чипах Pascal (GTX 1070 и GTX 1070 Ti) с 8 Гбайт локальной памяти и даже превосходят их по средней частоте смены кадров и оценке в баллах.

#UE4 Reflections

Ранее короткий ролик Reflections на движке Unreal Engine 4 уже не раз участвовал в тестах трассировки лучей и DLSS на видеокартах GeForce RTX. Однако для исследования возможностей DXR на чипах предыдущего поколения NVIDIA создала отдельную версию программы и позволяет скачать ее с собственного сайта вместе с бенчмарками Justice и Atomic Heart. Reflections лишился поддержки DLSS, зато исчезло и ограничение по разрешению экрана (раньше ролик был привязан к режимам 1440p и 2160p, на которых была выполнена тренировка нейросети DLSS).

В обновленной версии ролика есть иная особенность, которая затрудняет его применение в качестве универсального бенчмарка трассировки лучей: частота смены кадров на старших ускорителях серии GeForce RTX (RTX 2080 и RTX 2080 Ti) не может превышать 48 FPS, а для всех остальных моделей установлен лимит в 24 FPS. Однако это препятствие вступает в силу лишь при разрешении 1080p, когда у соответствующих GPU есть избыток вычислительной мощности. Если о каком-либо избытке быстродействия вообще можно рассуждать применительно к Reflections, ведь эта сцена практически целиком освещается при помощи трассировки лучей.

В этом режиме GeForce RTX 2060, RTX 2070 и 2080 Ti достигли разрешенных значений 24 и 48 FPS соответственно, в то время как лучшая из потребительских видеокарт прошлого поколения (GeForce GTX 1080 Ti) набрала скромные 16 кадров/с. Как видите, паритет между GeForce RTX 2060 и GTX 1080 Ti, который мы зафиксировали в предыдущей части статьи, вновь был нарушен при столь агрессивной нагрузке, как в демо Reflections.

Рендеринг Reflection в режиме 1440p является пределом возможностей для любого из современных GPU без помощи таких методов, как DLSS. Даже GeForce RTX 2080 Ti с трудом преодолел отметку 30 FPS, а быстродействие видеокарт без RT-блоков характеризуется однозначными числами.

Модели серии GeForce 16 вновь продемонстрировали достоинства архитектуры Turing: при разрешении экрана ниже 4К GeForce GTX 1660 и GTX 1660 Ti не отстают от GeForce GTX 1080. Положение меняется при разрешении 2160p, когда программе недостаточно 6 Гбайт оперативной памяти GPU, но в таком случае Reflections не по зубам и самому GeForce RTX 2080 Ti.

#Выводы

Вслед за первой стычкой GeForce GTX и GeForce RTX на поле игр с трассировкой лучей мы сравнили быстродействие аппаратной и программной реализации DXR в перспективных проектах и двух откровенно футуристических тестах гибридного рендеринга.

Предварительные версии Atomic Heart и Justice дают понять, как будут выглядеть компьютерные игры в ближайшие несколько месяцев. И здесь, увы, уже нельзя поставить на один уровень какие бы то ни было устройства NVIDIA прошлого и современного поколения. Даже в Justice — а это сравнительно легкая игра без трассировки лучей — GeForce GTX 1080 Ti не достиг оптимального уровня быстродействия в 60 FPS при разрешении 1080p, а в Atomic Heart бывшему флагману не светят и минимальные 30. В обоих тестах GeForce RTX 2060 превосходит GeForce GTX 1080 Ti практически вдвое. При столь печальных результатах еще недавно столь могучего GeForce GTX 1080 Ti обсуждать достижения других видеокарт на чипах Pascal, пожалуй, и вовсе не стоит.

Да и младшие представители серии GeForce RTX в такой тяжелой игре, как Atomic Heart, уже близки к пределу своих возможностей и оказались заперты в режиме 1080p, хотя прекрасно чувствуют себя в Justice. Вполне может сложиться и такая ситуация, что ко времени массового внедрения гибридного рендеринга те устройства, которые инициировали поворот игроделов в этом направлении, будут уже не актуальны.

А что касается деморолика Reflections на движке Unreal Engine 4 и тем паче теста Port Royal в пакете 3DMark, то в пейзаже уже не завтрашнего, а послезавтрашнего дня совсем нет места GPU без аппаратных расчетов трассировки лучей. А если начистоту, то и современным ускорителям Turing неминуемо придется уступить место новой итерации чипов NVIDIA.



Оригинал материала: https://3dnews.ru/986747