⇣ Содержание
Опрос
|
реклама
GeForce RTX больше не нужен? Тесты трассировки лучей на ускорителях GeForce GTX 10 и 16
После того как NVIDIA продемонстрировала трассировку лучей в реальном времени на видеокартах серии GeForce RTX, трудно сомневаться в том, что именно за этой технологией (в разумном сочетании с алгоритмом растеризации) будущее компьютерных игр. Однако графические процессоры на основе архитектуры Turing со специализированными RT-ядрами до недавнего времени считались единственной категорией дискретных GPU, которая располагает подходящей для этого вычислительной мощностью. Как показали тесты первых игр, освоивших Ray Tracing (Battlefield V, Metro Exodus и Shadow of the Tomb Raider), даже ускорители GeForce RTX (особенно младший из них — RTX 2060) испытывают существенное падение частоты смены кадров в задачах гибридного рендеринга. Несмотря на первые успехи, трассировку лучей в реальном времени еще нельзя считать зрелой технологией. Лишь тогда, когда не только самые передовые и дорогостоящие устройства, но и графические карты среднего ценового уровня достигнут прежних стандартов быстродействия в играх новой волны, можно будет объявить, что смена парадигм, запущенная компанией Дженсена Хуанга, наконец, совершилась. Трассировка лучей на «Паскалях» — за и против Но уже сейчас, пока еще не сказано ни слова о будущем преемнике архитектуры Turing, NVIDIA решила подстегнуть прогресс. На мероприятии GPU Technology Conference в прошлом месяце зеленая команда сообщила, что ускорители на чипах Pascal, а также младшие представители семейства Turing (серия GeForce GTX 16) приобретут функцию трассировки лучей в реальном времени наравне с продуктами под маркой RTX. Сегодня обещанный драйвер уже можно скачать на официальном сайте NVIDIA, а список устройств включает модели семейства GeForce 10, начиная с GeForce GTX 1060 (версия 6 Гбайт), профессиональный ускоритель TITAN V на чипе Volta, и, разумеется, новоприбывшие модели средней ценовой категории на чипе TU116 — GeForce GTX 1660 и GTX 1660 Ti. Обновление коснулось и ноутбуков с соответствующими GPU. С технической точки зрения здесь нет ничего сверхъестественного. Графические процессоры с унифицированными шейдерными блоками могли выполнять Ray Tracing задолго до появления архитектуры Turing, хотя в то время не располагали достаточным быстродействием для того, чтобы эта возможность была востребована в играх. Кроме того, отсутствовал единый стандарт программных методов, помимо закрытых API наподобие фирменного NVIDIA OptiX. Теперь, когда существует расширение DXR для Direct3D 12 и аналогичные библиотеки в интерфейсе программирования Vulkan, игровой движок может обращаться к ним вне зависимости от того, оснащен ли графический процессор специализированной логикой — лишь бы драйвер давал такую возможность. У чипов Turing для этой цели есть отдельные RT-ядра, а в GPU архитектуры Pascal и процессоре TU116 трассировка лучей реализована в формате вычислений общего назначения на массиве шейдерных ALU. Однако все, что нам известно об архитектуре Turing со слов самой NVIDIA, говорит о том, что Pascal не годится для приложений с поддержкой DXR. В прошлогодней презентации, посвященной флагманским моделям семейства Turing — GeForce RTX 2080 и RTX 2080 Ti — инженеры приводили следующие выкладки. Если бросить все ресурсы лучшей из потребительских видеокарт прошлого поколения — GeForce GTX 1080 Ti — на вычисления трассировки лучей, то итоговая производительность не превысит 11 % от того, на что в теории способен RTX 2080 Ti. Не менее важно и то, что свободные CUDA-ядра чипа Turing в то же время можно использовать для параллельной обработки других компонентов изображения — выполнения шейдерных программ, очереди неграфических расчетов Direct3D при асинхронном исполнении и так далее. В реальных играх ситуация сложнее, ведь на существующем железе разработчики дозированно пользуются функциями DXR, а львиную долю вычислительной нагрузки по-прежнему занимает растеризация и шейдерные инструкции. К тому же часть различных эффектов, которые создаются при помощи трассировки лучей, неплохо исполняются и на CUDA-ядрах чипов Pascal. К примеру, зеркальные поверхности в Battlefield V не подразумевают вторичного отражения лучей, а следовательно, являются посильной нагрузкой для мощных видеокарт прошлого поколения. То же относится и к теням в Shadow of the Tomb Raider, хотя рендеринг сложных теней, сформированных несколькими источниками света, уже представляет собой более трудную задачу. А вот глобальное освещение в Metro Exodus с трудом дается даже «Тьюрингу», и от Pascal нельзя ожидать в какой-либо степени сопоставимых результатов. Как ни крути, речь идет о многократной разнице в теоретическом быстродействии между представителями архитектуры Turing и их ближайшими аналогами на кремнии Pascal. Причем в пользу Turing играет не только присутствие RT-ядер, но и многочисленные усовершенствования общего характера, свойственные ускорителям нового поколения. Так, чипы Turing умеют параллельно выполнять операции над вещественными (FP32) и целочисленными (INT) данными, несут большой объем локальной кеш-памяти и отдельные CUDA-ядра для расчетов сниженной точности (FP16). Все это значит, что Turing не только лучше справляется с шейдерными программами, но и может сравнительно эффективно обсчитывать трассировку лучей без специализированных блоков. Ведь настолько ресурсоемким рендеринг при помощи Ray Tracing делает не только и не столько поиск пересечений между лучами и элементами геометрии (которым занимаются RT-ядра), сколько вычисление цвета в точке пересечения (shading). И между прочим, перечисленные достоинства архитектуры Turing в полной мере относятся к GeForce GTX 1660 и GTX 1660 Ti, хотя в чипе TU116 нет RT-ядер, поэтому тесты этих видеокарт с программной трассировкой лучей представляют отдельный интерес. Но довольно теории, ведь мы уже собрали данные о производительности «Паскалей» (а также младших «Тьюрингов») в Battlefield V, Metro Exodus и Shadow of the Tomb Raider на основе собственных измерений. Заметим, что ни драйвер, ни сами игры не регулируют количество лучей для того, чтобы снизить нагрузку на GPU без RT-ядер, а значит, качество эффектов на GeForce GTX и GeForce RTX должно быть одинаковым. ⇡#Тестовый стенд, методика тестирования
Показатели средней и минимальной кадровых частот выводятся из массива времени рендеринга индивидуальных кадров, который записывает встроенный бенчмарк (Metro Exodus, Shadow of the Tomb Raider) или утилита OCAT, если в игре его нет (Battlefield V). Средняя частота смены кадров на диаграммах является величиной, обратной среднему времени кадра. Для оценки минимальной кадровой частоты вычисляется количество кадров, сформированных в каждую секунду теста. Из этого массива чисел выбирается значение, соответствующее 1-му процентилю распределения. Участники тестирования В тестировании производительности приняли участие следующие видеокарты:
Battlefield V Благодаря тому, что Battlefield V сама по себе является довольно нетребовательной игрой (особенно в режимах 1080p и 1440p), а трассировка лучей в ней применяется фрагментарно, испытание GeForce 10-й серии с опцией DXR принесло обнадеживающие результаты. Впрочем, из всех моделей без поддержки Ray Tracing на уровне кремния нам пришлось ограничиться моделями GTX 1070/1070 Ti и GTX 1080/1080 Ti. Игры Electronic Arts с подозрением реагируют на частую смену конфигурации железа и блокируют пользователя на период в одни или несколько суток. Поэтому замеры производительности GeForce GTX 1060 и двух устройств серии GeForce GTX 16 появятся в этой статье позже, как только Battlefield V снимет ограничения с нашей тестовой машины. В процентном выражении любой из участников тестирования испытывает примерно одинаковое падение быстродействия при различных установках качества трассировки лучей вне зависимости от разрешения экрана. Так, быстродействие видеокарт под маркой GeForce RTX 20 снижается на 28–43 % при низком и среднем качестве эффектов DXR, а при высоком и максимальном — на 37–53 %. Если речь идет о старших моделях семейства GeForce 10, то на уровнях трассировки лучей Low и Medium игра теряет от 36 до 42 % FPS, а при высоком качестве (настройки High и Ultra) DXR съедает уже 54–67 % частоты смены кадров. Заметим, что во многих, если не в большинстве игровых сцен Battlefield V нет выраженной разницы между настройками Low и Medium, а также между High и Ultra — ни по четкости изображения, ни по быстродействию. В надежде на то, что графические процессоры Pascal окажутся более чувствительными к этому параметру, мы провели тесты при всех четырех настройках. И действительно, проявились определенные различия, но только при разрешении 2160p и в пределах 6% FPS. В абсолютных показателях любой из старших ускорителей на чипах Pascal может поддерживать кадровую частоту выше 60 FPS в режиме 1080p при сниженном качестве отражений, а GeForce GTX 1080 Ti претендует на аналогичный результат даже при трассировке на уровне High. Но стоит перейти к разрешению 1440p, и уже лишь GeForce GTX 1080 и GTX 1080 Ti обеспечивают комфортный фреймрейт на уровне 60 FPS и выше при качестве трассировки лучей Low или Medium, а в режиме 4К ни одна из карт прошлого поколения не обладает подходящей вычислительной мощностью (как, впрочем, и любой Turing за исключением флагманского GeForce RTX 2080 Ti). Если искать параллели между конкретными ускорителями под маркой GeForce GTX 10 и GeForce RTX 20, то лучшая модель прошлого поколения (GeForce GTX 1080 Ti), которая в задачах стандартного рендеринга без DXR является аналогом GeForce RTX 2080, опустилась на уровень GeForce RTX 2070 при сниженном качестве трассировки лучей, а при высоком может бороться разве что с GeForce RTX 2060. Дополнение: результаты GeForce GTX 1060, GTX 1660 и GTX 1660 Ti. В тестах GeForce GTX 1660 и GTX 1660 Ti можно заметить слабые признаки того, что архитектура Turing и вправду лучше справляется с трассировкой лучей даже без поддержки RT-ядер по сравнению с видеокартами семейства Pascal аналогичного уровня — GeForce GTX 1070 и GTX 1070 Ti. При разрешениях 1080p и 1440p разница в потере быстродействия, которую GPU испытывает при активации DXR, между ускорителями 16-й серии, с одной стороны, и картами на чипе GP104, с другой, возникает при высоком и максимальном качестве эффектов трассировки лучей, пусть она и не превышает нескольких процентов. А вот в режиме 2160p при таких же настройках графический процессор TU116 уже выдерживает дополнительную нагрузку заметно лучше, чем «Паскали». Впрочем, последнее относится именно к GTX 1660 Ti: модель без приставки Ti с гибридным рендерингом в 4К откровенно не справляется. Результаты двух моделей GeForce 16-й серии в абсолютных значениях частоты смены кадров также выглядят обнадеживающе. В режиме 1080p GeForce GTX 1660 и GTX 1660 Ti поддерживают около 60 FPS при низком и среднем качестве эффектов DXR, а при разрешении 1440p можно рассчитывать по меньшей мере на 30. Только в 4К с трассировкой лучей чипу TU116 делать уже нечего. Что касается GeForce GTX 1060, то при условно низком разрешении экрана (1080p и 1440p) младший ускоритель из списка моделей, допущенных к трассировке лучей в реальном времени, утратил от 35 до 39 % кадровой частоты с низкими и средними настройками DXR, и от 57 до 64 % с высокими и максимальными. В этом GTX 1060 мало отличается от своих ближайших соседей по серии GeForce 10. Однако, как и GeForce GTX 1660, эта видеокарта получает катастрофический удар по быстродействию в 4К: теряется от 59 до 95 % изначальной скорости. Тем не менее, играть в Battlefield V с DXR на GeForce GTX 1060 все-таки можно, но придется согласиться на средний FPS немногим больше 50 в режиме 1080p и 30 в 1440p (если не жадничать с настройками качества).
⇡#Metro ExodusВ отличие от Battlefield V, графический движок Metro Exodus не дает пощады видеокартам, лишенным аппаратных функций трассировки лучей. Так, в режиме 1080p старшие представители семейства Turing (начиная с GeForce RTX 2060 и заканчивая RTX 2080 Ti) понесли урон в диапазоне от 18 до 20 % FPS при высоком качестве трассировки и от 27 до 31 % — при низком. Другие же участники тестирования в таких же условиях теряют 53–59 и 66–71 % исходной частоты смены кадров. При разрешении 1440p потери вычислительной мощности на трассировку лучей составляют 21–27 и 31–38 % для моделей GeForce RTX 20, а также 59–64 и 72–76 % для всех остальных — в зависимости от того, какая из двух опций качества активирована в бенчмарке. Заметим, что, пусть младшие «Тьюринги» (GeForce GTX 1660 и GTX 1660 Ti) и имеют преимущество в программной трассировке лучей перед ускорителями на чипах Pascal благодаря общим оптимизациям новой архитектуры, в Metro Exodus они испытывают не менее сильное падение быстродействия, чем GeForce GTX 1060. Среди видеокарт без аппаратной поддержки DXR лучше всего держатся GeForce GTX 1080 и GTX 1080 Ti — просто за счет крупного массива шейдерных ALU. Однако процентные оценки быстродействия еще не дают ответа на вопрос, можно ли с комфортом играть в Metro Exodus на ускорителях без аппаратных RT-ядер в условиях гибридного рендеринга. Результаты тестирования легко описать одним примером: GeForce GTX 1080 Ti обеспечивает не меньше 60 FPS в режимах 1080p и 1440p при ультравысоком качестве изображения и без трассировки лучей. Но когда были включены эффекты DXR, бывший флагман преодолел отметку 30 FPS только при разрешении 1080p и низшем качестве трассировки лучей (опция High), которое допускает Metro Exodus. Модель GeForce RTX 2060, которая сама по себе не блещет результатами в этой игре, в любых тестах с DXR демонстрирует более высокую производительность. Что и говорить о более слабых представителях серии GeForce GTX 10: к примеру, GeForce GTX 1060 с трассировкой лучей в Metro Exodus годится только для съемки скриншотов. Что касается последних новинок NVIDIA — GeForce GTX 1660 и GTX 1660 Ti, — то результаты на уровне GeForce GTX 1070 и GTX 1070 Ti в тестах гибридного рендеринга едва ли можно рассматривать как достижение, коль скоро и без трассировки лучей эти представители прошлого и настоящего поколений видеокарт соотносятся примерно так же.
⇡#Shadow of the Tomb RaiderИз трех игр, которые в настоящий момент используют трассировку лучей в реальном времени, Shadow of the Tomb Raider располагается в промежутке между Battlefield V и Metro Exodus по требованиям к быстродействию GPU. Графический движок выполняет Ray Tracing для рендеринга теней с тремя уровнями детализации: от среднего до ультравысокого. Самая щадящая опция (Medium) на видеокартах под маркой GeForce RTX 20 забирает от 13 до 18 % частоты смены кадров — в зависимости от разрешения экрана. Впрочем, настройка Medium в Shadow of the Tomb Raider активирует трассировку лучей только для редких точечных источников света и в большинстве игровых сцен не производит заметного эффекта. Промежуточный вариант качества теней (High) снижает быстродействие этих устройств на 37–44 %, а высший (Ultra) — на 39–48 %. Ускорители семейства GeForce GTX 10 при среднем качестве эффектов DXR отделались снижением быстродействия в 16–24 % (единственным исключением оказался GeForce GTX 1060, который потерял уже 31 % FPS при разрешении 1440p и 2160p). Установка высокого качества трассированных теней приводит к тому, что частота смены кадров на «Паскалях» падает на 41–57 % даже при разрешении экрана ниже 4К, а в режиме 2160p потери увеличиваются до 61–68 %. И наконец, ради трассировки на уровне Ultra владельцу видеокарты серии GeForce GTX 10 придется пожертвовать 54–67 % FPS при условно низких разрешениях экрана и 67-74 % в 4К. Перед новыми устройствами NVIDIA в средней ценовой категории — GeForce GTX 1660 и GTX 1660 Ti — Shadow of the Tomb Raider открыл возможность доказать преимущества архитектуры Turing перед чипами Pascal без помощи специализированных RT-ядер. Действительно, эти ускорители справляются с тестами в условиях гибридного рендеринга более эффективно, чем близкие по производительности модели GeForce 10-й серии. Так, потери быстродействия на GeForce GTX 1660 Ti при трех уровнях качества эффектов DXR равняются 16–21, 50–55 и 51–61 % — в зависимости от разрешения экрана. У GeForce 1070 эти показатели достигают 19–21, 53–68 и 58–72 %. Пусть эффекты трассировки лучей на минимальном уровне качества не так сильно повышают запросы игры к быстродействию железа, как в Metro Exodus или даже в Battlefield V, активация DXR мгновенно снимает с дистанции все видеокарты прошлого поколения. Исключением стал только GeForce GTX 1080 Ti: бывший флагман смог пробить отметку 60 FPS при разрешении 1080p. В любом случае, даже GeForce GTX 1080 Ti в любых тестах с трассировкой лучей проигрывает младшей модели среди полноценных «Тьюрингов» — GeForce RTX 2060.
⇡#ВыводыС тех пор как на рынке появились первые видеокарты под флагом «RTX On», NVIDIA неустанно убеждала нас в том, что трассировка лучей в реальном времени невозможна на железе прошлого поколения с приемлемой частотой смены кадров. Есть ли повод чувствовать себя обманутым теперь, когда функции DXR открылись для множества моделей семейства GeForce GTX 10 и GeForce GTX 16? Определенно нет, ведь такой неожиданный шаг со стороны NVIDIA пойдет на пользу всем — геймерам, игроделам и производителям железа. За счет поддержки гибридного рендеринга в новом драйвере для «Паскалей» NVIDIA многократно увеличила базу оборудования, на возможности которой будут ориентироваться создатели грядущих игровых проектов. И мы не сомневаемся, что AMD рано или поздно тоже сделает свои продукты совместимыми с DXR. По крайней мере на это вполне способны модели Radeon RX Vega и Radeon VII. Как бы то ни было, для обладателей мощных ускорителей NVIDIA прошлого поколения у нас уже есть хорошие новости: оказалось, что GeForce GTX 1080 Ti справляется с играми, которые используют трассировку лучей, почти не менее успешно, чем GeForce RTX 2060. На первый взгляд, сомнительное достижение, если учесть разницу между GTX 1080 Ti и RTX 2060 в цене и энергопотреблении. Но с другой стороны, ресурсов старого флагмана (да и GeForce GTX 1080, с рядом оговорок) вполне достаточно для того, чтобы играть в Battlefield V и Shadow of the Tomb Raider с умеренными настройками эффектов DXR (в Metro Exodus с трассировкой лучей «Паскалям» уже делать нечего). А вот остальные видеокарты, которые NVIDIA допустила к гибридному рендерингу наряду с семейством GeForce RTX 20, не оправдали подобной чести — особенно GeForce GTX 1060, который годится лишь для того, чтобы делать впечатляющие скриншоты. Конечно, можно увеличить быстродействие за счет снижения других параметров детализации, но в таком случае рендеринг теней и отражений с помощью трассировки лучей едва ли компенсирует общее падение качества изображения. Кроме того, NVIDIA стремится стремится делать так, что поддержка DXR всегда сопровождается опцией DLSS (Deep Learning Super Sampling), которая повышает быстродействие за счет рендеринга в сниженном разрешении с последующим масштабированием кадра на тензорных ядрах (они, напомним, есть лишь в картах GeForce RTX). Четкость картинки, пропущенной через нейросеть, пока что сильно плавает в различных играх. Пускай мы видели откровенно провальные образцы использования этой технологии (такие, как в Battlefield V), есть и примеры высокого качества — Final Fantasy XV и Shadow of the Tomb Raider. Но даже без DLSS преимущество новой архитектуры в играх с трассировкой лучей неоспоримо, и появление таких возможностей у старых GPU лишь дополнительно его подчеркивает. Что касается младших ускорителей на чипах Turing из серии GeForce GTX 16, то усовершенствованная организация шейдерных ALU, несмотря на отсутствие RT-ядер, и вправду позволяет графическому процессору TU116 легче справляться с трассировкой лучей по сравнению с ближайшими по быстродействию устройствами 10-го семейства (GeForce GTX 1070 и GTX 1070 Ti). Вот только разница заметна больше всего при высоком качестве эффектов DXR, когда никакие видеокарты, помимо GeForce RTX, уже явно не вытягивают игру с приемлемой частотой смены кадров.
⇣ Содержание
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
|