Оригинал материала: https://3dnews.ru/1140749

Больше кадров — больше лага: тестирование латентности с генерацией кадров DLSS и FSR

Все время, пока существуют игровые видеокарты, мы знали одно окончательное мерило их потребительской ценности — FPS, кадровая частота. Но почему запросы покупателей пришли к тому, что 60 FPS считаются комфортной величиной, 30 FPS — терпимой, а для соревновательных игр — чем выше фреймрейт, тем лучше? Причина в том, что кадровая частота — это всего лишь опосредованный индикатор задержки между нажатием на клавишу и результатом на экране. Мало FPS, и говорят, что игра «тормозит» или «лагает». В то же время почти никто не жалуется на то, что фильмы — искусство, лишенное интерактивности, — по-прежнему снимают с кадровой частотой 24 FPS, да и в играх катсцены часто ограничивают фреймрейтом 30 FPS.

Всесильные FPS решают судьбу видеокарт на рынке. В компьютерном журнале напишут, что «зеленый» флагман в этот раз на 5 % FPS быстрее «красного» и дадут ему медаль, а «красный» поругают. Однако с тех пор, как появилась так называемая генерация кадров, кадровая частота уже не так тесно связана со своим практическим значением. Давайте проверим, что же на самом деле происходит с задержкой реакции на ввод, когда работает генерация кадров, а фреймрейт чудесным образом увеличивается в несколько раз.

#В чем проблема с генерацией кадров

Несмотря на всю сложность вычислений, которые выполняют «под капотом» алгоритмы DLSS, FSR и XeSS, в основе генерации кадров лежат простые идеи. Рендеринг отдельного кадра игры занимает существенное время работы центрального и графического процессоров, которое в конечном счете и определяет частоту смены кадров. А что если выполнить честный рендеринг двух последовательных кадров, сравнить их между собой и интерполировать промежуточный результат? Подобным образом действует функция вставки промежуточных кадров в видеоряд, которая есть у всех современных телевизоров. Только GPU, в отличие от ASIC телевизора, оперирует более разносторонним набором данных — таких, как векторы движения внутри графического движка.

Заострим внимание на том, что генерация кадров, независимо от особенностей каждой проприетарной технологии, опирается именно на интерполяцию, а не экстраполяцию, а значит сгенерированный DLSS, FSR или XeSS кадр отражает состояние движущихся объектов в промежутке между двумя кадрами, которые только что прошли весь конвейер рендеринга. Как следствие, наблюдаемый рост фреймрейта (а он может быть и многократным, если речь идет о генерации нескольких кадров подряд) уже никак не характеризует такое свойство игры, как отзывчивость. Более того, весь ряд кадров необходимо выводить на экран с задержкой на один «честный» кадр, что явно демонстрирует диаграмма конвейера FSR 3.

Нашумевшая цитата Дженсена Хуанга о том, что DLSS в режиме генерации будто бы предсказывает будущее, не соответствует действительности. С натяжкой так можно было бы охарактеризовать вспомогательную технологию Reflex 2, которая дебютировала вместе с DLSS 4 и использует прием Frame Warp: сразу перед отправкой на монитор кадр меняется в зависимости от последнего перемещения мыши. Однако, насколько нам известно, ни в одной коммерческой игре вторая версия Reflex так и не была использована.

Как бы то ни было, даже если представить, что интерполирующая генерация кадров сама по себе не требует никаких вычислительных ресурсов, эта технология неизбежно влечет за собой рост времени реакции игры на действия игрока. Однако, будь то алгоритмическое решение (как FSR 3) или нейросеть (FSR 4, XeSS и все версии DLSS), генерация отнимает какую-то долю циклов GPU от рендеринга «настоящих» кадров, что приводит к еще большим задержкам.

Ключевой вопрос — насколько велика цена генерации кадров, выраженная в миллисекундах лага. А чтобы ответить на него, у нас есть средства аппаратного измерения латентности по золотому стандарту — от клика до фотона.

#Тестовый стенд, методика тестирования

Тестовый стенд
CPU AMD Ryzen 9 9950X3D (PBO +200 МГц, CU -25)
Материнская плата ASUS ROG CROSSHAIR X870E HERO
Оперативная память G.Skill Trident Z5 Royal Neo (F5-8000J4048G24GX2-TR5NS), 2 × 24 Гбайт (8000 МТ/с, CL38)
SSD Solidigm P44 Pro, 2 Тбайт
Блок питания Corsair AX1600i, 1600 Вт
Система охлаждения CPU Кастомная СЖО (EK-Quantum Velocity² DDC 4.2 PWM D-RGB + EK-Quantum Surface X280M)
Корпус Открытый стенд
Монитор GIGABYTE AORUS FO32U2P
Операционная система Windows 11 Pro
ПО для GPU AMD
Все видеокарты AMD Software Adrenalin Edition 26.3.1
ПО для GPU NVIDIA
Все видеокарты NVIDIA GeForce Game Ready Driver 596.21

Среди массы игр, которые поддерживают генерацию кадров, мы выбрали четыре тайтла, объединенные общим признаком — на платформе AMD они нативно используют для FG технологию FSR 4 (или позволяют форсировать ее через настройки драйвера), которая, в отличие от прошлых версий, опирается на нейросеть. В то же время все из тестовых игр совместимы с пакетом DLSS 4 от NVIDIA, включая генерацию множественных кадров — как минимум на уровне 4х или с возможностью форсировать режим 6х через программу NVIDIA App.

Тестирование выполнено на ускорителях GeForce RTX 5070 Ti и Radeon RX 9070 XT, которые обладают очень схожей производительностью в растеризованных играх и играх с гибридным рендерингом, а настройки игр подобраны таким образом, чтобы охватить широкий диапазон базовой (без генерации кадров) кадровой частоты — от фреймрейта чуть ниже 30 FPS до сотен FPS.

ИграНастройки графикиМасштабирование кадров и пр.
AMD NVIDIA
Battlefield 6 Макс. качество графики FSR AA + Radeon Anti-Lag DLAA + Reflex
Black Myth: Wukong Макс. качество графики, трассировка лучей выкл. FSR AA + Radeon Anti-Lag DLAA + Reflex
Cyberpunk 2077 Макс. качество графики и трассировки лучей, трассировка путей выкл. Radeon Anti-Lag Reflex
Hogwarts Legacy Макс. качество графики и трассировки лучей FSR Quality + Radeon Anti-Lag DLSS Quality + Reflex

Реализовать задумку статьи было бы невозможно без устройства под названием LDAT, которое было создано инженерами NVIDIA в 2020 году — задолго до того, как функция генерации кадров вошла в состав DLSS. LDAT представляет собой оптический датчик и модифицированную мышь под управлением микроконтроллера и специализированного ПО.

Принцип действия прибора состоит в том, что оптический датчик фиксируется в нужной точке монитора, а микроконтроллер регистрирует время, которое прошло между нажатием левой кнопки мыши и изменением точечной яркости экрана. Это и есть латентность от клика до фотона. Программное обеспечение LDAT было запущено на отдельном хосте, к которому был подключен и микроконтроллер. А значит, процедура измерения никаким образом не влияет на тестовую систему.

Идеальными тестовыми играми для LDAT являются шутеры с видом от первого лица, где в ответ на нажатие ЛКМ возникает короткая и яркая анимация дульной вспышки. Впрочем, даже анимация выстрела в шутерах занимает определенное число последовательных кадров, а если использовать в качестве визуального триггера другие действия (например, прыжок в играх от третьего лица), то еще больше. Поэтому важно учитывать, что абсолютные величины латентности, полученные с помощью LDAT, не имеют смысла сами по себе: изображение могло и раньше как-то отреагировать на ввод, но анимация позже дошла до точки, в которой находится датчик.

Задача работы иная — оценить, как изменяется латентность от клика до фотона под влиянием генерации кадров в каждой из тестовых игр. Другими независимыми переменными стало разрешение экрана и платформа GPU, а значит технология DLSS либо FSR. Монитор тестового стенда работал с частотой обновления 240 Гц без вертикальной синхронизации и динамического управления частотой обновления (FreeSync или G-Sync).

При каждой комбинации независимых переменных было получено 50 (после исключения статистических выбросов) замеров латентности в одной и той же сцене игры с одним и тем же положением датчика LDAT. Кроме того, программными средствами регистрировалась частота смены кадров.

Обработка полученных данных проходила в два этапа для каждой комбинации игры, марки GPU и разрешения экрана. На первом этапе мы проверили гипотезу о том, что включение генерации кадров (без MFG) влечет за собой статистически значимый прирост латентности, с помощью однонаправленного U-критерия.

На втором этапе для каждой игры была построена модель множественной линейной регрессии, где независимыми переменными является длина цепочки сгененерированных нейросетью кадров (включая нулевое значение, то есть без генерации кадров), базовая кадровая частота без FG и взаимодействие между ними. Зависимой переменной является латентность от клика до фотона.

#Результаты

Battlefield 6 (DLSS)

В силу того, что последняя серия Battlefield лишилась трассировки лучей, тестовый ускоритель GeForce RTX 5070 Ti развивает высокий фреймрейт без апскейлинга и генерации кадров — 150 и 107 FPS в условно низких разрешениях и почти 60 FPS в 4К. Кроме того, шутеры от первого лица лучше всего подходят для замеров латентности аппаратным методом благодаря коротким цепочкам анимации выстрелов.

Как следствие, Battlefield 6 продемонстрировала низкие величины базовой латентности по сравнению с другими тайтлами — медиана равна 23,4, 27,8 и 40,5 мс в зависимости от разрешения. Генерация одного кадра с помощью DLSS увеличивает медианную латентность на 6,4 и 8,8 мс соответственно при разрешении 1080p и 1440p, а в 4К — уже на 17 мс. Во всех трех случаях разница является статистически значимой с большой величиной эффекта (r ≥ 0,78).

1920 × 1080
FG выкл. FG 2x FG 3x FG 4x
Частота смены кадров, FPS 150 247 350 431
Задержка макс., мс 28,0 35,9 38,9 39,0
Задержка медиан., мс 23,4 29,9 31,8 33,3
Задержка мин., мс 19,8 22,5 26,2 25,8
Задержка ст. откл., мс 2,5 2,9 3,0 3,5
2560 × 1440
FG выкл. FG 2x FG 3x FG 4x
Частота смены кадров, FPS 107 175 241 299
Задержка макс., мс 34,9 55,1 47,9 67,4
Задержка медиан., мс 27,8 36,6 38,4 41,3
Задержка мин., мс 23,9 28,1 27,6 31,9
Задержка ст. откл., мс 2,5 4,8 4,2 6,3
3840 × 2160
FG выкл. FG 2x FG 3x FG 4x
Частота смены кадров, FPS 57 99 138 173
Задержка макс., мс 57,5 84,0 90,7 97,3
Задержка медиан., мс 40,5 57,5 58,3 68,2
Задержка мин., мс 26,0 42,7 42,7 50,1
Задержка ст. откл., мс 5,7 9,2 10,7 11,7
FG выкл. против FG 2x (U-критерий, однонаправленный)
1920 × 1080 2560 × 1440 3840 × 2160
r 0,78 0,79 0,80
p <0,01 <0,01 <0,01
Линейная регрессия
R2 0,75
ANOVA p <0,01
Свободный член, коэфф. 53,84
Свободный член, p <0,01
Базовая частота смены кадров, коэфф. -0,20
Базовая частота смены кадров, p <0,01
N сгенерированных кадров, коэфф. 11,23
N сгенерированных кадров, p <0,01
Взаимодействие, коэфф. -0,06
Взаимодействие, p <0,01

Battlefield 6 (FSR)

Radeon RX 9070 XT выдает сопоставимые с конкурентом значения базовой кадровой частоты (132, 101 и 58 FPS) и медианной латентности (26, 28,8 и 43,2 мс) при разрешениях экрана от 1080p до 4К. Парадоксально, но генерация кадров с помощью нейросети FSR 4 приводит к максимальному росту латентности в режиме 1080p — на 17,5 мс, — в то время как при разрешениях 1440p и 4К медианная задержка увеличилась лишь на 10,7 и 13,4 мс соответственно. Во всех трех случаях изменение латентности является статистически значимым с большой величиной эффекта (r ≥ 0,69).

1920 × 1080
FG выкл. FG 2x
Частота смены кадров, FPS 132 249
Задержка макс., мс 32,0 60,7
Задержка медиан., мс 26,0 43,5
Задержка мин., мс 19,0 33,1
Задержка ст. откл., мс 2,9 5,8
2560 × 1440
FG выкл. FG 2x
Частота смены кадров, FPS 101 190
Задержка макс., мс 36,5 70,0
Задержка медиан., мс 28,8 39,4
Задержка мин., мс 21,8 28,8
Задержка ст. откл., мс 3,6 6,6
3840 × 2160
FG выкл. FG 2x
Частота смены кадров, FPS 58 105
Задержка макс., мс 63,7 80,2
Задержка медиан., мс 43,2 56,5
Задержка мин., мс 29,3 38,1
Задержка ст. откл., мс 6,9 8,3
FG выкл. против FG 2x (U-критерий, однонаправленный)
1920 × 1080 2560 × 1440 3840 × 2160
r 0,86 0,74 0,69
p <0,01 <0,01 <0,01
Линейная регрессия
R2 0,65
ANOVA p <0,01
Свободный член, коэфф. 54,67
Свободный член, p <0,01
Базовая частота смены кадров, коэфф. -0,23
Базовая частота смены кадров, p <0,01
N сгенерированных кадров, коэфф. 9,80
N сгенерированных кадров, p <0,01
Взаимодействие, коэфф. 0,04
Взаимодействие, p 0,13

Cyberpunk 2077 (DLSS)

Cyberpunk 2077 — еще одна игра, которая хорошо сочетается с нашей тестовой методологией благодаря коротким анимациям выстрелов. Но, в отличие от Battlefield 6, графика Cyberpunk 2077 с трассировкой лучей не позволяет рассчитывать на высокую кадровую частоту в 4К — всего 34 FPS. В свою очередь, низкие разрешения сопровождаются фреймрейтом 106 и 66 FPS соответственно. Медианная латентность в трех режимах составляет 29,9, 38,1 и 61,5 мс.

Когда задействована генерация кадров с помощью DLSS, эти значения увеличиваются на 8,2, 14,5 и 28,9 мс. Разница является статистически значимой с большой величиной эффекта (r ≥ 0,81).

1920 × 1080
FG выкл. FG 2x FG 3x FG 4x FG 5x FG 6x
Частота смены кадров, FPS 106 186 258 342 412 460
Задержка макс., мс 34,8 44,8 48,8 48,3 54,6 51,1
Задержка медиан., мс 29,9 38,1 41,2 41,7 42,6 44,5
Задержка мин., мс 24,3 31,3 32,4 36,0 36,0 37,4
Задержка ст. откл., мс 2,9 3,6 3,9 3,5 4,3 4,0
2560 × 1440
FG выкл. FG 2x FG 3x FG 4x FG 5x FG 6x
Частота смены кадров, FPS 66 115 167 213 250 290
Задержка макс., мс 47,6 65,2 66,0 67,8 69,4 72,5
Задержка медиан., мс 38,1 52,5 54,9 57,3 59,3 60,5
Задержка мин., мс 30,1 41,1 43,4 48,9 49,5 49,0
Задержка ст. откл., мс 4,4 5,9 5,5 5,5 5,4 6,2
3840 × 2160
FG выкл. FG 2x FG 3x FG 4x FG 5x FG 6x
Частота смены кадров, FPS 34 61 86 111 136 152
Задержка макс., мс 80,1 110,2 112,3 116,5 116,5 126,1
Задержка медиан., мс 61,5 90,3 93,2 99,0 95,8 104,1
Задержка мин., мс 45,5 67,9 77,1 79,4 79,9 85,9
Задержка ст. откл., мс 9,3 11,3 10,9 10,9 10,4 10,2
FG выкл. против FG 2x (U-критерий, однонаправленный)
1920 × 1080 2560 × 1440 3840 × 2160
r 0,81 0,87 0,87
p <0,01 <0,01 <0,01
Множественная линейная регрессия
R2 0,81
ANOVA p <0,01
Свободный член, коэфф. 87,58
Свободный член, p <0,01
Базовая частота смены кадров, коэфф. -0,55
Базовая частота смены кадров, p <0,01
N сгенерированных кадров, коэфф. 8,74
N сгенерированных кадров, p <0,01
Взаимодействие, коэфф. -0,06
Взаимодействие, p <0,01

Cyberpunk 2077 (FSR)

При тех же настройках графики Cyberpunk 2077 «красный» ускоритель Radeon RX 9070 XT развивает базовый фреймрейт 96, 59 и 28 FPS при трех разрешениях экрана. А вот соответствующие значения медианной латентности равны 37,5, 51,8 и 101,2 — куда выше, чем на платформе NVIDIA. В свою очередь, генерация кадров вызывает статистически значимый и большой (r ≥ 0,78) прирост латентности — на 8,4, 18,9 и 32,5 мс соответственно.

1920 × 1080
FG выкл. FG 2x
Частота смены кадров, FPS 96 186
Задержка макс., мс 44,0 53,6
Задержка медиан., мс 37,5 45,9
Задержка мин., мс 33,0 39,6
Задержка ст. откл., мс 2,9 3,3
2560 × 1440
FG выкл. FG 2x
Частота смены кадров, FPS 59 114
Задержка макс., мс 62,3 81,5
Задержка медиан., мс 51,8 70,7
Задержка мин., мс 44,0 60,4
Задержка ст. откл., мс 4,7 5,9
3840 × 2160
FG выкл. FG 2x
Частота смены кадров, FPS 28 54
Задержка макс., мс 120,5 151,5
Задержка медиан., мс 101,2 133,7
Задержка мин., мс 86,5 114,2
Задержка ст. откл., мс 9,9 11,2
FG выкл. против FG 2x (U-критерий, однонаправленный)
1920 × 1080 2560 × 1440 3840 × 2160
r 0,78 0,85 0,83
p <0,01 <0,01 <0,01
Множественная линейная регрессия
R2 0,87
ANOVA p <0,01
Свободный член, коэфф. 121,72
Свободный член, p <0,01
Базовая частота смены кадров, коэфф. -0,94
Базовая частота смены кадров, p <0,01
N сгенерированных кадров, коэфф. 38,47
N сгенерированных кадров, p <0,01
Взаимодействие, коэфф. -0,33
Взаимодействие, p <0,01

Hogwarts Legacy (DLSS)

Hogwarts Legacy оказалась самой легкой из тестовых игр для ускорителей класса GeForce RTX 5070 Ti и Radeon RX 9070 XT, несмотря на трассировку лучей. Дело в том, что здесь нельзя включить генерацию кадров силами FSR в отрыве от масштабирования кадров, поэтому тесты на обеих платформах были выполнены с апскейлингом уровня Quality.

Как следствие, фреймрейт при трех разрешениях экрана стартует с высоких отметок 264, 218 и 125 FPS, но это еще не гарантирует низкой латентности. Поскольку Hogwarts Legacy — не шутер от первого лица, нам пришлось использовать в качестве визуального триггера появление вспышки от заклинания, а главному герою сперва нужно взмахнуть волшебной палочкой. Отсюда большие и, что немаловажно, сопоставимые при трех разрешениях, медианные задержки в 66,4, 63,7 и 68 мс.

Тесты в режиме 1080p принесли на первый взгляд парадоксальный результат: активация FG влияет на латентность, но с небольшим размером эффекта (r = 0,24), и медианное значение не увеличивается, а падает на 1,1 мс. Как бы то ни было, при разрешениях 1440p и 2160p мы получили ожидаемый рост медианной латентности на 5,9 и 9,5 мс с большим размером эффекта (r ≥ 0,81).

1920 × 1080
FG выкл. FG 2x FG 3x FG 4x FG 5x FG 6x
Частота смены кадров, FPS 264 405 551 650 773 861
Задержка макс., мс 69,2 69,4 71,6 72,0 73,1 73,9
Задержка медиан., мс 66,4 65,4 64,5 68,3 68,6 68,5
Задержка мин., мс 63,1 62,5 60,9 62,9 63,1 64,0
Задержка ст. откл., мс 1,5 1,7 1,8 2,2 2,3 2,2
2560 × 1440
FG выкл. FG 2x FG 3x FG 4x FG 5x FG 6x
Частота смены кадров, FPS 218 296 386 458 537 587
Задержка макс., мс 69,1 74,5 73,1 80,2 78,5 79,8
Задержка медиан., мс 63,7 69,6 68,6 73,0 72,8 73,4
Задержка мин., мс 59,3 65,2 64,7 66,3 67,4 66,4
Задержка ст. откл., мс 1,9 2,3 2,4 3,1 2,7 3,1
3840 × 2160
FG выкл. FG 2x FG 3x FG 4x FG 5x FG 6x
Частота смены кадров, FPS 125 183 243 292 341 376
Задержка макс., мс 77,6 83,5 84,8 88,5 89,6 92,5
Задержка медиан., мс 68,0 77,6 78,1 81,1 80,2 86,8
Задержка мин., мс 62,3 71,0 72,2 73,7 72,2 74,9
Задержка ст. откл., мс 3,4 3,2 3,3 4,3 4,2 5,0
FG выкл. против FG 2x (U-критерий, однонаправленный)
1920 × 1080 2560 × 1440 3840 × 2160
r 0,24 0,83 0,81
p <0,01 <0,01 <0,01
Множественная линейная регрессия
R2 0,74
ANOVA p <0,01
Свободный член, коэфф. 77,34
Свободный член, p <0,01
Базовая частота смены кадров, коэфф. -0,05
Базовая частота смены кадров, p <0,01
N сгенерированных кадров, коэфф. 4,51
N сгенерированных кадров, p <0,01
Взаимодействие, коэфф. -0,01
Взаимодействие, p <0,01

Hogwarts Legacy (FSR)

Radeon RX 9070 XT достиг базового фреймрейта в 270, 198 и 108 FPS. А вот поддержку генерации кадров FSR 4 в Hogwarts Legacy необходимо форсировать в настройках драйвера и, судя по всему, она здесь далеко не идеальна. В режимах 1080p и 1440p генерация кадров с помощью FSR обеспечивает куда меньший прирост кадровой частоты по сравнению с DLSS, а вот латентность при трех разрешениях увеличивается на 20,4, 23,3 и 24,7 мс соответственно. Опять-таки, разница статистически значима, а размер эффекта велик (r ≥ 0,86).

1920 × 1080
FG выкл. FG 2x
Частота смены кадров, FPS 270 295
Задержка макс., мс 69,4 90,0
Задержка медиан., мс 65,7 86,0
Задержка мин., мс 62,6 81,0
Задержка ст. откл., мс 1,7 2,5
2560 × 1440
FG выкл. FG 2x
Частота смены кадров, FPS 198 239
Задержка макс., мс 75,2 99,3
Задержка медиан., мс 72,1 95,4
Задержка мин., мс 69,9 90,8
Задержка ст. откл., мс 1,4 2,4
3840 × 2160
FG выкл. FG 2x
Частота смены кадров, FPS 108 166
Задержка макс., мс 91,3 119,3
Задержка медиан., мс 87,4 112,1
Задержка мин., мс 82,7 101,9
Задержка ст. откл., мс 2,5 3,9
FG выкл. против FG 2x (U-критерий, однонаправленный)
1920 × 1080 2560 × 1440 3840 × 2160
r 0,86 0,86 0,86
p <0,01 <0,01 <0,01
Множественная линейная регрессия
R2 0,97
ANOVA p <0,01
Свободный член, коэфф. 100,23
Свободный член, p <0,01
Базовая частота смены кадров, коэфф. -0,13
Базовая частота смены кадров, p <0,01
N сгенерированных кадров, коэфф. 28,61
N сгенерированных кадров, p <0,01
Взаимодействие, коэфф. -0,03
Взаимодействие, p <0,01

Black Myth: Wukong (DLSS)

Наконец, Black Myth: Wukong является очень ресурсоемкой игрой даже без трассировки лучей: исходная кадровая частота на GeForce RTX 5070 Ti в трех тестовых режимах составляет лишь 90, 68 и 40 FPS соответственно. Кроме того, в Black Myth: Wukong оказалось труднее всего измерять латентность от клика до фотона из-за сложности анимаций главного героя. Медианные величины латентности равны 66,6, 68,8 и 83,3 мс в зависимости от разрешения экрана.

Включение генерации кадров с помощью DLSS привело к ожидаемому росту латентности на 10,6, 7,4 и 22,1 мс, что является статистически значимым и большим (r ≥ 0,69) эффектом.

В ситуации MFG при разрешении 1080p и 4К направление связи перевернуто, и это видно по графикам: самый «дорогой» режим с точки зрения латентности — FG 2x.

1920 × 1080
FG выкл. FG 2x FG 3x FG 4x
Частота смены кадров, FPS 90 149 203 248
Задержка макс., мс 76,0 84,4 75,5 80,2
Задержка медиан., мс 66,6 77,2 67,9 71,1
Задержка мин., мс 58,2 69,0 58,4 59,8
Задержка ст. откл., мс 3,6 4,2 4,5 4,9
2560 × 1440
FG выкл. FG 2x FG 3x FG 4x
Частота смены кадров, FPS 68 113 159 198
Задержка макс., мс 75,4 87,4 90,3 94,0
Задержка медиан., мс 68,8 76,1 79,8 85,9
Задержка мин., мс 60,4 67,8 70,2 73,1
Задержка ст. откл., мс 4,5 4,5 5,4 6,2
3840 × 2160
FG выкл. FG 2x FG 3x FG 4x
Частота смены кадров, FPS 40 71 102 130
Задержка макс., мс 95,6 118,1 115,6 101,0
Задержка медиан., мс 83,3 105,4 81,0 83,9
Задержка мин., мс 69,5 89,3 64,8 69,7
Задержка ст. откл., мс 7,2 9,0 12,3 8,9
FG выкл. против FG 2x (U-критерий, однонаправленный)
1920 × 1080 2560 × 1440 3840 × 2160
r 0,80 0,69 0,82
p <0,01 <0,01 <0,01
Множественная линейная регрессия
R2 0,41
ANOVA p <0,01
Свободный член, коэфф. 105,02
Свободный член, p <0,01
Базовая частота смены кадров, коэфф. -0,43
Базовая частота смены кадров, p <0,01
N сгенерированных кадров, коэфф. -1,06
N сгенерированных кадров, p 0,36
Взаимодействие, коэфф. 0,04
Взаимодействие, p 0,03

Black Myth: Wukong (FSR)

Radeon RX 9070 XT развивает базовый фреймрейт 93, 68 и 38 FPS и соответствующую медианную латентность 64,7, 68,8 и 79,9 мс. А вот генерация кадров силами FSR 4 обойдется пользователям «красного» ускорителя в дополнительные 21,5, 28,4 и 61,3 мс лага, что даже по интуитивной оценке можно назвать худшим результатом с точки зрения игрового опыта. Результат статистически значим и имеет большой размер эффекта (r = 0,86).

1920 × 1080
FG выкл. FG 2x
Частота смены кадров, FPS 93 169
Задержка макс., мс 70,9 94,4
Задержка медиан., мс 64,7 86,2
Задержка мин., мс 55,9 78,7
Задержка ст. откл., мс 3,6 4,1
2560 × 1440
FG выкл. FG 2x
Частота смены кадров, FPS 68 124
Задержка макс., мс 74,8 107,4
Задержка медиан., мс 68,8 97,2
Задержка мин., мс 57,5 88,0
Задержка ст. откл., мс 5,1 4,7
3840 × 2160
FG выкл. FG 2x
Частота смены кадров, FPS 38 69
Задержка макс., мс 95,6 167,8
Задержка медиан., мс 79,9 141,2
Задержка мин., мс 66,4 108,6
Задержка ст. откл., мс 7,3 17,2
FG выкл. против FG 2x (U-критерий, однонаправленный)
1920 × 1080 2560 × 1440 3840 × 2160
r 0,86 0,86 0,86
p <0,01 <0,01 <0,01
Множественная линейная регрессия
R2 0,87
ANOVA p <0,01
Свободный член, коэфф. 90,28
Свободный член, p <0,01
Базовая частота смены кадров, коэфф. -0,30
Базовая частота смены кадров, p <0,01
N сгенерированных кадров, коэфф. 83,19
N сгенерированных кадров, p <0,01
Взаимодействие, коэфф. -0,69
Взаимодействие, p <0,01

#Выводы

Наше исследование не претендует на широкий охват сценариев, в которых используется генерация кадров, да и само измерение латентности от клика до фотона в реальных играх имеет неустранимые ограничения. Но даже в таких условиях нам удалось выйти за пределы задачи-минимум — показать, что в условиях генерации кадров величина FPS теряет прежний смысл как индикатор отзывчивости игры.

Хуже того, при всей вычислительной мощности современных GPU генерация кадров с помощью нейросети является достаточно обременительной задачей, чтобы латентность от клика до фотона увеличивалась, и порой счет идет на десятки миллисекунд. При этом намечается тенденция к тому, что чем ниже исходная кадровая частота, тем большим лагом придется заплатить за генерацию кадров.

Что касается генерации множественных кадров с помощью DLSS четвертой версии, то оказалось, что «цена входа» в генерацию как таковую перевешивает доплату за каждый следующий кадр. Линейная связь между длиной цепочки сгенерированных кадров и латентностью существует, но она тонет в массе измерительного шума.

Чтобы оценить полученные результаты качественно, нужно поднять вопрос: какую прибавку латентности способен заметить игрок и какие величины можно считать приемлемыми? Увы, это уже отдельная область исследований, которая выходит далеко за рамки данной статьи. Но вот вам пример в порядке вольной дискуссии: разница между частотой обновления экрана 60 и 120 Гц — всего лишь 8,33 мс, и ее видят все. А раз так, резонно предположить, что если генерация кадров в игре добавляет вдвое большую задержку к далеко не мизерной базовой латентности, то это тоже будет заметно.

В таком случае на какой диапазон базовой частоты смены кадров следует ориентироваться, прежде чем включать генерацию кадров? Если судить по нашим данным, то все, что ниже 60 FPS, просто исключено, а практической рекомендацией можно считать 90–100 FPS. Но разве это и так не достаточно комфортный фреймрейт, чтобы рисковать лагом и появлением визуальных артефактов? Складывается впечатление, что у генерации кадров пока просто отсутствует идеальный сценарий применения, в котором преимущества технологии неоспоримо перевешивали бы ее издержки.

Наконец, кадровая частота всегда на виду, а вот латентность от клика до фотона так просто не измеришь. Как следствие, никто не заметит скрытых огрехов реализации FG в отдельных играх — таких, как отрицательная связь между количеством сгенерированных кадров и латентностью в Black Myth: Wukong — или (порой громадную) разницу в латентности между DLSS и FSR.

Разумеется, все это не помешает производителям GPU и дальше использовать величины фреймрейта, достигнутые с помощью генерации кадров, как мерило производительности в маркетинговых материалах. Но мы надеемся, что смогли напомнить читателям: игровые FPS, на которые испокон веку опирается сравнение видеокарт, ценятся именно за то, что косвенно говорят о латентности, а в противном случае бесполезны.



Оригинал материала: https://3dnews.ru/1140749