Обзор видеокарты GeForce RTX 2080 Ti: часть 2 — результаты тестирования / Видеокарты

В предыдущей части обзора мы изучили особенности семейства графических процессоров Turing и модельный ряд видеокарт GeForce RTX 20. По масштабу архитектурных изменений и возможностям, которые открывает в играх трассировка лучей в реальном времени (а также специализированные тензорные ядра для задач машинного обучения), Turing представляет собой чрезвычайно амбициозный и многообещающий проект, а по техническим характеристикам эти GPU не имеют даже близких соперников на потребительском рынке.

Но не будем упускать из виду, что на данный момент ни одна игра еще не может задействовать новые функции GPU, а цены новинок беспрецедентно велики. Прежде чем потенциал архитектуры Turing раскроется в играх с эффектами, основанными на трассировке лучей, новые видеокарты должны проявить себя в бенчмарках, актуальных на данный момент, и в противостоянии с куда более дешевыми соперниками — как собственными продуктами NVIDIA поколения Pascal, так и Radeon RX Vega от AMD.

Технические характеристики

Производитель	NVIDIA
Модель	GeForce GTX 1070	GeForce GTX 1080	GeForce GTX 1080 Ti	GeForce RTX 2070	GeForce RTX 2080	GeForce RTX 2080 Ti
Графический процессор
Название	GP104	GP104	GP102	TU106	TU104	TU102
Микроархитектура	Pascal	Pascal	Pascal	Turing	Turing	Turing
Техпроцесс, нм	16 нм FinFET	16 нм FinFET	16 нм FinFET	12 нм FFN	12 нм FFN	12 нм FFN
Число транзисторов, млн	7 200	7 200	12 000	10 800	13 600	18 600
Тактовая частота, МГц: Base Clock / Boost Clock	1 506 / 1 683	1 607 / 1 733	1 480 / 1 582	1 410 / 1 620 (Founders Edition: 1 410 / 1 710)	1 515 / 1 710 (Founders Edition: 1 515 / 1 800)	1 350 / 1 545 (Founders Edition: 1 350 / 1 635)
Число шейдерных ALU	1 920	2 560	3 584	2304	2944	4352
Число блоков наложения текстур	120	160	224	144	184	272
Число ROP	64	64	88	64	64	88
Оперативная память
Разрядность шины, бит	256	256	352	256	256	352
Тип микросхем	GDDR5 SDRAM	GDDR5X SDRAM	GDDR5X SDRAM	GDDR6 SDRAM	GDDR6 SDRAM	GDDR6 SDRAM
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с)	2 000 (8 000)	1 250 (10 000)	1 376,25 (11 010)	1 750 (14 000)	1 750 (14 000)	1 750 (14 000)
Объем, Мбайт	8 192	8 192	11 264	8 192	8 192	11 264
Шина ввода/вывода	PCI Express 3.0 x16	PCI Express 3.0 x16	PCI Express 3.0 x16	PCI Express 3.0 x16	PCI Express 3.0 x16	PCI Express 3.0 x16
Производительность
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты)	6 463	8 873	11 340	7 465 / 7 880 (Founders Edition)	10 069 / 10 598 (Founders Edition)	13 448 / 14 231 (Founders Edition)
Производительность FP32/FP64	1/32	1/32	1/32	1/32	1/32	1/32
Пропускная способность оперативной памяти, Гбайт/с	256	320	484	448	448	616
Вывод изображения
Интерфейсы вывода изображения	DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b	DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b	DisplayPort 1.3/1.4, HDMI 2.0b	DisplayPort 1.4a, HDMI 2.0b	DisplayPort 1.4a, HDMI 2.0b	DisplayPort 1.4a, HDMI 2.0b
TDP, Вт	150	180	250	175/185 (Founders Edition)	215/225 (Founders Edition)	250/260 (Founders Edition)
Розничная цена (США, без налога), $	349 (рекомендованная) / 399 (Founders Edition, nvidia.com)	499 (рекомендованная) / 549 (Founders Edition, nvidia.com)	НД (рекомендованная) / 699 (Founders Edition, nvidia.com)	499 (рекомендованная) / 599 (Founders Edition, nvidia.com)	699 (рекомендованная) / 799 (Founders Edition, nvidia.com)	999 (рекомендованная) / 1 199 (Founders Edition, nvidia.com)
Розничная цена (Россия), руб.	НД (рекомендованная) / 31 590 (Founders Edition, nvidia.ru)	НД (рекомендованная) / 45 790 (Founders Edition, nvidia.ru)	НД (рекомендованная) / 52 990 (Founders Edition, nvidia.ru)	НД (рекомендованная) / 47 990 (Founders Edition, nvidia.ru)	НД (рекомендованная) / 63 990 (Founders Edition, nvidia.ru)	НД (рекомендованная) / 95 990 (Founders Edition, nvidia.ru)

Конструкция

В первой части обзора мы уже прокомментировали характеристики видеокарт серии GeForce RTX 20 и сегодня уделим внимание устройствам, которые NVIDIA распространяет под собственной маркой Founders Edition. Запуск архитектуры Turing прошел необычно во многих отношениях, и одна из отличительных черт нового поколения — это доступность видеокарт оригинального дизайна с первого дня продаж. Как следствие, NVIDIA не нуждается в референсных платах, чтобы насытить первую волну поставок GeForce RTX 20. Формально говоря, модели Founders Edition еще в прошлом поколении не считались референсными, хотя имели полностью референсные характеристики частот и энергопотребления. Но в этот раз особенный статус Founders Edition подчеркивают повышенные частоты и TDP, трехлетняя гарантия, а также увеличенный зазор между ценой FE и рекомендованными розничными значениями, который достигает $200 в случае GeForce RTX 2080 Ti.

Founders Edition поставлены в один ряд с «премиальными» моделями сторонних производителей, и инженеры NVIDIA хорошо подготовились к такой конкуренции. Главное, что отличает GeForce RTX 20 FE от прошлого поколения — открытая система охлаждения. У «турбинного» кулера есть свои преимущества, и GeForce GTX 1080 Ti был одним из лучших образцов подобного дизайна, но открытая СО при прочих равных условиях работает эффективнее и тише.

GeForce RTX 2080 Ti снабжен двумя 13-лопастными вентиляторами с диаметром крыльчатки 85 мм, а под ними — радиатор с испарительной камерой, покрывающей всю площадь платы. Обратная сторона PCB, как и в Founders Edition поколения Pascal, защищена массивной алюминиевой пластиной. NVIDIA сообщает, что благодаря новому кулеру RTX 2080 Ti в пять раз тише шумит под нагрузкой с разгоном по сравнению с GTX 1080 Ti.

Плата

Помимо охлаждения, NVIDIA усовершенствовала систему питания Founders Edition. Преобразователь напряжения GeForce RTX 2080 Ti включает 13 фаз для питания GPU и три фазы для чипов GDDR6 (в отличие от схемы 7 + 2 в GeForce GTX 1080 Ti FE). Кроме того, ШИМ-контроллер обеспечивает более точное управление, мониторинг напряжения, и, что наиболее важно, позволяет динамически регулировать число задействованных фаз в зависимости от нагрузки — таким образом поддерживается стабильный КПД во всем диапазоне потребляемой мощности.

⇡#Тестовый стенд, методика тестирования

Конфигурация тестового стенда
CPU	Intel Core i7-5960X @ 4 ГГц (100 МГц × 40), постоянная частота
Материнская плата	ASUS RAMPAGE V EXTREME
Оперативная память	Corsair Vengeance LPX, 2133 МГц, 4 × 4 Гбайт
ПЗУ	Intel SSD 760p 1024 Гбайт
Блок питания	Corsair AX1200i, 1200 Вт
Система охлаждения CPU	Thermalright Archon
Корпус	CoolerMaster Test Bench V1.0
Монитор	NEC EA244UHD
Операционная система	Windows 10 Pro x64
ПО для GPU AMD
Все видеокарты	AMD Radeon Software Crimson Adrenalin Edition 18.9.1 (Tesselation: Use application settings)
ПО для GPU NVIDIA
Все видеокарты	NVIDIA GeForce Game Ready Driver 411.51

Бенчмарки: синтетические
Тест	API	Разрешение	Полноэкранное сглаживание
3DMark Fire Strike	DirectX 11 (feature level 11_0)	1920 × 1080	Выкл.
3DMark Fire Strike Extreme		2560 × 1440
3DMark Fire Strike Ultra		3840 × 2160
3DMark Time Spy	DirectX 12 (feature level 11_0)	2560 × 1440

Бенчмарки: игры
Игра (в порядке даты выхода)	API	Настройки, метод тестирования	Полноэкранное сглаживание
Игра (в порядке даты выхода)	API	Настройки, метод тестирования	1920 × 1080 / 2560 × 1440	3840 × 2160
GTA V	DirectX 11	Макс. качество. Встроенный бенчмарк	MSAA 4x + FXAA + Reflection MSAA 4x	Выкл.
The Witcher 3: Wild Hunt	DirectX 11	Макс. качество. FRAPS, локация Caer Morhen	TAA + HairWorks AA 4x	Выкл.
Tom Clancy's The Division	DirectX 12	Макс. качество, HFTS выкл. Встроенный бенчмарк	SMAA 1x Ultra + TAA: Supersampling	TAA: Stabilization
DOOM	Vulkan	Макс. качество. Миссия Foundry	TSSAA 8TX	Выкл.
Deus Ex: Mankind Divided	DirectX 12	Макс. качество. Встроенный бенчмарк	MSAA 4x
Battlefield 1	DirectX 12	Макс. качество. OCAT, начало миссии Over the Top	TAA
Ashes of the Singularity: Escalation	Vulkan	Макс. качество. Встроенный бенчмарк	MSAA 4x + TAA 4x
Total War: WARHAMMER II, встроенный бенчмарк	DirectX 12	Макс. качество. Встроенный бенчмарк (Battle Benchmark)	MSAA 4x
Far Cry 5	DirectX 11	Макс. качество. Встроенный бенчмарк	TAA
F1 2018	DirectX 11	Макс. качество. Встроенный бенчмарк	TAA
Shadow of the Tomb Raider	DirectX 12	Макс. качество. Встроенный бенчмарк	SMAA 4x

Бенчмарки: декодирование видео, вычисления
Программа	Настройки
Blender 2.78b + Blenchmark 1.0.7	—
DXVA Checker, Decode Benchmark, H.264	Файлы 1920 × 1080 (High Profile, L4.1), 3840 × 2160 (High Profile, L5.1). Microsoft H264 Video Decoder
DXVA Checker, Decode Benchmark, H.265	Файлы 1920 × 1080 (Main Profile, L4.0), 3840 × 2160 (Main Profile, L5.0). Microsoft HEVC Video Extensions
DXVA Checker, Decode Benchmark, VP9	Файлы 1920 × 1080, 3840 × 2160. Microsoft WebM MF VP8 Decoder
LuxMark 3.1 x64	Сцена Hotel Lobby (Complex Benchmark)
SiSoftware Sandra Titanium (2018), GPGPU Scientific Analysis	OpenCL, FP16/FP32
CompuBench 2.0, Ocean Surface Simulation	—
CompuBench 2.0, N-Body Simulation 1024K	—

Мощность видеокарт мы измеряем отдельно от CPU и прочих компонентов ПК. Для этого применяется жесткий райзер PCI Express x16, в котором линии +12 В и земли, идущие от материнской платы, разорваны и выведены на отдельный шестиконтактный разъем питания. Блок питания Corsair AX1200i с помощью утилиты Corsair Link 4 позволяет регистрировать общий ток, проходящий по разъемам дополнительного питания видеокарты и райзеру, с периодом 1 с, а мощность вычисляется путем умножения величины тока на величину напряжения 12 В в каждый момент времени.

В качестве тестовой нагрузки используется FurMark с наиболее агрессивными настройками (разрешение 3840 × 2160, MSAA 8x) и Crysis 3 (максимальное качество графики, разрешение 3840 × 2160, MSAA 4x). Замеры мощности выполняются после прогрева видеокарты, когда температура GPU и тактовые частоты стабилизируются. Также во время теста мы регистрируем ряд других переменных с помощью ПО MSI Afterburner: тактовую частоту, напряжение питания и температуру графического процессора, скорость вращения вентиляторов системы охлаждения.

⇡#Участники тестирования

В тестировании производительности приняли участие следующие видеокарты:

AMD Radeon RX Vega 64 (1630/1890 МГц, 8 Гбайт);
NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт);
NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт);
NVIDIA GeForce RTX 2080 Ti (1350/14000 МГц, 11 Гбайт).

⇡#Тактовые частоты, энергопотребление, температура, разгон

В серии GeForce RTX NVIDIA изменила взаимодействие видеокарты с оверклокерским ПО. В рамках предыдущей, третьей версии GPU Boost алгоритмы, управляющие частотой процессора в зависимости от его температуры и мощности карты, были скрыты внутри драйвера. В GPU Boost 4.0 разработчики предоставили к ним ограниченный доступ со стороны утилит для разгона.

Первое преимущество нового алгоритма заключается в возможности изменять форму температурной функции. В ускорителях Pascal для разгона имеет значение только целевая температура: в ее пределах частота GPU не ограничена, при достижении целевой температуры GPU сбрасывает частоту до базового уровня.

GPU Boost 3.0

В Turing кривая температуры/частоты задана несколькими точками таким образом, что существуют несколько промежуточных значений температуры, последовательно ограничивающих тактовую частоту. Образуется дополнительная зона, в которой GPU работает на сравнительно высокой частоте и одновременно разрешается превышать целевую температуру. С помощью сторонних утилит пользователь может раздвинуть эту зону за счет более высоких частот или более высоких температур.

Другое изменение в GPU Boost — это функция автоматизированного разгона на основе индивидуальных характеристик видеокарты. Известно, что стандартная функция, задающая позиции тактовой частоты в диапазоне значений питающего напряжения, соответствует среднестатистическому кристаллу GPU и дает определенный резерв стабильности. Исчерпать резерв тактовой частоты — и есть задача оверклокера, только GPU Boost 4.0 позволяет сделать это в автоматическом режиме.

GPU Boost 4.0

Тестовая сборка EVGA Precision X1 показывает, как работает алгоритм авторазгона. Кнопка Scan запускает тестовую нагрузку, невидимую для пользователя, и утилита стремится поднять отдельные точки кривой тактовой частоты до того момента, когда появятся ошибки в расчетах. Наш экземпляр GeForce RTX 2080 Ti при штатных регулировках температуры и энергопотребления в результате относительно быстрого (16 мин) теста набрал 151 «балл», что, по всей видимости, означает максимальный прирост тактовой частоты. Однако наибольший разгон произошел в среднем диапазоне частот, пиковые значения алгоритм не затронул. Мы рассчитывали, что в более комфортных условиях (термопакет, увеличенный на 23%, максимальная скорость вращения вентиляторов и модифицированная кривая температуры) разгон окажется сильнее, а получилось наоборот: есть небольшой сдвиг пиковой частоты, но в зоне средних частот результаты только ухудшились.

Похоже, что авторазгон в GPU Boost 4.0 не рассчитан на квалифицированных оверклокеров и оставляет большой резерв тактовой частоты для стабильности, ведь стандартным путем мы добились большего от RTX 2080 Ti. В штатном режиме пиковая частота GPU составляет 1950 МГц, а устойчивое значение под нагрузкой в Crysis 3 — 1707 МГц. При TDP 123% и максимальной скорости вращения вентиляторов ускоритель допускает простой сдвиг кривой тактовой частоты на 140 МГц вверх — вплоть до 2090 МГц в пике, а под нагрузкой GPU работает на средней частоте 1995 МГц. Скорее всего, и это не предел, поскольку EVGA Precision X1 пока не позволяет регулировать напряжение питания. Память GDDR6 также превосходно разогналась, позволив увеличить эффективную тактовую частоту с 14 до 15,5 ГГц.

Видеоадаптер	Настройки	Тактовая частота GPU, МГц			Напряжение питания GPU, В			Частота вращения вентиляторов 1, об/мин (% от макс.)	Частота вращения вентиляторов 2, об/мин (% от макс.)
		Средн.	Макс.	Предел	Средн.	Макс.	Предел	Средн.	Средн.
NVIDIA GeForce RTX 2080 Ti FE (1350/14000 МГц, 11 Гбайт)		1707	1740	1950	0,938	1,037	1,243	2087 (56%)	2087 (56%)
NVIDIA GeForce RTX 2080 Ti FE (1490/15500 МГц, 11 Гбайт)	+23% TDP, 100% RPM	1995	1995	2050	1,012	1,043	1,243	3710 (100%)	3710 (100%)
NVIDIA GeForce GTX 1080 FE (1607/10008 МГц, 8 Гбайт)		1697	1785	1911	0,920	0,993	1,243	2194 (55%)	НД
NVIDIA GeForce GTX 1080 Ti FE (1480/11010 МГц, 11 Гбайт)		1624	1709	1911	0,886	0,931	1,243	2386 (50%)	НД
AMD Radeon RX Vega 64 (1630/1890 МГц, 8 Гбайт)	WattMan: Balanced	1382	1492	1630	0,965	1,150	1,200	2392 (49%)	НД

Прим.: измерение всех параметров проводится после в игре Crysis 3 (максимальное качество графики, 3840 × 2160, MSAA 4x) после прогрева GPU.

По резерву мощности, как показывает FurMark, GeForce RTX 2080 Ti примерно соответствует GeForce GTX 1080 Ti и Radeon RX Vega 64, невзирая на огромную разницу в размере соответствующих GPU. В стресс-тесте видеокартам приходится работать на частотах, близких к базовым, в силу исчерпания TDP. В играх, напротив, главным сдерживающим фактором выступает температура, поэтому референсные образцы GTX 1080 Ti и Vega 64, оснащенные закрытыми кулерами, хронически недогружены и RTX 2080 Ti стал наиболее мощной видеокартой среди участников тестирования за счет эффективной СО открытого типа.

⇡#Производительность: 3DMark

В синтетических тестах GeForce RTX 2080 Ti получил на 28% больше очков по сравнению с GeForce GTX 1080 Ti и на 64% больше по сравнению с GTX 1080. Разгон, пусть и неплохой в абсолютных значениях для столь массивного GPU без программного вольтмода, увеличил быстродействие в 3DMark лишь на 7%.

3DMark (Graphics Score)
	Разрешение	NVIDIA GeForce RTX 2080 Ti (1350/14000 МГц, 11 Гбайт)	NVIDIA GeForce RTX 2080 Ti (1490/15500 МГц, 11 Гбайт)	NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт)	NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт)	AMD Radeon RX Vega 64 (1630/1890 МГц, 8 Гбайт)
Fire Strike	1920 × 1080	34 515	36 236	21 801	27 492	23 228
Fire Strike Extreme	2560 × 1440	16 517	17 800	10 414	13 343	10 840
Fire Strike Ultra	3840 × 2160	7 965	8 644	5 130	6 710	5 481
Time Spy	2560 × 1440	13 392	14 275	7 193	9 258	7 285
Макс.			+9%	−36%	−16%	−31%
Средн.			+7%	−39%	−22%	−36%
Мин.			+5%	−46%	−31%	−46%

⇡#Производительность: игры (1920 × 1080, 2560 × 1440)

Играм в разрешении 1080p на столь мощных GPU явно недостаточно производительности центрального процессора, даже если это восьмиядерный CPU, работающий на частоте 4 ГГц. По средней частоте смены кадров GeForce RTX 2080 Ti лишь на 16% превосходит GeForce GTX 1080 Ti и на 43% — GTX 1080.

Потенциал новой архитектуры начинает раскрываться только при разрешении 1440p. Здесь прирост быстродействия по сравнению с GeForce GTX 1080 Ti и GTX 1080 достиг 22 и 64% соответственно.

Разгон флагмана 20-й серии в обоих режимах принес ничтожные 3–5% кадровой частоты.

1920 × 1080
	Полноэкранное сглаживание	NVIDIA GeForce RTX 2080 Ti FE (1350/14000 МГц, 11 Гбайт)	NVIDIA GeForce RTX 2080 Ti FE (1490/15500 МГц, 11 Гбайт)	NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт)	NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт)	AMD Radeon RX Vega 64 (1630/1890 МГц, 8 Гбайт)
Ashes of the Singularity: Escalation	MSAA 4x + TAA 4x	65	66	41	53	42
Battlefield 1	TAA	153	151	124	144	131
Deus Ex: Mankind Divided	MSAA 4x	67	72	40	53	41
DOOM	TSSAA 8TX	200	200	200	200	200
F1 2018	TAA	190	192	116	147	123
Far Cry 5	TAA	111	110	103	109	100
GTA V	MSAA 4x + FXAA + Reflection MSAA 4x	95	93	85	93	69
Shadow of the Tomb Raider	SMAA 4x	99	103	63	75	55
Tom Clancy's The Division	SMAA 1x Ultra + TAA: Supersampling	130	142	83	107	86
Total War: WARHAMMER II	MSAA 4x	58	63	36	47	39
The Witcher 3: Wild Hunt	TAA + HairWorks AA 4x	149	161	93	120	80
Макс.			+9%	+0%	+0%	+0%
Средн.			+3%	−27%	−14%	−29%
Мин.			−2%	−40%	−24%	−46%

2560 × 1440
	Полноэкранное сглаживание	NVIDIA GeForce RTX 2080 Ti FE (1350/14000 МГц, 11 Гбайт)	NVIDIA GeForce RTX 2080 Ti FE (1490/15500 МГц, 11 Гбайт)	NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт)	NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт)	AMD Radeon RX Vega 64 (1630/1890 МГц, 8 Гбайт)
Ashes of the Singularity: Escalation	MSAA 4x + TAA 4x	54	55	33	43	35
Battlefield 1	TAA	148	148	95	118	104
Deus Ex: Mankind Divided	MSAA 4x	44	48	26	34	25
DOOM	TSSAA 8TX	200	200	152	196	154
F1 2018	TAA	151	159	89	115	91
Far Cry 5	TAA	105	107	79	96	85
GTA V	MSAA 4x + FXAA + Reflection MSAA 4x	88	89	65	80	51
Shadow of the Tomb Raider	SMAA 4x	67	72	41	49	36
Tom Clancy's The Division	SMAA 1x Ultra + TAA: Supersampling	94	102	58	76	61
Total War: WARHAMMER II	MSAA 4x	42	45	25	33	26
The Witcher 3: Wild Hunt	TAA + HairWorks AA 4x	117	128	69	91	62
Макс.			+9%	−24%	−2%	−19%
Средн.			+5%	−35%	−18%	−36%
Мин.			+0%	−41%	−27%	−47%

⇡#Производительность: игры (3840 × 2160)

Только в режиме 4K можно по достоинству оценить вычислительную мощность GeForce RTX 2080 Ti. Здесь разница между флагманскими видеокартами двух поколений достигла 28%, а по сравнению с GeForce GTX 1080 новинка быстрее на 70%. Даже разгон стал играть заметную роль, увеличив средний результат на 8%.

Быстродействие RTX 2080 Ti в 4К впечатляет и по абсолютным показателям. Только в двух из одиннадцати тестовых игр средняя кадровая частота оказалась ниже 60 FPS, да и то за счет неэкономичных режимов полноэкранного сглаживания (MSAA 4x в Deus Ex: Mankind Divided и Total War: WARHAMMER II).

3840 × 2160
	Полноэкранное сглаживание	NVIDIA GeForce RTX 2080 Ti FE (1350/14000 МГц, 11 Гбайт)	NVIDIA GeForce RTX 2080 Ti FE (1490/15500 МГц, 11 Гбайт)	NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт)	NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт)	AMD Radeon RX Vega 64 (1630/1890 МГц, 8 Гбайт)
Ashes of the Singularity: Escalation	Выкл.	67	71	43	57	47
Battlefield 1		101	106	56	75	63
Deus Ex: Mankind Divided		47	52	28	37	29
DOOM		137	147	83	109	81
F1 2018		99	108	53	75	57
Far Cry 5		73	78	44	56	48
GTA V		81	84	54	71	48
Shadow of the Tomb Raider		59	63	32	43	32
Tom Clancy's The Division	TAA: Stabilization	57	62	34	44	35
Total War: WARHAMMER II	Выкл.	36	41	21	28	23
The Witcher 3: Wild Hunt	Выкл.	79	86	46	61	40
Макс.			+14%	−33%	−12%	−30%
Средн.			+8%	−41%	−22%	−39%
Мин.			+4%	−46%	−27%	−49%

⇡#Производительность: DLSS, трассировка лучей

В завершение игровых тестов у нас появилась возможность протестировать технологию DLSS с помощью двух задач — технической демки Infiltrator на основе Unreal Engine 4 и бенчмарка Final Fantasy XV Windows Edition. Напомним, что алгоритм DLSS (Deep Learning Super Sampling) позволяет выполнять рендеринг игры в сниженном разрешении, а заранее подготовленная нейросеть восстанавливает изображение до целевого разрешения экрана и одновременно дает эффект полноэкранного сглаживания. Подробнее принципы работы DLSS описаны в первой части обзора GeForce RTX 2080 Ti.

В данных примерах сравнивается частота смены кадров при целевом разрешении 3840 × 2160 с применением полноэкранного сглаживания TAA и DLSS. Как видим, в Infiltrator метод DLSS повысил быстродействие GeForce RTX 2080 Ti на 25, а в Final Fantasy XV — на 39%.

Что касается качества изображения, то движущуюся картину трудно оценить в Infiltraror из-за обильного Motion Blur. В сценах теста Final Fantasy XV можно обнаружить ошибки рендеринга — а именно, на границах сложных объектов вроде волос персонажей в сочетании с размытием заднего фона (Depth of Field) есть артефакты, и DLSS их усугубляет. В остальном заметных глазу различий между TAA и DLSS мы не нашли. То есть, DLSS будет практически бесплатно увеличивать частоту смены кадров в тех играх, которые получат поддержку этой технологии. Но напомним, DLSS необходимы тензорные ядра. Применять ее на GPU предыдущих поколений запрещено, и в любом случае это было бы чрезвычайно непрактично с точки зрения быстродействия.

Судя по тому, как много проектов уже объявили о поддержке DLSS, разработчикам относительно легко интегрировать эту технологию в игровой движок. Другое дело — трассировка лучей. Однако уже сейчас возможность увидеть Ray Tracing на GeForce RTX своими глазами дают несколько демонстрационных анимаций. Насколько мы знаем, Epic и NVIDIA не собираются выкладывать в публичный доступ нашумевшую демку Reflections, но мы можем смело использовать ее в качестве бенчмарка для GeForce RTX и будущих устройств, совместимых с раcширением DXR для Direct3D 12.

Сборка теста, предложенная NVIDIA, работает в разрешениях 1440p и 2160p с применением DLSS, и нам неизвестно, какое разрешение в действительности используется для масштабирования за счет нейросети. Как бы то ни было, GeForce RTX 2080 Ti справляется с рендерингом этой абсолютно фотореалистичной сцены при частоте смены кадров 56 и 33 FPS соответственно.

⇡#Производительность: декодирование видео

Помимо фундаментальных архитектурных изменений, описанных в первой части обзора GeForce RTX 2080 Ti, чипы семейства Turing получили обновленный мультимедийный блок. Декодер видеопотока способен обрабатывать HEVC с форматом цвета YUV444 и глубиной 10/12 бит на частоте 30 кадров/с, а в декодировании VP9 реализована поддержка 10/12-битной глубины цвета.

К сожалению, в тестовой версии драйвера для Turing есть ошибка, из-за которой при декодировании видео силами выделенного блока NVDEC последний работает на сниженной частоте. Как следствие, результаты бенчмарков не отражают реального быстродействия в соответствующих задачах, хотя обратите внимание: даже на низкой частоте RTX 2080 Ti не уступает GTX 1080 в декодировании HEVC разрешения 1080p.

Производительность: вычисления

Часть бенчмарков GP-GPU, которые мы используем для тестирования видеокарт, пока не могут работать с архитектурой Turing. В частности, пришлось отказаться от Blender и CompuBench, а в SiSoftware Sandra невозможно проверить пропускную способность операций FP16.

Тем не менее в оставшемся тесте трассировки лучей (LuxMark) GeForce RTX 2080 Ti продемонстрировал выдающийся результат, закончив рендеринг кадра на 66% быстрее по сравнению с GeForce GTX 1080 Ti. В этом тесте не используются RT-ядра архитектуры Turing, но огромную роль сыграл увеличенный объем кешей GPU.

Не столь велик прирост быстродействия в операциях GEMM и FFT, согласно бенчмарку SiSoftware Sandra. Здесь лидерство по-прежнему принадлежит ускорителю Radeon RX Vega 64.

⇡#Выводы

Подготовка к запуску на потребительский рынок видеокарт серии GeForce RTX 20 прошла в режиме максимальной секретности, и NVIDIA сделала все, чтобы до последнего момента сохранить в тайне быстродействие архитектуры Turing в практических задачах. Если учесть, как дорого стоят видеокарты нового поколения, и тот факт, что PR-кампания GeForce RTX полностью сосредоточена на новых функциях рендеринга, эффективность Turing в существующих играх без поддержки Ray Tracing и алгоритмов машинного обучения оказалась под сомнением для всех, кто не имел раннего доступа к железу и, быть может, успел оформить предзаказ на GeForce RTX 2080/2080 Ti.

Спешим развеять худшие опасения: в сухом остатке RTX 2080 Ti обеспечивает частоту кадров на 28% выше по сравнению с GTX 1080 Ti при разрешении 4К. По сути, это единственный режим, в котором современные CPU позволяют раскрыться столь мощным графическим процессорам. И между прочим, вот еще один аргумент в пользу скорейшего перехода игровых движков на гибридную модель рендеринга.

Достижения GeForce RTX 2080 Ti не столь велики, если сопоставить с тем увеличением вычислительной мощности, которое предложил GeForce GTX 1080 Ti в качестве замены GTX 980 Ti (вплоть до 67%), а до того — GeForce GTX 680 по сравнению с GTX 580. Но не будем забывать, что смена флагманских ускорителей в тех эпизодах сопровождалась переходом на новый узел фотолитографии, в то время как преимущество GeForce RTX 20 основано на чистом размере GPU и оптимизациях логики. Таким образом, Turing совершенно не выбивается из ряда предшествующих итераций архитектуры NVIDIA, а предсказания фиаско в современных играх оказались далеки от истины.

Вместе с тем ни GTX 980 Ti, ни GTX 1080 Ti не были дороже своих предшественников, а рекордная цена нового флагмана совершенно не оправдана в свете межпоколенческого прогресса, который мы уже привыкли считать должным. С этим придется смириться, ведь конкурентов у GeForce RTX 2080 Ti — и по быстродействию в современных играх, и тем более по принципиально новым возможностям — на рынке нет и не предвидится в ближайшем будущем.

Прим. от 27.09.2018: в статье исправлены результаты тестирования GeForce GTX 1080 Ti. Выяснилось, что наш экземпляр Founders Edition, который мы использовали в предыдущих тестах, потерял эффективность системы охлаждения и нуждается в замене термоинтерфейса. Как следствие, в ряде бенчмарков GPU работал на сниженных частотах. В данный момент получены корректные результаты на другом экземпляре GTX 1080 Ti, и все сравнения в таблицах и тексте приведены в соответствие с новыми данными.