Благодаря трассировке лучей в реальном времени архитектура Turing имеет огромный потенциал и без сомнения продемонстрирует все свои преимущества в новых проектах. Но при беспрецедентно высоких ценах, установленных компанией NVIDIA, новым видеокартам придется доказать свою актуальность здесь и сейчас, в существующих играх
В предыдущей части обзора мы изучили особенности семейства графических процессоров Turing и модельный ряд видеокарт GeForce RTX 20. По масштабу архитектурных изменений и возможностям, которые открывает в играх трассировка лучей в реальном времени (а также специализированные тензорные ядра для задач машинного обучения), Turing представляет собой чрезвычайно амбициозный и многообещающий проект, а по техническим характеристикам эти GPU не имеют даже близких соперников на потребительском рынке.
Но не будем упускать из виду, что на данный момент ни одна игра еще не может задействовать новые функции GPU, а цены новинок беспрецедентно велики. Прежде чем потенциал архитектуры Turing раскроется в играх с эффектами, основанными на трассировке лучей, новые видеокарты должны проявить себя в бенчмарках, актуальных на данный момент, и в противостоянии с куда более дешевыми соперниками — как собственными продуктами NVIDIA поколения Pascal, так и Radeon RX Vega от AMD.
Технические характеристики
Производитель
NVIDIA
Модель
GeForce GTX 1070
GeForce GTX 1080
GeForce GTX 1080 Ti
GeForce RTX 2070
GeForce RTX 2080
GeForce RTX 2080 Ti
Графический процессор
Название
GP104
GP104
GP102
TU106
TU104
TU102
Микроархитектура
Pascal
Pascal
Pascal
Turing
Turing
Turing
Техпроцесс, нм
16 нм FinFET
16 нм FinFET
16 нм FinFET
12 нм FFN
12 нм FFN
12 нм FFN
Число транзисторов, млн
7 200
7 200
12 000
10 800
13 600
18 600
Тактовая частота, МГц: Base Clock / Boost Clock
1 506 / 1 683
1 607 / 1 733
1 480 / 1 582
1 410 / 1 620 (Founders Edition: 1 410 / 1 710)
1 515 / 1 710 (Founders Edition: 1 515 / 1 800)
1 350 / 1 545 (Founders Edition: 1 350 / 1 635)
Число шейдерных ALU
1 920
2 560
3 584
2304
2944
4352
Число блоков наложения текстур
120
160
224
144
184
272
Число ROP
64
64
88
64
64
88
Оперативная память
Разрядность шины, бит
256
256
352
256
256
352
Тип микросхем
GDDR5 SDRAM
GDDR5X SDRAM
GDDR5X SDRAM
GDDR6 SDRAM
GDDR6 SDRAM
GDDR6 SDRAM
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с)
2 000 (8 000)
1 250 (10 000)
1 376,25 (11 010)
1 750 (14 000)
1 750 (14 000)
1 750 (14 000)
Объем, Мбайт
8 192
8 192
11 264
8 192
8 192
11 264
Шина ввода/вывода
PCI Express 3.0 x16
PCI Express 3.0 x16
PCI Express 3.0 x16
PCI Express 3.0 x16
PCI Express 3.0 x16
PCI Express 3.0 x16
Производительность
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты)
6 463
8 873
11 340
7 465 / 7 880 (Founders Edition)
10 069 / 10 598 (Founders Edition)
13 448 / 14 231 (Founders Edition)
Производительность FP32/FP64
1/32
1/32
1/32
1/32
1/32
1/32
Пропускная способность оперативной памяти, Гбайт/с
В первой части обзора мы уже прокомментировали характеристики видеокарт серии GeForce RTX 20 и сегодня уделим внимание устройствам, которые NVIDIA распространяет под собственной маркой Founders Edition. Запуск архитектуры Turing прошел необычно во многих отношениях, и одна из отличительных черт нового поколения — это доступность видеокарт оригинального дизайна с первого дня продаж. Как следствие, NVIDIA не нуждается в референсных платах, чтобы насытить первую волну поставок GeForce RTX 20. Формально говоря, модели Founders Edition еще в прошлом поколении не считались референсными, хотя имели полностью референсные характеристики частот и энергопотребления. Но в этот раз особенный статус Founders Edition подчеркивают повышенные частоты и TDP, трехлетняя гарантия, а также увеличенный зазор между ценой FE и рекомендованными розничными значениями, который достигает $200 в случае GeForce RTX 2080 Ti.
Founders Edition поставлены в один ряд с «премиальными» моделями сторонних производителей, и инженеры NVIDIA хорошо подготовились к такой конкуренции. Главное, что отличает GeForce RTX 20 FE от прошлого поколения — открытая система охлаждения. У «турбинного» кулера есть свои преимущества, и GeForce GTX 1080 Ti был одним из лучших образцов подобного дизайна, но открытая СО при прочих равных условиях работает эффективнее и тише.
GeForce RTX 2080 Ti снабжен двумя 13-лопастными вентиляторами с диаметром крыльчатки 85 мм, а под ними — радиатор с испарительной камерой, покрывающей всю площадь платы. Обратная сторона PCB, как и в Founders Edition поколения Pascal, защищена массивной алюминиевой пластиной. NVIDIA сообщает, что благодаря новому кулеру RTX 2080 Ti в пять раз тише шумит под нагрузкой с разгоном по сравнению с GTX 1080 Ti.
Плата
Помимо охлаждения, NVIDIA усовершенствовала систему питания Founders Edition. Преобразователь напряжения GeForce RTX 2080 Ti включает 13 фаз для питания GPU и три фазы для чипов GDDR6 (в отличие от схемы 7 + 2 в GeForce GTX 1080 Ti FE). Кроме того, ШИМ-контроллер обеспечивает более точное управление, мониторинг напряжения, и, что наиболее важно, позволяет динамически регулировать число задействованных фаз в зависимости от нагрузки — таким образом поддерживается стабильный КПД во всем диапазоне потребляемой мощности.
Мощность видеокарт мы измеряем отдельно от CPU и прочих компонентов ПК. Для этого применяется жесткий райзер PCI Express x16, в котором линии +12 В и земли, идущие от материнской платы, разорваны и выведены на отдельный шестиконтактный разъем питания. Блок питания Corsair AX1200i с помощью утилиты Corsair Link 4 позволяет регистрировать общий ток, проходящий по разъемам дополнительного питания видеокарты и райзеру, с периодом 1 с, а мощность вычисляется путем умножения величины тока на величину напряжения 12 В в каждый момент времени.
В качестве тестовой нагрузки используется FurMark с наиболее агрессивными настройками (разрешение 3840 × 2160, MSAA 8x) и Crysis 3 (максимальное качество графики, разрешение 3840 × 2160, MSAA 4x). Замеры мощности выполняются после прогрева видеокарты, когда температура GPU и тактовые частоты стабилизируются. Также во время теста мы регистрируем ряд других переменных с помощью ПО MSI Afterburner: тактовую частоту, напряжение питания и температуру графического процессора, скорость вращения вентиляторов системы охлаждения.
В серии GeForce RTX NVIDIA изменила взаимодействие видеокарты с оверклокерским ПО. В рамках предыдущей, третьей версии GPU Boost алгоритмы, управляющие частотой процессора в зависимости от его температуры и мощности карты, были скрыты внутри драйвера. В GPU Boost 4.0 разработчики предоставили к ним ограниченный доступ со стороны утилит для разгона.
Первое преимущество нового алгоритма заключается в возможности изменять форму температурной функции. В ускорителях Pascal для разгона имеет значение только целевая температура: в ее пределах частота GPU не ограничена, при достижении целевой температуры GPU сбрасывает частоту до базового уровня.
GPU Boost 3.0
В Turing кривая температуры/частоты задана несколькими точками таким образом, что существуют несколько промежуточных значений температуры, последовательно ограничивающих тактовую частоту. Образуется дополнительная зона, в которой GPU работает на сравнительно высокой частоте и одновременно разрешается превышать целевую температуру. С помощью сторонних утилит пользователь может раздвинуть эту зону за счет более высоких частот или более высоких температур.
Другое изменение в GPU Boost — это функция автоматизированного разгона на основе индивидуальных характеристик видеокарты. Известно, что стандартная функция, задающая позиции тактовой частоты в диапазоне значений питающего напряжения, соответствует среднестатистическому кристаллу GPU и дает определенный резерв стабильности. Исчерпать резерв тактовой частоты — и есть задача оверклокера, только GPU Boost 4.0 позволяет сделать это в автоматическом режиме.
GPU Boost 4.0
Тестовая сборка EVGA Precision X1 показывает, как работает алгоритм авторазгона. Кнопка Scan запускает тестовую нагрузку, невидимую для пользователя, и утилита стремится поднять отдельные точки кривой тактовой частоты до того момента, когда появятся ошибки в расчетах. Наш экземпляр GeForce RTX 2080 Ti при штатных регулировках температуры и энергопотребления в результате относительно быстрого (16 мин) теста набрал 151 «балл», что, по всей видимости, означает максимальный прирост тактовой частоты. Однако наибольший разгон произошел в среднем диапазоне частот, пиковые значения алгоритм не затронул. Мы рассчитывали, что в более комфортных условиях (термопакет, увеличенный на 23%, максимальная скорость вращения вентиляторов и модифицированная кривая температуры) разгон окажется сильнее, а получилось наоборот: есть небольшой сдвиг пиковой частоты, но в зоне средних частот результаты только ухудшились.
Похоже, что авторазгон в GPU Boost 4.0 не рассчитан на квалифицированных оверклокеров и оставляет большой резерв тактовой частоты для стабильности, ведь стандартным путем мы добились большего от RTX 2080 Ti. В штатном режиме пиковая частота GPU составляет 1950 МГц, а устойчивое значение под нагрузкой в Crysis 3 — 1707 МГц. При TDP 123% и максимальной скорости вращения вентиляторов ускоритель допускает простой сдвиг кривой тактовой частоты на 140 МГц вверх — вплоть до 2090 МГц в пике, а под нагрузкой GPU работает на средней частоте 1995 МГц. Скорее всего, и это не предел, поскольку EVGA Precision X1 пока не позволяет регулировать напряжение питания. Память GDDR6 также превосходно разогналась, позволив увеличить эффективную тактовую частоту с 14 до 15,5 ГГц.
Видеоадаптер
Настройки
Тактовая частота GPU, МГц
Напряжение питания GPU, В
Частота вращения вентиляторов 1, об/мин (% от макс.)
Частота вращения вентиляторов 2, об/мин (% от макс.)
Средн.
Макс.
Предел
Средн.
Макс.
Предел
Средн.
Средн.
NVIDIA GeForce RTX 2080 Ti FE (1350/14000 МГц, 11 Гбайт)
1707
1740
1950
0,938
1,037
1,243
2087 (56%)
2087 (56%)
NVIDIA GeForce RTX 2080 Ti FE (1490/15500 МГц, 11 Гбайт)
+23% TDP, 100% RPM
1995
1995
2050
1,012
1,043
1,243
3710 (100%)
3710 (100%)
NVIDIA GeForce GTX 1080 FE (1607/10008 МГц, 8 Гбайт)
1697
1785
1911
0,920
0,993
1,243
2194 (55%)
НД
NVIDIA GeForce GTX 1080 Ti FE (1480/11010 МГц, 11 Гбайт)
1624
1709
1911
0,886
0,931
1,243
2386 (50%)
НД
AMD Radeon RX Vega 64 (1630/1890 МГц, 8 Гбайт)
WattMan: Balanced
1382
1492
1630
0,965
1,150
1,200
2392 (49%)
НД
Прим.: измерение всех параметров проводится после в игре Crysis 3 (максимальное качество графики, 3840 × 2160, MSAA 4x) после прогрева GPU.
По резерву мощности, как показывает FurMark, GeForce RTX 2080 Ti примерно соответствует GeForce GTX 1080 Ti и Radeon RX Vega 64, невзирая на огромную разницу в размере соответствующих GPU. В стресс-тесте видеокартам приходится работать на частотах, близких к базовым, в силу исчерпания TDP. В играх, напротив, главным сдерживающим фактором выступает температура, поэтому референсные образцы GTX 1080 Ti и Vega 64, оснащенные закрытыми кулерами, хронически недогружены и RTX 2080 Ti стал наиболее мощной видеокартой среди участников тестирования за счет эффективной СО открытого типа.
В синтетических тестах GeForce RTX 2080 Ti получил на 28% больше очков по сравнению с GeForce GTX 1080 Ti и на 64% больше по сравнению с GTX 1080. Разгон, пусть и неплохой в абсолютных значениях для столь массивного GPU без программного вольтмода, увеличил быстродействие в 3DMark лишь на 7%.
3DMark (Graphics Score)
Разрешение
NVIDIA GeForce RTX 2080 Ti (1350/14000 МГц, 11 Гбайт)
NVIDIA GeForce RTX 2080 Ti (1490/15500 МГц, 11 Гбайт)
NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт)
NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт)
AMD Radeon RX Vega 64 (1630/1890 МГц, 8 Гбайт)
Fire Strike
1920 × 1080
34 515
36 236
21 801
27 492
23 228
Fire Strike Extreme
2560 × 1440
16 517
17 800
10 414
13 343
10 840
Fire Strike Ultra
3840 × 2160
7 965
8 644
5 130
6 710
5 481
Time Spy
2560 × 1440
13 392
14 275
7 193
9 258
7 285
Макс.
+9%
−36%
−16%
−31%
Средн.
+7%
−39%
−22%
−36%
Мин.
+5%
−46%
−31%
−46%
⇡#Производительность: игры (1920 × 1080, 2560 × 1440)
Играм в разрешении 1080p на столь мощных GPU явно недостаточно производительности центрального процессора, даже если это восьмиядерный CPU, работающий на частоте 4 ГГц. По средней частоте смены кадров GeForce RTX 2080 Ti лишь на 16% превосходит GeForce GTX 1080 Ti и на 43% — GTX 1080.
Потенциал новой архитектуры начинает раскрываться только при разрешении 1440p. Здесь прирост быстродействия по сравнению с GeForce GTX 1080 Ti и GTX 1080 достиг 22 и 64% соответственно.
Разгон флагмана 20-й серии в обоих режимах принес ничтожные 3–5% кадровой частоты.
1920 × 1080
Полноэкранное сглаживание
NVIDIA GeForce RTX 2080 Ti FE (1350/14000 МГц, 11 Гбайт)
NVIDIA GeForce RTX 2080 Ti FE (1490/15500 МГц, 11 Гбайт)
NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт)
NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт)
AMD Radeon RX Vega 64 (1630/1890 МГц, 8 Гбайт)
Ashes of the Singularity: Escalation
MSAA 4x + TAA 4x
65
66
41
53
42
Battlefield 1
TAA
153
151
124
144
131
Deus Ex: Mankind Divided
MSAA 4x
67
72
40
53
41
DOOM
TSSAA 8TX
200
200
200
200
200
F1 2018
TAA
190
192
116
147
123
Far Cry 5
TAA
111
110
103
109
100
GTA V
MSAA 4x + FXAA + Reflection MSAA 4x
95
93
85
93
69
Shadow of the Tomb Raider
SMAA 4x
99
103
63
75
55
Tom Clancy's The Division
SMAA 1x Ultra + TAA: Supersampling
130
142
83
107
86
Total War: WARHAMMER II
MSAA 4x
58
63
36
47
39
The Witcher 3: Wild Hunt
TAA + HairWorks AA 4x
149
161
93
120
80
Макс.
+9%
+0%
+0%
+0%
Средн.
+3%
−27%
−14%
−29%
Мин.
−2%
−40%
−24%
−46%
2560 × 1440
Полноэкранное сглаживание
NVIDIA GeForce RTX 2080 Ti FE (1350/14000 МГц, 11 Гбайт)
NVIDIA GeForce RTX 2080 Ti FE (1490/15500 МГц, 11 Гбайт)
NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт)
NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт)
Только в режиме 4K можно по достоинству оценить вычислительную мощность GeForce RTX 2080 Ti. Здесь разница между флагманскими видеокартами двух поколений достигла 28%, а по сравнению с GeForce GTX 1080 новинка быстрее на 70%. Даже разгон стал играть заметную роль, увеличив средний результат на 8%.
Быстродействие RTX 2080 Ti в 4К впечатляет и по абсолютным показателям. Только в двух из одиннадцати тестовых игр средняя кадровая частота оказалась ниже 60 FPS, да и то за счет неэкономичных режимов полноэкранного сглаживания (MSAA 4x в Deus Ex: Mankind Divided и Total War: WARHAMMER II).
3840 × 2160
Полноэкранное сглаживание
NVIDIA GeForce RTX 2080 Ti FE (1350/14000 МГц, 11 Гбайт)
NVIDIA GeForce RTX 2080 Ti FE (1490/15500 МГц, 11 Гбайт)
NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт)
NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт)
В завершение игровых тестов у нас появилась возможность протестировать технологию DLSS с помощью двух задач — технической демки Infiltrator на основе Unreal Engine 4 и бенчмарка Final Fantasy XV Windows Edition. Напомним, что алгоритм DLSS (Deep Learning Super Sampling) позволяет выполнять рендеринг игры в сниженном разрешении, а заранее подготовленная нейросеть восстанавливает изображение до целевого разрешения экрана и одновременно дает эффект полноэкранного сглаживания. Подробнее принципы работы DLSS описаны в первой части обзора GeForce RTX 2080 Ti.
В данных примерах сравнивается частота смены кадров при целевом разрешении 3840 × 2160 с применением полноэкранного сглаживания TAA и DLSS. Как видим, в Infiltrator метод DLSS повысил быстродействие GeForce RTX 2080 Ti на 25, а в Final Fantasy XV — на 39%.
Что касается качества изображения, то движущуюся картину трудно оценить в Infiltraror из-за обильного Motion Blur. В сценах теста Final Fantasy XV можно обнаружить ошибки рендеринга — а именно, на границах сложных объектов вроде волос персонажей в сочетании с размытием заднего фона (Depth of Field) есть артефакты, и DLSS их усугубляет. В остальном заметных глазу различий между TAA и DLSS мы не нашли. То есть, DLSS будет практически бесплатно увеличивать частоту смены кадров в тех играх, которые получат поддержку этой технологии. Но напомним, DLSS необходимы тензорные ядра. Применять ее на GPU предыдущих поколений запрещено, и в любом случае это было бы чрезвычайно непрактично с точки зрения быстродействия.
Судя по тому, как много проектов уже объявили о поддержке DLSS, разработчикам относительно легко интегрировать эту технологию в игровой движок. Другое дело — трассировка лучей. Однако уже сейчас возможность увидеть Ray Tracing на GeForce RTX своими глазами дают несколько демонстрационных анимаций. Насколько мы знаем, Epic и NVIDIA не собираются выкладывать в публичный доступ нашумевшую демку Reflections, но мы можем смело использовать ее в качестве бенчмарка для GeForce RTX и будущих устройств, совместимых с раcширением DXR для Direct3D 12.
Сборка теста, предложенная NVIDIA, работает в разрешениях 1440p и 2160p с применением DLSS, и нам неизвестно, какое разрешение в действительности используется для масштабирования за счет нейросети. Как бы то ни было, GeForce RTX 2080 Ti справляется с рендерингом этой абсолютно фотореалистичной сцены при частоте смены кадров 56 и 33 FPS соответственно.
Помимо фундаментальных архитектурных изменений, описанных в первой части обзора GeForce RTX 2080 Ti, чипы семейства Turing получили обновленный мультимедийный блок. Декодер видеопотока способен обрабатывать HEVC с форматом цвета YUV444 и глубиной 10/12 бит на частоте 30 кадров/с, а в декодировании VP9 реализована поддержка 10/12-битной глубины цвета.
К сожалению, в тестовой версии драйвера для Turing есть ошибка, из-за которой при декодировании видео силами выделенного блока NVDEC последний работает на сниженной частоте. Как следствие, результаты бенчмарков не отражают реального быстродействия в соответствующих задачах, хотя обратите внимание: даже на низкой частоте RTX 2080 Ti не уступает GTX 1080 в декодировании HEVC разрешения 1080p.
Производительность:вычисления
Часть бенчмарков GP-GPU, которые мы используем для тестирования видеокарт, пока не могут работать с архитектурой Turing. В частности, пришлось отказаться от Blender и CompuBench, а в SiSoftware Sandra невозможно проверить пропускную способность операций FP16.
Тем не менее в оставшемся тесте трассировки лучей (LuxMark) GeForce RTX 2080 Ti продемонстрировал выдающийся результат, закончив рендеринг кадра на 66% быстрее по сравнению с GeForce GTX 1080 Ti. В этом тесте не используются RT-ядра архитектуры Turing, но огромную роль сыграл увеличенный объем кешей GPU.
Не столь велик прирост быстродействия в операциях GEMM и FFT, согласно бенчмарку SiSoftware Sandra. Здесь лидерство по-прежнему принадлежит ускорителю Radeon RX Vega 64.
Подготовка к запуску на потребительский рынок видеокарт серии GeForce RTX 20 прошла в режиме максимальной секретности, и NVIDIA сделала все, чтобы до последнего момента сохранить в тайне быстродействие архитектуры Turing в практических задачах. Если учесть, как дорого стоят видеокарты нового поколения, и тот факт, что PR-кампания GeForce RTX полностью сосредоточена на новых функциях рендеринга, эффективность Turing в существующих играх без поддержки Ray Tracing и алгоритмов машинного обучения оказалась под сомнением для всех, кто не имел раннего доступа к железу и, быть может, успел оформить предзаказ на GeForce RTX 2080/2080 Ti.
Спешим развеять худшие опасения: в сухом остатке RTX 2080 Ti обеспечивает частоту кадров на 28% выше по сравнению с GTX 1080 Ti при разрешении 4К. По сути, это единственный режим, в котором современные CPU позволяют раскрыться столь мощным графическим процессорам. И между прочим, вот еще один аргумент в пользу скорейшего перехода игровых движков на гибридную модель рендеринга.
Достижения GeForce RTX 2080 Ti не столь велики, если сопоставить с тем увеличением вычислительной мощности, которое предложил GeForce GTX 1080 Ti в качестве замены GTX 980 Ti (вплоть до 67%), а до того — GeForce GTX 680 по сравнению с GTX 580. Но не будем забывать, что смена флагманских ускорителей в тех эпизодах сопровождалась переходом на новый узел фотолитографии, в то время как преимущество GeForce RTX 20 основано на чистом размере GPU и оптимизациях логики. Таким образом, Turing совершенно не выбивается из ряда предшествующих итераций архитектуры NVIDIA, а предсказания фиаско в современных играх оказались далеки от истины.
Вместе с тем ни GTX 980 Ti, ни GTX 1080 Ti не были дороже своих предшественников, а рекордная цена нового флагмана совершенно не оправдана в свете межпоколенческого прогресса, который мы уже привыкли считать должным. С этим придется смириться, ведь конкурентов у GeForce RTX 2080 Ti — и по быстродействию в современных играх, и тем более по принципиально новым возможностям — на рынке нет и не предвидится в ближайшем будущем.
Прим. от 27.09.2018: в статье исправлены результаты тестирования GeForce GTX 1080 Ti. Выяснилось, что наш экземпляр Founders Edition, который мы использовали в предыдущих тестах, потерял эффективность системы охлаждения и нуждается в замене термоинтерфейса. Как следствие, в ряде бенчмарков GPU работал на сниженных частотах. В данный момент получены корректные результаты на другом экземпляре GTX 1080 Ti, и все сравнения в таблицах и тексте приведены в соответствие с новыми данными.