В предыдущей части обзора мы изучили особенности семейства графических процессоров Turing и модельный ряд видеокарт GeForce RTX 20. По масштабу архитектурных изменений и возможностям, которые открывает в играх трассировка лучей в реальном времени (а также специализированные тензорные ядра для задач машинного обучения), Turing представляет собой чрезвычайно амбициозный и многообещающий проект, а по техническим характеристикам эти GPU не имеют даже близких соперников на потребительском рынке.
Но не будем упускать из виду, что на данный момент ни одна игра еще не может задействовать новые функции GPU, а цены новинок беспрецедентно велики. Прежде чем потенциал архитектуры Turing раскроется в играх с эффектами, основанными на трассировке лучей, новые видеокарты должны проявить себя в бенчмарках, актуальных на данный момент, и в противостоянии с куда более дешевыми соперниками — как собственными продуктами NVIDIA поколения Pascal, так и Radeon RX Vega от AMD.
Технические характеристики
Производитель | NVIDIA | |||||
Модель | GeForce GTX 1070 | GeForce GTX 1080 | GeForce GTX 1080 Ti | GeForce RTX 2070 | GeForce RTX 2080 | GeForce RTX 2080 Ti |
Графический процессор | ||||||
Название | GP104 | GP104 | GP102 | TU106 | TU104 | TU102 |
Микроархитектура | Pascal | Pascal | Pascal | Turing | Turing | Turing |
Техпроцесс, нм | 16 нм FinFET | 16 нм FinFET | 16 нм FinFET | 12 нм FFN | 12 нм FFN | 12 нм FFN |
Число транзисторов, млн | 7 200 | 7 200 | 12 000 | 10 800 | 13 600 | 18 600 |
Тактовая частота, МГц: Base Clock / Boost Clock | 1 506 / 1 683 | 1 607 / 1 733 | 1 480 / 1 582 | 1 410 / 1 620 (Founders Edition: 1 410 / 1 710) | 1 515 / 1 710 (Founders Edition: 1 515 / 1 800) | 1 350 / 1 545 (Founders Edition: 1 350 / 1 635) |
Число шейдерных ALU | 1 920 | 2 560 | 3 584 | 2304 | 2944 | 4352 |
Число блоков наложения текстур | 120 | 160 | 224 | 144 | 184 | 272 |
Число ROP | 64 | 64 | 88 | 64 | 64 | 88 |
Оперативная память | ||||||
Разрядность шины, бит | 256 | 256 | 352 | 256 | 256 | 352 |
Тип микросхем | GDDR5 SDRAM | GDDR5X SDRAM | GDDR5X SDRAM | GDDR6 SDRAM | GDDR6 SDRAM | GDDR6 SDRAM |
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с) | 2 000 (8 000) | 1 250 (10 000) | 1 376,25 (11 010) | 1 750 (14 000) | 1 750 (14 000) | 1 750 (14 000) |
Объем, Мбайт | 8 192 | 8 192 | 11 264 | 8 192 | 8 192 | 11 264 |
Шина ввода/вывода | PCI Express 3.0 x16 | PCI Express 3.0 x16 | PCI Express 3.0 x16 | PCI Express 3.0 x16 | PCI Express 3.0 x16 | PCI Express 3.0 x16 |
Производительность | ||||||
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты) | 6 463 | 8 873 | 11 340 | 7 465 / 7 880 (Founders Edition) | 10 069 / 10 598 (Founders Edition) | 13 448 / 14 231 (Founders Edition) |
Производительность FP32/FP64 | 1/32 | 1/32 | 1/32 | 1/32 | 1/32 | 1/32 |
Пропускная способность оперативной памяти, Гбайт/с | 256 | 320 | 484 | 448 | 448 | 616 |
Вывод изображения | ||||||
Интерфейсы вывода изображения | DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b | DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b | DisplayPort 1.3/1.4, HDMI 2.0b | DisplayPort 1.4a, HDMI 2.0b | DisplayPort 1.4a, HDMI 2.0b | DisplayPort 1.4a, HDMI 2.0b |
TDP, Вт | 150 | 180 | 250 | 175/185 (Founders Edition) | 215/225 (Founders Edition) | 250/260 (Founders Edition) |
Розничная цена (США, без налога), $ | 349 (рекомендованная) / 399 (Founders Edition, nvidia.com) | 499 (рекомендованная) / 549 (Founders Edition, nvidia.com) | НД (рекомендованная) / 699 (Founders Edition, nvidia.com) | 499 (рекомендованная) / 599 (Founders Edition, nvidia.com) | 699 (рекомендованная) / 799 (Founders Edition, nvidia.com) | 999 (рекомендованная) / 1 199 (Founders Edition, nvidia.com) |
Розничная цена (Россия), руб. | НД (рекомендованная) / 31 590 (Founders Edition, nvidia.ru) | НД (рекомендованная) / 45 790 (Founders Edition, nvidia.ru) | НД (рекомендованная) / 52 990 (Founders Edition, nvidia.ru) | НД (рекомендованная) / 47 990 (Founders Edition, nvidia.ru) | НД (рекомендованная) / 63 990 (Founders Edition, nvidia.ru) | НД (рекомендованная) / 95 990 (Founders Edition, nvidia.ru) |
Конструкция
В первой части обзора мы уже прокомментировали характеристики видеокарт серии GeForce RTX 20 и сегодня уделим внимание устройствам, которые NVIDIA распространяет под собственной маркой Founders Edition. Запуск архитектуры Turing прошел необычно во многих отношениях, и одна из отличительных черт нового поколения — это доступность видеокарт оригинального дизайна с первого дня продаж. Как следствие, NVIDIA не нуждается в референсных платах, чтобы насытить первую волну поставок GeForce RTX 20. Формально говоря, модели Founders Edition еще в прошлом поколении не считались референсными, хотя имели полностью референсные характеристики частот и энергопотребления. Но в этот раз особенный статус Founders Edition подчеркивают повышенные частоты и TDP, трехлетняя гарантия, а также увеличенный зазор между ценой FE и рекомендованными розничными значениями, который достигает $200 в случае GeForce RTX 2080 Ti.
Founders Edition поставлены в один ряд с «премиальными» моделями сторонних производителей, и инженеры NVIDIA хорошо подготовились к такой конкуренции. Главное, что отличает GeForce RTX 20 FE от прошлого поколения — открытая система охлаждения. У «турбинного» кулера есть свои преимущества, и GeForce GTX 1080 Ti был одним из лучших образцов подобного дизайна, но открытая СО при прочих равных условиях работает эффективнее и тише.
GeForce RTX 2080 Ti снабжен двумя 13-лопастными вентиляторами с диаметром крыльчатки 85 мм, а под ними — радиатор с испарительной камерой, покрывающей всю площадь платы. Обратная сторона PCB, как и в Founders Edition поколения Pascal, защищена массивной алюминиевой пластиной. NVIDIA сообщает, что благодаря новому кулеру RTX 2080 Ti в пять раз тише шумит под нагрузкой с разгоном по сравнению с GTX 1080 Ti.
Плата
Помимо охлаждения, NVIDIA усовершенствовала систему питания Founders Edition. Преобразователь напряжения GeForce RTX 2080 Ti включает 13 фаз для питания GPU и три фазы для чипов GDDR6 (в отличие от схемы 7 + 2 в GeForce GTX 1080 Ti FE). Кроме того, ШИМ-контроллер обеспечивает более точное управление, мониторинг напряжения, и, что наиболее важно, позволяет динамически регулировать число задействованных фаз в зависимости от нагрузки — таким образом поддерживается стабильный КПД во всем диапазоне потребляемой мощности.
⇡#Тестовый стенд, методика тестирования
Конфигурация тестового стенда | |
---|---|
CPU | Intel Core i7-5960X @ 4 ГГц (100 МГц × 40), постоянная частота |
Материнская плата | ASUS RAMPAGE V EXTREME |
Оперативная память | Corsair Vengeance LPX, 2133 МГц, 4 × 4 Гбайт |
ПЗУ | Intel SSD 760p 1024 Гбайт |
Блок питания | Corsair AX1200i, 1200 Вт |
Система охлаждения CPU | Thermalright Archon |
Корпус | CoolerMaster Test Bench V1.0 |
Монитор | NEC EA244UHD |
Операционная система | Windows 10 Pro x64 |
ПО для GPU AMD | |
Все видеокарты | AMD Radeon Software Crimson Adrenalin Edition 18.9.1 (Tesselation: Use application settings) |
ПО для GPU NVIDIA | |
Все видеокарты | NVIDIA GeForce Game Ready Driver 411.51 |
Бенчмарки: синтетические | |||
---|---|---|---|
Тест | API | Разрешение | Полноэкранное сглаживание |
3DMark Fire Strike | DirectX 11 (feature level 11_0) | 1920 × 1080 | Выкл. |
3DMark Fire Strike Extreme | 2560 × 1440 | ||
3DMark Fire Strike Ultra | 3840 × 2160 | ||
3DMark Time Spy | DirectX 12 (feature level 11_0) | 2560 × 1440 |
Бенчмарки: игры | ||||
---|---|---|---|---|
Игра (в порядке даты выхода) | API | Настройки, метод тестирования | Полноэкранное сглаживание | |
1920 × 1080 / 2560 × 1440 | 3840 × 2160 | |||
GTA V | DirectX 11 | Макс. качество. Встроенный бенчмарк | MSAA 4x + FXAA + Reflection MSAA 4x | Выкл. |
The Witcher 3: Wild Hunt | DirectX 11 | Макс. качество. FRAPS, локация Caer Morhen | TAA + HairWorks AA 4x | |
Tom Clancy's The Division | DirectX 12 | Макс. качество, HFTS выкл. Встроенный бенчмарк | SMAA 1x Ultra + TAA: Supersampling | TAA: Stabilization |
DOOM | Vulkan | Макс. качество. Миссия Foundry | TSSAA 8TX | Выкл. |
Deus Ex: Mankind Divided | DirectX 12 | Макс. качество. Встроенный бенчмарк | MSAA 4x | |
Battlefield 1 | DirectX 12 | Макс. качество. OCAT, начало миссии Over the Top | TAA | |
Ashes of the Singularity: Escalation | Vulkan | Макс. качество. Встроенный бенчмарк | MSAA 4x + TAA 4x | |
Total War: WARHAMMER II, встроенный бенчмарк | DirectX 12 | Макс. качество. Встроенный бенчмарк (Battle Benchmark) | MSAA 4x | |
Far Cry 5 | DirectX 11 | Макс. качество. Встроенный бенчмарк | TAA | |
F1 2018 | DirectX 11 | Макс. качество. Встроенный бенчмарк | TAA | |
Shadow of the Tomb Raider | DirectX 12 | Макс. качество. Встроенный бенчмарк | SMAA 4x |
Бенчмарки: декодирование видео, вычисления | |
---|---|
Программа | Настройки |
Blender 2.78b + Blenchmark 1.0.7 | — |
DXVA Checker, Decode Benchmark, H.264 | Файлы 1920 × 1080 (High Profile, L4.1), 3840 × 2160 (High Profile, L5.1). Microsoft H264 Video Decoder |
DXVA Checker, Decode Benchmark, H.265 | Файлы 1920 × 1080 (Main Profile, L4.0), 3840 × 2160 (Main Profile, L5.0). Microsoft HEVC Video Extensions |
DXVA Checker, Decode Benchmark, VP9 | Файлы 1920 × 1080, 3840 × 2160. Microsoft WebM MF VP8 Decoder |
LuxMark 3.1 x64 | Сцена Hotel Lobby (Complex Benchmark) |
SiSoftware Sandra Titanium (2018), GPGPU Scientific Analysis | OpenCL, FP16/FP32 |
CompuBench 2.0, Ocean Surface Simulation | — |
CompuBench 2.0, N-Body Simulation 1024K | — |
Мощность видеокарт мы измеряем отдельно от CPU и прочих компонентов ПК. Для этого применяется жесткий райзер PCI Express x16, в котором линии +12 В и земли, идущие от материнской платы, разорваны и выведены на отдельный шестиконтактный разъем питания. Блок питания Corsair AX1200i с помощью утилиты Corsair Link 4 позволяет регистрировать общий ток, проходящий по разъемам дополнительного питания видеокарты и райзеру, с периодом 1 с, а мощность вычисляется путем умножения величины тока на величину напряжения 12 В в каждый момент времени.
В качестве тестовой нагрузки используется FurMark с наиболее агрессивными настройками (разрешение 3840 × 2160, MSAA 8x) и Crysis 3 (максимальное качество графики, разрешение 3840 × 2160, MSAA 4x). Замеры мощности выполняются после прогрева видеокарты, когда температура GPU и тактовые частоты стабилизируются. Также во время теста мы регистрируем ряд других переменных с помощью ПО MSI Afterburner: тактовую частоту, напряжение питания и температуру графического процессора, скорость вращения вентиляторов системы охлаждения.
В тестировании производительности приняли участие следующие видеокарты:
⇡#Тактовые частоты, энергопотребление, температура, разгон
В серии GeForce RTX NVIDIA изменила взаимодействие видеокарты с оверклокерским ПО. В рамках предыдущей, третьей версии GPU Boost алгоритмы, управляющие частотой процессора в зависимости от его температуры и мощности карты, были скрыты внутри драйвера. В GPU Boost 4.0 разработчики предоставили к ним ограниченный доступ со стороны утилит для разгона.
Первое преимущество нового алгоритма заключается в возможности изменять форму температурной функции. В ускорителях Pascal для разгона имеет значение только целевая температура: в ее пределах частота GPU не ограничена, при достижении целевой температуры GPU сбрасывает частоту до базового уровня.
В Turing кривая температуры/частоты задана несколькими точками таким образом, что существуют несколько промежуточных значений температуры, последовательно ограничивающих тактовую частоту. Образуется дополнительная зона, в которой GPU работает на сравнительно высокой частоте и одновременно разрешается превышать целевую температуру. С помощью сторонних утилит пользователь может раздвинуть эту зону за счет более высоких частот или более высоких температур.
Другое изменение в GPU Boost — это функция автоматизированного разгона на основе индивидуальных характеристик видеокарты. Известно, что стандартная функция, задающая позиции тактовой частоты в диапазоне значений питающего напряжения, соответствует среднестатистическому кристаллу GPU и дает определенный резерв стабильности. Исчерпать резерв тактовой частоты — и есть задача оверклокера, только GPU Boost 4.0 позволяет сделать это в автоматическом режиме.
Тестовая сборка EVGA Precision X1 показывает, как работает алгоритм авторазгона. Кнопка Scan запускает тестовую нагрузку, невидимую для пользователя, и утилита стремится поднять отдельные точки кривой тактовой частоты до того момента, когда появятся ошибки в расчетах. Наш экземпляр GeForce RTX 2080 Ti при штатных регулировках температуры и энергопотребления в результате относительно быстрого (16 мин) теста набрал 151 «балл», что, по всей видимости, означает максимальный прирост тактовой частоты. Однако наибольший разгон произошел в среднем диапазоне частот, пиковые значения алгоритм не затронул. Мы рассчитывали, что в более комфортных условиях (термопакет, увеличенный на 23%, максимальная скорость вращения вентиляторов и модифицированная кривая температуры) разгон окажется сильнее, а получилось наоборот: есть небольшой сдвиг пиковой частоты, но в зоне средних частот результаты только ухудшились.
Похоже, что авторазгон в GPU Boost 4.0 не рассчитан на квалифицированных оверклокеров и оставляет большой резерв тактовой частоты для стабильности, ведь стандартным путем мы добились большего от RTX 2080 Ti. В штатном режиме пиковая частота GPU составляет 1950 МГц, а устойчивое значение под нагрузкой в Crysis 3 — 1707 МГц. При TDP 123% и максимальной скорости вращения вентиляторов ускоритель допускает простой сдвиг кривой тактовой частоты на 140 МГц вверх — вплоть до 2090 МГц в пике, а под нагрузкой GPU работает на средней частоте 1995 МГц. Скорее всего, и это не предел, поскольку EVGA Precision X1 пока не позволяет регулировать напряжение питания. Память GDDR6 также превосходно разогналась, позволив увеличить эффективную тактовую частоту с 14 до 15,5 ГГц.
Видеоадаптер | Настройки | Тактовая частота GPU, МГц | Напряжение питания GPU, В | Частота вращения вентиляторов 1, об/мин (% от макс.) | Частота вращения вентиляторов 2, об/мин (% от макс.) | ||||
---|---|---|---|---|---|---|---|---|---|
Средн. | Макс. | Предел | Средн. | Макс. | Предел | Средн. | Средн. | ||
NVIDIA GeForce RTX 2080 Ti FE (1350/14000 МГц, 11 Гбайт) | 1707 | 1740 | 1950 | 0,938 | 1,037 | 1,243 | 2087 (56%) | 2087 (56%) | |
NVIDIA GeForce RTX 2080 Ti FE (1490/15500 МГц, 11 Гбайт) | +23% TDP, 100% RPM | 1995 | 1995 | 2050 | 1,012 | 1,043 | 1,243 | 3710 (100%) | 3710 (100%) |
NVIDIA GeForce GTX 1080 FE (1607/10008 МГц, 8 Гбайт) | 1697 | 1785 | 1911 | 0,920 | 0,993 | 1,243 | 2194 (55%) | НД | |
NVIDIA GeForce GTX 1080 Ti FE (1480/11010 МГц, 11 Гбайт) | 1624 | 1709 | 1911 | 0,886 | 0,931 | 1,243 | 2386 (50%) | НД | |
AMD Radeon RX Vega 64 (1630/1890 МГц, 8 Гбайт) | WattMan: Balanced | 1382 | 1492 | 1630 | 0,965 | 1,150 | 1,200 | 2392 (49%) | НД |
Прим.: измерение всех параметров проводится после в игре Crysis 3 (максимальное качество графики, 3840 × 2160, MSAA 4x) после прогрева GPU.
По резерву мощности, как показывает FurMark, GeForce RTX 2080 Ti примерно соответствует GeForce GTX 1080 Ti и Radeon RX Vega 64, невзирая на огромную разницу в размере соответствующих GPU. В стресс-тесте видеокартам приходится работать на частотах, близких к базовым, в силу исчерпания TDP. В играх, напротив, главным сдерживающим фактором выступает температура, поэтому референсные образцы GTX 1080 Ti и Vega 64, оснащенные закрытыми кулерами, хронически недогружены и RTX 2080 Ti стал наиболее мощной видеокартой среди участников тестирования за счет эффективной СО открытого типа.
В синтетических тестах GeForce RTX 2080 Ti получил на 28% больше очков по сравнению с GeForce GTX 1080 Ti и на 64% больше по сравнению с GTX 1080. Разгон, пусть и неплохой в абсолютных значениях для столь массивного GPU без программного вольтмода, увеличил быстродействие в 3DMark лишь на 7%.
3DMark (Graphics Score) | ||||||
---|---|---|---|---|---|---|
Разрешение | NVIDIA GeForce RTX 2080 Ti (1350/14000 МГц, 11 Гбайт) | NVIDIA GeForce RTX 2080 Ti (1490/15500 МГц, 11 Гбайт) | NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт) | NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт) | AMD Radeon RX Vega 64 (1630/1890 МГц, 8 Гбайт) | |
Fire Strike | 1920 × 1080 | 34 515 | 36 236 | 21 801 | 27 492 | 23 228 |
Fire Strike Extreme | 2560 × 1440 | 16 517 | 17 800 | 10 414 | 13 343 | 10 840 |
Fire Strike Ultra | 3840 × 2160 | 7 965 | 8 644 | 5 130 | 6 710 | 5 481 |
Time Spy | 2560 × 1440 | 13 392 | 14 275 | 7 193 | 9 258 | 7 285 |
Макс. | +9% | −36% | −16% | −31% | ||
Средн. | +7% | −39% | −22% | −36% | ||
Мин. | +5% | −46% | −31% | −46% |
⇡#Производительность: игры (1920 × 1080, 2560 × 1440)
Играм в разрешении 1080p на столь мощных GPU явно недостаточно производительности центрального процессора, даже если это восьмиядерный CPU, работающий на частоте 4 ГГц. По средней частоте смены кадров GeForce RTX 2080 Ti лишь на 16% превосходит GeForce GTX 1080 Ti и на 43% — GTX 1080.
Потенциал новой архитектуры начинает раскрываться только при разрешении 1440p. Здесь прирост быстродействия по сравнению с GeForce GTX 1080 Ti и GTX 1080 достиг 22 и 64% соответственно.
Разгон флагмана 20-й серии в обоих режимах принес ничтожные 3–5% кадровой частоты.
1920 × 1080 | ||||||
---|---|---|---|---|---|---|
Полноэкранное сглаживание | NVIDIA GeForce RTX 2080 Ti FE (1350/14000 МГц, 11 Гбайт) | NVIDIA GeForce RTX 2080 Ti FE (1490/15500 МГц, 11 Гбайт) | NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт) | NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт) | AMD Radeon RX Vega 64 (1630/1890 МГц, 8 Гбайт) | |
Ashes of the Singularity: Escalation | MSAA 4x + TAA 4x | 65 | 66 | 41 | 53 | 42 |
Battlefield 1 | TAA | 153 | 151 | 124 | 144 | 131 |
Deus Ex: Mankind Divided | MSAA 4x | 67 | 72 | 40 | 53 | 41 |
DOOM | TSSAA 8TX | 200 | 200 | 200 | 200 | 200 |
F1 2018 | TAA | 190 | 192 | 116 | 147 | 123 |
Far Cry 5 | TAA | 111 | 110 | 103 | 109 | 100 |
GTA V | MSAA 4x + FXAA + Reflection MSAA 4x | 95 | 93 | 85 | 93 | 69 |
Shadow of the Tomb Raider | SMAA 4x | 99 | 103 | 63 | 75 | 55 |
Tom Clancy's The Division | SMAA 1x Ultra + TAA: Supersampling | 130 | 142 | 83 | 107 | 86 |
Total War: WARHAMMER II | MSAA 4x | 58 | 63 | 36 | 47 | 39 |
The Witcher 3: Wild Hunt | TAA + HairWorks AA 4x | 149 | 161 | 93 | 120 | 80 |
Макс. | +9% | +0% | +0% | +0% | ||
Средн. | +3% | −27% | −14% | −29% | ||
Мин. | −2% | −40% | −24% | −46% |
2560 × 1440 | ||||||
---|---|---|---|---|---|---|
Полноэкранное сглаживание | NVIDIA GeForce RTX 2080 Ti FE (1350/14000 МГц, 11 Гбайт) | NVIDIA GeForce RTX 2080 Ti FE (1490/15500 МГц, 11 Гбайт) | NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт) | NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт) | AMD Radeon RX Vega 64 (1630/1890 МГц, 8 Гбайт) | |
Ashes of the Singularity: Escalation | MSAA 4x + TAA 4x | 54 | 55 | 33 | 43 | 35 |
Battlefield 1 | TAA | 148 | 148 | 95 | 118 | 104 |
Deus Ex: Mankind Divided | MSAA 4x | 44 | 48 | 26 | 34 | 25 |
DOOM | TSSAA 8TX | 200 | 200 | 152 | 196 | 154 |
F1 2018 | TAA | 151 | 159 | 89 | 115 | 91 |
Far Cry 5 | TAA | 105 | 107 | 79 | 96 | 85 |
GTA V | MSAA 4x + FXAA + Reflection MSAA 4x | 88 | 89 | 65 | 80 | 51 |
Shadow of the Tomb Raider | SMAA 4x | 67 | 72 | 41 | 49 | 36 |
Tom Clancy's The Division | SMAA 1x Ultra + TAA: Supersampling | 94 | 102 | 58 | 76 | 61 |
Total War: WARHAMMER II | MSAA 4x | 42 | 45 | 25 | 33 | 26 |
The Witcher 3: Wild Hunt | TAA + HairWorks AA 4x | 117 | 128 | 69 | 91 | 62 |
Макс. | +9% | −24% | −2% | −19% | ||
Средн. | +5% | −35% | −18% | −36% | ||
Мин. | +0% | −41% | −27% | −47% |
⇡#Производительность: игры (3840 × 2160)
Только в режиме 4K можно по достоинству оценить вычислительную мощность GeForce RTX 2080 Ti. Здесь разница между флагманскими видеокартами двух поколений достигла 28%, а по сравнению с GeForce GTX 1080 новинка быстрее на 70%. Даже разгон стал играть заметную роль, увеличив средний результат на 8%.
Быстродействие RTX 2080 Ti в 4К впечатляет и по абсолютным показателям. Только в двух из одиннадцати тестовых игр средняя кадровая частота оказалась ниже 60 FPS, да и то за счет неэкономичных режимов полноэкранного сглаживания (MSAA 4x в Deus Ex: Mankind Divided и Total War: WARHAMMER II).
3840 × 2160 | ||||||
---|---|---|---|---|---|---|
Полноэкранное сглаживание | NVIDIA GeForce RTX 2080 Ti FE (1350/14000 МГц, 11 Гбайт) | NVIDIA GeForce RTX 2080 Ti FE (1490/15500 МГц, 11 Гбайт) | NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт) | NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт) | AMD Radeon RX Vega 64 (1630/1890 МГц, 8 Гбайт) | |
Ashes of the Singularity: Escalation | Выкл. | 67 | 71 | 43 | 57 | 47 |
Battlefield 1 | 101 | 106 | 56 | 75 | 63 | |
Deus Ex: Mankind Divided | 47 | 52 | 28 | 37 | 29 | |
DOOM | 137 | 147 | 83 | 109 | 81 | |
F1 2018 | 99 | 108 | 53 | 75 | 57 | |
Far Cry 5 | 73 | 78 | 44 | 56 | 48 | |
GTA V | 81 | 84 | 54 | 71 | 48 | |
Shadow of the Tomb Raider | 59 | 63 | 32 | 43 | 32 | |
Tom Clancy's The Division | TAA: Stabilization | 57 | 62 | 34 | 44 | 35 |
Total War: WARHAMMER II | Выкл. | 36 | 41 | 21 | 28 | 23 |
The Witcher 3: Wild Hunt | 79 | 86 | 46 | 61 | 40 | |
Макс. | +14% | −33% | −12% | −30% | ||
Средн. | +8% | −41% | −22% | −39% | ||
Мин. | +4% | −46% | −27% | −49% |
⇡#Производительность: DLSS, трассировка лучей
В завершение игровых тестов у нас появилась возможность протестировать технологию DLSS с помощью двух задач — технической демки Infiltrator на основе Unreal Engine 4 и бенчмарка Final Fantasy XV Windows Edition. Напомним, что алгоритм DLSS (Deep Learning Super Sampling) позволяет выполнять рендеринг игры в сниженном разрешении, а заранее подготовленная нейросеть восстанавливает изображение до целевого разрешения экрана и одновременно дает эффект полноэкранного сглаживания. Подробнее принципы работы DLSS описаны в первой части обзора GeForce RTX 2080 Ti.
В данных примерах сравнивается частота смены кадров при целевом разрешении 3840 × 2160 с применением полноэкранного сглаживания TAA и DLSS. Как видим, в Infiltrator метод DLSS повысил быстродействие GeForce RTX 2080 Ti на 25, а в Final Fantasy XV — на 39%.
Что касается качества изображения, то движущуюся картину трудно оценить в Infiltraror из-за обильного Motion Blur. В сценах теста Final Fantasy XV можно обнаружить ошибки рендеринга — а именно, на границах сложных объектов вроде волос персонажей в сочетании с размытием заднего фона (Depth of Field) есть артефакты, и DLSS их усугубляет. В остальном заметных глазу различий между TAA и DLSS мы не нашли. То есть, DLSS будет практически бесплатно увеличивать частоту смены кадров в тех играх, которые получат поддержку этой технологии. Но напомним, DLSS необходимы тензорные ядра. Применять ее на GPU предыдущих поколений запрещено, и в любом случае это было бы чрезвычайно непрактично с точки зрения быстродействия.
Судя по тому, как много проектов уже объявили о поддержке DLSS, разработчикам относительно легко интегрировать эту технологию в игровой движок. Другое дело — трассировка лучей. Однако уже сейчас возможность увидеть Ray Tracing на GeForce RTX своими глазами дают несколько демонстрационных анимаций. Насколько мы знаем, Epic и NVIDIA не собираются выкладывать в публичный доступ нашумевшую демку Reflections, но мы можем смело использовать ее в качестве бенчмарка для GeForce RTX и будущих устройств, совместимых с раcширением DXR для Direct3D 12.
Сборка теста, предложенная NVIDIA, работает в разрешениях 1440p и 2160p с применением DLSS, и нам неизвестно, какое разрешение в действительности используется для масштабирования за счет нейросети. Как бы то ни было, GeForce RTX 2080 Ti справляется с рендерингом этой абсолютно фотореалистичной сцены при частоте смены кадров 56 и 33 FPS соответственно.
⇡#Производительность: декодирование видео
Помимо фундаментальных архитектурных изменений, описанных в первой части обзора GeForce RTX 2080 Ti, чипы семейства Turing получили обновленный мультимедийный блок. Декодер видеопотока способен обрабатывать HEVC с форматом цвета YUV444 и глубиной 10/12 бит на частоте 30 кадров/с, а в декодировании VP9 реализована поддержка 10/12-битной глубины цвета.
К сожалению, в тестовой версии драйвера для Turing есть ошибка, из-за которой при декодировании видео силами выделенного блока NVDEC последний работает на сниженной частоте. Как следствие, результаты бенчмарков не отражают реального быстродействия в соответствующих задачах, хотя обратите внимание: даже на низкой частоте RTX 2080 Ti не уступает GTX 1080 в декодировании HEVC разрешения 1080p.
Часть бенчмарков GP-GPU, которые мы используем для тестирования видеокарт, пока не могут работать с архитектурой Turing. В частности, пришлось отказаться от Blender и CompuBench, а в SiSoftware Sandra невозможно проверить пропускную способность операций FP16.
Тем не менее в оставшемся тесте трассировки лучей (LuxMark) GeForce RTX 2080 Ti продемонстрировал выдающийся результат, закончив рендеринг кадра на 66% быстрее по сравнению с GeForce GTX 1080 Ti. В этом тесте не используются RT-ядра архитектуры Turing, но огромную роль сыграл увеличенный объем кешей GPU.
Не столь велик прирост быстродействия в операциях GEMM и FFT, согласно бенчмарку SiSoftware Sandra. Здесь лидерство по-прежнему принадлежит ускорителю Radeon RX Vega 64.
Подготовка к запуску на потребительский рынок видеокарт серии GeForce RTX 20 прошла в режиме максимальной секретности, и NVIDIA сделала все, чтобы до последнего момента сохранить в тайне быстродействие архитектуры Turing в практических задачах. Если учесть, как дорого стоят видеокарты нового поколения, и тот факт, что PR-кампания GeForce RTX полностью сосредоточена на новых функциях рендеринга, эффективность Turing в существующих играх без поддержки Ray Tracing и алгоритмов машинного обучения оказалась под сомнением для всех, кто не имел раннего доступа к железу и, быть может, успел оформить предзаказ на GeForce RTX 2080/2080 Ti.
Спешим развеять худшие опасения: в сухом остатке RTX 2080 Ti обеспечивает частоту кадров на 28% выше по сравнению с GTX 1080 Ti при разрешении 4К. По сути, это единственный режим, в котором современные CPU позволяют раскрыться столь мощным графическим процессорам. И между прочим, вот еще один аргумент в пользу скорейшего перехода игровых движков на гибридную модель рендеринга.
Достижения GeForce RTX 2080 Ti не столь велики, если сопоставить с тем увеличением вычислительной мощности, которое предложил GeForce GTX 1080 Ti в качестве замены GTX 980 Ti (вплоть до 67%), а до того — GeForce GTX 680 по сравнению с GTX 580. Но не будем забывать, что смена флагманских ускорителей в тех эпизодах сопровождалась переходом на новый узел фотолитографии, в то время как преимущество GeForce RTX 20 основано на чистом размере GPU и оптимизациях логики. Таким образом, Turing совершенно не выбивается из ряда предшествующих итераций архитектуры NVIDIA, а предсказания фиаско в современных играх оказались далеки от истины.
Вместе с тем ни GTX 980 Ti, ни GTX 1080 Ti не были дороже своих предшественников, а рекордная цена нового флагмана совершенно не оправдана в свете межпоколенческого прогресса, который мы уже привыкли считать должным. С этим придется смириться, ведь конкурентов у GeForce RTX 2080 Ti — и по быстродействию в современных играх, и тем более по принципиально новым возможностям — на рынке нет и не предвидится в ближайшем будущем.
Прим. от 27.09.2018: в статье исправлены результаты тестирования GeForce GTX 1080 Ti. Выяснилось, что наш экземпляр Founders Edition, который мы использовали в предыдущих тестах, потерял эффективность системы охлаждения и нуждается в замене термоинтерфейса. Как следствие, в ряде бенчмарков GPU работал на сниженных частотах. В данный момент получены корректные результаты на другом экземпляре GTX 1080 Ti, и все сравнения в таблицах и тексте приведены в соответствие с новыми данными.