Обзор и тестирование видеокарты NVIDIA GeForce GTX 1080 Ti: бой с тенью / Видеокарты

NVIDIA применяет эту стратегию не в первый раз: когда происходит очередная смена техпроцесса или архитектуры графических процессоров, верхнюю позицию в новой линейке геймерских видеокарт какое-то время занимает устройство на чипе второго эшелона. Флагманский GPU сперва появляется в составе просьюмерского ускорителя под маркой TITAN, а затем, с теми или иными потерями вычислительных блоков и функций, доходит и до игровых моделей. Однако различия в технических характеристиках между очередным TITAN и очередным игровым флагманом на том же GPU в каждом поколении видеокарт уникальны.

В эпоху Kepler, которая породила первый «Титан» четыре года тому назад, GeForce GTX 780 и GTX TITAN были меньше всего похожи друг на друга. Помимо существенной разницы в наборе вычислительных блоков, игровая видеокарта получила вдвое меньше оперативной памяти и в восемь раз медленнее выполняла расчеты двойной точности (FP64). На базе архитектуры Maxwell NVIDIA уже не стала выпускать процессор, охватывающий одновременно графические задачи и вычисления двойной точности, поэтому GTX 980 Ti отличается от GeForce GTX TITAN X лишь объемом RAM и обладает практически эквивалентной производительностью в играх.

С приходом Pascal, впервые в своей истории, NVIDIA разделила GPU высшего эшелона на профессиональную и игровую категории. Переход на технологию 16 нм FinFET позволил выпустить процессор с беспрецедентным числом вычислительных блоков и уровнем быстродействия — GP100. Однако последний применяется лишь в ускорителях Quadro и Tesla, и вероятность увидеть его под маркой GeForce стремится к нулю. Альтернативный вариант «большого ядра», GP102, лишен архитектурных элементов и функций, важных для вычислительных задач, но вместе с тем не уступает GP100 в пропускной способности операций FP32, которые лежат в основе шейдерного кода 3D-приложений.

GP102 уже проявил себя в составе обновленного TITAN X, который, в неменьшей степени, чем игровой видеокартой, является ускорителем вычислений, приоритетом среди которых на этот раз стало применение моделей ИИ, созданных методом глубинного обучения (inference). Но, глядя на TITAN X, предсказать, каким окажется GTX 1080 Ti, было не так-то просто.

Дело в том, что NVIDIA не оставила себе большого пространства для маневра между GTX 1080 и TITAN X. Если судить по пиковой пропускной способности операций FP32 (что, разумеется, не является исчерпывающей характеристикой GPU), TITAN X лишь на 24% превосходит GeForce GTX 1080, в то время как разница между GTX 980 и GeForce GTX TITAN X по этому параметру составляла 35%. Если бы в поколении Pascal разработчики решили сколь-либо существенно сократить вычислительные ресурсы TITAN X, у NVIDIA получился бы довольно неубедительный флагман игровой линейки.

С другой стороны, в TITAN X ни частотный потенциал, ни набор функциональных блоков GP102 не раскрыты полностью, поэтому GeForce GTX 1080 Ti вполне мог оказаться быстрее, чем TITAN X, ведь NVIDIA когда-то поступила точно так же с GeForce GTX 780 Ti и первым TITAN. А в результате случилось нечто неожиданное: GeForce GTX 1080 Ti действительно урезали блоки GPU по сравнению с TITAN X, однако не те блоки, которых это обычно касается. Вместе с тем пиковая производительность GTX 1080 Ti, по крайней мере на бумаге, выше. Более того, у игровой видеокарты есть и другие, уже не столь очевидные преимущества.

GPU

Кристалл GP102, произведенный по норме 16 нм FinFET на мощностях TSMC, содержит 12 млрд транзисторов на площади 471 мм². Параметры следующего по рангу чипа в линейке Pascal, GP104, намного скромнее — 7,2 млрд транзисторов и 314 мм².

Однако структура вычислительных блоков GP102 повторяет таковую у чипа GP104, с учетом количественных изменений на высшем уровне архитектуры, так что весь дополнительный транзисторный бюджет в GP102 пошел на увеличение быстродействия в графике и иных вычислениях, опирающихся на формат данных FP32. Отдельно взятый SM (Streaming Multiprocessor) в GP102 и GP104 содержит 128 ядер CUDA для операций FP32, четыре FP64-совместимых ядра и одно ядро, способное выполнять две инструкции FP16 одновременно. Кроме того, в SM входят 40 блоков наложения текстур, 96 Кбайт разделяемой памяти и 48 Кбайт кеша L1.

Всего GP102 содержит 30 блоков SM, которые в сумме дают конфигурацию из 3840 ядер CUDA одинарной точности и 240 текстурников. Back-end конвейера представлен двенадцатью 32-битными контроллерами памяти GDDR5/5X (384-битная шина), с каждым из которых ассоциированы 8 ROP и секция кеша L2 объемом 256 Кбайт (3072 Кбайт на весь GPU).

Блок-схема NVIDIA GP102 в GeForce GTX 1080 Ti

По поводу отличий архитектуры Pascal от Maxwell рекомендуем обратиться к нашему обзору GeForce GTX 1080. В этой итерации разработчики развили достоинства предыдущего поколения и компенсировали присущие ему недостатки. Кратко перечислим наиболее существенные изменения:

улучшенная компрессия цвета с соотношениями вплоть до 8:1;
функция Simultaneous Multi-Projection геометрического движка PolyMorph Engine, позволяющая за один проход создавать вплоть до 16 проекций геометрии сцены (для VR и систем с несколькими дисплеями в конфигурации NVIDIA Surround);
возможность прерывания (preemption) в процессе исполнения draw call (при рендеринге) и потока команд (при вычислениях), которая вместе с динамическим распределением вычислительных ресурсов GPU обеспечивает полноценную поддержку асинхронных вычислений (Async Compute) — дополнительного источника быстродействия в играх под API DirectX 12 и сниженной латентности в VR;
контроллер дисплея, совместимый с интерфейсами DisplayPort 1.3/1.4 и HDMI 2.b. Поддержка высокого динамического диапазона (HDR);
шина SLI с повышенной пропускной способностью.

Добавим к этому списку технологию, которая была секретным ноу-хау последних архитектур NVIDIA, но вслед за независимым расследованием, результаты которого распространились в интернете, компания раскрыла свои карты. Помимо мощной компрессии цвета, Архитектуры Maxwell и Pascal используют разновидность тайлового рендеринга для экономии пропускной способности памяти (ПСП).

Классический тайловый рендеринг, широко распространенный в мобильных GPU, подразумевает обработку кадра в два прохода. Сначала драйвер разделяет экранное пространство на тайлы (участки с типичным размером 16 × 16 или 32 × 32 пиксела) и составляет индекс полигонов, находящихся в проекции каждого тайла. Затем последовательно в пределах каждого тайла целиком выполняется процедура рендеринга — от трансформации и пересечения полигонов до заполнения текстур и исполнения шейдеров — и конечный результат всех тайлов сшивается в единую картинку. Преимущество такого метода состоит в том, что любые промежуточные операции в пределах тайла оперируют единым массивом данных, который целиком помещается в кеш GPU, а следовательно, сокращается частота обращений к оперативной памяти.

Тем не менее, необходимость в двух проходах обработки геометрии сцены сама по себе расходует пропускную способность RAM, поскольку GPU необходимо сначала записать во внешнюю память информацию о полигонах, попадающих в тот или иной тайл, а затем, выполняя рендеринг от тайла к тайлу, извлекать ее обратно. Как следствие, эффективность тайлового рендеринга в конечном счете зависит от того, перевешивает ли экономия ПСП на скорости заполнения пикселов ее потери на двухпроходную проекцию геометрии. В мобильных приложениях, отличающихся простой геометрией, тайловый рендеринг оправдывает себя, но для современных десктопных игр лучше подходит стандартный метод мгновенного (immediate) рендеринга, при котором в едином экранном пространстве происходит последовательная растеризация одного полигона за другим.

В конвейере Maxwell и Pascal сочетаются лучшие черты обеих методов рендеринга. NVIDIA тоже использует тайлы, но в данном случае отрисовка кадров, как и в других десктопных архитектурах, не требует отдельной стадии сортировки (binning) всех полигонов, принадлежащих кадру, между тем или иным тайлом. Вместо этого GPU сначала целиком выполняет трансформацию геометрии сцены, а остальные этапы рендеринга происходят тайл за тайлом. При этом размер и количество тайлов, которые обрабатываются одновременно, определяется динамически по мере заполнения очереди геометрии фиксированной длины — таким образом, чтобы все данные помещались в кеш L2.

⇡#Технические характеристики, цены

Как и TITAN X, GTX 1080 Ti не располагает полностью функциональной версией графического процессора. Производитель заблокировал два из 30 SM в GPU обеих видеокарт. Таким образом, front-end чипа и, следовательно, теоретическая пропускная способность в операциях за такт в GTX 1080 Ti ничуть не пострадали по сравнению с TITAN X. Однако в GTX 1080 Ti отключен один из 12 контроллеров RAM, а вместе с ним — 8 ROP и секция кеша L2. Как следствие, шина памяти GPU уменьшилась с 384 до 352 бит и видеокарта оснащается лишь 11 вместо 12 Гбайт GDDR5X.

Тем не менее GTX 1080 Ti отыграл потерянную пропускную способность RAM за счет увеличенной частоты шины — с 10 000 до 11 000 Мбит/с на контакт. Кроме того, NVIDIA подняла частоты GPU: базовую на 63 МГц и Boost Clock — на 51 МГц. Таким образом, единственным параметром, который дифференцирует GTX 1080 Ti от TITAN X в рендеринге графики, остается объем L2.

А что насчет вычислительных задач? Здесь, в отличие от игр, может возникнуть такая ситуация, когда дополнительный гигабайт RAM имеет значение. Удивительно другое: NVIDIA нисколько не ограничила скорость работы GTX 1080 Ti с различными форматами данных. GP102 и без того не подходит для «боевых» расчетов на основе данных FP64 и FP16 (скорость исполнения на уровне 1/32 и 1/64 от FP32), зато как TITAN X, так и GTX 1080 Ti выполняют за такт вчетверо больше операций int8 по сравнению с FP32. До появления GTX 1080 Ti только TITAN X в потребительской линейке NVIDIA поддерживал int8 — инструкции, применяемые для обработки данных моделями глубинного обучения.

Производитель	NVIDIA
Модель	GeForce GTX 980 Ti	GeForce GTX TITAN X	GeForce GTX 1080	GeForce GTX 1080 Ti	TITAN X
Графический процессор
Название	GM200	GM200	GP104	GP102	GP102
Микроархитектура	Maxwell	Maxwell	Pascal	Pascal	Pascal
Техпроцесс, нм	28 нм	28 нм	16 нм FinFET	16 нм FinFET	16 нм FinFET
Число транзисторов, млн	8 000	8 000	7 200	12 000	12 000
Тактовая частота, МГц: Base Clock / Boost Clock	1 000 / 1 076	1 000 / 1 089	1 607 / 1 733	1 480 / 1582	1 417 / 1531
Число шейдерных ALU	2 816	3 072	2 560	3 584	3 584
Число блоков наложения текстур	176	192	160	224	224
Число ROP	96	96	64	88	96
Оперативная память
Разрядность шины, бит	384	384	256	352	384
Тип микросхем	GDDR5 SDRAM	GDDR5 SDRAM	GDDR5X SDRAM	GDDR5X SDRAM	GDDR5X SDRAM
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с)	1 753 (7 012)	1 753 (7 012)	1 250 (10 000)	1 376,25 (11 010)	1 250 (10 000)
Объем, Мбайт	6 144	12 288	8 192	11 264	12 288
Шина ввода/вывода	PCI Express 3.0 x16	PCI Express 3.0 x16	PCI Express 3.0 x16	PCI Express 3.0 x16	PCI Express 3.0 x16
Производительность
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты)	6 060	6 691	8 873	11 340	10 974
Производительность FP32/FP64	1/32	1/32	1/32	1/32	1/32
Пропускная способность оперативной памяти, Гбайт/с	336	336	320	484	480
Вывод изображения
Интерфейсы вывода изображения	DL DVI-I, DisplayPort 1.2, HDMI 1.4a	DL DVI-I, DisplayPort 1.2, HDMI 1.4a	DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b	DisplayPort 1.3/1.4, HDMI 2.0b	DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b
TDP, Вт	250	250	180	250	250
Рекомендованная розничная цена (США, без налога), $	649 (на момент выхода)	999 (на момент выхода)	На момент выхода: 599 / 699 (FE) Новая цена: 499 / 549 (FE)	699	1 200
Рекомендованная розничная цена (Россия), руб.	39 990 (на момент выхода)	74 900 (на момент выхода)	На момент выхода: 54 990 (FE) Новая цена: 45 790 (FE)	52 990 (FE)	89 990

GTX 1080 Ti и TITAN X разделяет довольно зыбкая граница, и это, с одной стороны, хорошая новость для энтузиастов, которые решили повременить с апгрейдом старой видеокарты на Pascal в ожидании топового ускорителя. С другой стороны, высокая производительность отражается на цене видеокарты. GTX 1080 Ti стал третьим однопроцессорным GeForce после GTX 780 Ti и GTX 1080 Founders Edition, достигшим отметки $699. Цена в российском онлайн-магазине компании составляет 52 990 руб. Кроме того, NVIDIA на этот раз не делает различий между видеокартой референсного дизайна (Founders Edition) и партнерскими образцами, которые появятся позже и получат точно такой же рекомендованный ценник.

В то же время NVIDIA сделала более доступными GeForce GTX 1070 и GTX 1080. На момент выхода последние были оценены в $379/449 и $599/699 (партнерские карты и Founders Edition соответственно), а теперь продаются за $349/399 и $499/549. Российские цены видеокарт на сайте NVIDIA снизились с 34 990 54 990 до 31 590 и 45 790 руб.

Вместе с тем NVIDIA объявила, что производители видеокарт получат возможность оснащать свои версии GeForce GTX 1060 и GTX 1080 более скоростными чипами GDDR5/5X: 9 вместо 8 Гбит/с для GTX 1060 и 11 вместо 10 Гбит/с — для GTX 1080. Референсные спецификации моделей при этом остались неизменными, просто у партнеров, закупающих у NVIDIA чипы памяти вместе с GPU для установки на собственные платы, появился выбор. Судя по тому, как редко мы видим на видеокартах оригинального дизайна микросхемы RAM, отличные от тех, которыми оснащаются референсные ускорители, такой ход NVIDIA действительно может сделать заводской разгон видеопамяти более распространенным явлением.

⇡#Конструкция

Поскольку предтечей GeForce GTX 1080 Ti является TITAN X, не удивительно, что различия в облике видеокарт минимальны. GTX 1080 Ti отличается от полностью черного «Титана» стандартно-серебристым цветом кожуха, а внутри — точно такой же радиатор с испарительной камерой и вентилятор радиального типа. Эта конструкция хорошо зарекомендовала себя еще во времена первого TITAN и GeForce GTX 780/780 Ti. Обладая выдающимися акустическими характеристиками для данного типа системы охлаждения, референсные видеокарты NVIDIA выделяются среди партнерских устройств, т. к. последние практически всегда оснащаются кулером открытой конструкции. При этом закрытая «турбинка» остается лучшим вариантом для компактных ПК, где важно, чтобы видеокарта выбрасывала большую часть воздуха наружу. Кроме того, референсный кулер гарантирует охлаждение микросхем памяти и множества других горячих точек платы за счет массивного алюминиевого основания.

Начиная с GeForce GTX 1080, видеокарты NVIDIA, совместимые с режимом SLI, позволяют удалить часть металлической пластины, которой покрыта обратная сторона печатной платы, чтобы воздух свободно проникал к системе охлаждения соседней видеокарты.

Несмотря общую с TITAN X конструкцию системы охлаждения, у GTX 1080 Ti есть одна очевидная особенность: NVIDIA удалила порт DL-DVI с внешней панели видеокарты. Весь набор выходов, который остался на GTX 1080 Ti, ограничивается тремя разъемами DisplayPort 1.3/1.4 и одним HDMI 2.0b. Зато вся половина пластины теперь задействована для вывода горячего воздуха за пределы корпуса ПК, что должно положительно сказаться на эффективности охлаждения. Для тех, кто все еще пользуется монитором без разъемов DisplayPort или HDMI, NVIDIA прилагает к GeForce GTX 1080 Ti Founders Edition переходник с интерфейса DP на Single-Link DVI.

⇡#Плата

Как и система охлаждения, оснастка печатной платы GeForce GTX 1080 Ti не только не ухудшилась по сравнению с TITAN X, но и стала лучше. Повышенная пропускная способность оперативной памяти в GTX 1080 Ti достигнута за счет новых чипов Micron (маркировка MT58K256M321JA-110), для которых эффективная частота 11 Гбайт/с является штатной. К слову, в каталоге Micron есть и память GDDR5X с частотой 12 Гбайт/с, но, выбрав наиболее скоростные чипы, NVIDIA, вероятно, пришлось бы исчерпать резерв надежности контроллеров RAM в составе GPU.

Что остается неизменным в преобразователе напряжения видеокарт NVIDIA, так это ШИМ-контроллер uP9511 от uPI Semiconductor, который на GTX 1080 Ti обслуживает максимальное для своих возможностей число фаз — семь, все из которых принадлежат схеме питания GPU. Две фазы чипов GDDR5X управляются контроллером uP1685. Однако и в силовой части видеокарты есть изменения. NVIDIA поместила на печатную плату ряд элементов, которые отсутствовали в TITAN X, в первую очередь — удвоила все полевые транзисторы в «фазах» питания GPU, что должно положительно отразиться на КПД преобразователя.

⇡#Тестовый стенд, методика тестирования

Конфигурация тестовых стендов
CPU	Intel Core i7-5960X @ 4 ГГц (100 МГц × 40), постоянная частота
Материнская плата	ASUS RAMPAGE V EXTREME
Оперативная память	Corsair Vengeance LPX, 2133 МГц, 4 × 4 Гбайт
ПЗУ	Intel SSD 520 240 Гбайт + Crucial M550 512 Гбайт
Блок питания	Corsair AX1200i, 1200 Вт
Система охлаждения CPU	Thermalright Archon
Корпус	CoolerMaster Test Bench V1.0
Монитор	NEC EA244UHD
Операционная система	Windows 10 Pro x64
ПО для GPU AMD
Все видеокарты	Radeon Software Crimson ReLive Edition 17.3.1 (Tesselation: Use application settings)
ПО для GPU NVIDIA
Все видеокарты	GeForce Game Ready Driver 378.78 WHQL

Бенчмарки: синтетические
Тест	API	Разрешение	Полноэкранное сглаживание
3DMark Fire Strike	DirectX 11 (feature level 11_0)	1920 × 1080	Выкл.
3DMark Fire Strike Extreme		2560 × 1440
3DMark Fire Strike Ultra		3840 × 2160
3DMark Time Spy	DirectX 12 (feature level 11_0)	2560 × 1440

Бенчмарки: игры
Игра (в порядке даты выхода)	API	Настройки	Полноэкранное сглаживание
Игра (в порядке даты выхода)	API	Настройки	1920 × 1080 / 2560 × 1440	3840 × 2160
Crysis 3 + FRAPS	DirectX 11	Макс. качество. Начало миссии Swamp	MSAA 4x	Выкл.
Metro: Last Light Redux, встроенный бенчмарк		Макс. качество	SSAA 4x
GTA V, встроенный бенчмарк		Макс. качество	MSAA 4x + FXAA + Reflection MSAA 4x
DiRT Rally, встроенный бенчмарк		Макс. качество	MSAA 4x
Rise of the Tomb Raider, встроенный бенчмарк	DirectX 12	Макс. качество, VXAO выкл.	SSAA 4x
Tom Clancy's The Division, встроенный бенчмарк		Макс. качество, HFTS выкл.	SMAA 1x Ultra + TAA: Supersampling	TAA: Stabilization
Ashes of the Singularity, встроенный бенчмарк		Макс. качество	MSAA 4x + TAA 4x	Выкл.
DOOM	Vulkan	Макс. качество. Миссия Foundry	TSSAA 8TX
Total War: WARHAMMER, встроенный бенчмарк	DirectX 12	Макс. качество	MSAA 4x
Deus Ex: Mankind Divided, встроенный бенчмарк		Макс. качество	MSAA 4x
Battlefield 1 + OCAT		Макс. качество. Начало миссии Through Mud and Blood	TAA

Бенчмарки: декодирование видео, вычисления
Программа	Настройки
DXVA Checker, Decode Benchmark, H.264	Файлы 1920 × 1080p (High Profile, L4.1), 3840 × 2160p (High Profile, L5.1). Microsoft H264 Video Decoder
DXVA Checker, Decode Benchmark, H.265	Файлы 1920 × 1080p (Main Profile, L4.0), 3840 × 2160p (Main Profile, L5.0). Microsoft H265 Video Decoder
LuxMark 3.1 x64	Сцена Hotel Lobby (Complex Benchmark)
Sony Vegas Pro 13	Бенчмарк Sony для Vegas Pro 11, продолжительность — 65 с, рендеринг в XDCAM EX, 1920 × 1080p 24 Гц
SiSoftware Sandra 2016 SP1, GPGPU Scientific Analysis	Open CL, FP32/FP64
CompuBench CL Desktop Edition X64, Ocean Surface Simulation	—
CompuBench CL Desktop Edition X64, Particle Simulation— 64K	—

Участники тестирования

В тестировании производительности приняли участие следующие видеокарты:

AMD Radeon R9 Fury X (1050/1000 МГц, 4 Гбайт);
NVIDIA TITAN X (1417/10000 МГц, 12 Гбайт);
NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт);
NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт);
NVIDIA GeForce GTX TITAN X (1000/7010 МГц, 12 Гбайт);

⇡#Производительность: 3DMark

Синтетические тесты игнорируют пропажу одного гигабайта памяти в GeForce GTX 1080 Ti, зато чувствительны к тактовой частоте GPU. Как следствие, в различных тестах либо GTX 1080 Ti и TITAN X эквивалентны по набранным очкам, либо GTX 1080 Ti имеет несущественное преимущество в 1–3%.

Какую бы из прочих однопроцессорных игровых видеокарт мы ни взяли для сравнения с GTX 1080 Ti, последний демонстрирует совершенно иной уровень быстродействия. Новый флагман в среднем на 32% опережает GTX 1080 в 3DMark, а в случае с GeForce GTX 980 Ti и Radeon R9 Fury X преимущество GTX 1080 Ti достигает 70% и 75%.

3DMark (Graphics Score)
	Разрешение	NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт)	NVIDIA GeForce GTX TITAN X (1000/7012 МГц, 12 Гбайт)	NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт)	NVIDIA TITAN X (1417/10000 МГц, 12 Гбайт)	AMD Radeon R9 Fury X (1050/1000 МГц, 4 Гбайт)	0
Fire Strike	1920 × 1080	28 003	17 115	21 694	27 987	16 279	0
Fire Strike Extreme	2560 × 1440	13 453	7 928	10 264	13 520	7 745	0
Fire Strike Ultra	3840 × 2160	6 594	4 042	5 001	6 557	3 942	0
Time Spy	2560 × 1440	9 480	5 106	7 111	9 149	5 084	0
Макс.			−39%	−23%	+0%	−40%	−100%
Среднее			−41%	−24%	−1%	−43%	−100%
Мин.			−46%	−25%	−3%	−46%	−100%

Производительность: игры (1920 × 1080, 2560 × 1440, 3840× 2160)

Тесты в реальных играх рисуют более сложную картину сравнения GeForce GTX 1080 Ti и TITAN X. Во всех разрешениях новинка имеет среднее преимущество в 2%. При этом между двумя картами подчас нет разницы даже в 1 FPS, а редкие примеры победы TITAN X как раз и сводятся к одному кадру в секунду сверх результата GTX 1080 Ti, что явно укладывается в случайные колебания замеров производительности. Тем не менее есть игра, которая отдает явное предпочтение GTX 1080 Ti, — Tom Clancy’s The Division. В ней преимущество GTX 1080 Ti составляет от 8 до 10%.

По сравнению с GTX 1080 новый флагман обеспечивает на 25–33% более высокую частоту смены кадров, но максимальная разница наблюдается при высоких разрешениях — от 1440p до 2160p. Вычислительная мощность топовых игровых видеокарт настолько велика, что в режиме 1080p важным фактором становится быстродействие CPU. Кроме того, DOOM уже достигает установленного в этой игре предела частоты смены кадров — 200 FPS — на обоих ускорителях.

Преимущество GTX 1080 Ti перед GTX TITAN X на базе архитектуры Maxwell в играх поменьше, чем в «синтетике», но по-прежнему чрезвычайно велико — от 54 до 67% в зависимости от разрешения. Radeon R9 Fury X, напротив, оказался еще более легким соперником, ведь против ускорителя AMD играет небольшой объем оперативной памяти (4 Гбайт). В результате если в режиме 1080p GTX 1080 Ti обеспечивает на 70% более высокую частоту смены кадров, то в 1440p и 2160p разница возрастает до 82 и 96%.

Отдельное внимание уделим результатам GTX 1080 Ti в 4К. Только видеокарты NVIDIA на базе GP102 на данный момент безоговорочно подходят для игры при таком разрешении с максимальными настройками качества графики (пусть и без полноэкранного сглаживания ресурсоемкими методами). В большинстве игр из нашей тестовой обоймы средняя частота смены кадров превышает 50–60 FPS и лишь в Deus Ex: Mankind Divided падает существенно ниже этого уровня.

1920 × 1080
	Полноэкранное сглаживание	NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт)	NVIDIA GeForce GTX TITAN X (1000/7012 МГц, 12 Гбайт)	NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт)	NVIDIA TITAN X (1417/10000 МГц, 12 Гбайт)	AMD Radeon R9 Fury X (1050/1000 МГц, 4 Гбайт)
Ashes of the Singularity	MSAA 4x + TAA 4x	58	45	45	55	32
Battlefield 1	TAA	144	90	118	140	92
Crysis 3	MSAA 4x	112	66	79	110	61
Deus Ex: Mankind Divided	MSAA 4x	53	30	38	52	34
DiRT Rally	MSAA 4x	128	84	101	124	66
DOOM	TSSAA 8TX	200	151	200	200	156
GTA V	MSAA 4x + FXAA + Reflection MSAA 4x	91	67	84	91	54
Metro: Last Light Redux	SSAA 4x	122	74	92	121	70
Rise of the Tomb Raider	SSAA 4x	85	47	63	84	43
Tom Clancy's The Division	SMAA 1x Ultra + TAA: Supersampling	127	67	94	116	61
Total War: WARHAMMER	MSAA 4x	77	59	71	78	51
Макс.			−23%	+0%	+1%	−22%
Среднее			−35%	−19%	−2%	−41%
Мин.			−47%	−29%	−9%	−52%

2560 × 1440
	Полноэкранное сглаживание	NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт)	NVIDIA GeForce GTX TITAN X (1000/7012 МГц, 12 Гбайт)	NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт)	NVIDIA TITAN X (1417/10000 МГц, 12 Гбайт)	AMD Radeon R9 Fury X (1050/1000 МГц, 4 Гбайт)
Ashes of the Singularity	MSAA 4x + TAA 4x	47	34	34	47	26
Battlefield 1	TAA	111	65	89	108	60
Crysis 3	MSAA 4x	72	41	53	70	40
Deus Ex: Mankind Divided	MSAA 4x	34	19	25	34	20
DiRT Rally	MSAA 4x	96	61	73	93	49
DOOM	TSSAA 8TX	177	100	136	175	107
GTA V	MSAA 4x + FXAA + Reflection MSAA 4x	78	48	63	78	40
Metro: Last Light Redux	SSAA 4x	72	44	52	69	42
Rise of the Tomb Raider	SSAA 4x	51	29	38	52	27
Tom Clancy's The Division	SMAA 1x Ultra + TAA: Supersampling	91	49	66	83	47
Total War: WARHAMMER	MSAA 4x	64	40	49	64	35
Макс.			−28%	−19%	+2%	−40%
Среднее			−40%	−25%	−2%	−45%
Мин.			−46%	−28%	−9%	−49%

3840 × 2160
	Полноэкранное сглаживание	NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт)	NVIDIA GeForce GTX TITAN X (1000/7012 МГц, 12 Гбайт)	NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт)	NVIDIA TITAN X (1417/10000 МГц, 12 Гбайт)	AMD Radeon R9 Fury X (1050/1000 МГц, 4 Гбайт)
Ashes of the Singularity	Выкл.	57	44	44	58	35
Battlefield 1		64	40	54	64	17
Crysis 3		50	31	36	47	28
Deus Ex: Mankind Divided		38	21	28	36	13
DiRT Rally		66	41	50	64	33
DOOM		97	54	75	97	57
GTA V		70	41	52	68	34
Metro: Last Light Redux		64	39	47	61	38
Rise of the Tomb Raider		61	35	44	61	31
Tom Clancy's The Division	TAA: Stabilization	54	29	39	50	32
Total War: WARHAMMER	Выкл.	52	31	39	52	32
Макс.			−23%	−16%	+3%	−38%
Среднее			−40%	−25%	−2%	−49%
Мин.			−46%	−28%	−7%	−73%

Производительность: декодирование видео

Чипы семейства Pascal оснащаются одним и тем же мультимедийным блоком, производительность которого зависит исключительно от тактовой частоты GPU. Как следствие, по скорости декодирования видео форматов H.264 и HEVC между топовыми «зелеными» видеокартами нет практически значимых различий. В этой дисциплине Pascal продвинулся далеко вперед по сравнению с прошлыми видеокартами, особенно GeForce GTX TITAN X, который, в отличие от GTX 960 и 950, не умеет полностью аппаратно декодировать HEVC и перекладывает часть работы на CPU. AMD тоже, хоть и улучшила производительность своего кодека в H.264, не может на равных соперничать с Pascal.

Прим.: поскольку в пределах одной линейки GPU декодеры обычно не различаются, в диаграммах приведено по одному устройству из каждого семейства (или больше в том случае, если это правило нарушается).

⇡#Производительность: вычисления

Результаты вычислительных тестов, в отличие от игр, далеко не столь однородны. Слишком многое зависит от специфики приложений, в которых приоритет имеют разные характеристики ускорителя: количество шейдерных ALU, тактовая частота, объем и пропускная способность памяти. Из всех задач TITAN X оказался быстрее GTX 1080 Ti лишь в трассировке лучей в LuxMark и математических функциях SiSoft Sandra. В остальных тестах либо между TITAN X и GTX 1080 Ti нет разницы, либо преимущество на стороне последнего. Есть и разновидности нагрузки, которые по-прежнему лучше всего ложатся на архитектуру AMD. Рендеринг ролика в Sony Vegas 13 Pro и симуляция водной поверхности в CompuBench CL отдают предпочтение Radeon R9 Fury X.

⇡#Тактовые частоты, энергопотребление, температура, разгон

По частотному режиму и профилю работы системы охлаждения GeForce GTX 1080 Ti отличается от TITAN X. В тесте Crysis 3 частота GPU новинки колеблется от 1734 до 1772 МГц, а предельное значение даже выше, чем у GTX 1080: 1873 МГц против 1860 МГц. У TITAN X зона типичных частот под нагрузкой, судя по нашим замерам, располагается ниже: 1557–1671 МГц.

При этом, естественно, GTX 1080 Ti нуждается в более эффективном отводе тепла от GPU. Помимо того, что в обеих видеокартах целевая температура по умолчанию увеличена на 3 °C по сравнению с GTX 1080 (85 против 82 °С), GTX 1080 Ti раскручивает вентилятор до более высоких оборотов, чем TITAN X (2628 против 2472 об/мин). Неспроста NVIDIA удалила порт DVI у GTX 1080 Ti, чтобы облегчить выход горячего воздуха. Максимальное напряжение питания для GP102 тоже превышает таковое для GP104: 1,062 и 1,05 В соответственно.

По мощности GTX 1080 Ti и TITAN X одинаковы с практической точки зрения, пусть система в комплекте с последним потребляет на 7 Вт меньше под игровой нагрузкой, что объясняется более низкими частотами GPU и RAM. Как GTX 1080, так и флагманы предыдущего поколения (GeForce GTX TITAN X и Radeon R9 Fury X), а в особенности — GeForce GTX 1080, являются более экономичными видеокартами.

Для разгона GTX 1080 Ti мы увеличили максимальное напряжение питания GPU до 1,093 В, запустили вентилятор СО на максимальной скорости (4815 об/мин) и в результате добились стабильной работы чипа на базовой частоте 1600 МГц. Образец TITAN X, который мы тестировали ранее, разогнался до 1617 МГц, но эту разницу можно смело списать на качество отдельных кристаллов GPU. Чипы памяти с более высокой штатной частотой впервые в нашей практике покорили отметку 12 ГГц. При этом средняя частота GPU, которую видеокарта поддерживала в играх, составила 1974 МГц, а максимальная — 2025 МГц. Между прочим, пиковая частота графического процессора в наших экспериментах с разгоном GTX 1080 была ненамного выше — 2126 МГц.

Любопытно сравнить разогнанные GeForce GTX 1080 Ti и TITAN X по температуре и энергопотреблению. Пусть незначительно с практической точки зрения, но у GTX 1080 Ti эти параметры ниже, при том что высокая частота RAM на GTX 1080 Ti перекрывает разницу в частотах разогнанного GPU. Заслуга в этом принадлежит усиленной системе питания и охлаждения новой карты.

⇡#Производительность: разгон

Эффект от разгона GeForce GTX 1080 Ti не столь велик, как в случае с TITAN X, ведь графический процессор здесь изначально работает на более высоких частотах. Тем не менее оверклокинг принес дополнительные 10% очков в 3DMark, а в играх частота смены кадров возросла на 7–12% в зависимости от разрешения (чем оно выше, тем больше разница).

3DMark (Graphics Score)
	Разрешение	NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт)	NVIDIA GeForce GTX 1080 Ti (1600/12310 МГц, 11 Гбайт)
Fire Strike	1920 × 1080	28 003	30 571
Fire Strike Extreme	2560 × 1440	13 453	14 882
Fire Strike Ultra	3840 × 2160	6 594	7 334
Time Spy	2560 × 1440	9 480	10 515
Макс.			+11%
Среднее			+10%
Мин.			+9%

1920 × 1080
	Полноэкранное сглаживание	NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт)	NVIDIA GeForce GTX 1080 Ti (1600/12310 МГц, 11 Гбайт)
Ashes of the Singularity	MSAA 4x + TAA 4x	58	63
Battlefield 1	TAA	144	154
Crysis 3	MSAA 4x	112	120
Deus Ex: Mankind Divided	MSAA 4x	53	59
DiRT Rally	MSAA 4x	128	139
DOOM	TSSAA 8TX	200	200
GTA V	MSAA 4x + FXAA + Reflection MSAA 4x	91	93
Metro: Last Light Redux	SSAA 4x	122	137
Rise of the Tomb Raider	SSAA 4x	85	92
Tom Clancy's The Division	SMAA 1x Ultra + TAA: Supersampling	127	140
Total War: WARHAMMER	MSAA 4x	77	77
Макс.			+13%
Среднее			+7%
Мин.			+0%

2560 × 1440
	Полноэкранное сглаживание	NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт)	NVIDIA GeForce GTX 1080 Ti (1600/12310 МГц, 11 Гбайт)
Ashes of the Singularity	MSAA 4x + TAA 4x	47	51
Battlefield 1	TAA	111	112
Crysis 3	MSAA 4x	72	80
Deus Ex: Mankind Divided	MSAA 4x	34	38
DiRT Rally	MSAA 4x	96	103
DOOM	TSSAA 8TX	177	197
GTA V	MSAA 4x + FXAA + Reflection MSAA 4x	78	84
Metro: Last Light Redux	SSAA 4x	72	80
Rise of the Tomb Raider	SSAA 4x	51	57
Tom Clancy's The Division	SMAA 1x Ultra + TAA: Supersampling	91	101
Total War: WARHAMMER	MSAA 4x	64	71
Макс.			+12%
Среднее			+9%
Мин.			+1%

3840 × 2160
	Полноэкранное сглаживание	NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт)	NVIDIA GeForce GTX 1080 Ti (1600/12310 МГц, 11 Гбайт)
Ashes of the Singularity	Выкл.	57	63
Battlefield 1		64	75
Crysis 3		50	55
Deus Ex: Mankind Divided		38	42
DiRT Rally		66	73
DOOM		97	110
GTA V		70	75
Metro: Last Light Redux		64	72
Rise of the Tomb Raider		61	69
Tom Clancy's The Division	TAA: Stabilization	54	61
Total War: WARHAMMER	Выкл.	52	57
Макс.			+17%
Среднее			+12%
Мин.			+6%

⇡#Выводы

Вопреки тому, как NVIDIA поступала с топовыми GPU в прошлых поколениях ускорителей, на этот раз, кажется, сделано все, чтобы GeForce GTX 1080 Ti не только не уступал TITAN X в производительности, но и получил дополнительные преимущества. Графический процессор GTX 1080 Ti понес определенные потери в наборе функциональных блоков по сравнению с GPU в составе TITAN X, который также не является полностью разблокированным. Но отсутствие одного контроллера RAM, восьми ROP и одного из 12 Гбайт памяти практически незаметно в играх и полностью компенсируется небольшим увеличением тактовых частот GPU и новыми чипами GDDR5X, работающими на эффективной частоте 11 ГГц. Как ни странно, даже расчетные возможности GP102 в GTX 1080 Ti не пострадали: видеокарта может агрегировать четыре операции над данными int8 за один такт 32-битного CUDA-ядра — точно так же, как и TITAN X, для которого, как ускорителя работы предварительно натренированных сетей глубинного обучения, это является одной из приоритетных функций.

Таким образом, небольшой компромисс в спецификациях GeForce GTX 1080 Ti выглядит скорее попыткой снизить себестоимость видеокарты, нежели дифференцировать ее от TITAN X. Более того, NVIDIA усовершенствовала «физические» параметры платы — эффективность охлаждения и КПД системы питания, в итоге лишив TITAN X остатков практической ценности. Последний, при цене на $500 выше, может подарить покупателю лишь моральное удовлетворение от владения немного более мощным GPU. На долю TITAN X также остаются специфические сценарии расчетных задач, в которых абсолютно необходимо иметь 12 Гбайт RAM.

Похоже, NVIDIA согласна пожертвовать TITAN X, чтобы в уже недалеком будущем дать решительный бой архитектуре Vega от AMD, которая возродит соревнование в верхнем сегменте игровых видеокарт. Не исключено, что вскоре появится и обновленная версия TITAN X на базе GP102, которая получит полностью функциональную версию GPU, а может, и «большой Pascal» — GP100 — все-таки найдет дорогу в просьюмерские устройства.

Что бы ни произошло в будущем, сейчас NVIDIA все еще наслаждается отсутствием конкуренции среди топовых видеоускорителей и GeForce GTX 1080 Ti можно сравнивать лишь с его предшественниками на лидерском посту — GTX 980 Ti (GTX TITAN X) и GeForce GTX 1080. Судя по нашим тестам, семейство Pascal получило лучший флагман, нежели Maxwell. GTX 1080 Ti обеспечивает на 25–33% более высокую частоту смены кадров в играх по сравнению с картой классом ниже (GTX 1080), чем не мог похвастаться GTX 980 Ti. В итоге те геймеры, которым GTX 1080 в свое время не показался убедительным предложением, могут решиться на апгрейд, даже если замене подлежит некогда могучий GTX TITAN X, который GTX 1080 Ti опережает на 54 –67%.

GTX 1080 Ti стал первым GeForce, который безоговорочно подходит для игры в разрешении 4К — цель, к которой безуспешно стремились видеокарты начиная с GeForce GTX 780 Ti и Radeon R9 290X. До GTX 1080 Ti с такой задачей мог справиться только TITAN X или пара GTX 1070/1080 в режиме SLI, но низкая цена флагмана по сравнению с TITAN X делает его более выгодным решеним, лишенным всех издержек многопроцессорных конфигураций.