NVIDIA применяет эту стратегию не в первый раз: когда происходит очередная смена техпроцесса или архитектуры графических процессоров, верхнюю позицию в новой линейке геймерских видеокарт какое-то время занимает устройство на чипе второго эшелона. Флагманский GPU сперва появляется в составе просьюмерского ускорителя под маркой TITAN, а затем, с теми или иными потерями вычислительных блоков и функций, доходит и до игровых моделей. Однако различия в технических характеристиках между очередным TITAN и очередным игровым флагманом на том же GPU в каждом поколении видеокарт уникальны.
В эпоху Kepler, которая породила первый «Титан» четыре года тому назад, GeForce GTX 780 и GTX TITAN были меньше всего похожи друг на друга. Помимо существенной разницы в наборе вычислительных блоков, игровая видеокарта получила вдвое меньше оперативной памяти и в восемь раз медленнее выполняла расчеты двойной точности (FP64). На базе архитектуры Maxwell NVIDIA уже не стала выпускать процессор, охватывающий одновременно графические задачи и вычисления двойной точности, поэтому GTX 980 Ti отличается от GeForce GTX TITAN X лишь объемом RAM и обладает практически эквивалентной производительностью в играх.
С приходом Pascal, впервые в своей истории, NVIDIA разделила GPU высшего эшелона на профессиональную и игровую категории. Переход на технологию 16 нм FinFET позволил выпустить процессор с беспрецедентным числом вычислительных блоков и уровнем быстродействия — GP100. Однако последний применяется лишь в ускорителях Quadro и Tesla, и вероятность увидеть его под маркой GeForce стремится к нулю. Альтернативный вариант «большого ядра», GP102, лишен архитектурных элементов и функций, важных для вычислительных задач, но вместе с тем не уступает GP100 в пропускной способности операций FP32, которые лежат в основе шейдерного кода 3D-приложений.
GP102 уже проявил себя в составе обновленного TITAN X, который, в неменьшей степени, чем игровой видеокартой, является ускорителем вычислений, приоритетом среди которых на этот раз стало применение моделей ИИ, созданных методом глубинного обучения (inference). Но, глядя на TITAN X, предсказать, каким окажется GTX 1080 Ti, было не так-то просто.
Дело в том, что NVIDIA не оставила себе большого пространства для маневра между GTX 1080 и TITAN X. Если судить по пиковой пропускной способности операций FP32 (что, разумеется, не является исчерпывающей характеристикой GPU), TITAN X лишь на 24% превосходит GeForce GTX 1080, в то время как разница между GTX 980 и GeForce GTX TITAN X по этому параметру составляла 35%. Если бы в поколении Pascal разработчики решили сколь-либо существенно сократить вычислительные ресурсы TITAN X, у NVIDIA получился бы довольно неубедительный флагман игровой линейки.
С другой стороны, в TITAN X ни частотный потенциал, ни набор функциональных блоков GP102 не раскрыты полностью, поэтому GeForce GTX 1080 Ti вполне мог оказаться быстрее, чем TITAN X, ведь NVIDIA когда-то поступила точно так же с GeForce GTX 780 Ti и первым TITAN. А в результате случилось нечто неожиданное: GeForce GTX 1080 Ti действительно урезали блоки GPU по сравнению с TITAN X, однако не те блоки, которых это обычно касается. Вместе с тем пиковая производительность GTX 1080 Ti, по крайней мере на бумаге, выше. Более того, у игровой видеокарты есть и другие, уже не столь очевидные преимущества.
GPU
Кристалл GP102, произведенный по норме 16 нм FinFET на мощностях TSMC, содержит 12 млрд транзисторов на площади 471 мм2. Параметры следующего по рангу чипа в линейке Pascal, GP104, намного скромнее — 7,2 млрд транзисторов и 314 мм2.
Однако структура вычислительных блоков GP102 повторяет таковую у чипа GP104, с учетом количественных изменений на высшем уровне архитектуры, так что весь дополнительный транзисторный бюджет в GP102 пошел на увеличение быстродействия в графике и иных вычислениях, опирающихся на формат данных FP32. Отдельно взятый SM (Streaming Multiprocessor) в GP102 и GP104 содержит 128 ядер CUDA для операций FP32, четыре FP64-совместимых ядра и одно ядро, способное выполнять две инструкции FP16 одновременно. Кроме того, в SM входят 40 блоков наложения текстур, 96 Кбайт разделяемой памяти и 48 Кбайт кеша L1.
Всего GP102 содержит 30 блоков SM, которые в сумме дают конфигурацию из 3840 ядер CUDA одинарной точности и 240 текстурников. Back-end конвейера представлен двенадцатью 32-битными контроллерами памяти GDDR5/5X (384-битная шина), с каждым из которых ассоциированы 8 ROP и секция кеша L2 объемом 256 Кбайт (3072 Кбайт на весь GPU).
По поводу отличий архитектуры Pascal от Maxwell рекомендуем обратиться к нашему обзору GeForce GTX 1080. В этой итерации разработчики развили достоинства предыдущего поколения и компенсировали присущие ему недостатки. Кратко перечислим наиболее существенные изменения:
Добавим к этому списку технологию, которая была секретным ноу-хау последних архитектур NVIDIA, но вслед за независимым расследованием, результаты которого распространились в интернете, компания раскрыла свои карты. Помимо мощной компрессии цвета, Архитектуры Maxwell и Pascal используют разновидность тайлового рендеринга для экономии пропускной способности памяти (ПСП).
Классический тайловый рендеринг, широко распространенный в мобильных GPU, подразумевает обработку кадра в два прохода. Сначала драйвер разделяет экранное пространство на тайлы (участки с типичным размером 16 × 16 или 32 × 32 пиксела) и составляет индекс полигонов, находящихся в проекции каждого тайла. Затем последовательно в пределах каждого тайла целиком выполняется процедура рендеринга — от трансформации и пересечения полигонов до заполнения текстур и исполнения шейдеров — и конечный результат всех тайлов сшивается в единую картинку. Преимущество такого метода состоит в том, что любые промежуточные операции в пределах тайла оперируют единым массивом данных, который целиком помещается в кеш GPU, а следовательно, сокращается частота обращений к оперативной памяти.
Тем не менее, необходимость в двух проходах обработки геометрии сцены сама по себе расходует пропускную способность RAM, поскольку GPU необходимо сначала записать во внешнюю память информацию о полигонах, попадающих в тот или иной тайл, а затем, выполняя рендеринг от тайла к тайлу, извлекать ее обратно. Как следствие, эффективность тайлового рендеринга в конечном счете зависит от того, перевешивает ли экономия ПСП на скорости заполнения пикселов ее потери на двухпроходную проекцию геометрии. В мобильных приложениях, отличающихся простой геометрией, тайловый рендеринг оправдывает себя, но для современных десктопных игр лучше подходит стандартный метод мгновенного (immediate) рендеринга, при котором в едином экранном пространстве происходит последовательная растеризация одного полигона за другим.
В конвейере Maxwell и Pascal сочетаются лучшие черты обеих методов рендеринга. NVIDIA тоже использует тайлы, но в данном случае отрисовка кадров, как и в других десктопных архитектурах, не требует отдельной стадии сортировки (binning) всех полигонов, принадлежащих кадру, между тем или иным тайлом. Вместо этого GPU сначала целиком выполняет трансформацию геометрии сцены, а остальные этапы рендеринга происходят тайл за тайлом. При этом размер и количество тайлов, которые обрабатываются одновременно, определяется динамически по мере заполнения очереди геометрии фиксированной длины — таким образом, чтобы все данные помещались в кеш L2.
⇡#Технические характеристики, цены
Как и TITAN X, GTX 1080 Ti не располагает полностью функциональной версией графического процессора. Производитель заблокировал два из 30 SM в GPU обеих видеокарт. Таким образом, front-end чипа и, следовательно, теоретическая пропускная способность в операциях за такт в GTX 1080 Ti ничуть не пострадали по сравнению с TITAN X. Однако в GTX 1080 Ti отключен один из 12 контроллеров RAM, а вместе с ним — 8 ROP и секция кеша L2. Как следствие, шина памяти GPU уменьшилась с 384 до 352 бит и видеокарта оснащается лишь 11 вместо 12 Гбайт GDDR5X.
Тем не менее GTX 1080 Ti отыграл потерянную пропускную способность RAM за счет увеличенной частоты шины — с 10 000 до 11 000 Мбит/с на контакт. Кроме того, NVIDIA подняла частоты GPU: базовую на 63 МГц и Boost Clock — на 51 МГц. Таким образом, единственным параметром, который дифференцирует GTX 1080 Ti от TITAN X в рендеринге графики, остается объем L2.
А что насчет вычислительных задач? Здесь, в отличие от игр, может возникнуть такая ситуация, когда дополнительный гигабайт RAM имеет значение. Удивительно другое: NVIDIA нисколько не ограничила скорость работы GTX 1080 Ti с различными форматами данных. GP102 и без того не подходит для «боевых» расчетов на основе данных FP64 и FP16 (скорость исполнения на уровне 1/32 и 1/64 от FP32), зато как TITAN X, так и GTX 1080 Ti выполняют за такт вчетверо больше операций int8 по сравнению с FP32. До появления GTX 1080 Ti только TITAN X в потребительской линейке NVIDIA поддерживал int8 — инструкции, применяемые для обработки данных моделями глубинного обучения.
Производитель | NVIDIA | ||||
---|---|---|---|---|---|
Модель | GeForce GTX 980 Ti | GeForce GTX TITAN X | GeForce GTX 1080 | GeForce GTX 1080 Ti | TITAN X |
Графический процессор | |||||
Название | GM200 | GM200 | GP104 | GP102 | GP102 |
Микроархитектура | Maxwell | Maxwell | Pascal | Pascal | Pascal |
Техпроцесс, нм | 28 нм | 28 нм | 16 нм FinFET | 16 нм FinFET | 16 нм FinFET |
Число транзисторов, млн | 8 000 | 8 000 | 7 200 | 12 000 | 12 000 |
Тактовая частота, МГц: Base Clock / Boost Clock | 1 000 / 1 076 | 1 000 / 1 089 | 1 607 / 1 733 | 1 480 / 1582 | 1 417 / 1531 |
Число шейдерных ALU | 2 816 | 3 072 | 2 560 | 3 584 | 3 584 |
Число блоков наложения текстур | 176 | 192 | 160 | 224 | 224 |
Число ROP | 96 | 96 | 64 | 88 | 96 |
Оперативная память | |||||
Разрядность шины, бит | 384 | 384 | 256 | 352 | 384 |
Тип микросхем | GDDR5 SDRAM | GDDR5 SDRAM | GDDR5X SDRAM | GDDR5X SDRAM | GDDR5X SDRAM |
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с) | 1 753 (7 012) | 1 753 (7 012) | 1 250 (10 000) | 1 376,25 (11 010) | 1 250 (10 000) |
Объем, Мбайт | 6 144 | 12 288 | 8 192 | 11 264 | 12 288 |
Шина ввода/вывода | PCI Express 3.0 x16 | PCI Express 3.0 x16 | PCI Express 3.0 x16 | PCI Express 3.0 x16 | PCI Express 3.0 x16 |
Производительность | |||||
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты) | 6 060 | 6 691 | 8 873 | 11 340 | 10 974 |
Производительность FP32/FP64 | 1/32 | 1/32 | 1/32 | 1/32 | 1/32 |
Пропускная способность оперативной памяти, Гбайт/с | 336 | 336 | 320 | 484 | 480 |
Вывод изображения | |||||
Интерфейсы вывода изображения | DL DVI-I, DisplayPort 1.2, HDMI 1.4a | DL DVI-I, DisplayPort 1.2, HDMI 1.4a | DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b | DisplayPort 1.3/1.4, HDMI 2.0b | DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b |
TDP, Вт | 250 | 250 | 180 | 250 | 250 |
Рекомендованная розничная цена (США, без налога), $ | 649 (на момент выхода) | 999 (на момент выхода) | На момент выхода: 599 / 699 (FE) Новая цена: 499 / 549 (FE) | 699 | 1 200 |
Рекомендованная розничная цена (Россия), руб. | 39 990 (на момент выхода) | 74 900 (на момент выхода) | На момент выхода: 54 990 (FE) Новая цена: 45 790 (FE) | 52 990 (FE) | 89 990 |
GTX 1080 Ti и TITAN X разделяет довольно зыбкая граница, и это, с одной стороны, хорошая новость для энтузиастов, которые решили повременить с апгрейдом старой видеокарты на Pascal в ожидании топового ускорителя. С другой стороны, высокая производительность отражается на цене видеокарты. GTX 1080 Ti стал третьим однопроцессорным GeForce после GTX 780 Ti и GTX 1080 Founders Edition, достигшим отметки $699. Цена в российском онлайн-магазине компании составляет 52 990 руб. Кроме того, NVIDIA на этот раз не делает различий между видеокартой референсного дизайна (Founders Edition) и партнерскими образцами, которые появятся позже и получат точно такой же рекомендованный ценник.
В то же время NVIDIA сделала более доступными GeForce GTX 1070 и GTX 1080. На момент выхода последние были оценены в $379/449 и $599/699 (партнерские карты и Founders Edition соответственно), а теперь продаются за $349/399 и $499/549. Российские цены видеокарт на сайте NVIDIA снизились с 34 990 54 990 до 31 590 и 45 790 руб.
Вместе с тем NVIDIA объявила, что производители видеокарт получат возможность оснащать свои версии GeForce GTX 1060 и GTX 1080 более скоростными чипами GDDR5/5X: 9 вместо 8 Гбит/с для GTX 1060 и 11 вместо 10 Гбит/с — для GTX 1080. Референсные спецификации моделей при этом остались неизменными, просто у партнеров, закупающих у NVIDIA чипы памяти вместе с GPU для установки на собственные платы, появился выбор. Судя по тому, как редко мы видим на видеокартах оригинального дизайна микросхемы RAM, отличные от тех, которыми оснащаются референсные ускорители, такой ход NVIDIA действительно может сделать заводской разгон видеопамяти более распространенным явлением.
Поскольку предтечей GeForce GTX 1080 Ti является TITAN X, не удивительно, что различия в облике видеокарт минимальны. GTX 1080 Ti отличается от полностью черного «Титана» стандартно-серебристым цветом кожуха, а внутри — точно такой же радиатор с испарительной камерой и вентилятор радиального типа. Эта конструкция хорошо зарекомендовала себя еще во времена первого TITAN и GeForce GTX 780/780 Ti. Обладая выдающимися акустическими характеристиками для данного типа системы охлаждения, референсные видеокарты NVIDIA выделяются среди партнерских устройств, т. к. последние практически всегда оснащаются кулером открытой конструкции. При этом закрытая «турбинка» остается лучшим вариантом для компактных ПК, где важно, чтобы видеокарта выбрасывала большую часть воздуха наружу. Кроме того, референсный кулер гарантирует охлаждение микросхем памяти и множества других горячих точек платы за счет массивного алюминиевого основания.
Начиная с GeForce GTX 1080, видеокарты NVIDIA, совместимые с режимом SLI, позволяют удалить часть металлической пластины, которой покрыта обратная сторона печатной платы, чтобы воздух свободно проникал к системе охлаждения соседней видеокарты.
Несмотря общую с TITAN X конструкцию системы охлаждения, у GTX 1080 Ti есть одна очевидная особенность: NVIDIA удалила порт DL-DVI с внешней панели видеокарты. Весь набор выходов, который остался на GTX 1080 Ti, ограничивается тремя разъемами DisplayPort 1.3/1.4 и одним HDMI 2.0b. Зато вся половина пластины теперь задействована для вывода горячего воздуха за пределы корпуса ПК, что должно положительно сказаться на эффективности охлаждения. Для тех, кто все еще пользуется монитором без разъемов DisplayPort или HDMI, NVIDIA прилагает к GeForce GTX 1080 Ti Founders Edition переходник с интерфейса DP на Single-Link DVI.
Как и система охлаждения, оснастка печатной платы GeForce GTX 1080 Ti не только не ухудшилась по сравнению с TITAN X, но и стала лучше. Повышенная пропускная способность оперативной памяти в GTX 1080 Ti достигнута за счет новых чипов Micron (маркировка MT58K256M321JA-110), для которых эффективная частота 11 Гбайт/с является штатной. К слову, в каталоге Micron есть и память GDDR5X с частотой 12 Гбайт/с, но, выбрав наиболее скоростные чипы, NVIDIA, вероятно, пришлось бы исчерпать резерв надежности контроллеров RAM в составе GPU.
Что остается неизменным в преобразователе напряжения видеокарт NVIDIA, так это ШИМ-контроллер uP9511 от uPI Semiconductor, который на GTX 1080 Ti обслуживает максимальное для своих возможностей число фаз — семь, все из которых принадлежат схеме питания GPU. Две фазы чипов GDDR5X управляются контроллером uP1685. Однако и в силовой части видеокарты есть изменения. NVIDIA поместила на печатную плату ряд элементов, которые отсутствовали в TITAN X, в первую очередь — удвоила все полевые транзисторы в «фазах» питания GPU, что должно положительно отразиться на КПД преобразователя.
⇡#Тестовый стенд, методика тестирования
Конфигурация тестовых стендов | |
---|---|
CPU | Intel Core i7-5960X @ 4 ГГц (100 МГц × 40), постоянная частота |
Материнская плата | ASUS RAMPAGE V EXTREME |
Оперативная память | Corsair Vengeance LPX, 2133 МГц, 4 × 4 Гбайт |
ПЗУ | Intel SSD 520 240 Гбайт + Crucial M550 512 Гбайт |
Блок питания | Corsair AX1200i, 1200 Вт |
Система охлаждения CPU | Thermalright Archon |
Корпус | CoolerMaster Test Bench V1.0 |
Монитор | NEC EA244UHD |
Операционная система | Windows 10 Pro x64 |
ПО для GPU AMD | |
Все видеокарты | Radeon Software Crimson ReLive Edition 17.3.1 (Tesselation: Use application settings) |
ПО для GPU NVIDIA | |
Все видеокарты | GeForce Game Ready Driver 378.78 WHQL |
Бенчмарки: синтетические | |||
---|---|---|---|
Тест | API | Разрешение | Полноэкранное сглаживание |
3DMark Fire Strike | DirectX 11 (feature level 11_0) | 1920 × 1080 | Выкл. |
3DMark Fire Strike Extreme | 2560 × 1440 | ||
3DMark Fire Strike Ultra | 3840 × 2160 | ||
3DMark Time Spy | DirectX 12 (feature level 11_0) | 2560 × 1440 |
Бенчмарки: игры | ||||
---|---|---|---|---|
Игра (в порядке даты выхода) | API | Настройки | Полноэкранное сглаживание | |
1920 × 1080 / 2560 × 1440 | 3840 × 2160 | |||
Crysis 3 + FRAPS | DirectX 11 | Макс. качество. Начало миссии Swamp | MSAA 4x | Выкл. |
Metro: Last Light Redux, встроенный бенчмарк | Макс. качество | SSAA 4x | ||
GTA V, встроенный бенчмарк | Макс. качество | MSAA 4x + FXAA + Reflection MSAA 4x | ||
DiRT Rally, встроенный бенчмарк | Макс. качество | MSAA 4x | ||
Rise of the Tomb Raider, встроенный бенчмарк | DirectX 12 | Макс. качество, VXAO выкл. | SSAA 4x | |
Tom Clancy's The Division, встроенный бенчмарк | Макс. качество, HFTS выкл. | SMAA 1x Ultra + TAA: Supersampling | TAA: Stabilization | |
Ashes of the Singularity, встроенный бенчмарк | Макс. качество | MSAA 4x + TAA 4x | Выкл. | |
DOOM | Vulkan | Макс. качество. Миссия Foundry | TSSAA 8TX | |
Total War: WARHAMMER, встроенный бенчмарк | DirectX 12 | Макс. качество | MSAA 4x | |
Deus Ex: Mankind Divided, встроенный бенчмарк | Макс. качество | MSAA 4x | ||
Battlefield 1 + OCAT | Макс. качество. Начало миссии Through Mud and Blood | TAA |
Бенчмарки: декодирование видео, вычисления | |
---|---|
Программа | Настройки |
DXVA Checker, Decode Benchmark, H.264 | Файлы 1920 × 1080p (High Profile, L4.1), 3840 × 2160p (High Profile, L5.1). Microsoft H264 Video Decoder |
DXVA Checker, Decode Benchmark, H.265 | Файлы 1920 × 1080p (Main Profile, L4.0), 3840 × 2160p (Main Profile, L5.0). Microsoft H265 Video Decoder |
LuxMark 3.1 x64 | Сцена Hotel Lobby (Complex Benchmark) |
Sony Vegas Pro 13 | Бенчмарк Sony для Vegas Pro 11, продолжительность — 65 с, рендеринг в XDCAM EX, 1920 × 1080p 24 Гц |
SiSoftware Sandra 2016 SP1, GPGPU Scientific Analysis | Open CL, FP32/FP64 |
CompuBench CL Desktop Edition X64, Ocean Surface Simulation | — |
CompuBench CL Desktop Edition X64, Particle Simulation— 64K | — |
Участники тестирования
В тестировании производительности приняли участие следующие видеокарты:
Синтетические тесты игнорируют пропажу одного гигабайта памяти в GeForce GTX 1080 Ti, зато чувствительны к тактовой частоте GPU. Как следствие, в различных тестах либо GTX 1080 Ti и TITAN X эквивалентны по набранным очкам, либо GTX 1080 Ti имеет несущественное преимущество в 1–3%.
Какую бы из прочих однопроцессорных игровых видеокарт мы ни взяли для сравнения с GTX 1080 Ti, последний демонстрирует совершенно иной уровень быстродействия. Новый флагман в среднем на 32% опережает GTX 1080 в 3DMark, а в случае с GeForce GTX 980 Ti и Radeon R9 Fury X преимущество GTX 1080 Ti достигает 70% и 75%.
3DMark (Graphics Score) | |||||||
---|---|---|---|---|---|---|---|
Разрешение | NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт) | NVIDIA GeForce GTX TITAN X (1000/7012 МГц, 12 Гбайт) | NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт) | NVIDIA TITAN X (1417/10000 МГц, 12 Гбайт) | AMD Radeon R9 Fury X (1050/1000 МГц, 4 Гбайт) | 0 | |
Fire Strike | 1920 × 1080 | 28 003 | 17 115 | 21 694 | 27 987 | 16 279 | 0 |
Fire Strike Extreme | 2560 × 1440 | 13 453 | 7 928 | 10 264 | 13 520 | 7 745 | 0 |
Fire Strike Ultra | 3840 × 2160 | 6 594 | 4 042 | 5 001 | 6 557 | 3 942 | 0 |
Time Spy | 2560 × 1440 | 9 480 | 5 106 | 7 111 | 9 149 | 5 084 | 0 |
Макс. | −39% | −23% | +0% | −40% | −100% | ||
Среднее | −41% | −24% | −1% | −43% | −100% | ||
Мин. | −46% | −25% | −3% | −46% | −100% |
Производительность: игры (1920 × 1080, 2560 × 1440, 3840× 2160)
Тесты в реальных играх рисуют более сложную картину сравнения GeForce GTX 1080 Ti и TITAN X. Во всех разрешениях новинка имеет среднее преимущество в 2%. При этом между двумя картами подчас нет разницы даже в 1 FPS, а редкие примеры победы TITAN X как раз и сводятся к одному кадру в секунду сверх результата GTX 1080 Ti, что явно укладывается в случайные колебания замеров производительности. Тем не менее есть игра, которая отдает явное предпочтение GTX 1080 Ti, — Tom Clancy’s The Division. В ней преимущество GTX 1080 Ti составляет от 8 до 10%.
По сравнению с GTX 1080 новый флагман обеспечивает на 25–33% более высокую частоту смены кадров, но максимальная разница наблюдается при высоких разрешениях — от 1440p до 2160p. Вычислительная мощность топовых игровых видеокарт настолько велика, что в режиме 1080p важным фактором становится быстродействие CPU. Кроме того, DOOM уже достигает установленного в этой игре предела частоты смены кадров — 200 FPS — на обоих ускорителях.
Преимущество GTX 1080 Ti перед GTX TITAN X на базе архитектуры Maxwell в играх поменьше, чем в «синтетике», но по-прежнему чрезвычайно велико — от 54 до 67% в зависимости от разрешения. Radeon R9 Fury X, напротив, оказался еще более легким соперником, ведь против ускорителя AMD играет небольшой объем оперативной памяти (4 Гбайт). В результате если в режиме 1080p GTX 1080 Ti обеспечивает на 70% более высокую частоту смены кадров, то в 1440p и 2160p разница возрастает до 82 и 96%.
Отдельное внимание уделим результатам GTX 1080 Ti в 4К. Только видеокарты NVIDIA на базе GP102 на данный момент безоговорочно подходят для игры при таком разрешении с максимальными настройками качества графики (пусть и без полноэкранного сглаживания ресурсоемкими методами). В большинстве игр из нашей тестовой обоймы средняя частота смены кадров превышает 50–60 FPS и лишь в Deus Ex: Mankind Divided падает существенно ниже этого уровня.
1920 × 1080 | ||||||
---|---|---|---|---|---|---|
Полноэкранное сглаживание | NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт) | NVIDIA GeForce GTX TITAN X (1000/7012 МГц, 12 Гбайт) | NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт) | NVIDIA TITAN X (1417/10000 МГц, 12 Гбайт) | AMD Radeon R9 Fury X (1050/1000 МГц, 4 Гбайт) | |
Ashes of the Singularity | MSAA 4x + TAA 4x | 58 | 45 | 45 | 55 | 32 |
Battlefield 1 | TAA | 144 | 90 | 118 | 140 | 92 |
Crysis 3 | MSAA 4x | 112 | 66 | 79 | 110 | 61 |
Deus Ex: Mankind Divided | MSAA 4x | 53 | 30 | 38 | 52 | 34 |
DiRT Rally | MSAA 4x | 128 | 84 | 101 | 124 | 66 |
DOOM | TSSAA 8TX | 200 | 151 | 200 | 200 | 156 |
GTA V | MSAA 4x + FXAA + Reflection MSAA 4x | 91 | 67 | 84 | 91 | 54 |
Metro: Last Light Redux | SSAA 4x | 122 | 74 | 92 | 121 | 70 |
Rise of the Tomb Raider | SSAA 4x | 85 | 47 | 63 | 84 | 43 |
Tom Clancy's The Division | SMAA 1x Ultra + TAA: Supersampling | 127 | 67 | 94 | 116 | 61 |
Total War: WARHAMMER | MSAA 4x | 77 | 59 | 71 | 78 | 51 |
Макс. | −23% | +0% | +1% | −22% | ||
Среднее | −35% | −19% | −2% | −41% | ||
Мин. | −47% | −29% | −9% | −52% |
2560 × 1440 | ||||||
---|---|---|---|---|---|---|
Полноэкранное сглаживание | NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт) | NVIDIA GeForce GTX TITAN X (1000/7012 МГц, 12 Гбайт) | NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт) | NVIDIA TITAN X (1417/10000 МГц, 12 Гбайт) | AMD Radeon R9 Fury X (1050/1000 МГц, 4 Гбайт) | |
Ashes of the Singularity | MSAA 4x + TAA 4x | 47 | 34 | 34 | 47 | 26 |
Battlefield 1 | TAA | 111 | 65 | 89 | 108 | 60 |
Crysis 3 | MSAA 4x | 72 | 41 | 53 | 70 | 40 |
Deus Ex: Mankind Divided | MSAA 4x | 34 | 19 | 25 | 34 | 20 |
DiRT Rally | MSAA 4x | 96 | 61 | 73 | 93 | 49 |
DOOM | TSSAA 8TX | 177 | 100 | 136 | 175 | 107 |
GTA V | MSAA 4x + FXAA + Reflection MSAA 4x | 78 | 48 | 63 | 78 | 40 |
Metro: Last Light Redux | SSAA 4x | 72 | 44 | 52 | 69 | 42 |
Rise of the Tomb Raider | SSAA 4x | 51 | 29 | 38 | 52 | 27 |
Tom Clancy's The Division | SMAA 1x Ultra + TAA: Supersampling | 91 | 49 | 66 | 83 | 47 |
Total War: WARHAMMER | MSAA 4x | 64 | 40 | 49 | 64 | 35 |
Макс. | −28% | −19% | +2% | −40% | ||
Среднее | −40% | −25% | −2% | −45% | ||
Мин. | −46% | −28% | −9% | −49% |
3840 × 2160 | ||||||
---|---|---|---|---|---|---|
Полноэкранное сглаживание | NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт) | NVIDIA GeForce GTX TITAN X (1000/7012 МГц, 12 Гбайт) | NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт) | NVIDIA TITAN X (1417/10000 МГц, 12 Гбайт) | AMD Radeon R9 Fury X (1050/1000 МГц, 4 Гбайт) | |
Ashes of the Singularity | Выкл. | 57 | 44 | 44 | 58 | 35 |
Battlefield 1 | 64 | 40 | 54 | 64 | 17 | |
Crysis 3 | 50 | 31 | 36 | 47 | 28 | |
Deus Ex: Mankind Divided | 38 | 21 | 28 | 36 | 13 | |
DiRT Rally | 66 | 41 | 50 | 64 | 33 | |
DOOM | 97 | 54 | 75 | 97 | 57 | |
GTA V | 70 | 41 | 52 | 68 | 34 | |
Metro: Last Light Redux | 64 | 39 | 47 | 61 | 38 | |
Rise of the Tomb Raider | 61 | 35 | 44 | 61 | 31 | |
Tom Clancy's The Division | TAA: Stabilization | 54 | 29 | 39 | 50 | 32 |
Total War: WARHAMMER | Выкл. | 52 | 31 | 39 | 52 | 32 |
Макс. | −23% | −16% | +3% | −38% | ||
Среднее | −40% | −25% | −2% | −49% | ||
Мин. | −46% | −28% | −7% | −73% |
Производительность: декодирование видео
Чипы семейства Pascal оснащаются одним и тем же мультимедийным блоком, производительность которого зависит исключительно от тактовой частоты GPU. Как следствие, по скорости декодирования видео форматов H.264 и HEVC между топовыми «зелеными» видеокартами нет практически значимых различий. В этой дисциплине Pascal продвинулся далеко вперед по сравнению с прошлыми видеокартами, особенно GeForce GTX TITAN X, который, в отличие от GTX 960 и 950, не умеет полностью аппаратно декодировать HEVC и перекладывает часть работы на CPU. AMD тоже, хоть и улучшила производительность своего кодека в H.264, не может на равных соперничать с Pascal.
Прим.: поскольку в пределах одной линейки GPU декодеры обычно не различаются, в диаграммах приведено по одному устройству из каждого семейства (или больше в том случае, если это правило нарушается).
⇡#Производительность: вычисления
Результаты вычислительных тестов, в отличие от игр, далеко не столь однородны. Слишком многое зависит от специфики приложений, в которых приоритет имеют разные характеристики ускорителя: количество шейдерных ALU, тактовая частота, объем и пропускная способность памяти. Из всех задач TITAN X оказался быстрее GTX 1080 Ti лишь в трассировке лучей в LuxMark и математических функциях SiSoft Sandra. В остальных тестах либо между TITAN X и GTX 1080 Ti нет разницы, либо преимущество на стороне последнего. Есть и разновидности нагрузки, которые по-прежнему лучше всего ложатся на архитектуру AMD. Рендеринг ролика в Sony Vegas 13 Pro и симуляция водной поверхности в CompuBench CL отдают предпочтение Radeon R9 Fury X.
⇡#Тактовые частоты, энергопотребление, температура, разгон
По частотному режиму и профилю работы системы охлаждения GeForce GTX 1080 Ti отличается от TITAN X. В тесте Crysis 3 частота GPU новинки колеблется от 1734 до 1772 МГц, а предельное значение даже выше, чем у GTX 1080: 1873 МГц против 1860 МГц. У TITAN X зона типичных частот под нагрузкой, судя по нашим замерам, располагается ниже: 1557–1671 МГц.
При этом, естественно, GTX 1080 Ti нуждается в более эффективном отводе тепла от GPU. Помимо того, что в обеих видеокартах целевая температура по умолчанию увеличена на 3 °C по сравнению с GTX 1080 (85 против 82 °С), GTX 1080 Ti раскручивает вентилятор до более высоких оборотов, чем TITAN X (2628 против 2472 об/мин). Неспроста NVIDIA удалила порт DVI у GTX 1080 Ti, чтобы облегчить выход горячего воздуха. Максимальное напряжение питания для GP102 тоже превышает таковое для GP104: 1,062 и 1,05 В соответственно.
По мощности GTX 1080 Ti и TITAN X одинаковы с практической точки зрения, пусть система в комплекте с последним потребляет на 7 Вт меньше под игровой нагрузкой, что объясняется более низкими частотами GPU и RAM. Как GTX 1080, так и флагманы предыдущего поколения (GeForce GTX TITAN X и Radeon R9 Fury X), а в особенности — GeForce GTX 1080, являются более экономичными видеокартами.
Для разгона GTX 1080 Ti мы увеличили максимальное напряжение питания GPU до 1,093 В, запустили вентилятор СО на максимальной скорости (4815 об/мин) и в результате добились стабильной работы чипа на базовой частоте 1600 МГц. Образец TITAN X, который мы тестировали ранее, разогнался до 1617 МГц, но эту разницу можно смело списать на качество отдельных кристаллов GPU. Чипы памяти с более высокой штатной частотой впервые в нашей практике покорили отметку 12 ГГц. При этом средняя частота GPU, которую видеокарта поддерживала в играх, составила 1974 МГц, а максимальная — 2025 МГц. Между прочим, пиковая частота графического процессора в наших экспериментах с разгоном GTX 1080 была ненамного выше — 2126 МГц.
Любопытно сравнить разогнанные GeForce GTX 1080 Ti и TITAN X по температуре и энергопотреблению. Пусть незначительно с практической точки зрения, но у GTX 1080 Ti эти параметры ниже, при том что высокая частота RAM на GTX 1080 Ti перекрывает разницу в частотах разогнанного GPU. Заслуга в этом принадлежит усиленной системе питания и охлаждения новой карты.
Эффект от разгона GeForce GTX 1080 Ti не столь велик, как в случае с TITAN X, ведь графический процессор здесь изначально работает на более высоких частотах. Тем не менее оверклокинг принес дополнительные 10% очков в 3DMark, а в играх частота смены кадров возросла на 7–12% в зависимости от разрешения (чем оно выше, тем больше разница).
3DMark (Graphics Score) | |||
---|---|---|---|
Разрешение | NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт) | NVIDIA GeForce GTX 1080 Ti (1600/12310 МГц, 11 Гбайт) | |
Fire Strike | 1920 × 1080 | 28 003 | 30 571 |
Fire Strike Extreme | 2560 × 1440 | 13 453 | 14 882 |
Fire Strike Ultra | 3840 × 2160 | 6 594 | 7 334 |
Time Spy | 2560 × 1440 | 9 480 | 10 515 |
Макс. | +11% | ||
Среднее | +10% | ||
Мин. | +9% |
1920 × 1080 | |||
---|---|---|---|
Полноэкранное сглаживание | NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт) | NVIDIA GeForce GTX 1080 Ti (1600/12310 МГц, 11 Гбайт) | |
Ashes of the Singularity | MSAA 4x + TAA 4x | 58 | 63 |
Battlefield 1 | TAA | 144 | 154 |
Crysis 3 | MSAA 4x | 112 | 120 |
Deus Ex: Mankind Divided | MSAA 4x | 53 | 59 |
DiRT Rally | MSAA 4x | 128 | 139 |
DOOM | TSSAA 8TX | 200 | 200 |
GTA V | MSAA 4x + FXAA + Reflection MSAA 4x | 91 | 93 |
Metro: Last Light Redux | SSAA 4x | 122 | 137 |
Rise of the Tomb Raider | SSAA 4x | 85 | 92 |
Tom Clancy's The Division | SMAA 1x Ultra + TAA: Supersampling | 127 | 140 |
Total War: WARHAMMER | MSAA 4x | 77 | 77 |
Макс. | +13% | ||
Среднее | +7% | ||
Мин. | +0% |
2560 × 1440 | |||
---|---|---|---|
Полноэкранное сглаживание | NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт) | NVIDIA GeForce GTX 1080 Ti (1600/12310 МГц, 11 Гбайт) | |
Ashes of the Singularity | MSAA 4x + TAA 4x | 47 | 51 |
Battlefield 1 | TAA | 111 | 112 |
Crysis 3 | MSAA 4x | 72 | 80 |
Deus Ex: Mankind Divided | MSAA 4x | 34 | 38 |
DiRT Rally | MSAA 4x | 96 | 103 |
DOOM | TSSAA 8TX | 177 | 197 |
GTA V | MSAA 4x + FXAA + Reflection MSAA 4x | 78 | 84 |
Metro: Last Light Redux | SSAA 4x | 72 | 80 |
Rise of the Tomb Raider | SSAA 4x | 51 | 57 |
Tom Clancy's The Division | SMAA 1x Ultra + TAA: Supersampling | 91 | 101 |
Total War: WARHAMMER | MSAA 4x | 64 | 71 |
Макс. | +12% | ||
Среднее | +9% | ||
Мин. | +1% |
3840 × 2160 | |||
---|---|---|---|
Полноэкранное сглаживание | NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт) | NVIDIA GeForce GTX 1080 Ti (1600/12310 МГц, 11 Гбайт) | |
Ashes of the Singularity | Выкл. | 57 | 63 |
Battlefield 1 | 64 | 75 | |
Crysis 3 | 50 | 55 | |
Deus Ex: Mankind Divided | 38 | 42 | |
DiRT Rally | 66 | 73 | |
DOOM | 97 | 110 | |
GTA V | 70 | 75 | |
Metro: Last Light Redux | 64 | 72 | |
Rise of the Tomb Raider | 61 | 69 | |
Tom Clancy's The Division | TAA: Stabilization | 54 | 61 |
Total War: WARHAMMER | Выкл. | 52 | 57 |
Макс. | +17% | ||
Среднее | +12% | ||
Мин. | +6% |
Вопреки тому, как NVIDIA поступала с топовыми GPU в прошлых поколениях ускорителей, на этот раз, кажется, сделано все, чтобы GeForce GTX 1080 Ti не только не уступал TITAN X в производительности, но и получил дополнительные преимущества. Графический процессор GTX 1080 Ti понес определенные потери в наборе функциональных блоков по сравнению с GPU в составе TITAN X, который также не является полностью разблокированным. Но отсутствие одного контроллера RAM, восьми ROP и одного из 12 Гбайт памяти практически незаметно в играх и полностью компенсируется небольшим увеличением тактовых частот GPU и новыми чипами GDDR5X, работающими на эффективной частоте 11 ГГц. Как ни странно, даже расчетные возможности GP102 в GTX 1080 Ti не пострадали: видеокарта может агрегировать четыре операции над данными int8 за один такт 32-битного CUDA-ядра — точно так же, как и TITAN X, для которого, как ускорителя работы предварительно натренированных сетей глубинного обучения, это является одной из приоритетных функций.
Таким образом, небольшой компромисс в спецификациях GeForce GTX 1080 Ti выглядит скорее попыткой снизить себестоимость видеокарты, нежели дифференцировать ее от TITAN X. Более того, NVIDIA усовершенствовала «физические» параметры платы — эффективность охлаждения и КПД системы питания, в итоге лишив TITAN X остатков практической ценности. Последний, при цене на $500 выше, может подарить покупателю лишь моральное удовлетворение от владения немного более мощным GPU. На долю TITAN X также остаются специфические сценарии расчетных задач, в которых абсолютно необходимо иметь 12 Гбайт RAM.
Похоже, NVIDIA согласна пожертвовать TITAN X, чтобы в уже недалеком будущем дать решительный бой архитектуре Vega от AMD, которая возродит соревнование в верхнем сегменте игровых видеокарт. Не исключено, что вскоре появится и обновленная версия TITAN X на базе GP102, которая получит полностью функциональную версию GPU, а может, и «большой Pascal» — GP100 — все-таки найдет дорогу в просьюмерские устройства.
Что бы ни произошло в будущем, сейчас NVIDIA все еще наслаждается отсутствием конкуренции среди топовых видеоускорителей и GeForce GTX 1080 Ti можно сравнивать лишь с его предшественниками на лидерском посту — GTX 980 Ti (GTX TITAN X) и GeForce GTX 1080. Судя по нашим тестам, семейство Pascal получило лучший флагман, нежели Maxwell. GTX 1080 Ti обеспечивает на 25–33% более высокую частоту смены кадров в играх по сравнению с картой классом ниже (GTX 1080), чем не мог похвастаться GTX 980 Ti. В итоге те геймеры, которым GTX 1080 в свое время не показался убедительным предложением, могут решиться на апгрейд, даже если замене подлежит некогда могучий GTX TITAN X, который GTX 1080 Ti опережает на 54 –67%.
GTX 1080 Ti стал первым GeForce, который безоговорочно подходит для игры в разрешении 4К — цель, к которой безуспешно стремились видеокарты начиная с GeForce GTX 780 Ti и Radeon R9 290X. До GTX 1080 Ti с такой задачей мог справиться только TITAN X или пара GTX 1070/1080 в режиме SLI, но низкая цена флагмана по сравнению с TITAN X делает его более выгодным решеним, лишенным всех издержек многопроцессорных конфигураций.