Оригинал материала: https://3dnews.ru/941190

NVIDIA GeForce GTX 1070 vs GTX 1080 SLI, сравнение трех поколений мостиков SLI

GIGABYTE GeForce GTX 1070 Xtreme Gaming: технические характеристики. Конструкция. Плата

Игровые системы с несколькими GPU переживают не лучшие времена. Каждый год, когда появляются видеокарты нового поколения, мы проводим тесты в SLI и CrossFire и вынуждены констатировать — современные игровые движки отложенного рендеринга не столь хорошо оптимизированы под работу в режиме с чередованием кадров (AFR — Alternate Frame Rendering), как их предшественники в первые годы существования технологий SLI и CrossFire. Это отражается и в политике компаний — производителей GPU. К примеру, NVIDIA официально прекратила поддержку конфигураций с тремя и более графическими процессорами в поколении GeForce 10 и предлагает одиночные видеокарты под маркой TITAN в качестве альтернативы двум GPU в SLI, обеспечивающей более предсказуемое быстродействие.

С другой стороны, как производители графических процессоров, так и разработчики игрового ПО приняли меры к тому, чтобы устранить препятствия другого рода, ограничивающие масштабирование быстродействия в системах с несколькими GPU. AMD давно отказалась от отдельного интерфейса CrossFire, а NVIDIA представила переработанную шину SLI в процессорах на базе архитектуры Pascal.

Ранее мы уже тестировали SLI на базе двух видеокарт GeForce GTX 1080, однако тандем GTX 1070 вызывает не меньший интерес, поэтому мы решили провести более развернутое исследование, включающее не только GTX 1080, но и GTX 1070 в двухпроцессорной конфигурации.

Вторая по старшинству модель в игровой линейке NVIDIA намного дешевле ($379/449 — рекомендованная цена на партнерские видеокарты и Founders Edition соответственно) по сравнению с флагманом ($599/699). Кроме того, мы ожидаем, что GTX 1070 продемонстрирует лучшую масштабируемость в SLI в силу того, что GTX 1080 (а разница между 70-й и 80-й моделями в линейке Pascal куда больше, нежели в предыдущих поколениях) в тандеме наверняка более зависим от быстродействия центрального процессора. Как мы знаем, в отношении однопоточной производительности (а игры в массе своей еще не научились использовать больше четырех потоков) CPU от Intel хоть и остаются непревзойденными в настольных ПК, но все же прогрессируют довольно медленно. Кстати, в прошлом году мы уже занимались вопросом процессорозависимости игр на платформах Intel и AMD.

Кроме того, в арсенале NVIDIA уже есть новый TITAN X на базе процессора архитектуры Pascal, сравнение с которым для SLI-систем неизбежно. В теории он обладает достаточно высокой вычислительной мощностью, чтобы составить конкуренцию по меньшей мере GeForce GTX 1070 в тандеме. Наконец, коль скоро NVIDIA внедрила новый интерфейс SLI с повышенной пропускной способностью, важно проверить, каково реальное преимущество двойных мостиков нового образца перед LED-мостиками и простыми старыми перемычками (жесткими или гибкими) которые существуют с момента появления SLI от NVIDIA и поставляются в комплекте с материнскими платами.

#Обновленный интерфейс SLI

В то время как AMD в конфигурациях из нескольких GPU перешла на синхронизацию по шине PCI Express, NVIDIA по-прежнему использует в SLI отдельный интерфейс. Однако от внимания публики ускользнул тот факт, что при достаточно высоких разрешениях экрана GPU NVIDIA также обмениваются частью данных и посредством PCI Express. Это говорит о том, что в такой форме, которая была реализована в предшествующих архитектурах NVIDIA, SLI уже исчерпала лимит своей пропускной способности. Насколько нам известно, он составляет 1 Гбайт/с, чего уже недостаточно для обмена кадрами в разрешении 3840 × 2160 с частотой 60 Гц.

Но вместо того, чтобы полностью перейти на PCI Express, в Pascal переработали существующий интерфейс. Традиционно видеокарта NVIDIA обладает двумя соединениями SLI, которые работают одновременно для связи GPU с его соседями в тройной или четверной конфигурации, но для передачи данных в двухпроцессорной связке используется только один канал. Использовать два канала в тандеме GPU – самый очевидный путь увеличения производительности.

Новый мостик, выпущенный одновременно с видеокартами Pascal, существует в нескольких версиях различной длины и помимо двойного интерфейса обладает улучшенными физическими характеристиками для работы на повышенной с 400 до 650 МГц частоте. Ранее выпущенные мостики также могут быть автоматически разогнаны при условии, что обеспечивают достаточно качественный сигнал. В частности, для этого годятся выпускаемые некоторыми производителями видеокарт жесткие мостики с подсветкой. Впрочем, последние не имеют двойного разъема для соединения GPU, поэтому новый фирменный мостик остается единственным решением, рекомендованным для разрешений класса 5К и мультимониторных конфигураций.

Кстати, если вы задаетесь вопросом, нельзя ли использовать пару старых мостиков одновременно вместо нового сдвоенного, то мы проверили — по крайней мере, с мостиками первого поколения это невозможно.

#GIGABYTE GeForce GTX 1070 Xtreme Gaming: технические характеристики, комплект поставки, цена

Для тестирования GeForce GTX 1070 в SLI мы использовали видеокарту GIGABYTE, которая представляет собой одну из наиболее совершенных модификаций GTX 1070 на рынке — в отношении как заводского разгона GPU, так и конструкции системы охлаждения, которая должна обеспечить стабильность и тишину при столь высоких тактовых частотах. Действительно, в режиме по умолчанию графический процессор GTX 1070 Xtreme Gaming работает на частотах 1670/1873 МГц (базовая и boost соответственно) — примерно таких результатов мы достигли, разогнав до предела референсный образец GTX 1070. Настройка OC Mode, которая активируется в утилите Xtreme Gaming Engine, увеличивает частоты до 1695/1898 МГц. Память в двух режимах работает на эффективной частоте 8168 и 8316 МГц.

Производитель NVIDIA GIGABYTE NVIDIA
Модель GeForce GTX TITAN X GeForce GTX 1070 GeForce GTX 1070 Xtreme Gaming (GV-N1070XTREME-8GD) GeForce GTX 1080 TITAN X
Графический процессор
Название GM200 GP104 GP104 GP104 GP102
Микроархитектура Maxwell Pascal Pascal Pascal Pascal
Техпроцесс, нм 28 нм 16 нм FinFET 16 нм FinFET 16 нм FinFET 16 нм FinFET
Число транзисторов, млн 8 000 7 200 7 200 7 200 12 000
Тактовая частота, МГц: Base Clock / Boost Clock 1 000 / 1 089 1 506 / 1 683 1 695 / 1 898 1 607 / 1 733 1 417 / 1531
Число шейдерных ALU 3 072 1 920 1 920 2 560 3 584
Число блоков наложения текстур 192 120 120 160 224
Число ROP 96 64 64 64 96
Оперативная память
Разрядность шины, бит 384 256 256 256 384
Тип микросхем GDDR5 SDRAM GDDR5 SDRAM GDDR5 SDRAM GDDR5X SDRAM GDDR5X SDRAM
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с) 1 753 (7 012) 2000 (8000) 2079 (8316) 1 250 (10 000) 1 250 (10 000)
Объем, Мбайт 12 288 8 192 8 192 8 192 12 288
Шина ввода/вывода PCI Express 3.0 x16 PCI Express 3.0 x16 PCI Express 3.0 x16 PCI Express 3.0 x16 PCI Express 3.0 x16
Производительность
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты) 6 691 6 463 7 288 8 873 10 974
Производительность FP32/FP64 1/32 1/32 1/32 1/32 1/32
Пропускная способность оперативной памяти, Гбайт/с 336 256 266 320 480
Вывод изображения
Интерфейсы вывода изображения DL DVI-I, DisplayPort 1.2, HDMI 1.4a DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b
TDP, Вт 250 150 НД 180 250
Рекомендованная розничная цена на момент выхода (США, без налога), $ 999 379/449 460 (newegg.com, 18.10.2016) 599/699 1 200
Рекомендованная розничная цена на момент выхода (Россия), руб. 74 900 — / 34 990 38 187 (market.yandex.ru, 18.10.2016) — / 54 990

Однако плата от GIGABYTE и стоит заметно дороже даже по сравнению с GeForce GTX 1070 Founders Edition — $460 на newegg.com и в среднем 38 187 руб. по данным «Яндекс.Маркета» на момент написания обзора.

Комплект поставки, традиционно скудный для современных геймерских видеокарт, включает бумажную документацию и два сувенира — металлическую наклейку и напульсник с логотипом производителя.

#GIGABYTE GeForce GTX 1070 Xtreme Gaming: конструкция

По сравнению с другими реализациями GTX 1070, не претендующими на столь высокие частоты, это весьма крупная видеокарта. Печатная плата превышает по высоте монтажную планку, а система охлаждения занимает два с половиной слота расширения.

С обратной стороны печатная плата защищена металлической пластиной, которая заодно обеспечивает дополнительное охлаждение преобразователя напряжения, компоненты которого находятся на обеих сторонах PCB.

Кулер GPU представляет собой массивную конструкцию из двух блоков ребер, пронизанных четырьмя тепловыми трубками. Сами трубки здесь необычные: вместо фитиля из тонкой проволоки для движения жидкости в них используются каналы, проложенные в стенке трубки. Разработчики не поясняют, как именно работает это решение, но можно предположить, что внутренняя полость трубки — это то место, где конденсируется испаренный хладагент.

Кристалл GPU отдает тепло трубкам посредством медной вставки, микросхемы DRAM контактируют с алюминиевым основанием кулера, и отдельная пластина предусмотрена для транзисторов VRM. Ребра радиатора искривлены специальным образом, дабы увеличить их площадь и оптимизировать поток воздуха, а также, согласно информации от производителя, снизить уровень шума.

Воздух нагнетают три крыльчатки диаметром 100 мм на двойных шарикоподшипниках со сложной формой лопастей. При небольшом нагреве вентиляторы останавливаются и GPU охлаждается пассивно. Цвет LED-индикатора в торце кожуха меняется в зависимости от скорости вращения.

#GIGABYTE GeForce GTX 1070 Xtreme Gaming: плата

Система питания видеокарты включает 13 фаз, среди которых 10 обслуживают GPU, две — микросхемы GDDR5X и еще одна — PLL. Напряжением на GPU управляет ШИМ-контроллер UPi uP9511P — такой же, как на плате Founders Edition.

Для питания платы используются два восьмиконтактных разъема, оснащенных индикаторами. Светодиоды сигнализируют не только об отсутствии тока, но и о нестабильном питании, что, скорее всего, означает выход напряжения за установленные границы.

Чипы памяти под маркировкой Samsung K4G80325FB-HC25 рассчитаны на эффективную частоту 8 ГГц.

Появление шлемов виртуальной реальности, все из которых подключаются к ПК по кабелю HDMI, заставило многих производителей расширить набор соответствующих портов вывода изображения, однако GIGABYTE решила задачу необычным способом. Вместо того чтобы заменить HDMI один из трех разъемов DisplayPort, разработчики поместили два дополнительных HDMI на торце платы, обращенном внутрь корпуса ПК. Впрочем, одновременно все семь портов работать не могут. При запуске компьютера видеокарта определяет, какие разъемы задействованы, и активирует либо два наружных DisplayPort, либо два внутренних HDMI.

Из оставшихся особенностей платы отметим покрытие, защищающее компоненты от пыли, влажности и коррозии.

Производительность: 3DMark. Производительность: игры (1920 × 1080, 2560 × 1440)

#Тестовый стенд, методика тестирования

Конфигурация тестовых стендов
CPU Intel Core i7-5960X @ 4 ГГц (100 × 40)
Материнская плата ASUS RAMPAGE V EXTREME
Оперативная память Corsair Vengeance LPX, 2133 МГц, 4 × 4 Гбайт
ПЗУ Intel SSD 520 240 Гбайт + Crucial M550 512 Гбайт
Блок питания Corsair AX1200i, 1200 Вт
Система охлаждения CPU Thermalright Archon
Корпус CoolerMaster Test Bench V1.0
Монитор NEC EA244UHD
Операционная система Windows 10 Pro x64
ПО для GPU AMD
Все Radeon Software Crimson Edition 16.8.2 Non-WHQL
ПО для GPU NVIDIA
Все GeForce Game Ready Driver 372.70 WHQL

CPU работает на постоянной частоте. В настройках драйвера NVIDIA в качестве процессора для вычисления PhysX выбран CPU. В настройках драйвера AMD настройка Tesselation переведена из состояния AMD Optimized в Use application settings.

Бенчмарки: синтетические
Тест API Разрешение Полноэкранное сглаживание
3DMark Fire Strike DirectX 11 (feature level 11_0) 1920 × 1080 Выкл.
3DMark Fire Strike Extreme 2560 × 1440
3DMark Fire Strike Ultra 3840 × 2160
3DMark Time Spy DirectX 12 (feature level 11_0) 2560 × 1440
Бенчмарки: игры
Игра (в порядке даты выхода) API Настройки Полноэкранное сглаживание
1920 × 1080 / 2560 × 1440 3840 × 2160
Crysis 3 + FRAPS DirectX 11 Макс. качество. Начало миссии Swamp MSAA 4x Выкл.
Battlefield 4 + FRAPS Макс. качество. Начало миссии Tashgar MSAA 4x + FXAA High
Metro: Last Light Redux, встроенный бенчмарк Макс. качество SSAA 4x
GTA V, встроенный бенчмарк Макс. качество MSAA 4x + FXAA
DiRT Rally Макс. качество MSAA 4x
Rise of the Tomb Raider, встроенный бенчмарк DirectX 12 Макс. качество, VXAO выкл. SSAA 4x
Tom Clancy's The Division, встроенный бенчмарк DirectX 11 Макс. качество, HFTS выкл. SMAA 1x Ultra
HITMAN, встроенный бенчмарк DirectX 12 Макс. качество SSAA 4x
Ashes of the Singularity, встроенный бенчмарк DirectX 12 Макс. качество MSAA 4x + Temporal AA 4x
DOOM Vulkan Макс. качество. Миссия Foundry TSSAA 8TX
Total War: WARHAMMER, встроенный бенчмарк DirectX 12 Макс. качество MSAA 4x
Бенчмарки: декодирование видео, вычисления
Программа Настройки
LuxMark 3.1 x64 Сцена Hotel Lobby (Complex Benchmark)
SiSoftware Sandra 2016 SP1, GPGPU Scientific Analysis Open CL, FP32/FP64

#Участники тестирования

В тестировании производительности приняли участие следующие видеокарты:

#Производительность: 3DMark

3DMark отлично оптимизирован для систем с несколькими GPU, поэтому результат сборки из двух GTX 1070 либо GTX 1080 практически двукратно превосходит баллы, набранные одиночными видеокартами этих моделей.

GTX 1080 в тандеме обладает на 20% более высокой производительностью, чем сборка из двух GTX 1070. По сравнению с одиночным NVIDIA TITAN X двухпроцессорные системы оказались на 28 и 54% быстрее.

3DMark (Graphics Score)
Разрешение 2 × NVIDIA GeForce GTX 1070 (1506/8008 МГц, 8 Гбайт) 2 × NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт) NVIDIA GeForce GTX TITAN X (1000/7012 МГц, 12 Гбайт) NVIDIA GeForce GTX 1070 (1506/8008 МГц, 8 Гбайт) NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт) NVIDIA TITAN X (1417/10000 МГц, 12 Гбайт) AMD Radeon R9 Fury X (1050/1000 МГц, 4 Гбайт) AMD Radeon R9 295X2 (1018/5000 МГц, 8 Гбайт)
Fire Strike 1920 × 1080 33 971 41 201 17 074 17 500 21 648 26 341 16 279 23 962
Fire Strike Extreme 2560 × 1440 16 467 19 831 7 945 8 245 10 207 13 025 7 745 10 527
Fire Strike Ultra 3840 × 2160 8 221 9 738 4 011 4 080 4 994 6 488 3 942 5 399
Time Spy 2560 × 1440 10 774 12 951 4 935 5 577 6 955 8 295 5 084 7 186
Макс. +21% −50% −48% −35% −21% −52% −29%
Среднее +20% −52% −49% −37% −22% −52% −33%
Мин. +18% −54% −50% −39% −23% −53% −36%

#Производительность: игры

В реальных играх ситуация сложнее, чем в синтетике. Хорошая новость в том, что из одиннадцати тестов лишь три не обладают поддержкой SLI и CrossFire (DOOM, HITMAN и Total War: WARHAMMER), да и то из-за того, что мы запускали эти игры в режимах Vulkan и DirectX 12. Другие игры под новый графический API от Microsoft не имеют таких проблем. Ashes of the Singularity самостоятельно распределяет нагрузку между несколькими GPU, а Rise of the Tomb Raider использует драйвер SLI, но в обеих играх производительность масштабируется превосходно.

На платформе NVIDIA прирост результатов в играх, совместимых с многопроцессорной графикой, колеблется от скромных 12% до 98%, но большинство все же обеспечивает масштабирование производительности как минимум в 1,5 раза.

Стоит отметить, что если в одиночных конфигурациях разница между GeForce GTX 1070 и GTX 1080 составляет 20–23% (здесь и далее — чем больше разрешение, тем больше разница), то в SLI можно говорить лишь о 12–17%. Если быстродействие GTX 1070 масштабируется на 67–78%, то GTX 1080 — на 56–68%.

По всей видимости, столь мощная графическая подсистема, как два процессора GP104, в ряде случаев уже исчерпывает возможности восьмиядерного CPU Haswell-E, работающего на частоте 4 ГГц, либо упирается в ограничения игрового кода.

Еще один аргумент не в пользу SLI связан с высочайшим быстродействием нового TITAN X. Если сравнивать одиночный флагман с GTX 1070 в режиме SLI, то TITAN в целом сопоставим с тандемом по уровню производительности. В среднем топовая видеокарта быстрее на 2–7%, в некоторых тестах она выигрывает 43% у двух GTX 1070 в SLI. Максимальная разница в пользу SLI — 9%.

GeForce GTX 1080, несмотря на более скромное масштабирование в режиме SLI, все же опережает TITAN X в среднем на 10–12%, а иногда и на 25%. Тем не менее в играх, плохо оптимизированных под множественные GPU, TITAN X достигает преимущества в 14% перед двумя GTX 1080.

Напоминаем, что все процентные соотношения, приведенные выше, относятся только к тем играм, где поддерживается и работает SLI/CrossFire.

#1920 × 1080, 2560 × 1440

1920 × 1080
Полноэкранное сглаживание

2 × NVIDIA GeForce GTX 1070 (1506 /8008 МГц, 8 Гбайт)

2 × NVIDIA GeForce GTX 1080 (1607 /10008 МГц, 8 Гбайт) NVIDIA GeForce GTX TITAN X (1000 /7012 МГц, 12 Гбайт) NVIDIA GeForce GTX 1070 (1506 /8008 МГц, 8 Гбайт) NVIDIA GeForce GTX 1080 (1607 /10008 МГц, 8 Гбайт) NVIDIA TITAN X (1617 /11110 МГц, 12 Гбайт) AMD Radeon R9 Fury X (1050 /1000 МГц, 4 Гбайт) AMD Radeon R9 295X2 (1018 /5000 МГц, 8 Гбайт)
Ashes of the Singularity MSAA 4x 65 69 31 34 42 61 26 34
Battlefield 4 MSAA 4x + FXAA High 199 200 118 124 149 198 94 134
Crysis 3 MSAA 4x 131 150 65 70 79 124 60 90
DiRT Rally MSAA 4x 114 137 83 86 101 126 65 97
DOOM TSSAA 8TX 153 185 151 153 185 200 156 122
GTA V MSAA 4x + FXAA 96 97 68 74 84 96 52 76
HITMAN SSAA 4x 29 49 39 41 52 77 33 24
Metro: Last Light Redux SSAA 4x 144 166 73 76 92 140 70 94
Rise of the Tomb Raider SSAA 4x 91 111 47 48 62 94 41 55
Tom Clancy's The Division SMAA 1x Ultra 101 116 59 66 80 117 58 57
Total War: WARHAMMER MSAA 4x 53 72 56 61 73 88 49 37
Макс. +22% −27% −23% −11% +16% −43% −15%
Среднее +12% −42% −39% −27% +2% −51% −33%
Мин. +1% −52% −48% −40% −6% −60% −48%

Прим.: процентные соотношения рассчитаны по результатам в играх, поддерживающих SLI/CrossFire.

2560 × 1440
Полноэкранное сглаживание 2 × NVIDIA GeForce GTX 1070 (1506 /8008 МГц, 8 Гбайт) 2 × NVIDIA GeForce GTX 1080 (1607 /10008 МГц, 8 Гбайт) NVIDIA GeForce GTX TITAN X (1000 /7012 МГц, 12 Гбайт) NVIDIA GeForce GTX 1070 (1506 /8008 МГц, 8 Гбайт) NVIDIA GeForce GTX 1080 (1607 /10008 МГц, 8 Гбайт) NVIDIA TITAN X (1617 /11110 МГц, 12 Гбайт) AMD Radeon R9 Fury X (1050 /1000 МГц, 4 Гбайт) AMD Radeon R9 295X2 (1018 /5000 МГц, 8 Гбайт)
Ashes of the Singularity MSAA 4x 52 56 24 27 33 48 21 27
Battlefield 4 MSAA 4x + FXAA High 152 177 75 82 98 146 65 95
Crysis 3 MSAA 4x 85 101 40 43 53 81 39 59
DiRT Rally MSAA 4x 78 96 60 61 74 93 48 71
DOOM TSSAA 8TX 102 127 95 102 126 183 107 82
GTA V SMAA 87 93 48 52 63 86 39 61
HITMAN MSAA 4x + FXAA 23 30 24 26 33 49 17 12
Metro: Last Light Redux SSAA 4x 86 99 43 44 52 82 43 54
Rise of the Tomb Raider Не поддерживается 57 67 28 29 38 59 27 23
Tom Clancy's The Division SSAA 4x 75 86 43 47 58 86 44 45
Total War: WARHAMMER SMAA 1x High 32 49 39 41 50 74 34 25
Макс. +22% −23% −22% −6% +19% −38% −9%
Среднее +15% −46% −43% −30% +2% −51% −37%
Мин. +7% −54% −49% −39% −8% −60% −60%

Прим.: процентные соотношения рассчитаны по результатам в играх, поддерживающих SLI/CrossFire.

Производительность: игры (3840 × 2160). Сравнение мостиков SLI. Вычисления. Энергопотребление, температура

#3840 × 2160

3840 × 2160
Полноэкранное сглаживание 2 × NVIDIA GeForce GTX 1070 (1506 /8008 МГц, 8 Гбайт) 2 × NVIDIA GeForce GTX 1080 (1607 /10008 МГц, 8 Гбайт) NVIDIA GeForce GTX TITAN X (1000 /7012 МГц, 12 Гбайт) NVIDIA GeForce GTX 1070 (1506 /8008 МГц, 8 Гбайт) NVIDIA GeForce GTX 1080 (1607 /10008 МГц, 8 Гбайт) NVIDIA TITAN X (1617 /11110 МГц, 12 Гбайт) AMD Radeon R9 Fury X (1050 /1000 МГц, 4 Гбайт) AMD Radeon R9 295X2 (1018/ 5000 МГц, 8 Гбайт)
Ashes of the Singularity Выкл. 57 63 29 33 41 60 37 38
Battlefield 4 116 137 57 60 74 112 52 72
Crysis 3 57 70 28 29 36 56 29 40
DiRT Rally 46 58 41 41 50 65 33 48
DOOM 55 69 51 55 68 104 57 45
GTA V 77 87 39 41 51 75 34 49
HITMAN 29 49 38 41 53 77 33 24
Metro: Last Light Redux 78 88 38 40 47 74 38 47
Rise of the Tomb Raider 66 80 33 35 44 69 31 37
Tom Clancy's The Division 46 53 25 27 33 52 28 26
Total War: WARHAMMER 21 38 30 31 38 58 32 20
Макс. +26% −10% −11% +10% +43% −28% +5%
Среднее +17% −45% −42% −28% +7% −46% −32%
Мин. +11% −51% −49% −40% −5% −56% −44%

Прим.: процентные соотношения рассчитаны по результатам в играх, поддерживающих SLI/CrossFire.

#Сравнение мостиков SLI

Для сравнения мостиков SLI старого и нового образца мы использовали пакет тестов 3DMark и несколько игр, демонстрирующих наибольшее масштабирование в системе с множественными GPU. Ни cинтетика, ни игры не обнаружили существенных различий между одинарным LED-мостиком, работающим на повышенной частоте в архитектуре Pascal, и новым двойным мостиком SLI. Лишь при очень высокой частоте смены кадров (как в Battlefield 4) двойной интерфейс имеет преимущество — около 4%.

Мостик старого образца (гибкий или жесткий — не имеет значения) все еще вполне подходит для игры в разрешении 1080p, где более скоростной интерфейс не приносит никакой пользы, и даже в некоторых играх в более высоких разрешениях (вплоть до 4К). Однако большинство игр в режимах 1440p и 2160p отдают предпочтение новому двойному или одинарному LED-мостику: средний прирост быстродействия составляет 11–15% (чем выше разрешение, тем больше), а максимальный достигает 21–27%.

3DMark (Graphics Score)
Разрешение 2 × NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт), гибкий мостик 2 × NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт), одинарный LED-мостик 2 × NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт), двойной мостик
Fire Strike 1920 × 1080 31 301 41 467 41 201
Fire Strike Extreme 2560 × 1440 17 729 19 832 19 831
Fire Strike Ultra 3840 × 2160 9 238 9 794 9 738
Time Spy 2560 × 1440 10 379 12 953 12 951
Макс. +32% +32%
Среднее +19% +18%
Мин. +6% +5%
1920 × 1080
Полноэкранное сглаживание 2 × NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт), гибкий мостик 2 × NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт), одинарный LED-мостик 2 × NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт), двойной мостик
Ashes of the Singularity MSAA 4x 69
Battlefield 4 MSAA 4x + FXAA High 200 200 200
Crysis 3 MSAA 4x 150 150 150
GTA V MSAA 4x + FXAA 97 97 97
Metro: Last Light Redux SSAA 4x 164 160 166
Rise of the Tomb Raider SSAA 4x 108 110 111
Tom Clancy's The Division SMAA 1x Ultra 112 116 116
Макс. +4% +4%
Среднее +0% +1%
Мин. −3% −0%

2560 × 1440
Полноэкранное сглаживание 2 × NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт), гибкий мостик 2 × NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт), одинарный LED-мостик 2 × NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт), двойной мостик
Battlefield 4 MSAA 4x + FXAA High 140 170 177
Crysis 3 MSAA 4x 100 101 101
GTA V SMAA 91 92 93
Metro: Last Light Redux SSAA 4x 86 96 99
Rise of the Tomb Raider Не поддерживается 62 70 67
Tom Clancy's The Division SSAA 4x 76 87 86
Макс. +21% +26%
Среднее +11% +11%
Мин. +1% +1%

3840 × 2160
Полноэкранное сглаживание 2 × NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт), гибкий мостик 2 × NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт), одинарный LED-мостик 2 × NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт), двойной мостик
Battlefield 4 Выкл. 116 132 137
Crysis 3 69 71 70
GTA V 80 86 87
Metro: Last Light Redux 76 86 88
Rise of the Tomb Raider 63 80 80
Tom Clancy's The Division 42 53 53
Макс. +27% +27%
Среднее +15% +16%
Мин. +3% +1%

#Производительность: вычисления

Среди вычислительных тестов в нашей методике только LuxMark и SiSoftware Sandra могут использовать множественные GPU. Однако в этом классе задач проблема масштабирования стоит не столь остро, как в играх, поэтому два GeForce GTX 1070 и GTX 1080 неизменно опережают одиночный ускоритель, пусть и такой мощный, как TITAN X на архитектуре Pascal. Впрочем, последний ненамного уступает GTX 1080 в SLI по результатам в Sandra и даже превосходит по результатам вычислений двойной точности.

Разница между тандемом GTX 1070 и GTX 1080 также более выражена в тесте Sandra, нежели в LuxMark.

Тактовые частоты, энергопотребление, температура, разгон. Выводы

#Энергопотребление

Картина энергопотребления SLI-систем вполне предсказуема. Тандем GeForce GTX 1070 либо GTX 1080 превосходит по мощности даже Radeon R9 295X2, хотя стоит учесть, что новые видеокарты создают повышенную нагрузку на CPU, а мы измеряем мощность компьютера целиком. Речь идет о тесте в FurMark, поскольку в Crysis 3 быстродействие множественных GPU масштабируется не столь хорошо, чтобы полностью нагрузить две видеокарты.

#GeForce GTX 1070 Xtreme Gaming: тактовые частоты, энергопотребление температура, разгон

Помимо того, что базовая частота GPU на плате GIGABYTE в режиме заводского оверклокинга на 189 МГц превышает таковую у GTX 1070 Founders Edition, в играх она варьирует в более широком диапазоне (381 против 366 МГц) и достигает 2076 МГц. При этом GIGABYTE довольствуется таким же напряжением питания GPU, как референсная карта, — не больше 1,062 В.

Производитель предоставил инструменты для дальнейшего разгона платы силами пользователя: напряжение питания GPU можно увеличить еще на 100 мВ, а лимит мощности — на 14%. Однако выяснилось, что графический процессор и без того работает на пределе возможностей со штатной системой охлаждения. При попытке поднять частоту даже на 20 МГц система теряет стабильность, и повышенное напряжение не в силах помочь: технология GPU Boost работает так, что вместе с разблокировкой дополнительных ступеней напряжения частотный диапазон GPU также увеличивается на несколько шагов (два-три десятка мегагерц в численном выражении), и этого уже хватает для потери стабильности.

Эффективную частоту оперативной памяти, напротив, можно поднять на 1152 МГц — до 9468 МГц, однако GTX 1070 благодаря эффективной компрессии цвета не испытывает недостатка в пропускной способности RAM на штатных частотах, поэтому от тестирования производительности GTX 1070 Xtreme Gaming в разгоне мы отказались.

Отметим, что заводской разгон платы GIGABYTE обошелся ценой небольшого увеличения мощности — всего лишь на 16 и 22 Вт в Crysis 3 и FurMark соответственно. При этом система охлаждения настолько эффективна, что температура GPU остается в пределах 61 °C — это на 22 °C ниже, чем у GTX 1070 Founders Edition.

#GeForce GTX 1070 Xtreme Gaming: производительность в разгоне

Заводской разгон GTX 1070 Xtreme Gaming принес неплохой прирост быстродействия в синтетических тестах: от 9 до 12% в зависимости от характера нагрузки. Однако на этот раз NVIDIA провела четкую границу между флагманским ускорителем и картой следующего эшелона: достигнуть уровня GTX 1080 последней не суждено. В играх это еще более заметно, т. к. разгон GTX 1070 увеличил среднюю частоту смены кадров лишь на 8–10%.

3DMark (Graphics Score)
Разрешение NVIDIA GeForce GTX 1070 (1506/8008 МГц, 8 Гбайт) GIGABYTE GeForce GTX 1070 Xtreme Gaming (1695/8316 МГц, 8 Гбайт) NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт)
Fire Strike 1920 × 1080 17 500 19 023 21 648
Fire Strike Extreme 2560 × 1440 8 245 9 161 10 207
Fire Strike Ultra 3840 × 2160 4 080 4 581 4 994
Time Spy 2560 × 1440 5 577 6 252 6 955
Макс. +12% +25%
Среднее +11% +24%
Мин. +9% +22%
1920 × 1080
Полноэкранное сглаживание NVIDIA GeForce GTX 1070 (1506/8008 МГц, 8 Гбайт) GIGABYTE GeForce GTX 1070 Xtreme Gaming (1695/8316 МГц, 8 Гбайт) NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт)
Ashes of the Singularity MSAA 4x 34 38 42
Battlefield 4 MSAA 4x + FXAA High 124 132 149
Crysis 3 MSAA 4x 70 74 79
DiRT Rally MSAA 4x 86 92 101
DOOM TSSAA 8TX 153 166 185
GTA V MSAA 4x + FXAA 74 77 84
HITMAN SSAA 4x 41 46 52
Metro: Last Light Redux SSAA 4x 76 83 92
Rise of the Tomb Raider SSAA 4x 48 52 62
Tom Clancy's The Division SMAA 1x Ultra 66 73 80
Total War: WARHAMMER MSAA 4x 61 64 73
Макс. +12% +29%
Среднее +8% +21%
Мин. +4% +13%
2560 × 1440
Полноэкранное сглаживание NVIDIA GeForce GTX 1070 (1506/8008 МГц, 8 Гбайт) GIGABYTE GeForce GTX 1070 Xtreme Gaming (1695/8316 МГц, 8 Гбайт) NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт)
Ashes of the Singularity MSAA 4x 27 30 33
Battlefield 4 MSAA 4x + FXAA High 82 87 98
Crysis 3 MSAA 4x 43 46 53
DiRT Rally MSAA 4x 61 67 74
DOOM TSSAA 8TX 102 111 126
GTA V SMAA 52 55 63
HITMAN MSAA 4x + FXAA 26 29 33
Metro: Last Light Redux SSAA 4x 44 48 52
Rise of the Tomb Raider Не поддерживается 29 31 38
Tom Clancy's The Division SSAA 4x 47 52 58
Total War: WARHAMMER SMAA 1x High 41 43 50
Макс. +12% +31%
Среднее +9% +23%
Мин. +6% +20%
3840 × 2160
Полноэкранное сглаживание NVIDIA GeForce GTX 1070 (1506/8008 МГц, 8 Гбайт) GIGABYTE GeForce GTX 1070 Xtreme Gaming (1695/8316 МГц, 8 Гбайт) NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт)
Ashes of the Singularity Выкл. 33 38 41
Battlefield 4 60 66 74
Crysis 3 29 31 36
DiRT Rally 41 45 50
DOOM 55 60 68
GTA V 41 44 51
HITMAN 41 47 53
Metro: Last Light Redux 40 43 47
Rise of the Tomb Raider 35 37 44
Tom Clancy's The Division 27 30 33
Total War: WARHAMMER 31 33 38
Макс. +15% +29%
Среднее +10% +24%
Мин. +6% +18%

#Выводы

Судя по полученным результатам, компьютеры с двумя GPU по-прежнему обеспечивают неплохое масштабирование производительности по сравнению с одиночными видеокартами Многое зависит от оптимизации игрового движка под режим рендеринга с чередующимися кадрами, но в среднем покупатели тандема из двух GeForce GTX 1070 могут рассчитывать на прирост производительности в 67–78% относительно результатов одного ускорителя, а двух GTX 1080 — на 56–68% в зависимости от разрешения (от 1080p к 2160p).

Тем не менее все еще существуют такие игры, где быстродействие практически удваивается при одновременной работе двух GPU, а также игры, где технологии SLI и CrossFire либо не поддерживаются, либо только снижают, а не увеличивают частоту смены кадров. Пока слишком рано рассуждать о том, как распространение DirectX12 скажется на эффективности систем со множественными GPU, но среди игр под новый API, использованных в тестировании, есть обнадеживающие примеры (Ashes of the Singularity, Rise of the Tomb Raider), в которых быстродействие масштабируется превосходно. С другой стороны, HITMAN и Total War: WARHAMMER в режиме DirectX 12 и SLI работают хуже, нежели на единственном GPU.

Так же как и в прошлые годы, вторая по старшинству модель в линейке игровых видеокарт NVIDIA является более практичным выбором для системы с множественными GPU. GTX 1070 в SLI имеет вполне достаточное быстродействие для игры в разрешении 4К, а в не столь тяжелых режимах 1080p и 1440p разница в результатах тестов по сравнению с GTX 1080 меньше, нежели между одиночными видеокартами. Наконец, отметим впечатляющие возможности NVIDIA TITAN X на базе процессора Pascal, который по вычислительной мощности сопоставим с тандемом GTX 1070 и в то же время застрахован от непредсказуемости, связанной с оптимизацией игр под SLI. К тому же, TITAN X в штатном режиме работает на весьма консервативных частотах и отлично разгоняется. Более высокая стоимость пары GeForce GTX 1080 Founders Edition ($699) также говорит в пользу покупки одиночной видеокарты на базе топового GPU NVIDIA ($1200).

Что касается вычислительных задач (GP-GPU), то развернутое тестирование такого рода не входит в повестку данного обзора. Теоретически, производительность неграфических вычислений растет практически линейно, если приложение способно задействовать несколько GPU, и определяется суммарным количеством шейдерных ALU. В таком случае два GeForce GTX 1080 безусловно превосходят единственный TITAN X, а вот тандем GTX 1070 имеет только ценовое преимущество, но отличается не в лучшую сторону по энергопотреблению.

Мостики нового образца, реализующие двойной канал связи между сотрудничающими видеокартами, то это нововведение стоит рассматривать как инвестицию в будущее со стороны NVIDIA, нежели насущную необходимость. На данный момент даже в разрешении 4К при частоте смены кадров свыше 120 Гц одинарный LED-мостик обеспечивает тандему графических процессоров практически такой же уровень быстродействия. А вот старые мостики, которые прилагаются к материнским платам, уже существенно ограничивают масштабирование производительности даже в разрешении 1440p, не говоря уже о более высоких. Они подходят лишь для игры в 1080p, а это явно не целевой сценарий использования для системы с двумя игровыми ускорителями высшего класса.

Напоследок отдадим должное видеокарте GIGABYTE GeForce GTX 1070 Xtreme Gaming, которую мы использовали в тестах SLI. Среди различных реализаций GeForce GTX 1070, выпущенных партнерами NVIDIA, этот ускоритель выделяется чрезвычайно эффективной системой охлаждения и гарантированным разгоном, который практически исчерпывает потенциал процессора GP104 «на воздухе». При этом видеокарта обладает весьма умеренным энергопотреблением по сравнению с референсным образцом GTX 1070. Развитая система питания GTX 1070 Xtreme Gaming также располагает к разгону более решительными методами — с установкой СЖО либо криогенного охладителя.



Оригинал материала: https://3dnews.ru/941190