В контексте существующего тренда на развитие GPU в сторону универсальных вычислительных устройств, который активно поддерживает сама NVIDIA, архитектура процессора GM200 стала вынужденным компромиссом. Так как производство крупных дискретных GPU еще не вырвалось из тисков техпроцесса 28 нм, ограничивающего всесторонний рост производительности за счет простого увеличения транзисторных бюджетов, для архитектуры Maxwell пришлось расставить четкие приоритеты: графика – в первую очередь, вычисления двойной точности (FP64) – по остаточному принципу (более подробно об этой архитектуре вы можете прочитать в обзорах GeForce GTX 750 Ti и GeForce GTX 980).
В качестве ускорителя для игр и вычислительных задач, не включающих операции FP64, TITAN X сделал большой шаг вперед относительно как GTX 980, так и группы плат, построенных на старшем чипе архитектуры Kepler – GK110: GTX 780/780 Ti, TITAN/TITAN Black. Но GeForce GTX 980 Ti неизбежно должен быть ограничен в конфигурации вычислительных блоков по сравнению с TITAN X, ведь производительность FP64, и так чрезвычайно низкая у GM200, не может служить фактором, отличающим плату серии TITAN от лидера игровой линейки GeForce. Основная интрига связана с тем, где в промежутке между GTX 980 и TITAN X производитель решит поместить новинку.
Как выяснилось, в GPU нового флагмана были отключены лишь 2 из 24 потоковых мультипроцессоров (SMM). Соответственно, GTX 980 Ti обладает 2816 активными ядрами CUDA и 176 текстурными блоками вместо 3072 и 192 в GPU TITAN X. Число ROP (96) не изменилось, равно как широта шины памяти (384 бит). Тактовые частоты GPU и памяти также остались в неприкосновенности, однако объем RAM был уполовинен до 6 Гбайт. Вот, собственно, и вся разница между GTX 980 Ti и TITAN X.
Модель | Графический процессор | Видеопамять | TDP, Вт | Рекомендованная розничная цена для рынка США (без налогов), $ | ||||||||
Кодовое название | Число транзис-торов, млн | Тактовая частота, МГц: Base Clock / Boost Clock | Число ядер CUDA | Число текстур-ных блоков | Число ROP | Разряд-ность шины, бит | Тип микро-схем | Тактовая частота: реальная (эффектив-ная), МГц | Объем, Мбайт | |||
GeForce GTX TITAN X | GM200 | 8 000 | 1000/1076 | 3072 | 192 | 96 | 384 | GDDR5 SDRAM | 1753 (7012) | 12 280 | 250 | 999 |
GeForce GTX 980 Ti | GM200 | 8 000 | 1000/1076 | 2816 | 176 | 96 | 384 | GDDR5 SDRAM | 1753 (7012) | 6 144 | 250 | 649 |
GeForce GTX 980 | GM204 | 5 200 | 1126/1216 | 2048 | 128 | 64 | 256 | GDDR5 SDRAM | 1750 (7000) | 4 096 | 165 | 499 |
GeForce GTX 780 Ti | GK110 | 7 100 | 875/928 | 2880 | 240 | 48 | 384 | GDDR5 SDRAM | 1750 (7000) | 3 072 | 250 | 699 (до снятия с продажи) |
За эту скромную жертву полагается существенная скидка: GeForce GTX 980 Ti имеет рекомендованную цену $649 (США, без налогов) – куда дешевле, чем TITAN X ($999). Рублевый эквивалент составляет 39 990 р. Новый флагман основной геймерской линейки NVIDIA GTX 980 Ti получился дешевле, чем 780 Ti, до снятия с производства продававшийся за $699, и в то же время дороже, чем GTX 980 ($549 на момент релиза). Кстати, последний в связи с выходом 980 Ti получил уценку до $499.
Топовый однопроцессорный адаптер AMD – Radeon R9 290X – по прежнему остается наиболее выгодным предложением в верхнем сегменте игровых видеоадаптеров ($369), хотя равным соперником для него может быть в лучшем случае GTX 980, но никак не GTX 980 Ti. Более интересно столкнуть новоприбывшего с Radeon R9 295X2 (цена – от $789). И хотя последний – это уже устройство классом выше как по цене, так и по производительности, интересно проверить, что новый продукт NVIDIA сможет противопоставить такому монстру.
⇡#Поддержка новых аппаратных функций в DirectX 12 и GameWorks VR
Осталось немного времени до выхода в свет Windows 10, поэтому DirectX 12 уже обрел окончательный вид. В частности, представлены два «уровня» аппаратных функций (feature level). Напомним, что новая версия DirectX – это, с одной стороны, другой API, поддержка которого может быть внедрена в драйверы GPU, выпущенных до его появления. Соответственно, относительно старое «железо» также сможет воспользоваться преимуществами DX12 – в первую очередь более эффективным расходованием ресурсов CPU. С другой стороны, DirectX 12 представляет новые функции рендеринга, которые опционально могут быть реализованы в графических процессорах, но не требуются для работы новой runtime-библиотеки API. GPU, принадлежащие ко второй итерации архитектуры Maxwell, включая GM200, обладают полной поддержкой данных функций (feature level 12_0 и 12_1), среди которых можно выделить Volume Tiled Resources и Conservative Raster.
Первая дает возможность по требованию загружать в память видеоадаптера необходимые части большой трехмерной текстуры (необходимой для рендеринга жидкости или дыма), не расходуя ресурс RAM на текстуру целиком. Вторая обеспечивает точную локализацию пересекающихся границ полигонов, что в ряде ситуаций помогает избежать артефактов с прозрачными текстурами или, к примеру, наложением теней методом Ray Tracing, как показано на следующем слайде.
Одновременно с GTX 980 Ti NVIDIA представила набор библиотек GameWorks VR, предназначенных для адаптации игр к шлемам виртуальной реальности. Одна из ключевых функций GameWorks VR, которая опирается на аппаратные алгоритмы в GPU архитектуры Maxwell, – Multi-Res Shading – должна увеличить производительность при рендеринге сцены для стереоскопического шлема.
В окулярах шлема установлены линзы, позволяющие глазам сфокусироваться на близко расположенных LCD-экранах, потому картинка, отрисованная GPU, должна быть модифицирована, чтобы компенсировать искажение геометрии: края изображения сжимаются, как в фотоснимке, сделанном на объектив-«рыбий глаз». В результате часть работы, которую выполнил GPU, потратив ресурсы на рендеринг пикселов по краям изображения, обесценивается компрессией.
NVIDIA предлагает разделить кадр на несколько зон (viewports), рендеринг в которых выполняется одновременно, но с различным разрешением: больше в центре, меньше – по краям. Специальные алгоритмы задействуются, чтобы сопоставить края пикселей разного размера на границе зон, а затем формируется финальный кадр с искаженной геометрией. По утверждению разработчиков, Multi-Res Shading увеличивает производительность пиксельных шейдеров в 1,3-2 раза по сравнению с такой ситуацией, когда изображение изначально строится в высоком разрешении.
С виду GeForce GTX 980 Ti отличает от TITAN X только маркировка, цвет кожуха системы охлаждения (светлый в данном случае и черный у TITAN X), да еще количество микросхем памяти: поскольку объем RAM вдвое меньше, все чипы разместились на лицевой стороне платы, под общим радиатором.
Видеокарта оснащается закрытым кулером, уже неоднократно использованным NVIDIA в других топовых решениях, начиная с самого первого TITAN.
Не будем в очередной раз описывать устройство этой системы охлаждения. Достаточно отметить, что в радиатор GPU вмонтирована испарительная камера, которая также применялась в адаптерах на базе GK110, но отсутствовала в GTX 980.
Видеокарта обладает тремя разъемами DisplayPort и по одной штуке – HDMI и Dual-Link DVI-I.
Печатные платы GTX 980 Ti и TITAN X различаются лишь количеством распаянных чипов RAM. Память набрана 12 микросхемами SK hynix H5GQ4H24MFR-R2C со штатной частотой 7 ГГц.
Преобразователь напряжения построен по схеме 6+2 (число фаз для питания GPU и микросхем памяти соответственно) и содержит контроллер ON Semiconductor NCP81174. Дополнительное питание подается через один восьмиконтактный и один шестиконтактный разъемы.
⇡#Тестовый стенд, методика тестирования
Конфигурация тестовых стендов | |
---|---|
CPU | Intel Core i7-5960X @ 4 ГГц (100x40) |
Материнская плата | ASUS RAMPAGE V EXTREME |
Оперативная память | Corsair Vengeance LPX, 2133 МГц, 4x4 Гбайт |
ПЗУ | Intel SSD 520 240 Гбайт |
Блок питания | Corsair AX1200i, 1200 Вт |
Охлаждение CPU | Thermalright Archon |
Корпус | CoolerMaster Test Bench V1.0 |
Операционная система | Windows 8.1 Pro X64 |
ПО для GPU AMD | AMD Catalyst Omega 15.4 Beta |
ПО для GPU NVIDIA | 350.90 |
Энергосберегающие технологии CPU во всех тестах отключены. В настройках драйвера NVIDIA в качестве процессора для вычисления PhysX выбирается CPU. В настройках AMD настройка Tesselation переводится из состояния AMD Optimized в Use application settings.
Бенчмарки: синтетические | |||
---|---|---|---|
Программа | Настройки | Анизотропная фильтрация, полноэкранное сглаживание | Разрешение |
3DMark 2011 | Тест Extreme | – | – |
3DMark | Тест Fire Strike (не Extreme) | – | – |
Unigine Heaven 4 | DirectX 11, макс. качество, тесселяция в режиме Extreme | AF 16x, MSAA 4x | 1920 × 1080 / 2560 × 1440 |
Бенчмарки: игры | |||
---|---|---|---|
Программа | Настройки | Полноэкранное сглаживание | Разрешение |
Tomb Raider, встроенный бенчмарк | Макс. качество | SSAA 4x | 1920 × 1080 / 2560 × 1440 |
Crysis 3 + FRAPS | Макс. качество. Начало миссии Post Human | MSAA 4x | 1920 × 1080 / 2560 × 1440 |
Metro: Last Light, встроенный бенчмарк | Макс. качество | SSAA 4x | 1920 × 1080 / 2560 × 1440 |
Company of Heroes 2, встроенный бенчмарк | Макс. качество | SSAA 4x | 1920 × 1080 / 2560 × 1440 |
Battlefield 4 + FRAPS | Макс. качество. Начало миссии Tashgar | MSAA 4x + FXAA | 1920 × 1080 / 2560 × 1440 |
Alien: Isolation | Макс. качество | SMAA T2X | 1920 × 1080 / 2560 × 1440 |
Far Cry 4 + FRAPS | Макс. качество. Banapur (первая деревня) | MSAA 4x | 1920 × 1080 / 2560 × 1440 |
GTA V, встроенный бенчмарк | Макс. качество | MSAA 4x | 1920 × 1080 / 2560 × 1440 |
Witcher 3 + FRAPS | Макс. качество. Локация Kaer Morhen | FXAA | 1920 × 1080 / 2560 × 1440 |
Бенчмарки: вычисления | |
---|---|
Программа | Настройки |
DXVA Checker | Decode benchmark. H.264, H.265. Файлы 1920х1080p (битрейт видео ~3000 Кбит/с), 3840x2160p (битрейт видео ~7500 Кбит/с). Microsoft H264 Video Decoder (H.264), LAV Video Decoder (H.265), ускорение на аппаратном кодеке GPU (DXVA2) |
LuxMark 2.0 X64 | Сцена Room (Complex Benchmark) |
Sony Vegas Pro 13 | Бенчмарк Sony для Vegas Pro 11, продолжительность – 65 с, рендеринг в XDCAM EX, 1920х1080@24p |
CompuBench CL Desktop Edition X64, Ocean Surface Simulation | – |
CompuBench CL Desktop Edition X64, Particle Simulation – 64K | – |
SiSoftware Sandra 2015, Scientific Analysis | Open CL, FP32/FP64 |
В тестировании производительности приняли участие следующие видеокарты:
⇡#Тактовые частоты, энергопотребление, температура, разгон
Хотя по спецификациям GPU в составе GeForce GTX 980 Ti работает на тех же частотах, что и в TITAN X, выяснилось, что частота ядра в новой видеокарте может достигать более высоких значений – вплоть до 1202 МГц (в отличие от 1177 МГц у TITAN X). При этом на GPU подается чуть более высокое напряжение, чем позволяет TITAN X (1,193 против 1,174 В).
В разгоне GTX 980 Ti также не подкачал. Увеличив максимальное напряжение на GPU до 1,237 В, нам удалось поднять базовую частоту до 1270 МГц, а в динамике процессор достигал планки 1497 МГц.
Base Clock, МГц | Макс. Boost Clock, МГц | Base Clock, МГц (разгон) | Макс. зарегистрированная Boost Clock, МГц (разгон) | |
---|---|---|---|---|
GeForce GTX TITAN X | 1000 | 1177 (+177) | 1252 | 1455 (+203) |
GeForce GTX 980 Ti | 1000 | 1202 (+202) | 1270 | 1497 (+227) |
GeForce GTX 980 | 1127 | 1253 (+126) | 1387 | 1526 (+139) |
GeForce GTX TITAN Black | 889 | 1032 (+143) | 1100 | 1262 (+162) |
GeForce GTX TITAN | 836 | 1006 (+145) | 966 | 1150 (+184) |
GeForce GTX 780 Ti | 876 | 1020 (+144) | 986 | 1130 (+144) |
GeForce GTX 780 | 863 | 1006 (+143) | 1053 | 1215 (+162) |
GeForce GTX 770 | 1046 | 1176 (+130) | 1190 | 1333 (+143) |
Среднее энергопотребление GTX 980 Ti в Crysis 3 чуть ниже, чем у TITAN X, что объясняется частично заблокированными вычислительными блоками. Если сравнивать с лучшим однопроцессорным решением AMD, то на штатных частотах новинка потребляет на 26 Вт меньше энергии, чем Radeon R9 290X.
FurMark демонстрирует меньший разброс показателей между разными видеоадаптерами. В частности, здесь GTX 980 Ti и R9 290X отстоят лишь на 13 Вт по средней мощности.
Поскольку GPU Boost позволяет графическому процессору работать при максимальной заданной температуре, не повышая без нужды обороты охлаждающего вентилятора, в замерах температуры под нагрузкой нет большого смысла. Ядро GTX 980 Ti прогревается до 84 °C, как и в TITAN X, а также продуктах на базе GK110. Система охлаждения референсного образца имеет большой запас мощности, который позволяет сбить температуру GPU до 63-66 °C даже после разгона, запустив вентилятор на максимальные обороты.
⇡#Производительность: синтетические тесты
3DMark 2011
3DMark
Unigine Heaven 4
Tomb Raider
Crysis 3
Metro: Last Light
Company of Heroes 2
Battlefield 4
Alien: Isolation
Far Cry 4
GTA V
Witcher 3
Оверклокинг, как уже не раз бывало, отлично конвертируется в баллы 3DMark, но далеко не всегда заметен в реальных играх. В Metro: Last Light и Witcher 3 эффект налицо, а вот в других тестах пользы от разгона совсем немного.
3DMark 2011
3DMark
Игровые тесты + Unigine Heaven 4
⇡#Производительность: вычисления
Luxmark: Room (Complex Benchmark)
Sony Vegas Pro 13
CompuBench CL: Ocean Surface Simulation
CompuBench CL: Particle Simulation
SiSoftware Sandra 2015: Scientific Analysis
NVIDIA удается двигать вперед производительность дискретных GPU, несмотря на ограничения техпроцесса 28 нм, который используется в этой категории микросхем с 2011-2012 года. GeForce GTX 980 Ti, оставшись в рамках TDP, которые заданы прошлыми флагманскими продуктами на базе GK110, предлагает совершенно новый уровень производительности в 3D-рендеринге и вычислениях FP32. Кроме того, GTX 980 Ti поступил в продажу по меньшей цене ($649), чем GTX 780 Ti в свое время ($699). В глазах перфекциониста впечатление от новинки немного портит тот факт, что в GTX 980 Ti отключена часть вычислительных блоков GPU, но на поверку это практически не влияет на игровую производительность и даже не всегда сказывается в расчетных задачах. В то же время небольшой компромисс в спецификациях GPU позволил NVIDIA нарастить объем поставок, пустив в дело частично дефектные чипы.
На текущий момент, пока AMD еще не разродилась адаптерами нового поколения, GTX 980 Ti просто не имеет конкурентов среди игровых однопроцессорных видеокарт. Выбирая аналог от AMD, вам придется либо удовлетвориться существенно менее производительным, но куда более дешевым Radeon R9 290X ($369), либо собрать систему из двух таких видеокарт (альтернатива – несколько более дорогой Radeon R9 295X2). В последнем случае, к сожалению, не гарантирована одинаковая производительность в любых играх в связи с подчас неэффективным использованием CrossFire либо отсутствием поддержки последнего, не говоря уже о повышенном энергопотреблении двухголовой системы.
Однако для того, чтобы нарастить производительность без перехода на более прогрессивный техпроцесс, NVIDIA пришлось кое-что принести в жертву. В отличие от GK110 (старшего GPU семейства Kepler), чип GM200, установленный в GTX 980 Ti и TITAN X, не претендует на универсальность и обладает весьма посредственными возможностями в расчетах двойной точности (FP64). Для этой задачи NVIDIA предлагает специализированные продукты – либо TITAN Z, либо ускорители Tesla на базе GK110/GK210. Видеоадаптеры AMD на GPU Hawaii (Radeon R9 290X, R9 295X2) также отлично подходят для этой цели.
Поскольку производительность в FP64 не позволяет провести черту между игровой (GTX 980 Ti) и полупрофессиональной (TITAN X) картами на базе GM200, разница проявляется лишь в избранных вычислительных задачах одинарной точности (FP32), когда количество активных ядер CUDA прямо связано с результатом. В отличие от ситуации с оригинальным TITAN и GTX 780, на этот раз существование отдельной разновидности ускорителя с полностью разблокированной конфигурацией GPU имеет под собой меньше оснований. Впрочем, TITAN X сослужил службу желающим получить самое лучшее, не дожидаясь по-настоящему массовых продуктов, и по-прежнему остается непревзойденным однопроцессорным ускорителем для FP32.