Появление крупного GPU на базе архитектуры Maxwell было неизбежно, вопрос только в том, когда это произойдет и в какой форме. В итоге оправдалось предположение, что GM200 повторит путь своего аналога из семейства Kepler — GK110, дебютировав в составе ускорителя под маркой TITAN.
Времени на тестирование новой видеокарты в этот раз было крайне мало, поэтому обзор будет сжатым. Отбросив необязательные рассуждения, перейдем сразу к делу. Архитектура Maxwell, по сравнению с Kepler, характеризуется упрощенным и оптимизированным строением потоковых мультипроцессоров (SMM), что позволило радикально уменьшить площадь SMM, сохранив 90% прежней производительности. Кроме того, GM200 принадлежит ко второй итерации архитектуры Maxwell, как и выпущенные ранее чипы GM204 (GeForce GTX 970/980) и GM206 (GeForce GTX 960). А следовательно, обладает более производительным геометрическим движком PolyMorph Engine версии 3.0 и поддерживает на уровне «железа» некоторые вычислительные функции, которые, вероятно, войдут в новый feature level Direct3D 12, а также необходимы для аппаратного ускорения технологии глобального освещения VXGI, разработанной NVIDIA. За более подробным описанием архитектуры Maxwell первого и второго поколения отсылаем читателей к обзорам GeForce GTX 750 Ti и GeForce GTX 980.
Качественно графический процессор GM200 и более младшие GPU в линейке не отличаются друг от друга, за исключением того, что только GM206 имеет выделенный блок декодирования видео, сжатого по стандарту H.265 (HEVC). Различия сугубо количественные. GM200 включает беспрецедентное число транзисторов — 8 млрд, поэтому вычислительных блоков в нем в полтора-два раза больше, чем в GM204 (в зависимости от того, какие именно считать). Кроме того, вернулась в строй 384-битная шина памяти. По сравнению с чипом GK110 новый флагманский GPU не столь устрашающе могуч, но, к примеру, число ROP здесь вдвое больше, что делает GM200 отлично подготовленным к 4К-разрешению.
В плане поддержки вычислений двойной точности GM200 ничем не отличается от GM204. Каждый SMX содержит только четыре ядра CUDA, совместимых с FP64, поэтому совокупная производительность при такой нагрузке составляет 1/32 от FP32.
⇡#Технические характеристики, цена
В TITAN X используется наиболее мощная версия ядра GM200 с полным набором активных вычислительных блоков. Базовая частота GPU составляет 1000 МГц, Boost Clock — 1076 МГц. Память работает на стандартной для продуктов на базе Maxwell частоте 7012 МГц. А вот объем невиданный для игровых видеокарт — 12 Гбайт (а TITAN X — это в первую очередь игровая видеокарта, по крайней мере до появления GM200 в основной, «номерной» линейке GeForce).
Рекомендованные розничные цены на TITAN X были объявлены в последние часы перед публикацией обзора. Для рынка США установлена цена в 999 долларов — столько же, сколько в свое время стоил первый TITAN на базе GK110.
Прим.: цены в таблице для GeForce GTX 780 Ti и TITAN Black приведены на момент снятия с производства последних.
Модель |
Графический процессор |
Видеопамять |
TDP, Вт |
РРЦ* для рынка США (без налогов), $ |
||||||||
Кодовое название |
Число транзисторов, млн |
Тактовая частота, МГц: Base Clock / Boost Clock |
Число ядер CUDA |
Число текстурных блоков |
Число ROP |
Разрядность шины, бит |
Тип микросхем |
Тактовая частота: реальная (эффективная), МГц |
Объем, Мбайт |
|||
GeForce GTX 780 Ti |
GK110 |
7 100 |
875/928 |
2880 |
240 |
48 |
384 |
GDDR5 SDRAM |
1750 (7000) |
3072 |
250 |
699 |
GeForce GTX TITAN Black |
GK110 |
7 100 |
889/980 |
2880 |
240 |
48 |
384 |
GDDR5 SDRAM |
1750 (7000) |
6144 |
250 |
999 |
GeForce GTX 980 |
GM204 |
5 200 |
1126/1216 |
2048 |
128 |
64 |
256 |
GDDR5 SDRAM |
1750 (7000) |
4096 |
165 |
549 |
GeForce GTX TITAN X |
GM110 |
8 000 |
1000/1076 |
3072 |
256 |
96 |
384 |
GDDR5 SDRAM |
1753 (7012) |
12 280 |
250 |
999 |
* Рекомендованная розничная цена.
Начиная с самого первого «Титана» NVIDIA использует в топовых видеокартах, с некоторыми вариациями, одну и ту же систему охлаждения. TITAN X выделяется в ряду своих предшественников только абсолютно черным корпусом (лишь две вставки на боках остались неокрашенными).
Задняя пластина, которой в порядке эксперимента оснастили GeForce GTX 980, в TITAN X вновь отсутствует, несмотря на то, что на оборотной стороне платы распаяна часть микросхем памяти. Хотя чипам GDDR5 дополнительное охлаждение, в общем-то, и не требуется.
Зато вернулся радиатор с испарительной камерой, который в GTX 980 был заменен более простым вариантом.
Видеокарта обладает тремя разъемами DisplayPort и по одной штуке — HDMI и Dual-Link DVI-I.
Дизайн печатной платы, что совершенно неудивительно, вызывает ассоциации с серией видеоадаптеров на чипе GK110. Преобразователь напряжения построен по схеме 6+2 (число фаз для питания GPU и микросхем памяти соответственно). Питание подается через один восьмиконтактный и один шестиконтактный разъем. А вот контроллер питания графического процессора ON Semiconductor NCP81174 мы здесь видим впервые.
24 микросхемы памяти SK hynix H5GQ4H24MFR-R2C со штатной частотой 7 ГГц расположены на обеих сторонах платы.
Тестовый стенд, методика тестирования
Конфигурация тестовых стендов | |
---|---|
CPU | Intel Core i7-5960X @ 4 ГГц (100 × 40) |
Материнская плата | ASUS RAMPAGE V EXTREME |
Оперативная память | Corsair Vengeance LPX, 2133 МГц, 4 × 4 Гбайт |
ПЗУ | Intel SSD 520 240 Гбайт |
Блок питания | Corsair AX1200i, 1200 Вт |
Охлаждение CPU | Thermalright Archon |
Корпус | CoolerMaster Test Bench V1.0 |
Операционная система | Windows 8.1 Pro X64 |
ПО для GPU AMD | AMD Catalyst Omega 14.12 |
ПО для GPU NVIDIA | 347.52 |
Энергосберегающие технологии CPU во всех тестах отключены. В настройках драйвера NVIDIA в качестве процессора для вычисления PhysX выбирается CPU. В драйверах AMD параметр Tesselation переводится из состояния AMD Optimized в Use application settings.
Бенчмарки: синтетические | |||
---|---|---|---|
Программа | Настройки | Анизотропная фильтрация, полноэкранное сглаживание | Разрешение |
3DMark 2011 | Тест Extreme | – | – |
3DMark | Тест Fire Strike (не Extreme) | – | – |
Unigine Heaven 4 | DirectX 11, макс. качество, тесселяция в режиме Extreme | AF 16x, MSAA 4x | 1920 × 1080 / 2560 × 1440 |
Бенчмарки: игры | |||
---|---|---|---|
Программа | Настройки | Анизотропная фильтрация, полноэкранное сглаживание | Разрешение |
Far Cry 3 + FRAPS | DirectX 11, макс. качество, HDAO. Начало миссии Secure the Outpost | AF, MSAA 4x | 2560 × 1440/3840 × 2160 |
Tomb Raider. Встроенный бенчмарк | Макс. качество | AF 16x, SSAA 4x | 2560 × 1440/3840 × 2160 |
Bioshock Infinite. Встроенный бенчмарк | Макс. качество. Postprocessing: Normal | AF 16x, FXAA | 2560 × 1440/3840 × 2160 |
Crysis 3 + FRAPS | Макс. качество. Начало миссии Post Human | AF 16x, MSAA 4x | 2560 × 1440/3840 × 2160 |
Metro: Last Light. Встроенный бенчмарк | Макс. качество | AF 16x, SSAA 4x | 2560 × 1440/3840 × 2160 |
Company of Heroes 2. Встроенный бенчмарк | Макс. качество | AF, SSAA 4x | 2560 × 1440/3840 × 2160 |
Battlefield 4 + FRAPS | Макс. качество. Начало миссии Tashgar | AF 16x, MSAA 4x + FXAA | 2560 × 1440/3840 × 2160 |
Thief. Встроенный бенчмарк | Макс. качество | AF 16x, SSAA 4x + FXAA | 2560 × 1440/3840 × 2160 |
Alien: Isolation | Макс. качество | AF 16x, SMAA T2X | 2560 × 1440/3840 × 2160 |
Бенчмарки: вычисления | |
---|---|
Программа | Настройки |
DXVA Checker | Decode benchmark. H.264, H.265. Файлы 1920 × 1080p (битрейт видео ~3000 Кбит/с), 3840 × 2160p (битрейт видео ~7500 Кбит/с). Microsoft H264 Video Decoder (H.264), LAV Video Decoder (H.265), ускорение на аппаратном кодеке GPU (DXVA2) |
LuxMark 2.0 X64 | Сцена Room (Complex Benchmark) |
Sony Vegas Pro 13 | Бенчмарк Sony для Vegas Pro 11, продолжительность — 65 с, рендеринг в XDCAM EX, 1920х1080@24i |
CompuBench CL Desktop Edition X64, Ocean Surface Simulation | — |
CompuBench CL Desktop Edition X64, Particle Simulation — 64K | — |
SiSoftware Sandra 2015, Scientific Analysis | Open CL, FP32/FP64 |
Участники тестирования
В тестировании производительности приняли участие следующие видеокарты:
⇡#Тактовые частоты, энергопотребление, температура, разгон
GM110 работает на базовой частоте, до которой никогда не поднимался GK110 в референсных спецификациях. Кроме того, GPU Boost действует весьма агрессивно, поднимая частоту вплоть до 1177 МГц. При этом процессор довольствуется напряжением 1,174 В — более низким относительно топовых продуктов на базе GK110.
Настройки BIOS позволяют увеличить лимит мощности до 110% и добавить 83 мВ к максимальному напряжению на GPU. На деле напряжение поднимается только до 1,23 В, но одновременно открываются несколько дополнительных ступенек частоты/VID: разница между базовой частотой и максимальной частотой, зарегистрированной в динамике, возрастает до 203 МГц.
Разгон видеокарты позволил достигнуть базовой частоты в 1252 МГц, а в динамике наблюдались частоты вплоть до 1455 МГц. Видеопамять смогла прибавить 1,2 ГГц, успешно работая на эффективной частоте 8 212 МГц.
Base Clock, МГц | Макс. Boost Clock, МГц | Base Clock, МГц (разгон) | Макс. зарегистрированная Boost Clock, МГц (разгон) | |
GeForce GTX TITAN X | 1000 | 1177 (+177) | 1252 | 1455 (+203) |
GeForce GTX 980 | 1127 | 1253 (+126) | 1387 | 1526 (+139) |
GeForce GTX TITAN Black | 889 | 1032 (+143) | 1100 | 1262 (+162) |
GeForce GTX TITAN | 836 | 1006 (+145) | 966 | 1150 (+184) |
GeForce GTX 780 Ti | 876 | 1020 (+144) | 986 | 1130 (+144) |
GeForce GTX 780 | 863 | 1006 (+143) | 1053 | 1215 (+162) |
GeForce GTX 770 | 1046 | 1176 (+130) | 1190 | 1333 (+143) |
По энергопотреблению TITAN X близок к GTX 780 Ti и намного превосходит GTX 980. Вопреки ожиданиям, в Crysis 3 нет существенной разницы между TITAN X и Radeon R9 290X, а вот в FurMark R9 290X (как и R9 280X) разогревается сильнее и заметно превосходит TITAN X.
Разгон TITAN X увеличивает мощность на 5-25 Вт в зависимости от того, на результаты какого теста опираться — FurMark или Crysis 3.
Максимальная температура, которая допустима для GPU, определяется настройками BIOS, поэтому TITAN X не выходит за рамки установленных 83° C. При этом турбина системы охлаждения раскручивается на 49% от максимальной скорости — до 2339 об/мин. На первый взгляд это довольно много, но на самом деле шум от кулера вполне приемлемый.
⇡#Производительность: синтетические тесты
3DMark 2011
3DMark
Unigine Heaven 4
В этот раз мы отступим от стандартной формы описания игровых тестов. Расписывать для каждой игры, какая видеокарта быстрее, в случае с TITAN X совершенно бессмысленно. Во всех играх новый «Титан» с колоссальным отрывом опережает соперников. Количественные показатели стремятся к формуле: TITAN X на 30-50% быстрее, чем GeForce GTX 780 Ti и Radeon R9 290X, и зачастую вдвое быстрее по сравнению с Radeon R9 280X и GeForce GTX 770. Единственная интрига — выискивать колебания внутри этого коридора в ту или иную сторону. Кроме того, есть уникальный случай: TITAN X наслаждается частотой смены кадров 24 FPS в Far Cry 4 при разрешении Ultra HD и сглаживании MSAA 4x, в то время как соперники не могут выбраться из ямы в 5-7 FPS (а GeForce GTX 770 — и того меньше). Тут, по всей видимости, «Титану» пригодился объем памяти в 12 Гбайт, и даже 4 Гбайт, которыми оснащен Radeon R9 290X, для таких настроек в FC4 недостаточно.
Tomb Raider
Bioshock Infinite
Crysis 3
Metro: Last Light
Company of Heroes 2
Battlefield 4
Thief
Alien: Isolation
Far Cry 4
Производительность: разгон
Как бы замечательно ни разгонялся TITAN X, эффект в конечном счете зависит от конкретного приложения. И в целом наибольшая отдача от разгона наблюдается в тестах при разрешении 3840 × 2160.
⇡#Производительность: вычисления
Декодирование видео (DXVA Checker, Decode Benchmark)
Luxmark: Room (Complex Benchmark)
Sony Vegas Pro 13
CompuBench CL: Ocean Surface Simulation
CompuBench CL: Particle Simulation
SiSoftware Sandra 2015: Scientific Analysis
Если учесть, что производство дискретных GPU все еще остается в рамках техпроцесса 28 нм, результаты GeForce GTX TITAN X выглядят просто фантастически. При таком же TDP, как у видеоадаптеров на базе GK110, TITAN X достигает 130-150% быстродействия таких ускорителей, как GTX 780 Ti и Radeon R9 290X. Если взять первые 28-нанометровые GPU — GK104 (GTX 680, GTX 770) и Radeon R9 280X, то TITAN X зачастую превосходит их в два раза.
TITAN X, как и его предшественники на этой позиции, чрезвычайно дорог для видеокарты на одиночном GPU. Позиционирование не изменилось по сравнению с предыдущими «Титанами». Во-первых, это альтернатива SLI-конфигурациям из двух дискретных GeForce GTX 980: пусть потенциальная производительность тандема выше, одиночный GPU обладает более предсказуемым быстродействием. Во-вторых, компактные ПК, в которых нет места для двух видеокарт. И наконец, неграфические вычисления (GP-GPU). Хотя производительность FP64 в GM200 ограничена 1/32 от производительности FP32, TITAN X отчасти компенсирует это ограничение грубой силой GPU. Кроме того, вычисления FP32 преобладают в «просьюмерской» нагрузке (тот же Ray Tracing, ускорение рендеринга видео), а в этой дисциплине GM200 по меньшей мере не уступает лучшим продуктам AMD, а часто и превосходит так же, как в игровых тестах.