Первым образцом архитектуры Pascal от NVIDIA, выпущенным на рынок, стал графический адаптер GeForce GTX 1080 на базе процессора GP104. Благодаря новому техпроцессу 16 нм FinFET, равно как и оптимизациям архитектуры и схемотехники чипа, GTX 1080 позволил достигнуть уровня быстродействия в играх, примерно на 30% превышающего достижения флагманской видеокарты NVIDIA предыдущего поколения — GeForce GTX TITAN X. В то же время разработчики GTX 1080 сумели сократить энергетический бюджет ускорителя на 70 Вт относительно TDP его предшественника — с 250 до 180 Вт. Между тем тепловой пакет 250 Вт является стандартной целью для топовых игровых видеокарт NVIDIA нескольких последних поколений, поэтому появление после GTX 1080 еще более производительного продукта, который займет эту нишу в линейке Pascal, оставалось лишь вопросом времени.
Начиная с архитектуры Kepler, NVIDIA использует следующую стратегию выпуска GPU различных категорий быстродействия. Сперва дебютирует чип второго эшелона: GK104 в семействе Kepler, GM204 — в Maxwell второй версии, и теперь — GP104 в Pascal. Впоследствии NVIDIA заполняет один-два эшелона ниже, и после существенного промежутка появляется графический процессор высшей категории, ложащийся в основу наиболее производительного ускорителя, который NVIDIA может произвести, сохраняя энергопотребление в рамках 250 Вт при текущем технологическом процессе.
Пиком развития архитектуры Pascal на данный момент является процессор GP100, отличительными свойствами которого стало беспрецедентное число шейдерных ALU (3840 ядер CUDA) и 16 Гбайт памяти типа HBM2, объединенные с GPU на кремниевой подложке. GP100 используется в составе ускорителя Tesla P100, применение которого ограничено сферой суперкомпьютеров в силу специального форм-фактора с шиной NVLINK и TDP в объеме 300 Вт. В конце года также ожидается выход Tesla P100 в стандартном формате платы расширения PCI Express.
Именно чип GP100, в мечтах энтузиастов индустрии, должен был в перспективе увенчать линейку игровых адаптеров GeForce 10, а предварительно NVIDIA могла бы выпустить новый TITAN — как раз с промежуточной остановкой на этой позиции предыдущие большие GPU прибыли в геймерские ПК (GK110 в составе TITAN и GM200 — в TITAN X).
Однако на этот раз, по всей видимости, оказались правы эксперты, предрекавшие окончательное разделение линейки GPU NVIDIA на две непересекающиеся группы — чипы игрового и просьюмерского (от слов producer и consumer) направления, с одной стороны, и чипы для вычислений — с другой. Дифференцирующим фактором в данном случае является скорость GPU в операциях над числами с плавающей точкой двойной точности (FP64). В линейке Kepler разработчики уже пожертвовали этой характеристикой для всех чипов (1/24 от FP32), помимо старшего — GK110/GK210 (1/3 от FP32), с целью снизить энергопотребление GPU. В следующем поколении эта тенденция усугубилась: все процессоры Maxwell работают с FP64 на скорости 1/32 от FP32.
Ситуация с Pascal показала, что экономия на производительности FP64 не осталась временной мерой, обусловленной задержкой на техпроцессе 28 нм. NVIDIA по-прежнему нуждается в GPU для серверов, суперкомпьютеров и рабочих станций, способном оперировать FP64 на высоком уровне быстродействия. Однако для игровых видеоадаптеров эта функциональность, раздувающая транзисторный бюджет и энергопотребление GPU, является лишь обузой.
Таким образом, вместо того, чтобы перенести GP100 (очевидно дорогой в производстве чип как из-за площади, так и из-за интегрированной памяти HBM2) в игровые видеокарты, NVIDIA выпустила дополнительный продукт — GP102, сфокусированный на операциях с FP32 — основном формате чисел, применяемом и рендеринге 3D-графики, и в ряде вычислительных задач. Единственная функциональная особенность GP102 — поддержка целочисленных операций формата int8. Это важный пункт для NVIDIA, поскольку int8 широко применяется в задачах машинного обучения, которые компания сделала для себя одним из приоритетных направлений (конкретнее, один из классов таких задач — глубинное обучение). В скором будущем мы планируем выпустить отдельную статью, посвященную этой теме.
Новый TITAN X, ставший первым устройством на базе процессора GP102, позиционируется в первую очередь именно как ускоритель профессионального класса, который предназначен для исследований и коммерческих приложений, связанных с глубинным обучением. Это подтверждает и отсутствие бренда GeForce в названии карты. Однако широкие игровые возможности новинки также не подлежат сомнению. Все «Титаны», выпущенные ранее, помимо их вычислительных функций, рассматривались как игровые видеокарты премиум-класса, способные обеспечить качество графики и быстродействие, недоступные современным им моделям в основной линейке GeForce.
⇡#NVIDIA GP102
Данный GPU задуман как альтернатива суперкомпьютерному GP100, не уступающая последнему в функциях рендеринга 3D-графики и расчетах FP32. Вместе с тем создатели GP102 сократили все компоненты, не соответствующие назначению продукта.
К примеру, отдельно взятый SM (Streaming Multiprocessor — блок, объединяющей ядра CUDA вместе с блоками наложения текстур, планировщиками, диспетчерами и сегментами локальной памяти) в GP100 содержит 64 ядра CUDA для операций FP32, в то время как SM в GP102 обладает в этом отношении конфигурацией, унаследованной от Maxwell: 128 ядер CUDA. Более дробное распределение ядер CUDA в GP100 позволяет процессору одновременно исполнять больше потоков инструкций (и также групп потоков — warps — и блоков warp’ов), а общий объем таких типов хранилища внутри SM, как разделяемая память (shared memory) и регистровый файл, в пересчете на весь GPU увеличился по сравнению с архитектурой Maxwell.
Далее, в GP100 на каждые 64 ядра CUDA для операций FP32 приходится по 32 ядра для FP64, в то время как SM в GP102 обладает в этом отношении конфигурацией, унаследованной от Maxwell: 128 ядер CUDA для FP32 и 4 для FP64. Отсюда урезанная производительность GP102 в работе с операциями двойной точности.
Наконец, GP100 несет более крупный кеш второго уровня: 4096 Кбайт против 3072 Кбайт в GP102. И разумеется, в GP102 отсутствует контроллер шины NVLINK, а место контроллеров памяти HBM2 (с общей разрядностью шины в 4096 бит) занимают контроллеры GDDR5X SDRAM. 12 таких 32-битных контроллеров обеспечивают общую 384-битную шину доступа к памяти.
В остальных интересующих нас аспектах чипы GP100 и GP102 идентичны. Оба кристалла содержат 3840 FP32-совместимых ядер CUDA и 240 блоков наложения текстур, а также 96 ROP. Таким образом, с общей точки зрения структура вычислительных блоков GP102 повторяет таковую у чипа GP104, с поправкой на количественные изменения. Хотя нам все еще неизвестны некоторые параметры (объемы кеша L1, shared memory и регистрового файла), они, вероятно, одинаковы в этих двух GPU.
Кристалл GP102, произведенный по техпроцессу 16 нм FinFET на мощностях TSMC, содержит 12 млрд транзисторов на площади 471 мм2. Для сравнения: характеристики GP100 — 15,3 млрд транзисторов и 610 мм2. Это весьма существенная разница. Кроме того, если TSMC не увеличила размер фотомаски для техпроцесса 16 нм по сравнению с 28 нм, то GP100 его практически исчерпывает, в то время как облегченная архитектура GP102 позволит NVIDIA в будущем создать более крупное ядро для широкого потребительского рынка, пользуясь той же производственной линией (что, однако, вряд ли случится, если разработчики не пересмотрят свои стандарты в отношении TDP топовых моделей).
По поводу отличий архитектуры Pascal от Maxwell рекомендуем обратиться к нашему обзору GeForce GTX 1080. В этой итерации разработчики развили достоинства предыдущего поколения и компенсировали присущие ему недостатки.
Кратко отметим следующие пункты:
- улучшенная компрессия цвета с соотношениями вплоть до 8:1;
- функция Simultaneous Multi-Projection геометрического движка PolyMorph Engine, позволяющая за один проход создавать вплоть до 16 проекций геометрии сцены (для VR и систем с несколькими дисплеями в конфигурации NVIDIA Surround);
- возможность прерывания (preemption) в процессе исполнения draw call (при рендеринге) и потока команд (при вычислениях), которая вместе с динамическим распределением вычислительных ресурсов GPU обеспечивает полноценную поддержку асинхронных вычислений (Async Compute) — дополнительного источника быстродействия в играх под API DirectX 12 и сниженной латентности в VR;
- контроллер дисплея, совместимый с интерфейсами DisplayPort 1.3/1.4 и HDMI 2.b. Поддержка высокого динамического диапазона (HDR);
- шина SLI с повышенной пропускной способностью.
⇡#Технические характеристики, цена
В TITAN X не используется полностью функциональная версия графического процессора GP102: из 30 SM здесь отключены два. Таким образом, по числу ядер CUDA и текстурных блоков «Титан» совпадает с Tesla P100, где чип GP100 также частично «порезан» (3584 ядра CUDA и 224 текстурных блока).
Графический процессор новинки работает на более высоких частотах (1417/1531 МГц), чем в Tesla P100 (вплоть до 1328/1480 МГц в суперкомпьютерной версии и вплоть до 1300 МГц в форм-факторе платы PCI-Express). И все же частоты «Титана» довольно консервативны по сравнению с характеристиками GeForce GTX 1080 (1607/1733 МГц). Как мы увидим в экспериментах с разгоном, ограничивающим фактором стало энергопотребление устройства, которое NVIDIA установила на привычном уровне 250 Вт.
TITAN X оснащен 12 Гбайт памяти GDDR5X SDRAM с пропускной способность 10 Гбит/с на контакт. 384-битная шина обеспечивает передачу данных на скорости 480 Гбайт/с: по этому показателю TITAN X лишь ненамного уступает действующему рекордсмену — Radeon R9 Fury X, как и прочим продуктам AMD на базе GPU Fiji (512 Гбайт/с).
Производитель |
NVIDIA |
Модель |
GeForce GTX TITAN |
GeForce GTX TITAN Black |
GeForce GTX TITAN Z |
GeForce GTX TITAN X |
GeForce GTX 1080 |
TITAN X |
Графический процессор |
Название |
GK110 |
GK110 |
2 × GK110 |
GM200 |
GP104 |
GP102 |
Микроархитектура |
Kepler |
Kepler |
Kepler |
Maxwell |
Pascal |
Pascal |
Техпроцесс, нм |
28 нм |
28 нм |
28 нм |
28 нм |
16 нм FinFET |
16 нм FinFET |
Число транзисторов, млн |
7 080 |
7 080 |
2 × 7080 |
8 000 |
7 200 |
12 000 |
Тактовая частота, МГц: Base Clock / Boost Clock |
837/876 |
889/980 |
705/876 |
1 000 / 1 089 |
1 607 / 1 733 |
1 417 / 1531 |
Число шейдерных ALU |
2 688 |
2 880 |
2 × 2880 |
3 072 |
2 560 |
3 584 |
Число блоков наложения текстур |
224 |
240 |
2 × 240 |
192 |
160 |
224 |
Число ROP |
48 |
48 |
2 × 48 |
96 |
64 |
96 |
Оперативная память |
Разрядность шины, бит |
384 |
384 |
2 × 384 |
384 |
256 |
384 |
Тип микросхем |
GDDR5 SDRAM |
GDDR5 SDRAM |
GDDR5 SDRAM |
GDDR5 SDRAM |
GDDR5X SDRAM |
GDDR5X SDRAM |
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с) |
1 502 (6 008) |
1 750 (7 000) |
1 750 (7 000) |
1 753 (7 012) |
1 250 (10 000) |
1 250 (10 000) |
Объем, Мбайт |
6 144 |
6 144 |
2 × 6144 |
12 288 |
8 192 |
12 288 |
Шина ввода/вывода |
PCI Express 3.0 x16 |
PCI Express 3.0 x16 |
PCI Express 3.0 x16 |
PCI Express 3.0 x16 |
PCI Express 3.0 x16 |
PCI Express 3.0 x16 |
Производительность |
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты) |
4 709 |
5 645 |
10 092 |
6 691 |
8 873 |
10 974 |
Производительность FP32/FP64 |
1/3 |
1/3 |
1/3 |
1/32 |
1/32 |
1/32 |
Пропускная способность оперативной памяти, Гбайт/с |
288 |
336 |
2 × 336 |
336 |
320 |
480 |
Вывод изображения |
Интерфейсы вывода изображения |
DL DVI-I, DisplayPort 1.2, HDMI 1.4a |
DL DVI-I, DisplayPort 1.2, HDMI 1.4a |
DL DVI-D, DL DVI-I, DisplayPort 1.2, HDMI 1.4a |
DL DVI-I, DisplayPort 1.2, HDMI 1.4a |
DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b |
DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b |
TDP, Вт |
250 |
250 |
375 |
250 |
180 |
250 |
Рекомендованная розничная цена на момент выхода (США, без налога), $ |
999 |
999 |
2 999 |
999 |
599/699 |
1 200 |
Рекомендованная розничная цена на момент выхода (Россия), руб. |
34 990 |
35 990 |
114 990 |
74 900 |
— / 54 990 |
— |
Что касается теоретических показателей быстродействия, то TITAN X стал первой однопроцессорной графической картой, превысившей отметку в 10 TFLOPS по производительности FP32. Из предыдущих продуктов NVIDIA на это был способен только TITAN Z, построенный на паре чипов GK110. С другой стороны, в отличие от Tesla P100 (и аналогично GeForce GTX 1060/1070/1080), TITAN X характеризуется весьма скромным быстродействием в расчетах двойной (1/32 от FP32) и половинной точности (1/64 от FP32), однако способен выполнять операции с числами int8 на скорости в 4 раза выше, чем с FP32. Другие GPU семейства Pascal — GP104 (GeForce GTX 1070/1080, Tesla P4) и GP106 (GTX 1060) и GP100 (Tesla P100) также поддерживают int8 с соотношением быстродействия 4:1 относительно FP32, однако нам на данный момент неизвестно, ограничена ли эта функциональность в игровых видеокартах GeForce.
TITAN X — весьма и весьма дорогое приобретение, на которое решатся только те, кто действительно желает обладать столь совершенной видеокартой. NVIDIA увеличила цену на $200 по сравнению с предыдущими однопроцессорными моделями под этой маркой — до $1 200. На этот раз устройство не распространяется через партнерские компании и продается исключительно на веб-сайте NVIDIA в ряде избранных стран. Россия пока не входит в их число.
⇡#Конструкция
Корпус видеокарты выполнен в единой стилистике с продуктами под маркой Founders Edition линейки GeForce 10. Система охлаждения с радиальным вентилятором (турбинка) покрыта металлическим кожухом, а заднюю поверхность печатной платы защищает толстая пластина. Часть последней можно снять, дабы обеспечить беспрепятственный доступ воздуха к кулеру соседней видеокарты в режиме SLI. Забавно, что хотя TITAN X формально больше не принадлежит к семейству GeForce, именно эта надпись, подсвеченная зелеными светодиодами, по-прежнему красуется на боку видеокарты.
TITAN X обладает такими же габаритами, как и GeForce GTX 1070/1080 референсных версий, но отличается черным цветом кожуха. Радиатор системы охлаждения, напротив, не окрашен.
Конструкция кулера такая же, как у GTX 1070/1080: GPU отдает тепло радиатору с испарительной камерой, а микросхемы оперативной памяти и транзисторы преобразователя напряжения накрыты массивной алюминиевой рамой, несущей отдельный блок ребер небольшого размера.
Между прочим, как выяснил один из обладателей TITAN X, NVIDIA позволяет пользователям сменить систему охлаждения видеокарты на нечто более эффективное (например, СЖО) без потери гарантии.
⇡#Плата
Подобно референсным версиям GTX 1060/1070/1080, плата TITAN X имеет три разъема DisplayPort и по одному разъему DVI и HDMI.
Система питания построена по схеме 6+1 (количество фаз для GPU и чипов памяти). Используются два разъема дополнительного питания — шести- и восьмиконтактный, что вместе с силовыми линиями в разъеме PCI-Express обеспечивает видеокарте резерв мощности в 300 Вт.
Память типа GDDR5X SDRAM, как и на GeForce GTX 1080, набрана микросхемами Micron D9TXS со штатной эффективной частотой 10 ГГц.
⇡#Тестовый стенд, методика тестирования
Конфигурация тестовых стендов |
CPU |
Intel Core i7-5960X @ 4 ГГц (100 × 40) |
Материнская плата |
ASUS RAMPAGE V EXTREME |
Оперативная память |
Corsair Vengeance LPX, 2133 МГц, 4 × 4 Гбайт |
ПЗУ |
Intel SSD 520 240 Гбайт + Crucial M550 512 Гбайт |
Блок питания |
Corsair AX1200i, 1200 Вт |
Система охлаждения CPU |
Thermalright Archon |
Корпус |
CoolerMaster Test Bench V1.0 |
Монитор |
NEC EA244UHD |
Операционная система |
Windows 10 Pro x64 |
ПО для GPU AMD |
Все |
Radeon Software Crimson Edition 16.8.2 Non-WHQL |
ПО для GPU NVIDIA |
Все |
GeForce Game Ready Driver 372.54 WHQL |
CPU работает на постоянной частоте. В настройках драйвера NVIDIA в качестве процессора для вычисления PhysX выбран CPU. В настройках драйвера AMD настройка Tesselation переведена из состояния AMD Optimized в Use application settings.
Бенчмарки: синтетические |
Тест |
API |
Разрешение |
Полноэкранное сглаживание |
3DMark Fire Strike |
DirectX 11 (feature level 11_0) |
1920 × 1080 |
Выкл. |
3DMark Fire Strike Extreme |
2560 × 1440 |
3DMark Fire Strike Ultra |
3840 × 2160 |
3DMark Time Spy |
DirectX 12 (feature level 11_0) |
2560 × 1440 |
Бенчмарки: игры |
Игра (в порядке даты выхода) |
API |
Настройки |
Полноэкранное сглаживание |
1920 × 1080 / 2560 × 1440 |
3840 × 2160 |
Crysis 3 + FRAPS |
DirectX 11 |
Макс. качество. Начало миссии Swamp |
MSAA 4x |
Выкл. |
Battlefield 4 + FRAPS |
Макс. качество. Начало миссии Tashgar |
MSAA 4x + FXAA High |
Metro: Last Light Redux, встроенный бенчмарк |
Макс. качество |
SSAA 4x |
GTA V, встроенный бенчмарк |
Макс. качество |
MSAA 4x + FXAA |
DiRT Rally |
Макс. качество |
MSAA 4x |
Rise of the Tomb Raider, встроенный бенчмарк |
DirectX 12 |
Макс. качество, VXAO выкл. |
SSAA 4x |
Tom Clancy's The Division, встроенный бенчмарк |
DirectX 11 |
Макс. качество, HFTS выкл. |
SMAA 1x Ultra |
HITMAN, встроенный бенчмарк |
DirectX 12 |
Макс. качество |
SSAA 4x |
Ashes of the Singularity, встроенный бенчмарк |
DirectX 12 |
Макс. качество |
MSAA 4x + Temporal AA 4x |
DOOM |
Vulkan |
Макс. качество. Миссия Foundry |
TSSAA 8TX |
Total War: WARHAMMER, встроенный бенчмарк |
DirectX 12 |
Макс. качество |
MSAA 4x |
Бенчмарки: декодирование видео, вычисления |
Программа |
Настройки |
DXVA Checker, Decode Benchmark, H.264 |
Файлы 1920 × 1080p (High Profile, L4.1), 3840 × 2160p (High Profile, L5.1). Microsoft H264 Video Decoder |
DXVA Checker, Decode Benchmark, H.265 |
Файлы 1920 × 1080p (Main Profile, L4.0), 3840 × 2160p (Main Profile, L5.0). Microsoft H265 Video Decoder |
LuxMark 3.1 x64 |
Сцена Hotel Lobby (Complex Benchmark) |
Sony Vegas Pro 13 |
Бенчмарк Sony для Vegas Pro 11, продолжительность — 65 с, рендеринг в XDCAM EX, 1920 × 1080p 24 Гц |
SiSoftware Sandra 2016 SP1, GPGPU Scientific Analysis |
Open CL, FP32/FP64 |
CompuBench CL Desktop Edition X64, Ocean Surface Simulation |
— |
CompuBench CL Desktop Edition X64, Particle Simulation— 64K |
— |
⇡#Участники тестирования
В тестировании производительности приняли участие следующие видеокарты:
⇡#Производительность: 3DMark
Синтетические тесты в среднем демонстрируют преимущество TITAN X перед GeForce GTX 1080 в 25 %. По сравнению с предыдущим поколением марки TITAN, а также Radeon R9 Fury X новый флагман предлагает на 61—63 % более высокий результат и более чем вдвое выросшую производительность, по сравнению с первой версией TITAN на базе архитектуры Kepler. Довольно высокую позицию в сравнении с ускорителем NVIDIA удерживает Radeon R9 295X2 — новинка лишь на 18 % быстрее в 3DMark.
3DMark (Graphics Score) |
|
Разрешение |
NVIDIA TITAN X (1417/10000 МГц, 12 Гбайт) |
NVIDIA GeForce GTX TITAN (837/6008 МГц, 6 Гбайт) |
NVIDIA GeForce GTX TITAN X (1000/7012 МГц, 12 Гбайт) |
NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт) |
AMD Radeon R9 295X2 (1018/5000 МГц, 8 Гбайт) |
AMD Radeon R9 Fury X (1050/1000 МГц, 4 Гбайт) |
Fire Strike |
1920 × 1080 |
26 341 |
10 449 |
17 074 |
21 648 |
23 962 |
16 279 |
Fire Strike Extreme |
2560 × 1440 |
13 025 |
4 766 |
7 945 |
10 207 |
10 527 |
7 745 |
Fire Strike Ultra |
3840 × 2160 |
6 488 |
2 299 |
4 011 |
4 994 |
5 399 |
3 942 |
Time Spy |
2560 × 1440 |
8 295 |
2 614 |
4 935 |
6 955 |
7 186 |
5 084 |
Макс. |
|
|
−60% |
−35% |
−16% |
−9% |
−38% |
Среднее |
|
|
−64% |
−38% |
−20% |
−15% |
−39% |
Мин. |
|
|
−68% |
−41% |
−23% |
−19% |
−41% |
⇡#Производительность: игры (1920 × 1080, 2560 × 1440)
В тестах при сравнительно низком разрешении для столь мощного GPU новый TITAN X на 15–20 % (от режима 1080p к 1440p соответственно) превосходит GeForce GTX 1080 по средним результатам. Еще более эффектно новый флагман выглядит в сравнении с лучшими ускорителями периода 28 нм: он на 47–56 % быстрее GeForce GTX TITAN X на базе GM200 и на 67–72 % опережает Radeon R9 Fury X.
Если взять самый первый TITAN поколения Kepler, то речь идет о более чем двукратном приросте быстродействия.
1920 × 1080 |
|
Полноэкранное сглаживание |
NVIDIA TITAN X (1417/10000 МГц, 12 Гбайт) |
NVIDIA GeForce GTX TITAN (837/6008 МГц, 6 Гбайт) |
NVIDIA GeForce GTX TITAN X (1000/7012 МГц, 12 Гбайт) |
NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт) |
AMD Radeon R9 295X2 (1018/5000 МГц, 8 Гбайт) |
AMD Radeon R9 Fury X (1050/1000 МГц, 4 Гбайт) |
Ashes of the Singularity |
MSAA 4x |
47 |
20 |
31 |
42 |
34 |
26 |
Battlefield 4 |
MSAA 4x + FXAA High |
162 |
71 |
118 |
149 |
134 |
94 |
Crysis 3 |
MSAA 4x |
99 |
45 |
65 |
79 |
90 |
60 |
DiRT Rally |
MSAA 4x |
126 |
57 |
83 |
101 |
97 |
65 |
DOOM |
TSSAA 8TX |
200 |
69 |
151 |
185 |
122 |
156 |
GTA V |
MSAA 4x + FXAA |
85 |
44 |
68 |
84 |
76 |
52 |
HITMAN |
SSAA 4x |
68 |
21 |
39 |
52 |
24 |
33 |
Metro: Last Light Redux |
SSAA 4x |
124 |
47 |
73 |
92 |
94 |
70 |
Rise of the Tomb Raider |
SSAA 4x |
70 |
28 |
47 |
62 |
55 |
41 |
Tom Clancy's The Division |
SMAA 1x Ultra |
87 |
35 |
59 |
80 |
57 |
58 |
Total War: WARHAMMER |
MSAA 4x |
76 |
38 |
56 |
73 |
37 |
49 |
Макс. |
|
|
−48% |
−20% |
−0% |
−9% |
−22% |
Среднее |
|
|
−58% |
−32% |
−13% |
−29% |
−40% |
Мин. |
|
|
−69% |
−43% |
−26% |
−65% |
−51% |
2560 × 1440 |
|
Полноэкранное сглаживание |
NVIDIA TITAN X (1417/10000 МГц, 12 Гбайт) |
NVIDIA GeForce GTX TITAN (837/6008 МГц, 6 Гбайт) |
NVIDIA GeForce GTX TITAN X (1000/7012 МГц, 12 Гбайт) |
NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт) |
AMD Radeon R9 295X2 (1018/5000 МГц, 8 Гбайт) |
AMD Radeon R9 Fury X (1050/1000 МГц, 4 Гбайт) |
Ashes of the Singularity |
MSAA 4x |
39 |
16 |
24 |
33 |
27 |
21 |
Battlefield 4 |
MSAA 4x + FXAA High |
109 |
47 |
75 |
98 |
95 |
65 |
Crysis 3 |
MSAA 4x |
63 |
27 |
40 |
53 |
59 |
39 |
DiRT Rally |
MSAA 4x |
93 |
40 |
60 |
74 |
71 |
48 |
DOOM |
TSSAA 8TX |
166 |
45 |
95 |
126 |
82 |
107 |
GTA V |
SMAA |
67 |
31 |
48 |
63 |
61 |
39 |
HITMAN |
MSAA 4x + FXAA |
43 |
13 |
24 |
33 |
12 |
17 |
Metro: Last Light Redux |
SSAA 4x |
71 |
26 |
43 |
52 |
54 |
43 |
Rise of the Tomb Raider |
Не поддерживается |
44 |
16 |
28 |
38 |
23 |
27 |
Tom Clancy's The Division |
SSAA 4x |
63 |
24 |
43 |
58 |
45 |
44 |
Total War: WARHAMMER |
SMAA 1x High |
57 |
26 |
39 |
50 |
25 |
34 |
Макс. |
|
|
−53% |
−29% |
−6% |
−6% |
−30% |
Среднее |
|
|
−61% |
−36% |
−16% |
−33% |
−42% |
Мин. |
|
|
−73% |
−44% |
−27% |
−72% |
−60% |
Прим.: В Total War: WARHAMMER не поддерживается DirectX 12 для GeForce GTX TITAN.
⇡#Производительность: игры (3840 × 2160)
При переходе от разрешения 1440p к 4К соотношение между видеокартами NVIDIA остается прежним. TITAN X на 20 % быстрее, чем GeForce GTX 1080 и на 56 % превосходит TITAN X на базе Maxwell.
Radeon R9 Fury X, что характерно для этой модели, более эффективно справляется с тестами в 4К, что в итоге сократило преимущество «Титана» до 56 %.
3840 × 2160 |
|
Полноэкранное сглаживание |
NVIDIA TITAN X (1417/10000 МГц, 12 Гбайт) |
NVIDIA GeForce GTX TITAN (837/6008 МГц, 6 Гбайт) |
NVIDIA GeForce GTX TITAN X (1000/7012 МГц, 12 Гбайт) |
NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт) |
AMD Radeon R9 295X2 (1018/5000 МГц, 8 Гбайт) |
AMD Radeon R9 Fury X (1050/1000 МГц, 4 Гбайт) |
Ashes of the Singularity |
Выкл. |
45 |
20 |
29 |
41 |
38 |
37 |
Battlefield 4 |
84 |
35 |
57 |
74 |
72 |
52 |
Crysis 3 |
42 |
18 |
28 |
36 |
40 |
29 |
DiRT Rally |
65 |
26 |
41 |
50 |
48 |
33 |
DOOM |
92 |
24 |
51 |
68 |
45 |
57 |
GTA V |
55 |
25 |
39 |
51 |
49 |
34 |
HITMAN |
67 |
21 |
38 |
53 |
24 |
33 |
Metro: Last Light Redux |
64 |
23 |
38 |
47 |
47 |
38 |
Rise of the Tomb Raider |
50 |
19 |
33 |
44 |
37 |
31 |
Tom Clancy's The Division |
38 |
15 |
25 |
33 |
26 |
28 |
Total War: WARHAMMER |
43 |
20 |
30 |
38 |
20 |
32 |
Макс. |
|
|
−53% |
−29% |
−7% |
−5% |
−18% |
Среднее |
|
|
−61% |
−36% |
−16% |
−29% |
−36% |
Мин. |
|
|
−74% |
−45% |
−27% |
−64% |
−51% |
Прим.: В Total War: WARHAMMER не поддерживается DirectX 12 для GeForce GTX TITAN.
⇡#Производительность: декодирование видео
В GP102 интегрирован такой же аппаратный кодек, как и в двух младших GPU семейства Pascal, поэтому TITAN X демонстрирует скорость декодирования стандартов H.264 и HEVC наравне с GeForce GTX 1080, с поправкой на сниженные тактовые частоты GPU. Производительность Pascal в этой задаче является непревзойденной как по сравнению с кодеками NVIDIA в чипах Maxwell, так и с таковыми в AMD Polaris.
Прим.: поскольку в пределах одной линейки GPU декодеры обычно не различаются, на диаграммах приведено по одному устройству из каждого семейства (или больше в том случае, если это правило нарушается).
Прим. 2: GeForce GTX TITAN X, как и другие устройства на базе GPU архитектуры Maxwell, за исключением GM204 (GeForce GTX 950/960), выполняет частично аппаратное декодирование H.265, подкрепленное ресурсами CPU.
⇡#Производительность: вычисления
Соотношение между различными архитектурами в задачах GPGPU зависит от специфики каждого приложения. TITAN X по большей части обеспечивает предсказуемый прирост быстродействия по сравнению с GeForce GTX 1080, однако есть исключительные случаи, когда задача упирается в частоту графического процессора (как тест физики частиц в CompuBench CL и рендеринг в Sony Vegas): здесь преимущество на стороне GTX 1080. Напротив, новый TITAN X взял реванш в той ситуации, где GeForce GTX 1080 уступает TITAN X на базе Maxwell и Radeon R9 Fury X (трассировка лучей в LuxMark).
В тесте SiSoftware Sandra, включающем перемножение матриц и быстрое преобразование Фурье, TITAN X не знает равных в режиме FP32. Что касается FP64, то просто за счет грубой силы (большого количества ядер CUDA и высоких тактовых частот) ускоритель достиг более высоких показателей, чем оригинальный TITAN поколения Kepler и Radeon R9 Fury X — видекарты, обладающие более выгодным соотношением скорости работы с FP32 и FP64. Это в конечном счете не позволяет совсем уж сбрасывать со счетов TITAN X как ускоритель задач с вычислениями двойной точности. Впрочем, для этой цели лучше всего подходит Radeon R9 295X2. Видеокарты AMD сохраняют сильные позиции и в некоторых других тестах: расчете водной поверхности в CompuBench CL и Sony Vegas.
⇡#Тактовые частоты, энергопотребление, температура, разгон
При игровой нагрузке графический процессор TITAN X периодически достигает столь же высоких тактовых частот, как GP104 в составе GTX 1080 (1848 против 1860 МГц), однако большую часть времени пребывает в существенно более низком диапазоне (1557–1671 МГц). При этом максимальное напряжение питания GPU составляет 1,062 В (1,05 В в GTX 1080).
Вентилятор СО вращается со скоростью вплоть до 2472 об/мин. Карта требует более сильного охлаждения, чем GTX 1080, а поскольку конструкция кулера осталась неизменной, он создает больше шума. Чтобы компенсировать этот фактор, для TITAN X установили на 3 °С более высокую целевую температуру GPU.
Хотя TITAN X на базе Pascal формально обладает одинаковым TDP c TITAN X предыдущего поколения, на практике система с новой видеокартой развивает существенно большую (на 49 Вт) мощность. Впрочем, здесь может играть роль повышенная нагрузка на CPU, обслуживающий более производительный графический процессор. В FurMark, напротив, все ускорители, обладающие TDP 250 Вт (а также 275-ваттный Fury X) находятся примерно на одном уровне.
Для разгона «Титана» мы воспользовались штатной возможностью увеличить лимит мощности видеокарты на 20 %, запустили турбину СО на полную скорость (4837 об/мин) и увеличили максимальное напряжение питания GPU до 1,093 В (такое же значение, как на GTX 1080). В результате нам удалось поднять базовую частоту GPU на 200 МГц — до 1617 МГц, а эффективную частоту памяти — до 11100 МГц.
Одно это уже совсем неплохо для столь крупного чипа, однако не меньшее значение имеет повышенный лимит мощности. Разогнанный GPU поддерживает частоты в диапазоне 1974–1987 МГц, достигая максимума в 2063 МГц, а это уже не менее чем просто потрясающее достижение. Для сравнения: пиковая частота графического процессора в нашем экземпляре GTX 1080 при разгоне составила 2126 МГц.
Система с разогнанным TITAN X развивает мощность на 46 Вт больше, чем при штатном режиме работы видеокарты. Раскрученный до максимальной скорости вентилятор сбил температуру GPU на 17–20 °C, что позволяет пользователям рассчитывать на столь же эффективный разгон при более низких оборотах, обеспечивающих относительно комфортный уровень шума.
⇡#Производительность: разгон
Оверклокинг TITAN X позволяет весьма существенно увеличить быстродействие — на 14% в 3DMark и на 18–23 % в игровых бенчмарках при разрешениях 1080p и 1440p. В играх при разрешении 4К бонус достигает 26 %.
Разница между разогнанным TITAN X и GeForce GTX 1080, работающим на референсных частотах, достигает шокирующих значений — 36, 47 и 50 % в трех использованных нами разрешениях. Разумеется, сам GTX 1080 также подлежит разгону, но, как мы помним из нашего обзора референсной видеокарты, это добавляет к результатам лишь 9, 13 и 12 %. Таким образом, если сравнивать разогнанный флагман линейки GeForce 10 и разогнанный TITAN X, то преимущество последнего составит 25, 30 и 34 %.
Используя наши старые данные о производительности GeForce GTX TITAN X на чипе GM200 в разгоне, произведем аналогичные расчеты для сравнения двух поколений «Титанов». Разогнанный TITAN X на Pascal опережает своего предшественника на 75, 93 и 97 %. Когда оба ускорителя разогнаны, новинка сохраняет отрыв в 74 и 70 % при разрешениях 1440p и 2160p. От тестирования в режиме 1080p мы (как помнят критиковавшие это решение читатели) отказались в обзоре GeForce GTX TITAN X.
3DMark (Graphics Score) |
|
Разрешение |
NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт) |
NVIDIA TITAN X (1417/10000 МГц, 12 Гбайт) |
NVIDIA TITAN X (1617/11110 МГц, 12 Гбайт) |
Fire Strike |
1920 × 1080 |
21 648 |
26 341 |
31 038 |
Fire Strike Extreme |
2560 × 1440 |
10 207 |
13 025 |
15 191 |
Fire Strike Ultra |
3840 × 2160 |
4 994 |
6 488 |
7 552 |
Time Spy |
2560 × 1440 |
6 955 |
8 295 |
8 644 |
Макс. |
|
|
+30% |
+51% |
Среднее |
|
|
+25% |
+42% |
Мин. |
|
|
+19% |
+24% |
1920 × 1080 |
|
Полноэкранное сглаживание |
NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт) |
NVIDIA TITAN X (1417/10000 МГц, 12 Гбайт) |
NVIDIA TITAN X (1617/11110 МГц, 12 Гбайт) |
Ashes of the Singularity |
MSAA 4x |
42 |
47 |
61 |
Battlefield 4 |
MSAA 4x + FXAA High |
149 |
162 |
198 |
Crysis 3 |
MSAA 4x |
79 |
99 |
124 |
DiRT Rally |
MSAA 4x |
101 |
126 |
126 |
DOOM |
TSSAA 8TX |
185 |
200 |
200 |
GTA V |
MSAA 4x + FXAA |
84 |
85 |
96 |
HITMAN |
SSAA 4x |
52 |
68 |
77 |
Metro: Last Light Redux |
SSAA 4x |
92 |
124 |
140 |
Rise of the Tomb Raider |
SSAA 4x |
62 |
70 |
94 |
Tom Clancy's The Division |
SMAA 1x Ultra |
80 |
87 |
117 |
Total War: WARHAMMER |
MSAA 4x |
73 |
76 |
88 |
Макс. |
|
|
+35% |
+57% |
Среднее |
|
|
+16% |
+36% |
Мин. |
|
|
+0% |
+8% |
2560 × 1440 |
|
Полноэкранное сглаживание |
NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт) |
NVIDIA TITAN X (1417/10000 МГц, 12 Гбайт) |
NVIDIA TITAN X (1617/11110 МГц, 12 Гбайт) |
Ashes of the Singularity |
MSAA 4x |
33 |
39 |
48 |
Battlefield 4 |
MSAA 4x + FXAA High |
98 |
109 |
146 |
Crysis 3 |
MSAA 4x |
53 |
63 |
81 |
DiRT Rally |
MSAA 4x |
74 |
93 |
93 |
DOOM |
TSSAA 8TX |
126 |
166 |
183 |
GTA V |
SMAA |
63 |
67 |
86 |
HITMAN |
MSAA 4x + FXAA |
33 |
43 |
49 |
Metro: Last Light Redux |
SSAA 4x |
52 |
71 |
82 |
Rise of the Tomb Raider |
Не поддерживается |
38 |
44 |
59 |
Tom Clancy's The Division |
SSAA 4x |
58 |
63 |
86 |
Total War: WARHAMMER |
SMAA 1x High |
50 |
57 |
74 |
Макс. |
|
|
+36% |
+58% |
Среднее |
|
|
+20% |
+47% |
Мин. |
|
|
+6% |
+27% |
3840 × 2160 |
|
Полноэкранное сглаживание |
NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт) |
NVIDIA TITAN X (1417/10000 МГц, 12 Гбайт) |
NVIDIA TITAN X (1617/11110 МГц, 12 Гбайт) |
Ashes of the Singularity |
Выкл. |
41 |
45 |
60 |
Battlefield 4 |
74 |
84 |
112 |
Crysis 3 |
36 |
42 |
56 |
DiRT Rally |
50 |
65 |
65 |
DOOM |
68 |
92 |
104 |
GTA V |
51 |
55 |
75 |
HITMAN |
53 |
67 |
77 |
Metro: Last Light Redux |
47 |
64 |
74 |
Rise of the Tomb Raider |
44 |
50 |
69 |
Tom Clancy's The Division |
33 |
38 |
52 |
Total War: WARHAMMER |
38 |
43 |
58 |
Макс. |
|
|
+37% |
+59% |
Среднее |
|
|
+20% |
+50% |
Мин. |
|
|
+7% |
+30% |
⇡#Выводы
Выход видеокарты на основе старшего GPU в линейке Pascal — ожидаемое событие. Необычное обстоятельство состоит в том, насколько краткое время потребовалось NVIDIA, чтобы выпустить TITAN X после дебюта флагманской модели в линейке GeForce 10 — GTX 1080. Компания на столь раннем этапе освоения техпроцесса 16 нм FinFET открыла массовое производство четырех графических процессоров, включая два GPU высшего эшелона — GP102 и GP100, обладающие колоссальным транзисторным бюджетом (12 и 15,3 млрд транзисторов).
TITAN X позиционируется в первую очередь как ускоритель задач GPGPU, среди которых приоритетное место занимает машинное обучение благодаря поддержке формата чисел int8 в GP102 при скорости исполнения 4:1 по сравнению с операциями FP32. В большинстве вычислительных задач, опирающихся на FP32, TITAN X также обладает лидирующим быстродействием по сравнению с любыми ранее выпущенными ускорителями игрового и просьюмерского класса.
Не стоит сбрасывать со счетов и функцию работы с операциями двойной точности. Хотя карты, построенные на таких GPU, как GK110/210 от NVIDIA, а также Tahiti и Hawaii от AMD обладают лучшим соотношением FP32 и FP64 по сравнению с TITAN X, но и в этой категории он достигает по меньшей мере конкурентоспособных результатов в силу прогрессивного техпроцесса, обеспечившего видеокарте высокие тактовые частоты и огромный массив ядер CUDA.
Для нашего сайта новый TITAN X интересен в первую очередь как игровая видеокарта. В этом качестве новинка производит двоякое впечатление. С одной стороны, преимущество в 15–20% перед GeForce GTX 1080 в игровых бенчмарках не оправдывает, с точки зрения покупателя, столь высокую цену модели ($1 200) и к тому же все еще не позволяет запускать многие из современных игр в разрешении 4К с максимальными настройками качества графики при комфортной частоте смены кадров (60 FPS).
С другой стороны, ограничение TDP в 250 Вт, установленное NVIDIA, явно не соответствует возможностям GPU. При разгоне штатными средствами TITAN X легко достигает частот свыше 2 ГГц, что в конечном счете обеспечивает на 34 % более высокую производительность, чем у (также разогнанного) GeForce GTX 1080 в режиме 4К. Фактически разгон делает TITAN X первой игровой видеокартой, безоговорочно подходящей для таких настроек.
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.