Двухпроцессорная графическая карта была обязательным пунктом в списке планов NVIDIA начиная с серии GeForce 7000. Запуск видеоадаптера на базе двух GPU GK110 был ожидаем с тех пор, как появились первые потребительские продукты на базе этого процессора. Однако с точки зрения человека, не посвященного в планы NVIDIA, перспективы такого устройства выглядели неоднозначно. Уж слишком велики и цена, и энергопотребление столь крупных GPU, изготовленных по техпроцессу 28 нм.
Топовые видеоадаптеры NVIDIA в текущем поколении стали беспрецедентно дорогими. Если рекомендованная цена GeForce GTX 780 Ti составляет $699, то сколько же должен стоить двухпроцессорный флагманский адаптер? Неудивительно, что в конце концов видеокарта с двумя чипами GK110 так и не появилась в игровой линейке GeForce 700, но вышла под маркой TITAN.
Семейство GeForce GTX TITAN имеет для NVIDIA двойное назначение. С одной стороны, в «Титаны» попадают продукты для геймеров-энтузиастов, обладающие максимальной игровой производительностью. Оригинальный GTX TITAN какое-то время был единственным продуктом на базе GK110. Сменивший его GTX TITAN Black просто работает на более высоких частотах по сравнению с GeForce GTX 780 Ti.
С другой стороны, TITAN — это высокопроизводительные устройства для вычислений в профессиональных областях. В то время как концепция GPGPU получает все более широкое распространение и признание, покупатель уже не может получить максимальную производительность в «счетных» задачах в нагрузку к игровому GPU, как это было в предыдущие годы.
NVIDIA заложила разделение по расчетным возможностям в саму архитектуру GPU. Операции с плавающей точкой двойной точности (FP64) в чипах Kepler выполняются специальными ядрами CUDA. И только GK110 из всей линейки имеет 64 FP64-совместимых ядра CUDA в каждом блоке SMX (Streaming Multiprocessor). Поскольку SMX содержит 192 обычных ядра, выполняющих операции одинарной точности, производительность GK110 в расчетах FP64 составляет 1/3 от производительности в расчетах FP32.
Все остальные GPU в линейке Kepler довольствуются восемью FP64-совместимыми ядрами CUDA в каждом SMX, что дает производительность на уровне всего лишь 1/24 от FP32. Но кроме того, в игровых моделях GeForce на базе GK110 ядра FP64 работают на частоте 1/8 от частоты GPU, что приводит все к тому же соотношению производительности FP64 к FP32 — 1/24. Только «Титаны» лишены этого ограничения, обладая максимальным для GK110 быстродействием в FP64.
Фактически по вычислительным возможностям TITAN Black не уступает профессиональным ускорителям Quadro K6000 и Tesla K40, которые также основаны на полностью функциональной ревизии чипа GK110, только стоят свыше 4 тыс. долларов.
Таким образом, видеоадаптер с двумя GK110 должен позиционироваться в качестве ускорителя для научных, финансовых и инженерных вычислений — всех тех задач, в которых используются операции двойной точности. И для него вполне оправданно четырехзначное число на ценнике. С другой стороны, мы имеем новый фетиш для энтузиастов и статусный продукт, который поддерживает заявку NVIDIA на лидерство в традиционной сфере применения GPU — 3D-графике и компьютерных играх.
В этом качестве GeForce GTX TITAN Z встретил сильного конкурента в лице Radeon R9 295X2 на базе двух чипов Hawaii. Двухпроцессорный флагман AMD не уступает в производительности двум отдельным адаптерам Radeon R9 290X и одновременно стоит вдвое дешевле, чем TITAN Z. Единственное слабое место R9 295X2 в противостоянии с TITAN Z – скорость вычислений двойной точности.
Процессор Hawaii включает полностью аппаратные планировщики, выполняющие разрешение зависимостей и формирование очереди операций — в отличие от архитектуры Kepler, в которой эти функции возложены на драйвер. Подход AMD более эффективен для расчетных задач, кроме того, в архитектуре GCN все потоковые процессоры способны исполнять FP64-операции за два такта, что дает производительность на уровне 1/2 от скорости вычислений одинарной точности. Но в десктопных устройствах на базе Hawaii искусственно установлено соотношение 1/8. Полная скорость зарезервирована для профессиональных ускорителей FirePro. Даже собрав систему из двух Radeon R9 295X2 за цену единственного TITAN Z, мы получим 1/4 производительности отдельной двухголовой видеокарты в режиме FP64.
⇡#Технические характеристики
Мощность GK110 была главной проблемой для разработчиков GeForce GTX TITAN Z. В прошлый раз, когда флагманским GPU NVIDIA был относительно компактный GPU GK104, удалось создать двухпроцессорную карту — GeForce GTX 690, которая практически не уступала в производительности паре отдельных GTX 680. Повторить это достижение с чипами GK110, которые в составе отдельных адаптеров развивают мощность 250 Вт, — серьезная задача.
AMD решила эту проблему для Radeon R9 295X2 за счет системы водяного охлаждения. Но GeForce GTX TITAN Z использует воздушный кулер, явно неспособный отвести от платы 500 Вт тепла. Карта имеет TDP 375 Вт — ровно столько, сколько по спецификациям могут обеспечить два восьмиконтактных разъема питания, которыми оснащена карта, в сочетании с разъемом PCI-E x16.
Как следствие, компромисс в тактовых частотах был неизбежен. TITAN Z имеет наименьшую базовую частоту среди всех моделей на базе GK110 — 706 МГц. С другой стороны, у него наибольшая дельта между базовой частотой и boost clock — 180 МГц, которая дает карте пространство для ускорения в благоприятных условиях. GPU даже способен на короткие броски к частоте 1058 МГц — на 352 МГц выше базовой! Видеопамять общим объемом 12 Гбайт работает на эффективной частоте, характерной для GTX 780 Ti и TITAN Black, — 7000 МГц.
Модель |
Графический процессор |
Видеопамять |
Шина ввода/вывода |
Вывод изображения |
TDP, Вт |
|
Кодовое название |
Число транзисторов, млн |
Техпроцесс, нм |
Тактовая частота, МГц: Base Clock / Boost Clock |
Число ядер CUDA |
Число текстурных блоков |
Число ROP |
Разрядность шины, бит |
Тип микросхем |
Тактовая частота: реальная (эффективная), МГц |
Объем, Мбайт |
|
Интерфейсы (макс разрешение@частота кадров, Гц) |
Порты вывода |
|
GeForce GTX 780 |
GK110 |
7 100 |
28 |
863/900 |
2304 |
192 |
48 |
384 |
GDDR5 SDRAM |
1502 (6008) |
3072 |
PCI-Express 3.0 x16 |
VGA (2048x1536@85), DL DVI (2560x1600@60), HDMI 1.4a (4096х2160@24), DisplayPort 1.2 (4096x2160@60) |
1 х DL DVI-I, 1 x DL DVI-D, 1 x DisplayPort, 1 x HDMI |
250 |
GeForce GTX 780 Ti |
GK110 |
7 100 |
28 |
875/928 |
2880 |
240 |
48 |
384 |
GDDR5 SDRAM |
1750 (7000) |
3072 |
PCI-Express 3.0 x16 |
VGA (2048x1536@85), DL DVI (2560x1600@60), HDMI 1.4a (4096х2160@24), DisplayPort 1.2 (4096x2160@60) |
1 х DL DVI-I, 1 x DL DVI-D, 1 x DisplayPort, 1 x HDMI |
250 |
GeForce GTX TITAN Black |
GK110 |
7 100 |
28 |
889/980 |
2880 |
240 |
48 |
384 |
GDDR5 SDRAM |
1750 (7000) |
6144 |
PCI-Express 3.0 x16 |
VGA (2048x1536@85), DL DVI (2560x1600@60), HDMI 1.4a (4096х2160@24), DisplayPort 1.2 (4096x2160@60) |
1 х DL DVI-I, 1 x DL DVI-D, 1 x DisplayPort, 1 x HDMI |
250 |
GeForce GTX TITAN Z |
GK110 |
7 100 |
28 |
705/876 |
2880 |
240 |
48 |
2 x 384 |
GDDR5 SDRAM |
1750 (7000) |
2 x 6144 |
PCI-Express 3.0 x16 |
VGA (2048x1536@85), DL DVI (2560x1600@60), HDMI 1.4a (4096х2160@24), DisplayPort 1.2 (4096x2160@60) |
1 х DL DVI-I, 1 x DL DVI-D, 1 x DisplayPort, 1 x HDMI |
375 |
Судя по объявленным спецификациям, понижение базовой частоты существенно сказалось на скорости карты. Пиковая расчетная производительность GTX TITAN Z составляет 8 TFLOPS, притом что GTX TITAN Black выдает на-гора 5 TFLOPS в FP32.
По конфигурации вычислительных блоков GPU TITAN Z не отличается от TITAN Black. Про графический процессор GK110 более подробно вы можете прочитать в статье, посвященной оригинальному GeForce GTX TITAN, а архитектура Kepler в целом описана в обзоре GeForce GTX 680.
⇡#Конструкция
Общие принципы дизайна TITAN Z унаследовал от предыдущей двухголовой видеокарты NVIDIA — GeForce GTX 690, только на этот раз кулер не двух-, а трехслотовый. Кожух системы охлаждения металлический, с прозрачными окошками, в которых видно черные радиаторы GPU. Задняя поверхность платы покрыта толстой алюминиевой пластиной, которая добавляет изрядную долю к общему немаленькому весу устройства. Назначение пластины не только декоративное. Она охлаждает микросхемы памяти, расположенные под ней.
Чисто эстетически «двухголовый Титан» производит сильное впечатление. Топовые однопроцессорные адаптеры NVIDIA, выполненные в таком же дизайне, прекрасно выглядят, но, держа в руках TITAN Z, чувствуешь настоящую мощь. Внешность, достойная такого дорогого и совершенного устройства.
Аксиальный вентилятор продувает воздух сквозь отдельные радиаторы, расположенные по сторонам. Не в пример турбинным кулерам, применяемым в однопроцессорных картах NVIDIA референсного дизайна, часть горячего воздуха он выбрасывает внутрь корпуса ПК. Кроме того, аксиальный вентилятор не позволяет разместить никакую другую плату вплотную к видеоадаптеру, тогда как турбинка при необходимости это допускает. Следовательно, в корпусе TITAN Z оккупирует не три, а все четыре слота расширения. В этом плане двухголовая карта не дает никакого выигрыша по сравнению с двумя GeForce GTX TITAN Black, установленными вплотную друг к другу.
Выхлопная решетка занимает половину крепежной пластины. Оставшаяся площадь использована для видеовыходов — в такой же конфигурации, как и на прочих топовых адаптерах NVIDIA: два порта DVI плюс полноформатные разъемы HDMI и DisplayPort. Поскольку один GPU может использовать четыре порта одновременно, возможности второго остаются незадействованными. В таком классе устройств (и за такие деньги) хотелось бы видеть больше разъемов DisplayPort 1.2 (пусть и в Mini-варианте, как на Radeon R9 295X2). Возможность подключить к одному ПК больше четырех мониторов не так уже важна, но в существующем варианте только один из них может иметь разрешение Ultra HD.
GPU охлаждают довольно компактные радиаторы, но в основание каждого вмонтирована испарительная камера. Металлическая рама покрывает лицевую поверхность платы. Платформа, на которой закреплен вентилятор, представляет собой еще один отдельный радиатор, прижатый к транзисторам системы питания и коммутатору шины PCI-E.
⇡#Плата
По сравнению с GeForce GTX 690 разводка платы радикально усложнилась. Неудивительно, если принять во внимание 384-битную шину памяти каждого GPU и 12 Гбайт RAM. Графические процессоры соединяет коммутатор PCI-E 3.0 PLX PEX8747, который мы ранее видели на том же GTX 690. Чипы памяти SK hynix H5GQ2H24BFR-R2C рассчитаны на эффективную частоту 7 ГГц.
Система питания не отличается по конфигурации фаз от того, что было в GeForce GTX 690. Каждый GPU получил по пять фаз, две фазы отданы для питания чипов памяти, и еще одна фаза — для PLL. Особенность TITAN Z в том, что принадлежность фаз к отдельным GPU не фиксирована. Один из чипов может в какой-то момент времени пользоваться большим числом фаз, чем другой, если его энергопотребление выше.
Контроллеры питания используются те же, что и в других референсных картах на базе GK110, — ON NCP4206.
⇡#Тестовый стенд, методика тестирования
Конфигурация тестовых стендов |
CPU |
Intel Core i7-3960X @ 4,6 ГГц (100x46) |
Intel Core i7-3970X @ 4,6 ГГц (100x46) |
Материнская плата |
ASUS P9X79 Pro |
Оперативная память |
DDR3 Kingston HyperX 4x2 Гбайт @ 1600 МГц, CL9 |
ПЗУ |
Intel SSD 520 240 Гбайт |
Блок питания |
Corsair AX1200i, 1200 Вт |
Seasonic Platinum-1000, 1000 Вт |
Охлаждение CPU |
Thermalright Archon |
Корпус |
CoolerMaster Test Bench V1.0 |
Операционная система |
Windows 7 Ultimate X64 Service Pack 1 |
ПО для GPU AMD |
AMD Catalyst 14.4 WHQL |
ПО для GPU NVIDIA |
340.52 WHQL |
Для измерения мощности системы используется стенд с блоком питания Corsair AX1200i. Энергосберегающие технологии CPU во всех тестах отключены. Шина PCI-Express работает в режиме 3.0. Для активации PCI-E 3.0 на видеокартах серий GeForce 600 и 700 в системе на чипсете X79 применяется патч от NVIDIA.
В настройках драйвера NVIDIA всегда в качестве процессора для вычисления PhysX выбирается CPU. В настройках AMD всегда настройка Tessellation переводится из состояния AMD Optimized в Use application settings. В CrossFire-конфигурациях остается включенной опция Frame Pacing.
Набор бенчмарков |
Программа |
API |
Настройки |
Анизотропная фильтрация, полноэкранное сглаживание |
Разрешение |
3DMark 2011 |
DirectX 11 |
Профиль Extreme |
|
|
3DMark |
DirectX 11 |
Тест Fire Strike (не Extreme) |
|
|
Unigine Heaven 4 |
DirectX 11 |
DirectX 11, макс. качество, тесселяция в режиме Extreme |
AF 16x, MSAA 4x |
2560х1440 / 3840x2160 |
DiRT Showdown . Встроенный бенчмарк |
DirectX 11 |
Макс. качество, Global Illumination вкл. Трасса Shibuya, 8 машин |
AF, AA 4х |
2560х1440 / 3840x2160 |
Far Cry 3 + FRAPS |
DirectX 11 |
DirectX 11, макс. качество, HDAO. Начало миссии Secure the Outpost |
AF, MSAA 4x |
2560х1440 / 3840x2160 |
Tomb Raider. Встроенный бенчмарк |
DirectX 11 |
Макс. качество |
AF 16x, SSAA 4x |
2560х1440 / 3840x2160 |
Bioshock Infinite. Встроенный бенчмарк |
DirectX 11 |
Макс. качество. Postprocessing: Normal |
AF 16x, FXAA |
2560х1440 / 3840x2160 |
Crysis 3 + FRAPS |
DirectX 11 |
Макс. качество. Начало миссии Post Human |
AF 16x, MSAA 4x |
2560х1440 / 3840x2160 |
Metro: Last Light. Встроенный бенчмарк |
DirectX 11 |
Макс. качество |
AF 16x, SSAA 4x |
2560х1440 / 3840x2160 |
Company of Heroes 2. Встроенный бенчмарк |
DirectX 11 |
Макс. качество |
AF, SSAA 4x |
2560х1440 / 3840x2160 |
Batman: Arkham Origins. Встроенный бенчмарк |
DirectX 11 |
Макс. качество |
AF, MSAA 4x |
2560х1440 / 3840x2160 |
Battlefield 4 + FRAPS |
DirectX 11 |
Макс. качество. Начало миссии Tashgar |
AF 16x, MSAA 4x + FXAA |
2560х1440 / 3840x2160 |
Thief. Встроенный бенчмарк |
DirectX 11 |
Макс. качество |
AF 16x, SSAA 4x + FXAA |
2560х1440 / 3840x2160 |
Набор бенчмарков |
Программа |
Настройки |
LuxMark 2.0 X64 |
Сцена Room (Complex Benchmark) |
CompuBench CL Desktop Edition X64, Ocean Surface Simulation |
– |
CompuBench CL Desktop Edition X64, Particle Simulation — 64K |
– |
SiSoftware Sandra 2014 SP3, Scientific Analysis |
Open CL, FP64 |
⇡#Участники тестирования
В тестировании производительности приняли участие следующие видеокарты:
⇡#Энергопотребление, температура, разгон
Как уже сказано выше, в редкие моменты графические процессоры TITAN Z могут достигать частоты 1058 МГц — на 352 МГц выше базовой. Любопытно, что вместе с лесенкой частот увеличился и диапазон соответствующих отдельным шагам напряжений. Верхнему значению соответствует напряжение 1,2 В, что намного выше, чем 1,162-1,187, которыми GK110 довольствуется на однопроцессорных платах референсного дизайна.
Под нагрузкой в тяжелых играх после прогрева карты частоты GPU стабилизируются в районе 862 МГц, а напряжение составляет 0,975-0,987 В. Это, прямо скажем, довольно мало для 28-нанометрового GPU под нагрузкой. NVIDIA, конечно же, отбирает для TITAN Z наиболее качественные кристаллы. Не говоря уже о том, что в GTX 780 Ti, TITAN Black и TITAN Z используются GPU нового степпинга B1.
Как ни странно, TITAN Z вполне подлежит разгону. Базовую частоту GPU удалось безопасно увеличить до 846 МГц. В динамике частота поднималась вплоть до 1189 МГц и стабилизировалась на уровне 1071 МГц при напряжении 1,025 В. BIOS дает возможность поднять максимальное напряжение на 75 мВ, но на практике эта функция, как и на GTX 780 Ti, не работает. Частота чипов памяти достигла 8 ГГц.
Разгону поспособствовал запас мощности карты: лимит энергопотребления можно поднять вплоть до 120%. Предельная температура была увеличена с 82 до 95 °C, вентилятор системы охлаждения запущен на максимальные обороты.
| Base Clock, МГц | Макс. Boost Clock, МГц | Base Clock, МГц (разгон) | Макс. зарегистрированная Boost Clock, МГц (разгон) |
GeForce GTX TITAN Z |
706 |
1058 (+352) |
846 |
1189 (+343) |
GeForce GTX TITAN Black |
889 |
1032 (+143) |
1100 |
1262 (+162) |
GeForce GTX TITAN |
836 |
1006 (+145) |
966 |
1150 (+184) |
GeForce GTX 780 Ti |
876 |
1020 (+144) |
986 |
1130 (+144) |
GeForce GTX 780 |
863 |
1006 (+143) |
1053 |
1215 (+162) |
В этом обзоре мы применили новый способ замера мощности вместо использования бытового ваттметра. Регистрируется мощность на выходе блока питания Corsair с помощью устройства Corsair Link, вычисляется среднее и максимальное значение.
Неразогнанный TITAN Z потребляет на добрых 80-100 ватт меньше, чем Radeon R9 295X2, что соответствует разнице между их TDP (375 и, предположительно, 500 Вт соответственно). Нечего и говорить, насколько много потребляет компьютер, если обменять TITAN Z на два R9 295X2 в режиме CrossFire. Резерв энергопотребления TITAN Z также достаточно велик, чтобы при разгоне карта приблизилась по мощности к своему конкуренту.
Прим.: для тандема R9 295X2 отсутствуют результаты в FurMark. При этой конфигурации тест не запускается в полноэкранном режиме, что необходимо для работы CrossFire.
Без разгона температура GPU упирается в установленный по умолчанию лимит, достигая 83 °C. Для поддержания такой температуры не требуется высоких оборотов крыльчатки. Как следствие, видеокарта работает довольно тихо для своей мощи. Вентилятор на СВО Radeon R9 295X2 шумит явно сильнее. Запуск кулера на полных оборотах позволяет удержать температуру GPU в пределах 71 °C.
⇡#Производительность: синтетические тесты
3DMark 2011
- Производительность GK110 в SLI прекрасно масштабируется, но о двукратном превосходстве TITAN Z над TITAN Black речи все же не идет.
- TITAN Z заметно уступает по графическому баллу своему конкуренту Radeon R9 295X2.
- Quad CrossFire также работает безупречно, обеспечивая двукратный прирост балла по сравнению с одиночным R9 295X2.
3DMark
- В новой версии бенчмарка сохранился крупный зазор между TITAN Z и R9 295X2.
- Кроме того, TITAN Z не настолько быстрее одиночного TITAN Black, как в предыдущем тесте. Речь идет разве что о 30% прироста графического балла.
- Однако и Quad CrossFire, в отличие от 3DMark 2011, не только не приносит дополнительных очков, но и снижает производительность по сравнению с одиночным R9 295X2.
Unigine Heaven 4
- Между TITAN Z и R9 295X2 установился паритет в обоих разрешениях.
- TITAN Z также почти в два раза производительнее, чем TITAN Black.
- Но и в CrossFire быстродействие прекрасно масштабируется, обеспечивая двукратное превосходство тандема R9 295X2 над одиночным R9 295X2, а следовательно — над TITAN Z.
⇡#Производительность: игры
Far Cry 3
- Результаты R9 295X2 и TITAN Z мало различаются, хотя последний имеет чисто символическое преимущество в обоих разрешениях.
- Масштабируемость быстродействия в SLI также на высоте, хотя и не достигает 100%.
- Quad CrossFire в режиме 4K дает мизерный эффект, а в WQHD просто бесполезен.
Tomb Raider
- TITAN Z уступает R9 295X2 при разрешении WQHD, но выходит вперед в 4К.
- Налицо неплохая, хотя и не достигающая 100% масштабируемость в SLI.
- Quad CrossFire опять-таки не дает никакого преимущества команде AMD.
Bioshock Infinite
- К масштабируемости в SLI претензий нет, особенно при разрешении 4K.
- В режиме WQHD TITAN Z чуть-чуть уступает Radeon R9 295X2, но в 4К имеет вполне существенное преимущество.
- Bioshock Infinite стал первым реальным тестом, где заработал Quad CrossFire. И хотя прирост быстродействия довольно скромный, он все же обеспечил этой конфигурации лидерство в обоих разрешениях.
Crysis 3
- TITAN Z и R9 295X2 имеют примерно одинаковую производительность в WQHD, но в 4К TITAN Z берет верх с небольшим отрывом.
- Кроме того, производительность в SLI великолепно масштабируется, достигая двукратного прироста у TITAN Z по сравнению с TITAN Black.
- В Crysis 3 также прекрасно работает Quad CrossFire. Тандем Radeon R9 295X2 в этой игре, до сих пор одной из самых ресурсоемких среди всех существующих, обеспечивает в среднем 40 кадров/с при разрешении 3840х2160. Впечатляющий результат.
Metro: Last Light
- В этой игре победа осталась на стороне Radeon R9 295X2 — вне зависимости от разрешения.
- SLI обеспечивает хорошее масштабирование, которое стремится к 100% в режиме 4K.
- Толку от Quad CrossFire вновь нет.
Batman: Arkham Origins
- В целом Radeon R9 295X2 и TITAN Z одинаково хороши. Только в WQHD карта NVIDIA имеет мизерное преимущество.
- На масштабирование в SLI также нельзя пожаловаться, в особенности при разрешении 3840x2160.
- Quad CrossFire не помогает адаптерам AMD при разрешении WHQD. В 4K есть небольшой эффект, который вывел тандем R9 295X2 в лидеры.
Thief
- Thief довольно странно работает с CrossFire. Radeon R9 295X2 даже хуже, чем одиночный Radeon R9 290X, но тандем R9 295X2 реально увеличивает производительность в режиме WQHD. Однако в 4К на двух R9 295X2 игра вылетает при попытке продвинуться дальше меню.
- SLI дает прирост производительности в районе 50%, но этого достаточно, чтобы TITAN Z одержал победу над R9 295X2, в котором, кажется, реально работает только один GPU из двух.
Примечание: мы вынуждены были опустить ряд тестов, которые обычно используем, — DiRT Showdown, Company of Heroes 2 и Battlefield 4, — из-за проблем с поддержкой 4К-разрешения на всех использованных видеокартах. Впрочем, первые два — небольшая потеря, поскольку DiRT уже недостаточно ресурсоемкая игра для таких конфигураций, а CoH 2 не поддерживает ни SLI, ни CrossFire.
На следующей странице мы рассмотрим производительность героев этого обзора в вычислительных приложениях и выясним, какие из них лучшим образом подходят для постройки рабочих станций.
⇡#Производительность: вычисления
Luxmark: Room (Complex Benchmark)
- Тест создания изображений методом Ray Tracing великолепно разделяет нагрузку на несколько GPU. Поэтому TITAN Z имеет практически вдвое большую производительность, чем одиночный TITAN Black.
- Однако Radeon R9 295X2 работает быстрее, и намного.
- Кроме того, при добавлении второго R9 295X2 результат также удваивается. Производительность такого кластера GPU более чем на 150% выше, чем у TITAN Z.
CompuBench CL: Ocean Surface Simulation
- Этот бенчмарк не умеет использовать несколько ускорителей одновременно, поэтому TITAN Z, работающий с одним GPU, нисколько не отличается от TITAN Black.
- То же относится и к видеоадаптерам AMD, которые показывают практически одинаковые результаты — вне зависимости от количества GPU в системе.
- Любая «красная» плата существенно превосходит по производительности устройства NVIDIA.
CompuBench CL: Particle Simulation
- Следующий тест также сводится к оценке одиночных GPU.
- И снова TITAN Z практически не уступает своему однопроцессорному собрату.
- Характер нагрузки более благоприятен для архитектуры NVIDIA, чем симуляция водной поверхности. В результате TITAN Z выступил ничуть не хуже всех своих соперников.
SiSoftware Sandra: Scientific Analysis, FP64
- Тест вычислений двойной точности благоприятствует GPU NVIDIA, которые могут производить операции FP64 на скорости 1/3 от FP32. Обе видеокарты показали более высокий результат по сравнению с процессором AMD Hawaii в различных конфигурациях.
- Sandra также не поддерживает одновременную работу нескольких GPU, но на этот раз TITAN Black получил преимущество перед одним GPU в составе TITAN Z.
⇡#Производительность: разгон
Разгон TITAN Z принес прекрасные плоды. Сказался и неслабый подъем базовой частоты, и увеличение пропускной способности памяти, и ослабление ограничений по энергопотреблению и температуре.
3DMark 2011
3DMark
Игровые тесты + Unigine Heaven 4
⇡#Выводы
NVIDIA блестяще преодолела трудности, связанные с размещением двух процессоров GK110 в одном видеоадаптере. Печатная плата невероятно сложная, и для охлаждения понадобилась трехслотовая конструкция, но GPU в составе GTX TITAN Z сохранили довольно высокую производительность по сравнению с одиночными чипами. Базовые частоты TITAN Z намного ниже, чем у остальных продуктов на базе GK110, но не все так просто. TITAN Z имеет большое пространство для динамического увеличения частоты и напряжения питания GPU. Возможно, именно поэтому в некоторых тестах мы наблюдали практически двукратную разницу в производительности между TITAN Z и TITAN Black. В условиях длительной тяжелой нагрузки TITAN Z работает на довольно-таки консервативных частотах, но грамотная поддержка SLI по-прежнему обеспечивает прирост производительности, которого мы вправе ожидать от двухпроцессорной видеокарты.
Практический смысл в покупке любого «Титана» связан с FP64-вычислениями. Даже два Radeon R9 295X2, которые можно купить за цену одного TITAN Z, теоретически не могут обеспечить такую же производительность в расчетах двойной точности. Для игр TITAN Z будет совершенно нерациональным вложением денег — вдвое меньшей суммы достаточно, чтобы купить пару GeForce GTX 780 Ti либо один Radeon R9 295X2. Последняя карта практически эквивалентна TITAN Z по производительности в большинстве игровых тестов и, как правило, существенно превосходит его в FP32-вычислениях, на которых основаны популярные расчетные задачи (трассировка лучей, рендеринг видео и так далее).
Как любопытную альтернативу для игровой машины мы рассмотрели тандем двух Radeon R9 295X2, равный по цене одному TITAN Z. Но со того времени, как мы в последний раз обращались к теме четырех GPU в SLI/CrossFire, ситуация не изменилась. Разделение нагрузки между четырьмя графическими процессорами работает из рук вон плохо и подчас приводит даже к падению производительности.
А вот в вычислениях FP32 кластер из четырех GPU Hawaii обладает колоссальной производительностью. Кроме того, и скорость выполнения операций FP64 достигает уровня 1/4 от одного Radeon R9 295X2: не так уж плохо по сравнению с 1/3 у TITAN Z. В результате если речь идет исключительно о счетных задачах, то два R9 295X2 — вполне разумный выбор при смешанной нагрузке и однозначно лучший, если преобладает FP32.
Два TITAN Black в режиме SLI также представляют соблазнительную альтернативу TITAN Z. Все-таки это не столь безупречная двухпроцессорная видеокарта, какой в свое время был GeForce GTX 690. Как ни крути, а в целом TITAN Z медленнее, чем две отдельные платы. И даже преимущество компактности сводится на нет трехслотовой системой охлаждения. Два «Титана» также позволят подключить два 4К-монитора, что недоступно для TITAN Z.
Но главная претензия к «двухголовому Титану» — по поводу цены. Адаптер стоит на добрую тысячу долларов дороже двух TITAN Black. Трудно придумать оправдание для такой наценки. Если бы не это, TITAN Z можно было бы считать удачным нишевым продуктом для геймеров-энтузиастов и пользователей профессионального софта. Но при текущей цене это, пожалуй, не более чем своеобразное произведение инженерного искусства и свидетельство возможностей NVIDIA на нынешнем этапе противостояния с AMD.
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.