Сегодня 22 декабря 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Видеокарты

Обзор NVIDIA GeForce GTX TITAN Z: в этот раз было нелегко

⇣ Содержание

Двухпроцессорная графическая карта была обязательным пунктом в списке планов NVIDIA начиная с серии GeForce 7000. Запуск видеоадаптера на базе двух GPU GK110 был ожидаем с тех пор, как появились первые потребительские продукты на базе этого процессора. Однако с точки зрения человека, не посвященного в планы NVIDIA, перспективы такого устройства выглядели неоднозначно. Уж слишком велики и цена, и энергопотребление столь крупных GPU, изготовленных по техпроцессу 28 нм.

Топовые видеоадаптеры NVIDIA в текущем поколении стали беспрецедентно дорогими. Если рекомендованная цена GeForce GTX 780 Ti составляет $699, то сколько же должен стоить двухпроцессорный флагманский адаптер? Неудивительно, что в конце концов видеокарта с двумя чипами GK110 так и не появилась в игровой линейке GeForce 700, но вышла под маркой TITAN.

Семейство GeForce GTX TITAN имеет для NVIDIA двойное назначение. С одной стороны, в «Титаны» попадают продукты для геймеров-энтузиастов, обладающие максимальной игровой производительностью. Оригинальный GTX TITAN какое-то время был единственным продуктом на базе GK110. Сменивший его GTX TITAN Black просто работает на более высоких частотах по сравнению с GeForce GTX 780 Ti.

С другой стороны, TITAN — это высокопроизводительные устройства для вычислений в профессиональных областях. В то время как концепция GPGPU получает все более широкое распространение и признание, покупатель уже не может получить максимальную производительность в «счетных» задачах в нагрузку к игровому GPU, как это было в предыдущие годы.

NVIDIA заложила разделение по расчетным возможностям в саму архитектуру GPU. Операции с плавающей точкой двойной точности (FP64) в чипах Kepler выполняются специальными ядрами CUDA. И только GK110 из всей линейки имеет 64 FP64-совместимых ядра CUDA в каждом блоке SMX (Streaming Multiprocessor). Поскольку SMX содержит 192 обычных ядра, выполняющих операции одинарной точности, производительность GK110 в расчетах FP64 составляет 1/3 от производительности в расчетах FP32.

Все остальные GPU в линейке Kepler довольствуются восемью FP64-совместимыми ядрами CUDA в каждом SMX, что дает производительность на уровне всего лишь 1/24 от FP32. Но кроме того, в игровых моделях GeForce на базе GK110 ядра FP64 работают на частоте 1/8 от частоты GPU, что приводит все к тому же соотношению производительности FP64 к FP32 — 1/24. Только «Титаны» лишены этого ограничения, обладая максимальным для GK110 быстродействием в FP64.

Фактически по вычислительным возможностям TITAN Black не уступает профессиональным ускорителям Quadro K6000 и Tesla K40, которые также основаны на полностью функциональной ревизии чипа GK110, только стоят свыше 4 тыс. долларов.

Таким образом, видеоадаптер с двумя GK110 должен позиционироваться в качестве ускорителя для научных, финансовых и инженерных вычислений — всех тех задач, в которых используются операции двойной точности. И для него вполне оправданно четырехзначное число на ценнике. С другой стороны, мы имеем новый фетиш для энтузиастов и статусный продукт, который поддерживает заявку NVIDIA на лидерство в традиционной сфере применения GPU — 3D-графике и компьютерных играх.

В этом качестве GeForce GTX TITAN Z встретил сильного конкурента в лице Radeon R9 295X2 на базе двух чипов Hawaii. Двухпроцессорный флагман AMD не уступает в производительности двум отдельным адаптерам Radeon R9 290X и одновременно стоит вдвое дешевле, чем TITAN Z. Единственное слабое место R9 295X2 в противостоянии с TITAN Z ­– скорость вычислений двойной точности.

Процессор Hawaii включает полностью аппаратные планировщики, выполняющие разрешение зависимостей и формирование очереди операций — в отличие от архитектуры Kepler, в которой эти функции возложены на драйвер. Подход AMD более эффективен для расчетных задач, кроме того, в архитектуре GCN все потоковые процессоры способны исполнять FP64-операции за два такта, что дает производительность на уровне 1/2 от скорости вычислений одинарной точности. Но в десктопных устройствах на базе Hawaii искусственно установлено соотношение 1/8. Полная скорость зарезервирована для профессиональных ускорителей FirePro. Даже собрав систему из двух Radeon R9 295X2 за цену единственного TITAN Z, мы получим 1/4 производительности отдельной двухголовой видеокарты в режиме FP64.

#Технические характеристики

Мощность GK110 была главной проблемой для разработчиков GeForce GTX TITAN Z. В прошлый раз, когда флагманским GPU NVIDIA был относительно компактный GPU GK104, удалось создать двухпроцессорную карту — GeForce GTX 690, которая практически не уступала в производительности паре отдельных GTX 680. Повторить это достижение с чипами GK110, которые в составе отдельных адаптеров развивают мощность 250 Вт, — серьезная задача.

AMD решила эту проблему для Radeon R9 295X2 за счет системы водяного охлаждения. Но GeForce GTX TITAN Z использует воздушный кулер, явно неспособный отвести от платы 500 Вт тепла. Карта имеет TDP 375 Вт — ровно столько, сколько по спецификациям могут обеспечить два восьмиконтактных разъема питания, которыми оснащена карта, в сочетании с разъемом PCI-E x16.

Как следствие, компромисс в тактовых частотах был неизбежен. TITAN Z имеет наименьшую базовую частоту среди всех моделей на базе GK110 — 706 МГц. С другой стороны, у него наибольшая дельта между базовой частотой и boost clock — 180 МГц, которая дает карте пространство для ускорения в благоприятных условиях. GPU даже способен на короткие броски к частоте 1058 МГц — на 352 МГц выше базовой! Видеопамять общим объемом 12 Гбайт работает на эффективной частоте, характерной для GTX 780 Ti и TITAN Black, — 7000 МГц.

Модель Графический процессор Видеопамять Шина ввода/вывода Вывод изображения TDP, Вт
Кодовое название Число транзисторов,
млн
Техпроцесс,
нм
Тактовая частота,
МГц: Base Clock / Boost Clock
Число ядер CUDA Число текстурных блоков Число ROP Разрядность шины,
бит
Тип микросхем Тактовая частота: реальная (эффективная),
МГц
Объем,
Мбайт
Интерфейсы (макс разрешение@частота кадров,
Гц)
Порты вывода
GeForce GTX 780 GK110 7 100 28 863/900 2304 192 48 384 GDDR5 SDRAM 1502 (6008) 3072 PCI-Express 3.0 x16 VGA (2048x1536@85),
DL DVI (2560x1600@60),
HDMI 1.4a (4096х2160@24),
DisplayPort 1.2 (4096x2160@60)
1 х DL DVI-I,
1 x DL DVI-D,
1 x DisplayPort,
1 x HDMI
250
GeForce GTX 780 Ti GK110 7 100 28 875/928 2880 240 48 384 GDDR5 SDRAM 1750 (7000) 3072 PCI-Express 3.0 x16 VGA (2048x1536@85),
DL DVI (2560x1600@60),
HDMI 1.4a (4096х2160@24),
DisplayPort 1.2 (4096x2160@60)
1 х DL DVI-I,
1 x DL DVI-D,
1 x DisplayPort,
1 x HDMI
250
GeForce GTX TITAN Black GK110 7 100 28 889/980 2880 240 48 384 GDDR5 SDRAM 1750 (7000) 6144 PCI-Express 3.0 x16 VGA (2048x1536@85),
DL DVI (2560x1600@60),
HDMI 1.4a (4096х2160@24),
DisplayPort 1.2 (4096x2160@60)
1 х DL DVI-I,
1 x DL DVI-D,
1 x DisplayPort,
1 x HDMI
250
GeForce GTX TITAN Z GK110 7 100 28 705/876 2880 240 48 2 x 384 GDDR5 SDRAM 1750 (7000) 2 x 6144 PCI-Express 3.0 x16 VGA (2048x1536@85),
DL DVI (2560x1600@60),
HDMI 1.4a (4096х2160@24),
DisplayPort 1.2 (4096x2160@60)
1 х DL DVI-I,
1 x DL DVI-D,
1 x DisplayPort,
1 x HDMI
375

Судя по объявленным спецификациям, понижение базовой частоты существенно сказалось на скорости карты. Пиковая расчетная производительность GTX TITAN Z составляет 8 TFLOPS, притом что GTX TITAN Black выдает на-гора 5 TFLOPS в FP32.

По конфигурации вычислительных блоков GPU TITAN Z не отличается от TITAN Black. Про графический процессор GK110 более подробно вы можете прочитать в статье, посвященной оригинальному GeForce GTX TITAN, а архитектура Kepler в целом описана в обзоре GeForce GTX 680.

#Конструкция

Общие принципы дизайна TITAN Z унаследовал от предыдущей двухголовой видеокарты NVIDIA — GeForce GTX 690, только на этот раз кулер не двух-, а трехслотовый. Кожух системы охлаждения металлический, с прозрачными окошками, в которых видно черные радиаторы GPU. Задняя поверхность платы покрыта толстой алюминиевой пластиной, которая добавляет изрядную долю к общему немаленькому весу устройства. Назначение пластины не только декоративное. Она охлаждает микросхемы памяти, расположенные под ней.

Чисто эстетически «двухголовый Титан» производит сильное впечатление. Топовые однопроцессорные адаптеры NVIDIA, выполненные в таком же дизайне, прекрасно выглядят, но, держа в руках TITAN Z, чувствуешь настоящую мощь. Внешность, достойная такого дорогого и совершенного устройства.

Аксиальный вентилятор продувает воздух сквозь отдельные радиаторы, расположенные по сторонам. Не в пример турбинным кулерам, применяемым в однопроцессорных картах NVIDIA референсного дизайна, часть горячего воздуха он выбрасывает внутрь корпуса ПК. Кроме того, аксиальный вентилятор не позволяет разместить никакую другую плату вплотную к видеоадаптеру, тогда как турбинка при необходимости это допускает. Следовательно, в корпусе TITAN Z оккупирует не три, а все четыре слота расширения. В этом плане двухголовая карта не дает никакого выигрыша по сравнению с двумя GeForce GTX TITAN Black, установленными вплотную друг к другу.

Выхлопная решетка занимает половину крепежной пластины. Оставшаяся площадь использована для видеовыходов — в такой же конфигурации, как и на прочих топовых адаптерах NVIDIA: два порта DVI плюс полноформатные разъемы HDMI и DisplayPort. Поскольку один GPU может использовать четыре порта одновременно, возможности второго остаются незадействованными. В таком классе устройств (и за такие деньги) хотелось бы видеть больше разъемов DisplayPort 1.2 (пусть и в Mini-варианте, как на Radeon R9 295X2). Возможность подключить к одному ПК больше четырех мониторов не так уже важна, но в существующем варианте только один из них может иметь разрешение Ultra HD.

GPU охлаждают довольно компактные радиаторы, но в основание каждого вмонтирована испарительная камера. Металлическая рама покрывает лицевую поверхность платы. Платформа, на которой закреплен вентилятор, представляет собой еще один отдельный радиатор, прижатый к транзисторам системы питания и коммутатору шины PCI-E.

#Плата

По сравнению с GeForce GTX 690 разводка платы радикально усложнилась. Неудивительно, если принять во внимание 384-битную шину памяти каждого GPU и 12 Гбайт RAM. Графические процессоры соединяет коммутатор PCI-E 3.0 PLX PEX8747, который мы ранее видели на том же GTX 690. Чипы памяти SK hynix H5GQ2H24BFR-R2C рассчитаны на эффективную частоту 7 ГГц.

Система питания не отличается по конфигурации фаз от того, что было в GeForce GTX 690. Каждый GPU получил по пять фаз, две фазы отданы для питания чипов памяти, и еще одна фаза — для PLL. Особенность TITAN Z в том, что принадлежность фаз к отдельным GPU не фиксирована. Один из чипов может в какой-то момент времени пользоваться большим числом фаз, чем другой, если его энергопотребление выше.

Контроллеры питания используются те же, что и в других референсных картах на базе GK110, — ON NCP4206.

Следующая страница →
 
⇣ Содержание
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.

window-new
Soft
Hard
Тренды 🔥
Foxconn немного охладела к покупке Nissan, но вернётся к этой теме, если слияние с Honda не состоится 15 мин.
В следующем году выйдет умная колонка Apple HomePod с 7-дюймовым дисплеем и поддержкой ИИ 40 мин.
Продажи AirPods превысили выручку Nintendo, они могут стать третьим по прибыльности продуктом Apple 2 ч.
Прорывы в науке, сделанные ИИ в 2024 году: археологические находки, разговоры с кашалотами и сворачивание белков 10 ч.
Arm будет добиваться повторного разбирательства нарушений лицензий компанией Qualcomm 14 ч.
Поставки гарнитур VR/MR достигнут почти 10 млн в 2024 году, но Apple Vision Pro занимает лишь 5 % рынка 16 ч.
Первая частная космическая станция появится на два года раньше, но летать на неё будет нельзя 17 ч.
В США выпущены федеральные нормы для автомобилей без руля и педалей 17 ч.
Для невыпущенного суперчипа Tachyum Prodigy выпустили 1600-страничное руководство по оптимизации производительности 19 ч.
Зонд NASA «Паркер» пошёл на рекордное сближение с Солнцем 19 ч.