Обзор видеокарты GIGABYTE AORUS GeForce RTX 2070 XTREME: RTX для скептиков / Видеокарты

С момента летнего анонса графических процессоров NVIDIA мы посвятили немало страниц продуктам на основе нового кремния — GeForce RTX 2080, RTX 2080 Ti, да и самой архитектуре Turing. И судя по тому, как выступили в тестах старшие модели двадцатой серии, складывается впечатление, что главное в видеокартах RTX — это именно новые функции рендеринга, трассировка лучей и акселерация сетей машинного обучения, а вовсе не «сырая» производительность. Это особенно заметно на примере GeForce RTX 2080, который оказался полным аналогом GeForce GTX 1080 Ti в существующих играх и продается по сопоставимым ценам. Зато младшая модель, GeForce RTX 2070, по всей видимости, готова предложить то, чего хотят геймеры, без энтузиазма настроенные по отношению к трассировке лучей в компьютерных играх, а именно — больше FPS за те же деньги!

⇡#Технические характеристики

TU106 — единственный из трех процессоров архитектуры Turing, который дошел до потребительских устройств с нетронутой конфигурацией вычислительных блоков, в то время как GeForce RTX 2080 и RTX 2080 Ti получили урезанные варианты TU104 и TU102. По количеству CUDA-ядер одинарной точности и блоков наложения текстур RTX 2070 находится в промежутке между двумя устройствами на основе GP104 — GeForce GTX 1070 и GTX 1080. Кроме того, согласно референсным данным, RTX 2070 рассчитан на более низкие тактовые частоты, чем GTX 1080, а кристалл сам по себе содержит в полтора раза больше транзисторов. Неудивительно, что вопрос сравнения с GTX 1080 стоит для RTX 2070 столь же остро, как для RTX 2080 — с GTX 1080 Ti. Однако графическим процессорам Turing помогает обновленная архитектура потоковых мультипроцессоров (SM) и большой объем кешей L1 и L2. Благодаря этим нововведениям новинке будет проще достигнуть проектного быстродействия в реальных задачах, чем GTX 1080, пусть на бумаге чип семейства Pascal имеет большое преимущество. Наконец, GeForce RTX 2070 и GTX 1080 обладают одинаковой разрядностью шины памяти (256 бит), но пиковая пропускная способность у RTX 2070 на целых 40 % больше за счет микросхем GDDR6, работающих на скорости 14 Гбит/с на контакт, даже без учета прогрессивных алгоритмов компрессии цвета, появившихся в архитектуре Turing.

Блок-схема графического процессора NVIDIA TU106

Что касается логики трассировки лучей и обработки данных нейросетями (inference), то внутри потокового мультипроцессора Turing соотношение между вычислительными блоками различных типов, включая CUDA-ядра FP32, блоки наложения текстур, RT- и тензорные ядра, не зависит от общего количества SM, поэтому ошибочно считать, что новые функции даны GeForce RTX 2070 лишь для того, чтобы оправдать буквы RTX в названии. В играх, которые освоят новые приемы рендеринга, скорее всего, сохранится тот баланс быстродействия между различными моделями 20-й серии, который сегодня мы увидим в тестах стандартного ПО под Direct3D 11 и 12.

Производитель	NVIDIA
Название	GP104	GP102	GP100	GV100	TU106	TU104	TU102
Микроархитектура	Pascal	Pascal	Pascal	Volta	Turing	Turing	Turing
Техпроцесс, нм	16 nm FinFET	16 nm FinFET	16 nm FinFET	12 нм FFN	12 нм FFN	12 нм FFN	12 нм FFN
Число транзисторов, млн	7 200	12 000	15 300	21 100	10 800	13 600	18 600
Площадь чипа, мм2	314	471	610	815	445	545	754
Конфигурация SM/TPC/GPC
Число SM	20	30	60	84	36	48	72
Число TPC	20	30	30	42	18	24	36
Число GPC	4	6	6	6	3	6	6
Конфигурация потокового мультипроцессора (SM)
FP32-ядра	128	128	64	64	64	64	64
FP64-ядра	4	4	32	32	2	2	2
INT32-ядра	Н/Д	Н/Д	Н/Д	64	64	64	64
Тензорные ядра	Н/Д	Н/Д	Н/Д	8	8	8	8
RT-ядра	Н/Д	Н/Д	Н/Д	Н/Д	1	1	1
Программируемые вычислительные блоки GPU
FP32-ядра	2 560	3 840	3 840	5 376	2 304	3 072	4 608
FP64-ядра	80	120	1 920	2 688	72	96	144
INT32-ядра	Н/Д	Н/Д	Н/Д	5 376	2 304	3 072	4 608
Тензорные ядра	Н/Д	Н/Д	Н/Д	672	288	384	576
RT-ядра	Н/Д	Н/Д	Н/Д	Н/Д	36	48	72
Блоки фиксированной функциональности
TMU (блоки наложения текстур)	160	240	240	336	144	192	288
ROP	64	96	128	128	64	64	96
Конфигурация памяти
Объем кеша L1 / текстурного кеша, Кбайт	48	48	24	≤ 128 из 128, общий с разделяемой памятью	32/64 из 96 (общий с разделяемой памятью)	32/64 из 96 (общий с разделяемой памятью)	32/64 из 96 (общий с разделяемой памятью)
Объем разделяемой памяти / SM, Кбайт	96	96	64	≤ 96 из 128 (общий с кешем L1)	32/64 из 96 (общий с кешем L1)	32/64 из 96 (общий с кешем L1)	32/64 из 96 (общий с кешем L1)
Объем регистрового файла / SM, Кбайт	256	256	256	256	256	256	256
Объем регистрового файла / GPU, Кбайт	5 120	7 680	15 360	21 504	9 216	12 288	18 432
Объем кеша L2, Кбайт	2 048	3 072	4 096	6 144	4 096	4 096	6 144
Разрядность шины RAM, бит	256	384	4 096	4 096	256	256	384
Тип микросхем RAM	GDDR5/GDDR5X	GDDR5X	HBM2	HBM2	GDDR6	GDDR6	GDDR6

Шина NVLINK	Н/Д	Н/Д	4 × NVLink 1.0 x8	6 × NVLink 2.0 x8	Н/Д	1 × NVLink 2.0 x8	2 × NVLink 2.0 x8

Формально GeForce RTX 2070 пришел на замену GTX 1070, и в этой паре техническое преимущество Turing не вызывает сомнений, но рекомендованные розничные цены ($499 для партнерских видеокарт) сделали новинку преемником GeForce GTX 1080. Видеокарты Founders Edition, доступные напрямую от NVIDIA, в этом поколении стали дороже ($599 за GeForce RTX 2070 FE вместо $549 за GeForce GTX 1070 FE) и фактически конкурируют с топовыми модификациями сторонних производителей — повышенные тактовые частоты и качество конструкции это позволяют.

Производитель	NVIDIA
Модель	GeForce GTX 1070	GeForce GTX 1080	GeForce GTX 1080 Ti	GeForce RTX 2070	GeForce RTX 2080	GeForce RTX 2080 Ti
Графический процессор
Название	GP104	GP104	GP102	TU106	TU104	TU102
Микроархитектура	Pascal	Pascal	Pascal	Turing	Turing	Turing
Техпроцесс, нм	16 нм FinFET	16 нм FinFET	16 нм FinFET	12 нм FFN	12 нм FFN	12 нм FFN
Число транзисторов, млн	7 200	7 200	12 000	10 800	13 600	18 600
Тактовая частота, МГц: Base Clock / Boost Clock	1 506 / 1 683	1 607 / 1 733	1 480 / 1 582	1 410 / 1 620 (Founders Edition: 1 410 / 1 710)	1 515 / 1 710 (Founders Edition: 1 515 / 1 800)	1 350 / 1 545 (Founders Edition: 1 350 / 1 635)
Число шейдерных ALU	1 920	2 560	3 584	2304	2944	4352
Число блоков наложения текстур	120	160	224	144	184	272
Число ROP	64	64	88	64	64	88
Оперативная память
Разрядность шины, бит	256	256	352	256	256	352
Тип микросхем	GDDR5 SDRAM	GDDR5X SDRAM	GDDR5X SDRAM	GDDR6 SDRAM	GDDR6 SDRAM	GDDR6 SDRAM
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с)	2 000 (8 000)	1 250 (10 000)	1 376,25 (11 010)	1 750 (14 000)	1 750 (14 000)	1 750 (14 000)
Объем, Мбайт	8 192	8 192	11 264	8 192	8 192	11 264
Шина ввода/вывода	PCI Express 3.0 x16	PCI Express 3.0 x16	PCI Express 3.0 x16	PCI Express 3.0 x16	PCI Express 3.0 x16	PCI Express 3.0 x16
Производительность
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты)	6 463	8 873	11 340	7 465 / 7 880 (Founders Edition)	10 069 / 10 598 (Founders Edition)	13 448 / 14 231 (Founders Edition)
Производительность FP32/FP64	1/32	1/32	1/32	1/32	1/32	1/32
Пропускная способность оперативной памяти, Гбайт/с	256	320	484	448	448	616
Вывод изображения
Интерфейсы вывода изображения	DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b	DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b	DisplayPort 1.3/1.4, HDMI 2.0b	DisplayPort 1.4a, HDMI 2.0b	DisplayPort 1.4a, HDMI 2.0b	DisplayPort 1.4a, HDMI 2.0b
TBP/TDP, Вт	150	180	250	175/185 (Founders Edition)	215/225 (Founders Edition)	250/260 (Founders Edition)
Розничная цена (США, без налога), $	349 (рекомендованная) / 399 (Founders Edition, nvidia.com)	499 (рекомендованная) / 549 (Founders Edition, nvidia.com)	НД (рекомендованная) / 699 (Founders Edition, nvidia.com)	499 (рекомендованная) / 599 (Founders Edition, nvidia.com)	699 (рекомендованная) / 799 (Founders Edition, nvidia.com)	999 (рекомендованная) / 1 199 (Founders Edition, nvidia.com)
Розничная цена (Россия), руб.	НД (рекомендованная) / 31 590 (Founders Edition, nvidia.ru)	НД (рекомендованная) / 45 790 (Founders Edition, nvidia.ru)	НД (рекомендованная) / 52 990 (Founders Edition, nvidia.ru)	НД (рекомендованная) / 47 990 (Founders Edition, nvidia.ru)	НД (рекомендованная) / 63 990 (Founders Edition, nvidia.ru)	НД (рекомендованная) / 95 990 (Founders Edition, nvidia.ru)

На примере Founders Edition мы познакомились со старшими моделями 20-й серии, но в случае GeForce RTX 2070 сразу начнем с партнерских видеокарт. AORUS GeForce RTX 2070 — наиболее совершенная модификация RTX 2070 в каталоге GIGABYTE. Базовый вариант этого устройства (артикул GV-N2070AORUS-8GC) работает на более высоких тактовых частотах, чем RTX 2070 Founders Edition (1770 против 1710 МГц), а у версии XTREME (GV-N2070AORUS X-8GC) расчетная частота GPU под нагрузкой составляет 1815 МГц. Кроме того, в AORUS GeForce RTX 2070 XTREME разогнана оперативная память, пусть и на чисто символические 142 МГц эффективной частоты. Штатное энергопотребление видеокарт производитель не указывает, но оба устройства наверняка выходят за пределы 185 Вт, заявленных для GeForce RTX 2070 FE.

Во всяком случае тот аспект, в котором видеокарта GIGABYTE явно не уступает GTX 2070 Founders Edition, — это розничные цены: на площадке Newegg просят $599 за базовую AORUS GeForce RTX 2070 и $620 за версию XTREME. В России, напротив, цены начинаются с 46 865 руб., а это даже меньше, чем стоимость Founders Edition в официальном магазине NVIDIA. С другой стороны, самые доступные модификации GeForce RTX 2070, которые только можно найти на торговых площадках США и в московских интернет-магазинах, продаются за $500 либо 36 581 руб. Да и видеокарты прошлого поколения заметно упали в цене, после того как в продаже появились GeForce 20-й серии — вплоть до $470 за GeForce GTX 1080 и $449 за Vega 64. Российский рынок эту коррекцию принимает с опозданием, у нас GeForce RTX 2070 оказывается самым выгодным предложением в своей категории производительности, тогда как GTX 1080 и Vega 64 пока только начали терять в цене.

⇡#Конструкция

Пусть графический процессор TU106 относится к третьему эшелону чипов Turing, фактические характеристики кремния задают совсем иные требования к обвязке видеокарт, нежели у GP106. С такими габаритами, как у AORUS GeForce RTX 2070 XTREME, система охлаждения вполне смогла бы обслужить и более мощные GPU. По высоте видеокарта занимает три полных слота расширения, но большая часть объема приходится вовсе не на радиатор, а на блок вентиляторов. Разработчики поместили внутрь пластиковой рамы три крыльчатки диаметром 100 мм, но длину устройства удалось уменьшить за счет того, что ребра вентиляторов имеют разную высоту и их окружности пересекаются. Центральный вентилятор вращается по часовой стрелке, а боковые — против, благодаря чему снижается турбулентность воздушного потока. К счастью, столь сложная конструкция защищена от повреждений перекладинами кожуха, ведь посторонний предмет, попавший в лопасти, может мгновенно привести в негодность все три крыльчатки.

Когда видеокарта включена, каждый вентилятор окружен ярким ободком, который пропадает, как только кулер переходит в пассивный режим. Раскрыть иллюзию не так уж просто, ведь здесь нет ни прозрачных колец, ни спрятанных под вентиляторами источников света. На самом деле в одну из лопастей крыльчатки встроен RGB-светодиод, синхронизированный с тахометром вентилятора таким образом, что человек видит разноцветные полоски, медленно ползущие вокруг центра вращения.

Окошки с логотипом AORUS в торце и на задней поверхности кожуха имеют собственную подсветку. Оттенок и режим работы всех светодиодов регулируются фирменным ПО AORUS Engine. Вот только для того, чтобы постоянно лицезреть это великолепие, владельцу устройства GIGABYTE понадобится не только корпус с прозрачным окном, но и райзер PCI Express, позволяющий смонтировать видеокарту параллельно системной плате.

Охлаждение компонентов PCB выполняет радиатор, скрепленный пятью тепловыми трубками. В то время как иные производители используют для передачи тепла с кристалла GPU полированное основание, а подчас даже испарительную камеру, GIGABYTE предпочитает прямой контакт между чипом и расплющенными концами тепловых трубок. Для чипов памяти GDDR6 и компонентов регулятора напряжения (причем не только полевых транзисторов, но и дросселей с конденсаторами) к оребрению припаяны отдельные пластины. Даже алюминиевый щиток на задней стороне печатной платы участвует в охлаждении текстолита под микросхемами RAM.

⇡#Печатная плата

Первое, что бросается в глаза на PCB этой видеокарты, — семь разъемов для вывода изображения (три DisplayPort, три HDMI и USB Type-C с интерфейсом DisplayLink), в то время как GeForce RTX 2070 Founders Edition и большинство партнерских видеокарт имеют лишь пять. Но не все так просто: сам графический процессор способен одновременно использовать четыре выхода, а на плате нет коммутатора видеосигнала для того, чтобы преодолеть это ограничение. В итоге пользователю всегда доступны только три разъема — DisplayPort, HDMI и USB. Оставшиеся четыре разделены на два блока: активна либо пара DisplayPort, либо два HDMI — в зависимости от того, к какому блоку подключено устройство вывода изображения. Причем сменить конфигурацию на лету нельзя, активный блок разъемов определяется при перезагрузке компьютера.

Напряжение на видеокарту подается по шести- и восьмиконтактному разъемам, что в комбинации с силовыми линиями слота PCI-Express обеспечивает резерв мощности в 300 Вт. VRM содержит 10 фаз питания графического процессора и две — чипов GDDR6 (GeForce RTX 2070 Founders Edition ограничена формулой 6+2). На текстолите пустуют места для распайки элементов двух дополнительных фаз питания GPU — по всей видимости, такая же плата, но с полностью укомплектованным VRM, лежит в основе модели AORUS GeForce RTX 2070 WATERFORCE. Как и в Founders Edition, здесь используются только твердотельные конденсаторы и полевые транзисторы с интегрированным драйвером, а также сразу два ШИМ-контроллера uPI uP9512P (разработчики не пошли по простому пути удвоения фаз), которые умеют варьировать число активных фаз для поддержания высокого КПД во всем диапазоне потребляемой мощности.

Микросхемы памяти с маркировкой 8SA77 D9WCW выпущены на фабрике Micron и характеризуются пропускной способностью 14 Гбит/с на контакт. Говорят, что NVIDIA уже применяет аналогичные чипы Samsung в потребительских видеокартах семейства Turing, но нам такие устройства пока не попадались.