Обзор видеокарты NVIDIA GeForce GTX 1660 Ti: ближе к народу / Видеокарты

Титульная функция новых видеокарт NVIDIA — трассировка лучей в реальном времени — уже проявила себя в первых играх, где она широко используется для формирования достоверных отражений и глобального освещения (Battlefield V и Metro Exodus), а на очереди еще несколько больших проектов, которые получат поддержку DXR (расширения API Direct3D 12 для Ray Tracing). Но среди геймеров не утихают споры о том, правильно ли поступила NVIDIA, поставив во главу угла передовые методы рендеринга вместо «сырой» производительности графических процессоров.

Те покупатели, которые не видят у трассировки лучей больших перспектив в компьютерных играх, с радостью согласились бы изъять из ускорителей GeForce RTX всю логику, обслуживающую эту функцию, в обмен на рост быстродействия в играх старого образца. Каким бы он стал — Turing без RTX? Конечно, NVIDIA не собирается выпускать аналог GeForce RTX 2080 или RTX 2080 Ti без RT-ядер специально для неверующих. С другой стороны, компании придется рано или поздно заменить всю серию GeForce 10 устройствами на основе GPU, выпущенных по технологии 12 нм. Так где же на ценовой линейке NVIDIA проведет отметку, ниже которой аппаратная трассировка лучей уже лишена практического смысла?

Теперь нам известен ответ на этот вопрос. GeForce RTX 2060 остался наиболее доступным представителем нового поколения, который обладает совместимостью с DXR, а «Тьюринги» бюджетной категории выделили в новую серию, GeForce 16, которая занимает промежуточное положение между GeForce 10 и GeForce 20. И родоначальником этой серии стал GeForce GTX 1660 Ti. Как мы помним, RTX 2060 уже оказался весьма выгодным предложением по соотношению цены и быстродействия в «старых» играх на фоне общего удорожания видеокарт NVIDIA. Посмотрим, чем продолжилось шествие архитектуры Turing — уже без RTX — в зоне ниже $300.

⇡#Графический процеcсор TU116

Для того, чтобы выпустить графическую карту на основе архитектуры Turing и прогрессивного техпроцесса 12 нм FinFET, но отбросить функции, связанные с аббревиатурой RTX (трассировку лучей и аппаратное ускорение нейронных сетей), NVIDIA пришлось создать отдельную модель графического процессора — TU116. Как ни крути, а TU106 — «младший из старших» чипов семейства Turing, уже применяется в двух ускорителях серии GeForce RTX — 2060 и 2070. Подвергнуть его дальнейшей деконструкции ради GeForce GTX 1660 Ti едва ли было бы целесообразно с экономической точки зрения.

Блок-схема TU116 производит такое впечатление, как будто никакого RTX не было и в помине, а микроархитектура Turing отличается от предшествующей Pascal лишь в части организации функциональных блоков, выполняющих традиционные функции рендеринга. Скальпель инженеров NVIDIA отсек лишь новые компоненты — тензорные и RT-ядра — а по другим параметрам TU116 отличается от TU106 в основном количественным, нежели качественным образом. Так, наряду с CUDA-ядрами, выполняющими операции стандартной точности над числами с плавающей запятой (FP32), внутри потокового мультипроцессора (SM — Streaming Multiprocessor) TU116 есть равное количество ядер для целочисленных операций (INT32), которые активно используются не только в расчетных задачах, но и в шейдерном коде компьютерных игр. Если точнее, целочисленные и FP-ALU, объединенные внутри CUDA-ядра, в архитектуре Turing получили раздельные каналы передачи данных, и это позволяет диспетчерам команд в течение двух тактов полностью нагрузить SM операциями того и другого типа.

Блок-схема графического процессора NVIDIA TU116

С другой стороны, TU116 не уступает прочим чипам архитектуры Turing в способности выполнять операции половинной точности (FP16) с пропускной способностью в отношении 2:1 к операциями FP32. Это неожиданное и даже подозрительное качество для чипа, который создали специально для условно бюджетных графических карт, лишенных функций RTX. Дело вот в чем: операции FP16 в старших «Тьюрингах» выполняются силами тензорных ядер, даже если приложение напрямую не обращается к ним через API CUDA. Конечно, формат FP16 уже нашел применение в компьютерной графике для шейдерных программ, не требующих более точного представления данных: самый яркий пример — это Wolfenstein II: The New Colossus, шейдеры половинной точности также применяются в Far Cry 5. Но честно говоря, трудно поверить, что NVIDIA потратила время разработчиков и площадь чипа (наверняка существенную) специально ради таких, по-прежнему маргинальных в играх на ПК, ситуаций. Двойную мощность в операциях FP16 проще объяснить тем, что тензорные ядра на самом деле есть в кремнии TU116. NVIDIA просто редуцировала их управляющую логику, либо, что более вероятно, заблокировала доступ программным путем (в первую очередь, для DLSS), чтобы лучше дифференцировать GeForce GTX 1660 Ti и GeForce RTX 2060, которые в остальном довольно-таки близки по своему вычислительному потенциалу.

Производитель	NVIDIA
Название	GP106	GP104	TU116	TU106	TU104
Микроархитектура	Pascal	Pascal	Turing	Turing	Turing
Техпроцесс, нм	16 nm FinFET	16 nm FinFET	12 нм FFN	12 нм FFN	12 нм FFN
Число транзисторов, млн	4400	7 200	6 600	10 800	13 600
Площадь чипа, мм2	200	314	284	445	545
Конфигурация SM/TPC/GPC
Число SM	10	20	24	36	48
Число TPC	5	20	12	18	24
Число GPC	2	4	3	3	6
Конфигурация потокового мультипроцессора (SM)
FP32-ядра	128	128	64	64	64
FP64-ядра	4	4	2	2	2
INT32-ядра	Нет	Нет	64	64	64
Тензорные ядра	Нет	Нет	Нет	8	8
RT-ядра	Нет	Нет	Нет	1	1
Объем кеша L1, Кбайт	48	48	32/64 из 96 (общий с разделяемой памятью)	32/64 из 96 (общий с разделяемой памятью)	32/64 из 96 (общий с разделяемой памятью)
Объем разделяемой памяти, Кбайт	96	96	32/64 из 96 (общий с кешем L1)	32/64 из 96 (общий с кешем L1)	32/64 из 96 (общий с кешем L1)
Объем регистрового файла, Кбайт	256	256	256	256	256
Программируемые вычислительные блоки GPU
FP32-ядра	1280	2 560	1 536	2 304	3 072
FP64-ядра	40	80	48	72	96
INT32-ядра	Нет	Нет	1 536	2 304	3 072
Тензорные ядра	Нет	Нет	Нет	288	384
RT-ядра	Нет	Нет	Нет	36	48
Блоки GPU фиксированной функциональности
TMU (блоки наложения текстур)	80	160	96	144	192
ROP	48	64	48	64	64
Конфигурация памяти
Объем кеша L2, Кбайт	1 536	2 048	1 536	4 096	4 096
Разрядность шины RAM, бит	192	256	192	256	256
Тип микросхем RAM	GDDR5	GDDR5/GDDR5X	GDDR6	GDDR6	GDDR6

Интерфейс SLI/NVLINK	Нет	2 × SLI Gen. 2	Нет	Нет	1 × NVLink 2.0 x8

Что бы в действительности ни произошло с тензорными ядрами TU116, новый чип трудно сравнить по площади и количеству транзисторов с TU106: эти параметры NVIDIA уменьшила на 26 и 39 % соответственно. В результате по транзисторному бюджету TU116 оказался в промежутке между двумя чипами предыдущего поколения — GP106 и GP104, а по числу главных исполнительных блоков (32-битных CUDA-ядер и текстурных модулей) ближе к первой, нежели второй модели. У TU116 и GP106 одинаковый объем кеш-памяти второго уровня (1,5 Мбайт), регистрового файла в пересчете на один SM (256 Кбайт) и разрядность шины RAM (192 бит).

Вместе с тем, чипы архитектуры Turing отличаются от Pascal массой оптимизаций конвейера, которые в совокупности позволяют лучше раскрыть теоретическую производительность GPU в реальных задачах. Это и кеш первого уровня, обладающий сниженной латентностью за счет слияния с разделяемой памятью, и отдельный кеш инструкций нулевого уровня, и возможность относительно независимой планировки потоков. По оценкам NVIDIA, пропускная способность Turing в шейдерных расчетах была увеличена в полтора раза по сравнению с Pascal.А среди функций рендеринга в рамках растеризации — набор проприетарных методов, таких как исполнение шейдеров с переменной выборкой (Variable Rate Shading). Но для того, чтобы описать суть и результаты всех нововведений, нам пришлось бы повторить добрую часть вводной статьи, посвященной архитектуре Turing — лучше освежите память с ее помощью.

NVIDIA TU116

NVIDIA TU106

⇡#Технические характеристики, цена

В составе GeForce GTX 1660 Ti используется полностью функциональная версия TU116, которая несет 1536 шейдерных ALU (32-битных CUDA-ядер) и 96 блоков наложения текстур. По сравнению с GeForce RTX 2060 младшая модель сохранила 80 % данных вычислительных ресурсов, но, благодаря тому, что GTX 1660 Ti характеризуется наивысшими тактовыми частотами в таблице референсных спецификаций ускорителей на чипах Turing, по теоретическому быстродействию в операциях с плавающей запятой стандартной точности (FP32) и скорости наложения текстур он отвоевал уже 84 % вычислительной мощности GeForce RTX 2060.

Если же сравнивать GTX 1660 Ti с видеокартами семейства GeForce 10, то новинка дает хорошее представление о тех преимуществах, которые подарили видеокартам NVIDIA техпроцесс 12 нм и архитектура Turing, не обремененная тензорными (если верить NVIDIA) и RT-ядрами. Так, GeForce GTX 1060 и GeForce GTX 1660 Ti работают в рамках одинакового резерва мощности (120 Вт) и близки по тактовым частотам (Boost Clock у этих моделей достигает 1708 и 1770 МГц соответственно). Но в новом чипе инженеры NVIDIA смогли поместить на 20 % больше 32-битных CUDA-ядер и текстурных блоков, а пиковая производительность в операциях FP32, как следствие, увеличилась на 24 %.

Производитель	NVIDIA
Модель	GeForce GTX 1060 6 Гбайт	GeForce GTX 1070	GeForce GTX 1660 Ti	GeForce RTX 2060	GeForce RTX 2070	GeForce RTX 2080	GeForce RTX 2080 Ti
Графический процессор
Название	GP106	GP104	TU116	TU106	TU106	TU104	TU102
Микроархитектура	Pascal	Pascal	Turing	Turing	Turing	Turing	Turing
Техпроцесс, нм	16 нм FinFET	16 нм FinFET	12 нм FFN	12 нм FFN	12 нм FFN	12 нм FFN	12 нм FFN
Число транзисторов, млн	4400	7 200	6 600	10 800	10 800	13 600	18 600
Тактовая частота, МГц: Base Clock / Boost Clock	1506/1708	1 506 / 1 683	1500/1770	1365/1680	1 410 / 1 620 (Founders Edition: 1 410 / 1 710)	1 515 / 1 710 (Founders Edition: 1 515 / 1 800)	1 350 / 1 545 (Founders Edition: 1 350 / 1 635)
Число шейдерных ALU	1280	1 920	1536	1920	2304	2944	4352
Число блоков наложения текстур	80	120	96	120	144	184	272
Число ROP	48	64	48	48	64	64	88
Оперативная память
Разрядность шины, бит	192	256	192	192	256	256	352
Тип микросхем	GDDR5 SDRAM	GDDR5 SDRAM	GDDR6 SDRAM	GDDR6 SDRAM	GDDR6 SDRAM	GDDR6 SDRAM	GDDR6 SDRAM
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с)	2000 (8000) 2250 (9000)	2 000 (8 000)	1 500 (12 000)	1 750 (14 000)	1 750 (14 000)	1 750 (14 000)	1 750 (14 000)
Объем, Мбайт	6 144	8 192	6 144	6 144	8 192	8 192	11 264
Шина ввода/вывода	PCI Express 3.0 x16	PCI Express 3.0 x16	PCI Express 3.0 x16	PCI Express 3.0 x16	PCI Express 3.0 x16	PCI Express 3.0 x16	PCI Express 3.0 x16
Производительность
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты)	4372	6 463	5437	6451	7 465 / 7 880 (Founders Edition)	10 069 / 10 598 (Founders Edition)	13 448 / 14 231 (Founders Edition)
Производительность FP32/FP64	1/32	1/32	1/32	1/32	1/32	1/32	1/32
Производительность FP32/FP16	1/128	1/128	2/1	2/1	2/1	2/1	2/1
Пропускная способность оперативной памяти, Гбайт/с	192/216	256	288	336	448	448	616
Вывод изображения
Интерфейсы вывода изображения	DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b	DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b	DL DVI-D, DisplayPort 1.4a, HDMI 2.0b	DL DVI-D, DisplayPort 1.4a, HDMI 2.0b	DL DVI-D, DisplayPort 1.4a, HDMI 2.0b	DisplayPort 1.4a, HDMI 2.0b	DisplayPort 1.4a, HDMI 2.0b
TBP/TDP, Вт	120	150	120	160	175/185 (Founders Edition)	215/225 (Founders Edition)	250/260 (Founders Edition)
Розничная цена (США, без налога), $	249 (рекомен-дованная) / 299 (Founders Edition, nvidia.com)	349 (рекомен-дованная) / 399 (Founders Edition, nvidia.com)	279 (рекомен-дованная)	349 (рекомен-дованная) / 349 (Founders Edition, nvidia.com)	499 (рекомен-дованная) / 599 (Founders Edition, nvidia.com)	699 (рекомен-дованная) / 799 (Founders Edition, nvidia.com)	999 (рекомен-дованная) / 1 199 (Founders Edition, nvidia.com)
Розничная цена (Россия), руб.	НД (рекомен-дованная) / 22 990 (Founders Edition, nvidia.ru)	НД (рекомен-дованная) / 31 590 (Founders Edition, nvidia.ru)	22 990 (рекомен-дованная)	НД (рекомен-дованная) / 31 990 (Founders Edition, nvidia.ru)	НД (рекомен-дованная) / 47 990 (Founders Edition, nvidia.ru)	НД (рекомен-дованная) / 63 990 (Founders Edition, nvidia.ru)	НД (рекомен-дованная) / 95 990 (Founders Edition, nvidia.ru)

Как мы уже поняли, GeForce GTX 1660 Ti по своим основным характеристикам является продолжателем традиций серии GeForce RTX, только без трассировки лучей и с поправкой на иной набор вычислительных блоков. Вот еще одна черта, которая роднит GeForce GTX 1660 Ti со старшими «Тьюрингами», — кадровый буфер на основе микросхем GDDR6. Однако пропускная способность шины памяти (ПСП), которую дают чипы номинала 14 Гбит/с на контакт, TU116 ни к чему, поэтому новинка довольствуется скоростью 12 Гбит/с. Как бы то ни было, итоговая ПСП у GTX 1660 Ti на 33 % выше по сравнению с модификациями GeForce GTX 1060 второй волны, которые оснащаются чипами GDDR5 9 Гбит/с.

В итоге GeForce GTX 1660 Ti можно охарактеризовать как модернизированный аналог GeForce GTX 1060, который за счет усиленного набора вычислительных блоков сделал крупный шаг в сторону GeForce GTX 1070. Но не будем забывать и о том, что в практических задачах чипам архитектуры Turing проще достигнуть своей теоретической производительности, чем их прародителям из семейства Pascal, благодаря оптимизированной структуре потокового мультипроцессора, увеличенному кешу первого уровня и другим не столь существенным нововведениям — это уже доказали видеокарты под маркой GeForce RTX. Так что в предварительных оценках реального быстродействия все-таки нужно поместить GTX 1660 Ti ближе к GTX 1070, нежели к GTX 1060.

GeForce GTX 1660 Ti поступит в продажу по рекомендованной стоимости $279. Как видим, NVIDIA и в этом случае продает новую видеокарту дороже, чем ее прямого предшественника (GeForce GTX 1060 стартовал на отметке $249), хотя ни о какой трассировке лучей уже речи не идет. Но прежде чем в очередной раз возмутиться алчности производителя, стоит окинуть взглядом положение дел, которое сложилось на рынке потребительских видеокарт ценой до $400.

Ближайшая модель серии GeForce RTX — 2060 — обладает рекомендованной стоимостью $349, и такую же цену получил в начале своего пути GeForce GTX 1070. А ведь GeForce GTX 1660 Ti наверняка не слишком отличается от последнего по быстродействию в играх. С другой стороны, формальный конкурент GTX 1660 Ti — Radeon RX 590 — сейчас стоит не меньше $259, хотя начинал с $279. Получается, и тут продукт NVIDIA стартовал с более низкой позиции.

Что касается российского рынка, то для GTX 1660 Ti объявлена рекомендованная цена в 22 990 рублей, но едва ли она удержится долго, ведь за такие деньги уже можно купить одну из простейших модификаций GeForce RTX 2060, а Radeon RX 590 у нас стоит от 18 660 р. Какими бы ни были розничные цены первых партий GeForce GTX 1660 Ti, геймерам, рассматривающим видеокарты этой категории, стоит повременить с покупкой — прайс-листы наверняка будет сильно штормить.

⇡#GIGABYTE GeForce GTX 1660 Ti OC: конструкция

Для знакомства с физическим воплощением GeForce GTX 1660 Ti нам прислали видеокарту GIGABYTE. Нет сомнений, что эта фирма выпустит несколько устройств на чипе TU116 для покупателей с разным уровнем потребностей и достатка. Но перед нами явно бюджетное устройство — это видно уже по маркировке, в которой нет сокращенных слов AORUS и WINDFORCE, сигнализирующих о принадлежности к более изысканным маркам в каталоге GIGABYTE. Однако это как раз к лучшему, ведь на сей раз речь идет о массовой видеокарте, которую следует изучить, убрав из уравнения такие переменные, как избыточно мощная система охлаждения и отбор кристаллов GPU с наилучшим частотным потенциалом.

Впрочем, наш экземпляр GIGABYTE GeForce GTX 1660 Ti имеет маркировку OC, которая указывает на заводской оверклокинг. Не известно, сколь сильно производитель увеличил частоты GPU, — точных спецификаций этой видеокарты нам не сообщили, а базовую частоту устройств на чипах Turing партнеры NVIDIA практически никогда не меняют. Но едва ли GIGABYTE GeForce GTX 1660 Ti разогнана настолько, чтобы дать TU116 неоправданное преимущество в тестах, где мы столкнем ее с референсными устройствами NVIDIA и AMD.

Внешний вид и особенности конструкции GIGABYTE GeForce GTX 1660 Ti не нуждаются в подробном описании. Корпус ускорителя целиком сделан из пластика — даже защитная панель на обратной стороне печатной платы выполнена из него же. Но если честно, металлический щиток, который монтируют на PCB более дорогих моделей, порой тоже выполняет чисто декоративную функцию и не участвует в охлаждении компонентов. Иных украшений видеокарта лишена. В частности, на ней нет ни единого светодиода, не говоря уже об RGB-подсветке или возможности питания светодиодных лент.

За охлаждение устройства отвечают два вентилятора диаметром 87 мм — здесь тоже нет никаких изысков, но применяется решение, которое GIGABYTE и некоторые другие производители ввели для снижения турбулентности воздушного потока: крыльчатки вращаются в противоположные стороны.

Радиатор кулера представляет собой простую конструкцию из блока алюминиевых ребер и плоского основания, которое накрывает графический процессор и чипы памяти GDDR6. Единственная теплотрубка диаметром 5 мм согнута в S-образную форму и пропущена через основание радиатора таким образом, что ее середина примыкает к кристаллу GPU. К чести производителя, стоит выделить тот факт, что компоненты регулятора напряжения тоже отдают тепло основному радиатору СО вместо отдельного «огрызка», как это часто делали в недорогих устройствах прошлых лет, причем активное охлаждение получили не только полевые транзисторы с интегрированным драйвером, но и дроссели VRM.

⇡#GIGABYTE GeForce GTX 1660 Ti OC: печатная плата

Пластиковый кожух, который обернут вокруг свободного конца печатной платы GIGABYTE GeForce GTX 1660 Ti, маскирует ее небольшие габариты. На основе этой PCB вполне можно сделать видеокарту форм-фактора Mini-ITX, и, если судить по пустующим площадкам для двух чипов GDDR6, она уже используется в составе какого-то другого устройства на чипе семейства Turing, причем с 256-битной шиной памяти. Среди всех продуктов серии GeForce RTX есть лишь один подходящий кандидат — RTX 2070, а чипы TU116 и TU106, выходит, являются электрически взаимозаменяемыми. Преобразователь напряжения GIGABYTE GeForce GTX 1660 Ti изначально рассчитан на восемь фаз, но в связи с умеренным энергопотреблением TU116 на текстолите распаяны компоненты лишь шесть из них: четыре для графического процесссора и две для микросхем RAM. Впрочем, как и в ускорителях серии GeForce RTX, в составе VRM здесь применяются полевые транзисторы с интегрированным драйвером (т. н. DrMOS или «силовые каскады» — power stages), благодаря которым ШИМ-контроллер точнее регулирует напряжение на стоке транзистора и возрастает КПД преобразования.

Микросхемы GDDR6 производства Micron с маркировкой 8XA77 D9WCR работают со штатной пропускной способностью 12 Гбит/с на контакт шины. Кристалл TU116 на этой плате не имеет буквы А в среднем блоке маркировки, которая у старших моделей на чипах Turing выделяет GPU отборного качества, обладающие повышенным частотным потенциалом. Стало быть, NVIDIA отказалась от предварительной категоризации образцов TU116, а может, нам наконец-то попался Turing «второго сорта». Независимо от того, какая версия соответствует действительности, разогнать эту видеокарту будет особенно интересно, ведь она покажет, на что можно рассчитывать в попытках оверклокинга простых модификаций GeForce GTX 1660 Ti, доступных за умеренные деньги.