Обзор видеокарты NVIDIA GeForce RTX 3060: самый доступный RTX / Видеокарты

На данный момент NVIDIA полностью укомплектовала верхушку модельной линейки GeForce 30 устройствами на чипах архитектуры Ampere. По сравнению со своими предшественниками все новые предложения NVIDIA существенно прибавили не только в абсолютных метриках производительности, но и в быстродействии на единицу рекомендованной стоимости. Тем не менее даже GeForce RTX 3060 Ti при официальной цене в $399 (или 39 990 российских рублей) доступен не всем геймерам или попросту обладает избыточными возможностями для тех, кто играет лишь эпизодически и не пользуется требовательными рабочими приложениями. Львиную долю продаж у производителей графических карт составляют устройства по цене ниже $400 — именно этот сегмент рынка стал следующей зоной экспансии для архитектуры Ampere. GeForce RTX 3060 оказался первым решением такого класса в новом поколении ускорителей NVIDIA и вместе с тем — самой дешевой видеокартой, когда-либо выпущенной под маркой RTX.

А пока AMD медлит с релизом аналогичных по быстродействию моделей на чипах Navi второго поколения, у покупателей, которые намерены сменить свои GeForce GTX 1060 и Radeon RX 570/580 на что-то помощнее и при этом сэкономить, не остается иного выбора, кроме GeForce RTX 3060. Главное, чтобы беспрецедентный дефицит компьютерных комплектующих обошел новинку стороной. NVIDIA получит больше компактных GPU, которыми укомплектован RTX 3060, с каждой кремниевой пластины. Кроме того, чипмейкер объявил, что криптомайнерам в данном случае ловить совершенно нечего: хешрейт RTX 3060 будет искусственно ограничен на уровне согласования между BIOS и драйвером. Помогли ли эти меры насытить спрос на видеокарту (а в данной ценовой категории он особенно велик), мы сможем узнать в первые дни после публикации обзора — продажи RTX 3060 стартуют уже сегодня. А пока выясним, что именно новинка сможет предложить геймерам (и экономным профессионалам) за свою стоимость.

⇡#Графический процессор NVIDIA GA106

NVIDIA по традиции выстраивает модельный ряд высокопроизводительных графических ускорителей вокруг GPU трех категорий под номерами 102, 104 и 106 с префиксом соответствующего поколения. На основе GA102 и GA104 уже появились на свет четыре устройства серии GeForce 30, а теперь эстафету должен перехватить процессор GA106. По функциям рендеринга и конфигурации основного строительного блока архитектуры NVIDIA — потокового мультипроцессора (SM) — младший GPU ничем не отличается от флагманских чипов. Читатели могут освежить память о том, что представляет собой Ampere и какими достоинствами он обладает по сравнению с предшествующей логикой Turing, в нашем обстоятельном обзоре. А для того, чтобы получить кремний, соответствующий ценовой категории GeForce RTX 3060, NVIDIA всего лишь изменила количественные показатели. Так, GA106 располагает 30 SM, в то время как у полностью функциональных кристаллов GA104 и GA102 этих блоков 48 и 84 штуки соответственно.

Прямым аналогом GA106 в семействе Turing является, разумеется, чип TU106, лежащий в основе GeForce RTX 2060, RTX 2060 SUPER и RTX 2070, но если GA104 и GA102 как минимум не уступают своим предкам по числу SM, то GA106 представляет собой шаг в обратном направлении: TU106 располагает в общей сложности 36 SM, а у GA106 их всего лишь 30. Как следствие, и объем кеша второго уровня можно было смело сократить с 4 до 3 Мбайт. Но сравнительно небольшое количество SM с лихвой компенсирует удвоенный объем вещественночисленных ALU стандартной точности внутри каждого из них. Это характерная черта Ampere, которая еще не гарантирует удвоенного быстродействия в любых ситуациях, кроме изолированных синтетических бенчмарков, но есть приложения, которые хорошо ложатся на подобную архитектуру (включая игры с рейтрейсингом), не говоря уже о массе прочих оптимизаций, свойственных Ampere. Количество блоков растеризации в составе GA106 также, на первый взгляд, невелико — всего лишь 48 штук против 64 у TU106, но и это нельзя считать компромиссным решением со стороны NVIDIA. Просто массив ROP теперь независим от контроллеров оперативной памяти и обеспечивает именно такой пиксельный филлрейт, который соответствует пропускной способности растеризаторов, — не больше и не меньше (ROP у TU106 как раз были в избытке).

Бросается в глаза то, что конфигурация чипа GA106 существенно уступает TU106 по другому важному параметру: в то время как TU106 сообщается с оперативной памятью широкой 256-битной шиной, у GA106 она 192-битная, что в предыдущем поколении было прерогативой младшей ветки Turing (видеокарты серии GeForce 16) и максимально урезанной разновидности TU106, которая используется в GeForce RTX 2060.

Производитель	NVIDIA
Название	TU106	GA106	GA104	GA102
Где используется	GeForce RTX 2060; GeForce RTX 2060 SUPER; GeForce RTX 2070	GeForce RTX 3060	GeForce RTX 3060 Ti; GeForce RTX 3070	GeForce RTX 3080; GeForce RTX 3090
Микроархитектура	Turing	Ampere	Ampere	Ampere
Техпроцесс, нм	12 нм FFN	8 нм (8N)	8 нм (8N)	8 нм (8N)
Число транзисторов, млн	10 800	12 000	17 400	28 300
Площадь чипа, мм²	445	276	392,5	628
Число SM/TPC/GPC
Streaming Multiprocessors (SM)	36	30	48	84
Thread Processing Clusters (TPC)	18	15	24	42
Graphics Processing Clusters (GPC)	3	3	6	7
Конфигурация потокового мультипроцессора (SM)
CUDA-ядра FP16	Нет	Нет	Нет	Нет
CUDA-ядра FP32	4 × 16	4 × 32	4 × 32	4 × 32
CUDA-ядра FP64	2	2	2	2
CUDA-ядра INT32	4 × 16	4 × 16	4 × 16	4 × 16
ALU специального назначения (SFU)	4 × 4	4 × 4	4 × 4	4 × 4
Тензорные ядра	4 × 2	4 × 1	4 × 1	4 × 1
RT-ядра	1	1	1	1
Блоки наложения текстур (TMU)	4	4	4	4
Объем регистрового файла, Кбайт	256	256	256	256
Объем кеша L1, Кбайт	32/64 из 96 (общий с разделяемой памятью)	До 64 из 128 (общий с разделяемой памятью)	До 64 из 128 (общий с разделяемой памятью)	До 64 из 128 (общий с разделяемой памятью)
Объем разделяемой памяти, Кбайт	32/64 из 96 (общий с кешем L1)	До 100 из 128 (общий с кешем L1)	До 100 из 128 (общий с кешем L1)	До 100 из 128 (общий с кешем L1)
Программируемые вычислительные блоки GPU
CUDA-ядра FP16	Нет	Нет	Нет	Нет
CUDA-ядра FP32	2 304	3 840	6 144	10 752
CUDA-ядра FP64	72	60	96	168
CUDA-ядра INT32	2 304	1 920	3 072	5 376
ALU специального назначения (SFU)	576	480	768	1 344
Тензорные ядра	288	240	192	336
RT-ядра	36	30	48	84
Блоки GPU фиксированной функциональности
Блоки наложения текстур (TMU)	144	120	192	336
Блоки операций растеризации (ROP)	64	48	96	112
Конфигурация памяти
Объем кеша L2, Кбайт	4 096	3 072	4 096	6 144
Разрядность шины RAM, бит	256	192	256	384
Тип микросхем RAM	GDDR6 SGRAM	GDDR6 SGRAM	GDDR6 / (GDDR6X?) SGRAM	GDDR6/GDDR6X SGRAM

Интерфейс NVLINK	Нет	Нет	Нет	4 × NVLink 3.0 x4
Интерфейс PCI Express	3.0 x16	4.0 x16	4.0 x16	4.0 x16

Как бы то ни было, резко увеличенное количество шейдерных ALU в кристалле GA106 отразилось на компонентном бюджете процессора: он составляет 12 млрд транзисторов, что на 1,1 млрд превышает данные TU106. Но благодаря высокой плотности самсунговского техпроцесса 8 нм кристалл GA106 получился весьма компактным: его площадь составляет всего 276 мм².

⇡#Технические характеристики, цены

Графический процессор GA106 на плате GeForce RTX 3060 урезан по числу активных вычислительных блоков. 2 из 30 SM на кристалле были отключены — в первую очередь для того, чтобы создать резерв на случай дефектов фотолитографии, но дистанция по характеристикам и быстродействию между RTX 3060 и RTX 3060 Ti достаточно велика (около 27 % в пропускной способности операций FP32), чтобы NVIDIA при необходимости смогла выпустить усиленную версию видеокарты в ответ на будущие действия AMD. А в существующем виде RTX 3060 почти вдвое превосходит своего непосредственного предшественника — RTX 2060 — по теоретической скорости вещественночисленных шейдерных расчетов. Но если принять во внимание тот факт, что дополнительные FP32-совместимые ALU внутри каждого SM архитектуры Ampere конкурируют за такты планировщика с веткой целочисленных блоков, можно считать GeForce RTX 3060 обновленной разновидностью RTX 2060, которая напоминает ускоритель прошлого поколения конфигурацией основных параметров, но сулит повышенное быстродействие за счет архитектурных усовершенствований. По официальным оценкам, RTX 3060 развивает на 30 % более высокую частоту смены кадров в играх, чем RTX 2060, и приблизительно соответствует базовой версии RTX 2070. Не удивительно, что на шкале потребляемой мощности RTX 3060 стоит ближе всего именно к RTX 2070 (170 Вт у первого и 175 у второго): самсунговский техпроцесс 8 нм, который NVIDIA использует для производства чипов Ampere потребительской категории, сам по себе не дал крупного прироста энергоэффективности, а у сравнительно небольших GPU мощность хуже масштабируется вместе с количеством основных вычислительных блоков.

Производитель	NVIDIA
Модель	GeForce RTX 2060	GeForce RTX 2060 SUPER	GeForce RTX 2070	GeForce RTX 3060	GeForce RTX 3060 Ti
Графический процессор
Название	TU106	TU106	TU106	GA106	GA104
Микроархитектура	Turing	Turing	Turing	Ampere	Ampere
Техпроцесс	12 нм FFN	12 нм FFN	12 нм FFN	8 нм (8N)	8 нм (8N)
Число транзисторов, млн	10 800	10 800	10 800	12 000	17 400
Тактовая частота, МГц: Base Clock / Boost Clock	1 365/1 680	1 470/1 650	1 410/1 620 (Founders Edition: 1 410/1 710)	1 320/1 777	1 410/1 665
Шейдерные ALU FP32	1 920	2 176	2 304	3 584	4 864
Блоки наложения текстур (TMU)	120	136	144	112	152
Блоки операций растеризации (ROP)	48	64	64	48	80
Тензорные ядра	240	272	288	112	152
RT-ядра	30	34	36	28	38
Оперативная память
Разрядность шины, бит	192	256	256	192	256
Тип микросхем	GDDR6 SGRAM	GDDR6 SGRAM	GDDR6 SGRAM	GDDR6 SGRAM	GDDR6 SGRAM
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с)	1 750 (14 000)	1 750 (14 000)	1 750 (14 000)	1 875 (15 000)	1 750 (14 000)
Объем, Мбайт	6 144	8 192	8 192	12 288	8 192
Шина ввода/вывода	PCI Express 3.0 x16	PCI Express 3.0 x16	PCI Express 3.0 x16	PCI Express 4.0 x16	PCI Express 4.0 x16
Производительность
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты)	6 451	7 181	7 465/7 880 (Founders Edition)	12 738	16 197
Производительность FP64/FP32	1/32	1/32	1/32	1/32	1/32
Производительность FP16/FP32	2/1	2/1	2/1	1/1	1/1
Пропускная способность оперативной памяти, Гбайт/с	336	448	448	360	448
Вывод изображения
Интерфейсы вывода изображения	DL DVI-D, DisplayPort 1.4a, HDMI 2.0b	DL DVI-D, DisplayPort 1.4a, HDMI 2.0b	DL DVI-D, DisplayPort 1.4a, HDMI 2.0b	DisplayPort 1.4a, HDMI 2.1	DisplayPort 1.4a, HDMI 2.1
TBP/TDP, Вт	160	175	175/185 (Founders Edition)	170	200
Розничная цена (США, без налога), $	349 (рекоменд. в момент выхода)	399 (рекоменд. в момент выхода)	499 (рекоменд.)/ 599 (Founders Edition) — в момент выхода	329 (рекоменд. в момент выхода)	399 (рекоменд. в момент выхода)
Розничная цена (Россия), руб.	31 990 (Founders Edition, в момент выхода)	32 990 (рекоменд. в момент выхода)	47 990 (Founders Edition в момент выхода)	32 990 (рекоменд. в момент выхода)	39 990 (рекоменд. в момент выхода)

Несмотря на то, что вычислительный потенциал GPU на плате RTX 3060 существенно увеличился по сравнению с устройствами прошлого поколения, скорость шины памяти, обслуживающей чип, пошла на убыль. В референсных спецификациях фигурирует пропускная способность 15 Гбит/с на контакт шины, но в силу того, что сама шина 192-битная, совокупная ПСП интерфейса ограничена 360 Гбайт/с, в то время как у GeForce RTX 3070 она достигает 448 Гбайт/с. Трудно сказать, насколько это обстоятельство сдерживает производительность GPU, но цифры 15 Гбит/с говорят о том, что чипы GDDR6 в данном случае не работают в полную силу (такого номинала не бывает) и наверняка без труда разгоняются до 16 Гбит/с и больше.

В чем GeForce RTX 3060 не испытывает недостатка, так это в объеме VRAM — 12 Гбайт. Это выглядит избыточно для RTX 3060 — видеокарты, которая явно не претендует на игры при разрешении выше 1440p, но при 192-битной шине памяти выбор невелик: либо ограничиться таким объемом, который даже не позволит выставит максимальные настройки графики в некоторых тайтлах, либо оставить крупный запас VRAM на будущее. Как бы то ни было, ирония ситуации очевидна: теперь GeForce RTX 3060 располагает большим объемом оперативной памяти, чем любая другая модель в линейке GeForce 30, за исключением RTX 3090. Существует и 6-гигабайтная версия RTX 3060. Пока она зарезервирована для мобильных компьютеров, но, по неофициальным данным, имеет все шансы появиться и в десктопах.

Именно для 12-гигабайтных разновидностей указаны рекомендованные цены GeForce RTX 3060: $329 или 32 990 руб. При условии, что дефицит железа обойдет RTX 3060 стороной, NVIDIA только что выпустила самую дешевую видеокарту под маркой RTX и вместе с тем самый дешевый ускоритель с функцией аппаратной трассировки лучей в принципе, поскольку единственным соперником RTX 3060 в красном углу ринга является Radeon RX 5700 XT, лишенный таких возможностей. Более того, рыночная ниша от $300 до $350 сейчас фактически свободна от конкуренции, ведь пресловутый дефицит добрался и до видеокарт прошлого поколения (тот же Radeon RX 5700 XT сейчас невозможно купить за сколь-либо приемлемую сумму).

В отличие от старших моделей на чипах Ampere, GeForce RTX 3060 не удостоился позиции в ряду фирменных устройств NVIDIA Founders Edition. Новинка будет представлена на рынке только партнерскими версиями, среди которых выбор для обзора пал на ускоритель Palit Dual OC.

⇡#Palit GeForce RTX 3060 Dual OC: конструкция

Большинство видеокарт в наше время изначально разогнаны производителем, и продукт Palit не является исключением. Референсные спецификации предписывают графическому процессору RTX 3060 тактовую частоту в играх на уровне 1777 МГц, но Palit Dual OC ориентируется на 1837 МГц и, как мы успеем убедиться, обладает повышенным энергопотреблением. Однако с TBP на уровне 170 Вт или немногим больше должна легко справиться конструкция, созданная для заведомо более горячего устройства. Под маркой Dual OC компания Palit использовала одну и ту же систему охлаждения для GeForce RTX 3060 Ti и RTX 3060, а TBP у RTX 3060 Ti — это уже 200 Вт.

Знакомый нам кулер обслуживают два вентилятора с диаметром крыльчатки 85 мм, а укороченная PCB позволила организовать сквозной продув половины радиатора через прорези бэкплейта — все как у «взрослых» ускорителей RTX 3080 и RTX 3090, только в меньшем масштабе. Dual OC — экономичная серия, поэтому кожух системы охлаждения здесь изготовлен целиком из пластика, включая и бэкплейт. Зато есть светодиодная подсветка.

Графический процессор, микросхемы оперативной памяти GDDR6 и силовые каскады регулятора напряжения Palit GeForce RTX 3060 Dual OC отдают тепло простому низкопрофильному радиатору с тремя тепловыми трубками. Эта система охлаждения, как и большинство конструкций открытого типа, не способна самостоятельно извлекать нагретый воздух из корпуса компьютера, но при таком энергопотреблении, как у RTX 3060, проблема вентиляции не стоит настолько остро, как в случае GeForce RTX 3080 и RTX 3090.

⇡#Palit GeForce RTX 3060 Dual OC: печатная плата

В силу того, что GeForce RTX 3060 комплектуется более компактным графическим процессором по сравнению со старшими моделями 30-го семейства, требования к питанию GPU снижаются. Однако чип GA106 и старший GA104 являются взаимозаменяемыми по разводке контактов судя по тому, что Palit GeForce RTX 3060 Dual OC собрана на точно такой же печатной плате, как Palit RTX 3060 Ti из серии Dual OC. Производителю было достаточно удалить компоненты одной из фаз регулятора напряжения GPU, чтобы осталось семь из десяти штук, на которые рассчитана PCB. Фазы укомплектованы силовыми каскадами ON Semiconductor NCP302045 с номинальным током 45 А под управлением ШИМ-контроллера uPI UP9512R. Питание микросхем VRAM осталось двухфазным. Другие признаки, к примеру конденсаторы сквозного монтажа на входе и выходе VRM, также говорят о том, что перед нами экономверсия печатной платы для GeForce RTX 3060.