Оригинал материала: https://3dnews.ru/1021061

Обзор видеокарты NVIDIA GeForce RTX 3080, часть 2: долгожданные тесты

Технические характеристики, комплект поставки, цены. Конструкция. Печатная плата

Новейшие видеокарты серии GeForce RTX 30 изрядно задержались на пути в редакцию 3DNews — настолько, как мы даже не предполагали, пока работали над первой частью обзора, посвященной архитектуре чипов Ampere и всем характеристикам потребительских устройств на их основе. Но теперь первые партии GeForce RTX 3080 наконец-то потекли в Россию тонким ручейком, и мы получили возможность испытать RTX 3080 на практике, ответив на все волнующие читателей вопросы, кроме одного: сколько в действительности будут стоить передовые ускорители. Планы IT-изданий на публикацию обзоров — не единственное, на что повлияла пандемия. Говорят, что свою лепту в дефицит RTX 3080 внесло осложнение отношений между США и Китаем, но главный виновник — невероятный ажиотаж вокруг новинок. Просто так взять и купить GeForce RTX 3080 сейчас практически невозможно. Геймерам, которые поспешили сбыть с рук GeForce RTX 2080 Ti, в лучшем случае придется отстоять очередь на предзаказ в каком-либо из зарубежных интернет-магазинов — складские запасы там иссякли в течение нескольких часов, если не минут после того, как NVIDIA дала отмашку на старт продаж, а цены закономерно (и намного) превышают рекомендованные Санта-Кларой $699. Нечего и говорить о том, что RTX 3080 в России — по крайней мере, на первых порах — будет стоить дорого. Но ведь не зря же покупатели так набросились на свежие ускорители NVIDIA? Это мы и собираемся выяснить сегодня.

Однако сразу предупредим, что, если вас интересует не только разбор производительности GeForce RTX 3080, но и знакомство с видеокартами Founders Edition, с этим придется еще немного повременить. Фирменные устройства попадут в редакцию позже партнерских вариантов RTX 3080, хотя это по-своему справедливо. В этот раз Founders Edition предельно далек от того, что раньше называли рефененсными платами, и представляет собой лимитированный продукт для ценителей прекрасного, который никогда не стоил бы в рознице $699, если бы вместо NVIDIA его конструировал и продавал кто-нибудь из партнеров компании.

Мы рады, что GeForce RTX 3080 в первых бенчмарках на 3DNews представляет устройство Palit. Под этой маркой уже не раз появлялись самые доступные модификации той или иной видеокарты на российском рынке. И хотя RTX 3080 принципиально не может быть дешевым, Palit GeForce RTX 3080 GamingPro OC продемонстрирует, на что может рассчитывать покупатель, который в сложившихся условиях по-прежнему намерен сэкономить

#Технические характеристики GeForce RTX 3080

Хотя официальным спецификациям видеокарт GeForce 30-й серии мы уделили повышенное внимание в архитектурной части обзора, не помешает напомнить читателям, с каким монстром мы имеем дело в лице GeForcе RTX 3080 и графического процессора GA102.

Логика полностью функционального кристалла GA102 представлена семью блоками GPC (Graphics Processing Cluster, крупнейшими масштабируемыми компонентами массива) — против шести в составе TU102. Каждый из них по-прежнему содержит 12 потоковых мультипроцессоров (Streaming Multiprocessor), только набор 32-битных CUDA-ядер, обрабатывающих вещественные числа, внутри SM был удвоен. В результате формула главных исполнительных блоков GA102 включает 10 752 FP32-совместимых CUDA-ядер и 336 блоков наложения текстур.

Однако GeForce RTX 3080 досталась существенно урезанная разновидность GA102, в которой осталось только шесть действующих модулей GPC. Кроме того, два из них не полностью укомплектованы SM’ами. В итоге GeForce RTX 3080 располагает 8 704 шейдерными ALU для операций FP32 и 272 блоками наложения текстур. Тем не менее это по-прежнему громадный запас сырой вычислительной мощности по сравнению с топ-моделями 20-й серии: у GeForce RTX 2080 SUPER и RTX 2080 Ti соответственно есть лишь 3072 и 4352 CUDA-ядра FP32. Рекомендуем обратиться к первой части обзора, чтобы узнать, каким образом NVIDIA удалось втиснуть на кристалл столько шейдерных ALU, не выходя за пределы и без того колоссального компонентного бюджета в 28 млрд транзисторов.

Для того чтобы насытить потребность GA102 в быстром доступе к данным, видеокарты GeForce RTX 3080 и RTX 3090 комплектуются оперативной памятью нового типа GDDR6X, которая в случае RTX 3080 обеспечивает пропускную способность в 19 Гбит/с на контакт шины против 14- или 16-гигабитной GDDR6, преобладающей в ускорителях прошлого поколения. При этом совокупная ПСП RTX 3080, несмотря на урезанную до 320 бит шину, достигает 760 Гбайт/с. Больше — только у GeForce RTX 3090 (960 Гбайт/с) и Radeon VII (1 Тбайт/с). Легкие опасения может вызвать только объем оперативной памяти в 10 Гбайт, хотя формально и фактически более слабый GeForce RTX 2080 Ti располагает 12 Гбайт VRAM.

ПроизводительNVIDIA
Модель GeForce RTX 2080 GeForce RTX 2080 SUPER GeForce RTX 2080 Ti TITAN RTX GeForce RTX 3080 GeForce RTX 3090
Графический процессор
Название TU104 TU104 TU102 TU102 GA102 GA102
Микроархитектура Turing Turing Turing Turing Ampere Ampere
Техпроцесс 12 нм FFN 12 нм FFN 12 нм FFN 12 нм FFN 8 нм (8N) 8 нм (8N)
Число транзисторов, млн 13 600 13 600 18 600 18 600 28 300 28 300
Тактовая частота, МГц: Base Clock / Boost Clock 1 515/1 710 (Founders Edition: 1 515/1 800) 1 650/1 815 1 350/1 545 (Founders Edition: 1 350/1 635) 1 350/1 770 НД /1 710 НД /1 695
Шейдерные ALU 2 944 3 072 4 352 4 608 8 704 10 496
Блоки наложения текстур (TMU) 184 192 272 288 272 328
Блоки операций растеризации (ROP) 64 64 88 96 96 112
Тензорные ядра 368 384 544 576 272 328
RT-ядра 46 48 68 72 68 82
Оперативная память
Разрядность шины, бит 256 256 352 384 320 384
Тип микросхем GDDR6 SGRAM GDDR6 SGRAM GDDR6 SGRAM GDDR6 SGRAM GDDR6X SGRAM GDDR6X SGRAM
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с) 1 750 (14 000) 1 937,5 (15 500) 1 750 (14 000) 1 750 (14 000) 1 188 (19 000) 1 219 (19 500)
Объем, Мбайт 8 192 8 192 11 264 24 576 10 240 24 576
Шина ввода/вывода PCI Express 3.0 x16 PCI Express 3.0 x16 PCI Express 3.0 x16 PCI Express 3.0 x16 PCI Express 4.0 x16 PCI Express 4.0 x16
Производительность
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты) 10 069/10 598 (Founders Edition) 11 151 13 448/14 231 (Founders Edition) 16 312 29 768 35 581
Производительность FP64/FP32 1/32 1/32 1/32 1/32 1/32 1/32
Производительность FP16/FP32 2/1 2/1 2/1 2/1 1/1 1/1
Пропускная способность оперативной памяти, Гбайт/с 448 496 616 672 760 936
Вывод изображения
Интерфейсы вывода изображения DisplayPort 1.4a, HDMI 2.0b DL DVI-D, DisplayPort 1.4a, HDMI 2.0b DisplayPort 1.4a, HDMI 2.0b DisplayPort 1.4a, HDMI 2.0b DisplayPort 1.4a, HDMI 2.1 DisplayPort 1.4a, HDMI 2.1
TBP/TDP, Вт 215/225 (Founders Edition) 250 250/260 (Founders Edition) 280 320 350
Розничная цена (США, без налога), $ 699 (рекоменд.)/ 799 (Founders Edition) — в момент выхода 699 (рекоменд. в момент выхода) 999 (рекоменд.)/ 1 199 (Founders Edition) — в момент выхода 2 499 699 (рекоменд. в момент выхода) 1499 (рекоменд. в момент выхода)
Розничная цена (Россия), руб. 63 990 (Founders Edition в момент выхода) 56 990 (рекоменд. в момент выхода) 95 990 (Founders Edition в момент выхода) 221 990 (в момент выхода) 63 490 (nvidia.ru) 136 990 (nvidia.ru)

Впрочем, действительное потребление набортной памяти видеокарты современными играми — тонкая тема, которую не раскрывают оценки занятых гигабайтов в мониторинге GPU-Z или MSI Afterburner. Пока 10 Гбайт оперативки GeForce RTX 3080 должно хватить для любых задач обычного пользователя, включая игры на 4К-экране с максимальными настройками детализации. Однако практика последних лет говорит о том, что для долгой службы без апгрейда лучше набирать VRAM с запасом. Неспроста на горизонте уже маячат версии GeForce RTX 3080 с 20 Гбайт GDDR6X, которые, очевидно, внесут дополнительные коррективы в ценовую картину 30-й серии. Также оставим за рамками обзора такой вопрос, как влияние на работу новых топов NVIDIA двух различных поколений интерфейса PCI Express. Консенсус состоит в том, что PCIe 4.0 не приносит в играх никакого практически значимого преимущества, хотя дает AMD лишнюю возможность подчеркнуть достоинства платформы AM4. Другое дело — профессиональные приложения, особенно те, что могут использовать несколько GPU одновременно, но это мы оставим на усмотрение специалистов в таких задачах, как глубинное обучение.

Как бы то ни было, официальные данные о производительности GeForce RTX 3080 таковы, что новинка обеспечивает вдвое более высокую частоту смены кадров по сравнению с базовой версией GeForce RTX 2080 — в условиях, идеальных для архитектуры Ampere, то есть при разрешении 4К и с трассировкой лучей, но тем не менее. Мы намерены выяснить, отработает ли RTX 3080 такую заявку, а заодно проверить, каково действительное энергопотребление ускорителя. Как ни крути, одночиповые игровые платы NVIDIA впервые перевалили за отметку 300 Вт, а ведь RTX 3080 — это даже не флагман серии. Но сперва внимательно изучим видеокарту, которая удостоилась чести представлять новую архитектуру в первых тестах, — Palit GeForce RTX 3080 GamingPro OC.

#Palit GeForce RTX 3080 GamingPro OC: конструкция, комплект поставки

Партнеры NVIDIA и AMD не любят выпускать видеокарты, лишенные хотя бы номинального разгона. Вот и Pait GamingPro несет в названии индекс ОС потому, что графический процессор в ней пускай совсем чуть-чуть, но все-таки разогнан. Оверклокинг сводится к добавочным 30 МГц проектной тактовой частоты под игровой нагрузкой (Boost Clock), поэтому спецификации ускорителя вполне можно приравнять к референсным с практической точки зрения.

Тем более сильное впечатление производит система охлаждения, которую Palit водрузила на чип GA102. Видеокарта занимает в корпусе ПК три полных слота расширения, что могли себе позволить далеко не все разновидности GeForce RTX 2080, включая те, которые разогнаны поболее Pait GamingPro. Не зря компания приложила к своему продукту акриловую подпорку, которая удерживает свободный край платы в горизонтальном положении.

Однако кулер палитовской версии GeForce RTX 3080 интересен не только своими габаритами. Когда все взгляды прикованы к видеокартам Founders Edition, задающим стандарты если не в эффективности охлаждения (это мы еще выясним в свое время), то уж точно в эстетике, партнеры NVIDIA, которые не могут себе позволить расходовать на один только кулер свыше $150 (по слухам, именно в такую сумму обходится производство СО для одной платы Founders Edition), стремятся так или иначе выделиться из общей массы.

При взгляде спереди Palit GeForce RTX 3080 GamingPro OC не представляет собой ничего экстраординарного: кажется, что перед нами обычный кулер с тремя вентиляторами диаметром 95 мм, только очень толстый. Есть и практически обязательная для современных высокопроизводительных видеокарт RGB-подсветка.

Но если перевернуть видеокарту, можно убедиться в том, что поток воздуха от правого вентилятора проходит насквозь через массив радиаторных ребер и пластину на оборотной стороне PCB — прямо как в Founders Edition. Не удивимся, если и другие производители последуют в этой детали примеру NVIDIA не столько из стремления подражать законодателю мод, сколько потому, что схемотехника ускорителей с памятью GDDR6X требует размещать чипы RAM как можно ближе к GPU и таким образом располагает к коротким печатным платам. Такой поход к устройству системы охлаждения мы уже видели когда-то в исполнении SAPPHIRE — тоже на базе короткой PCB ускорителей Radeon R9 Fury.

Кстати, нельзя не похвалить Palit за то, что пластина поверх печатной платы сделана не из бесполезного и даже вредного для охлаждения пластика, а из алюминия и прижата к текстолиту через несколько термопрокладок.

Под кожухом системы охлаждения скрывается вполне типичный, разве что с поправкой на размеры, двухсекционный радиатор, пронизанный несколькими толстыми теплотрубками. Тепло с кристалла GPU снимает никелированная медная подошва, а микросхемы памяти и силовые каскады VRM контактируют с массивной металлической рамой.

Кулер GeForce RTX 3080 GamingPro OC выглядит подобающе мощным для видеокарты со штатным энергопотреблением в 320 Вт и, как мы успеем убедиться, отличается одновременно и высокой эффективностью, и низким уровнем шума. Когда температура GPU меньше 60 °C, активное охлаждение ему вообще не требуется, а вращение вентиляторов прекращается. Единственная претензия, которую можно предъявить к конструкции этой видеокарты (да и многих других тоже), состоит в том, что весь отработанный горячий воздух система охлаждения оставляет внутри корпуса ПК. При таком устройстве, когда ребра радиатора идут параллельно решетке в торце кожуха, ее вполне можно было заменить глухой пластиной с вырезами только под разъемы видеовыходов — от этого бы ничего не изменилось.

К слову, о видеовыходах GeForce RTX 3080: отсутствие характерного для ускорителей 20-й серии разъема USB Type-C с поддержкой DisplayLink не является мерой экономии со стороны Palit. Этот стандарт, предназначенный для подключения шлемов VR одним проводом, как говорится, не взлетел и в итоге был отвергнут NVIDIA.

#Palit GeForce RTX 3080 GamingPro OC: печатная плата

Как мы уже отметили в самом начале, разновидности GeForce 30-й серии под маркой Founders Edition некорректно называть референсными устройствами. Тем не менее NVIDIA предоставляет партнерам настоящий референсный дизайн PCB, чтобы помочь наладить выпуск видеокарт первой волны с фирменными системами охлаждения, а под кулером бюджетного ускорителя иногда можно обнаружить и саму эталонную плату с маркировкой NVIDIA. Печатная плата Palit GeForce RTX 3080 GamingPro OC представляет собой примерно то же самое: фотографии еще нескольких PCB для чипов GA102, которые всплыли в интернете, похожи на то, что вы видите на фотографиях, и, очевидно, являются вариациями на одну и ту же тему.

Как бы то ни было, у рядового покупателя, не заинтересованного в соревновательном оверклокинге, вряд ли найдется повод придраться к плате RTX 3080 GamingPro OC. Референсный дизайн позволяет организовать 16-фазное питание графического процессора при помощи двух восьмифазных контроллеров On Semiconductor NCP81610, хотя в данном случае на плате распаяно только пять силовых каскадов одного из VRM. Памяти GDDR6X выделено вплоть до четырех фаз, но компоненты одной опять-таки отсутствуют. В фазах питания графического процессора применяются силовые каскады AOZ5311NQI от Alpha & Omega с номинальным током 50 А.

Печатная плата Palit GeForce RTX 3080 GamingPro OC не нуждается в более подробных комментариях. Ускорители Founders Edition обслуживают VRM, состоящий в общей сложности из 18 фаз, в них применяются исключительно твердотельные конденсаторы, но среди партнерских разновидностей RTX 3080 и RTX 3090 мы еще не раз увидим именно такой — удешевленный, но вполне достойно укомплектованный — дизайн.

Методика тестирования. Тактовые частоты, энергопотребление, температура, уровень шума и разгон. Игровые тесты (1920 × 1080)

#Тестовый стенд, методика тестирования

Тестовый стенд
CPU Intel Core i9-9900K (4,9 ГГц, 4,8 ГГц в AVX, фиксированная частота)
Материнская плата ASUS MAXIMUS XI APEX
Оперативная память G.Skill Trident Z RGB F4-3200C14D-16GTZR, 2 × 8 Гбайт (3200 МГц, CL14)
ПЗУ Intel SSD 760p, 1024 Гбайт
Блок питания Corsair AX1200i, 1200 Вт
Система охлаждения CPU Corsair Hydro Series H115i
Корпус CoolerMaster Test Bench V1.0
Монитор NEC EA244UHD
Операционная система Windows 10 Pro x64
ПО для GPU AMD
Все видеокарты AMD Radeon Software Adrenalin 2020 Edition 20.8.3
ПО для GPU NVIDIA
Все видеокарты NVIDIA GeForce Game Ready Driver 456.16
Игры
Игра (в порядке даты выхода) API Метод тестирования Настройки графики Полноэкранное сглаживание
Strange Brigade Vulkan Встроенный бенчмарк Макс. качество графики AA Ultra
Shadow of the Tomb Raider DirectX 12 Встроенный бенчмарк Макс. качество графики. DXR выкл., DLSS выкл. TAA
Assassin's Creed Odyssey DirectX 11 Встроенный бенчмарк Макс. качество графики AA High (TAA)
Battlefield V DirectX 12 Миссия Liberte + OCAT Макс. качество графики. DXR выкл., DLSS выкл. TAA High
Metro Exodus DirectX 12 Встроенный бенчмарк Макс. качество графики. DXR выкл., DLSS выкл., Shading Rate 100% TAA
Total War: THREE KINGDOMS DirectX 12 Встроенный бенчмарк (Battle Benchmark) Макс. качество графики TAA
Control DirectX 12 OCAT Макс. качество графики TAA
Borderlands 3 DirectX 12 Встроенный бенчмарк Макс. качество графики TAA
Red Dead Redemption 2 Vulkan Встроенный бенчмарк Макс. качество графики TAA High
DOOM Eternal Vulkan Начало миссии Mars Core + OCAT Макс. качество графики TAA
Игры (с трассировкой лучей)
Игра (в порядке даты выхода) API Метод тестирования Полноэкранное сглаживание
Battlefield V DirectX 12 Миссия Liberté + OCAT Макс. качество графики. DXR Raytrace Reflection Quality: Ultra TAA/DLSS
Shadow of the Tomb Raider DirectX 12 Встроенный бенчмарк Макс. качество графики. Ray Traced Shadows Quality: Ultra TAA/DLSS
Metro Exodus DirectX 12 Встроенный бенчмарк Макс. качество графики. Shading Rate 100%. Ray Trace: Ultra TAA/DLSS
Quake II RTX Vulkan Timedemo, запись demo1.dm2 Макс. качество графики TAA
Control DirectX 12 OCAT Ray Tracing Preset: High TAA/DLSS 2.0
Minecraft with RTX Beta DirectX 12 Бенчмарк в мире Portal Pioneers + OCAT Макс. дальность рендеринга геометрии и частиц Нет/DLSS 2.0

В большинстве тестовых игр показатели средней и минимальной кадровых частот выводятся из массива времени рендеринга индивидуальных кадров, который записывает встроенный бенчмарк (или утилита OCAT, если его нет).

Средняя частота смены кадров на диаграммах является величиной, обратной среднему времени кадра. Для оценки минимальной кадровой частоты вычисляется количество кадров, сформированных в каждую секунду теста. Из этого массива чисел выбирается значение, соответствующее 1-му процентилю распределения. Red Dead Redemption 2 является исключением: ее встроенный бенчмарк регистрирует 1-й процентиль времени рендеринга кадра, из которого выводится соответствующая кадровая частота.

Вычисления общего назначения, кодирование/декодирование видео
Приложение Настройки API
AMD NVIDIA AMD NVIDIA
Adobe Premiere Pro CC 2020 PugetBench for Premiere Pro 0.88 GPU Effects: живое воспроизведение (ProRes 422, 4K@59,94 FPS) OpenCL CUDA
GPU Effects: экспорт в H.264 40 Мбит/с и ProRes 422HQ (4K@59,94 FPS)
Blender 2.9 Демо Class Room с сайта Blender Foundation Рендерер Cycles. Feature Set: Supported. Размер тайла: 256 × 256 OpenCL CUDA/OptX
Демо Nissan GTR от AMD Рендерер AMD Radeon ProRender OpenCL
DXVA Checker 4.1.2, Decode Benchmark H.264 (Microsoft H264 Video Decoder) 1920 × 1080 (High Profile, L4.1); 3840 × 2160 (High Profile, L5.1) D3D11VA
H.265 (Microsoft HEVC Video Extensions) 1920 × 1080 (Main Profile, L4.0); 3840 × 2160 (Main Profile, L5.0); 7680 × 4320 (Main Profile, L6.0)
VP9 (Microsoft VP9 Video Extensions) 1920 × 1080; 3840 × 2160; 7680 × 4320
FFmpeg 4.2.1, кодирование H.264 1920 × 1080 -c:v h264_amf -quality speed -coder cabac -level 4.1 -refs 1 -b:v 3M -c:v h264_nvenc -preset fast -coder cabac -level 4.1 -refs 1 -b:v 3M AMF NVENC
3840 × 2160 -c:v h264_amf -quality speed -coder cabac -level 5.1 -refs 1 -b:v 7.5M -c:v h264_nvenc -preset fast -coder cabac -level 5.1 -refs 1 -b:v 7.5M
FFmpeg 4.2.1, кодирование H.265 1920 × 1080 -c:v hevc_amf -quality speed -level 4 -b:v 3M -c:v hevc_nvenc -preset fast -level 4 -b:v 3M
3840 × 2160 -c:v hevc_amf -quality speed -level 5 -b:v 7.5M -c:v hevc_nvenc -preset fast -level 5 -b:v 7.5M
7680 × 4320 Н/Д -c:v hevc_nvenc -preset fast -level 6 -refs 1 -b:v 20M
REDCINE-X PRO Декодирование файлов RED R3D с разрешением 4К, 6К и 8К OpenCL CUDA

Мощность видеокарт регистрируется отдельно от CPU и прочих компонентов ПК с помощью устройства NVIDIA PCAT. В качестве нагрузки для тестов мощности и уровня шума используется игра Crysis 3 при разрешении 3840 × 2160 без полноэкранного сглаживания и при максимальных параметрах качества графики, а также стресс-тест FurMark с наиболее агрессивными настройками (разрешение 3840 × 2160, MSAA 8x). Замеры всех параметров выполняются после прогрева видеокарты, когда температура GPU и тактовые частоты стабилизируются.

#Участники тестирования

В тестировании производительности приняли участие следующие видеокарты:

Прим. В скобках после названий видеокарт указаны базовая и boost-частота согласно спецификациям каждого устройства. Видеокарты нереференсного дизайна приведены в соответствие с референсными параметрами (или приближены к последним) при условии, что это можно сделать без ручной правки кривой тактовых частот. В противном случае (ускорители серии NVIDIA GeForce 16, а также GeForce RTX 2070/2080/2080 Ti Founders Edition) используются настройки производителя.

#Тактовые частоты, энергопотребление, температура, уровень шума и разгон

Прежде чем приступить к бенчмаркам Palit RTX 3080 GamingPro OC, хотим рассказать о пополнении в нашем тестовом инструментарии. Вместе с комплектом LDAT, который позволяет регистрировать время задержки между вводом и реакцией изображения в играх, мы получили от NVIDIA новое средство измерения потребляемой мощности для плат расширения PCI Express под названием PCAT (Power Capture Analysis Tool).

В большинстве обзоров графических ускорителей используются косвенные методы оценки энергопотребления — при помощи программных инструментов драйвера видеокарты или чаще всего по совокупной мощности компьютера, — которые не позволяют проводить точное сравнение устройств различных производителей и рассчитывать такой показатель, как быстродействие на ватт мощности, характеризующий новые достижения в проектировании GPU. Так, современные видеокарты на чипах NVIDIA способны отдавать через API данные о своем общем энергопотреблении (включая оперативную память, вентиляторы охлаждения и потери КПД на преобразование напряжения) благодаря тому, что для контроля мощности в них применяются шунты на всех линиях 12 В. В то же время система питания ускорителей AMD устроена проще и позволяет отслеживать лишь мощность самого графического процессора на выходе силовых каскадов VRM без учета остальных компонентов. Ну а замеры полной мощности системы бытовым ваттметром, очевидно, не дают возможности исключить из уравнения неодинаковую загрузку центрального процессора при использовании GPU различных классов производительности.

Единственный способ раз и навсегда устранить перечисленные ограничения состоит в том, чтобы изолировать питание видеокарты от материнской платы тестового стенда и контролировать ток непосредственно между подопытным устройством и БП. В обзорах новых GPU мы уже не первый год следуем именно такой методике, когда видеокарта подключается к материнской плате жестким райзером, в котором разорваны линии питания, а весь ток и, следовательно, потребляемая мощность измеряется универсальным цифровым ваттметром при помощи шунта, рассчитанного на несколько сотен ватт.

Инструмент PCAT работает точно таким же образом. Он состоит из платы микроконтроллера с восьмиконтактными разъемами питания PCI Express и переходника, изолирующего видеокарту от материнской платы. Таким образом, все питание поступает на ускоритель через PCAT, а микроконтроллер регистрирует ток, проходящий через кабели и слот PCI Express. Для оценки энергопотребления на глазок у PCAT есть миниатюрный OLED-экран, но, в отличие от нашего ваттметра, устройство NVIDIA можно подключить к компьютеру по USB и записывать лог потребляемой мощности — совокупной или, если требуется, мощности слота PCI Express и разъемов дополнительного питания в отдельности.

Заметим, что программное обеспечение PCAT, как и LDAT, не обязательно запускать на тестовом компьютере, а в том случае, когда оно работает на отдельной машине, у PCAT нет никакой возможности узнать, какое именно железо мы тестируем. Соответственно, не стоит волноваться о том, получат ли ускорители AMD справедливые оценки мощности в сравнении с новинками NVIDIA. Что касается точности измерения, то замеры энергопотребления видеокарт под нагрузкой с помощью PCAT не разошлись с показателями наших собственных инструментов, откалиброванных по падению напряжения на шунте, более чем на 5 %. Тем не менее, в обзорах всех будущих GPU мы целиком перейдем на PCAT. В конце концов, инструмент NVIDIA намного удобнее в работе, не говоря о том, что выглядит куда симпатичнее наших самоделок.

Однако вернемся к Palit RTX 3080 GamingPro OC. Как мы уже заметили, перед нами разогнанный вариант GeForce RTX 3080, но оверклокинг в данном случае сводится к чисто символической величине 30 МГц по частоте Boost Clock, а резерв мощности видеокарты соответствует референсным 320 Вт. Как следствие, заводской разгон видеокарты не должен исказить общую картину сравнения GeForce RTX 3080 с другими ускорителями, все из которых представлены в бенчмарках референсными моделями.

NVIDIA оценивает диапазон тактовых частот GeForce RTX 3080 более консервативно, чем у его формальных предшественников — RTX 2080 и RTX 2080 SUPER. В действительности так оно и есть, хотя дистанция между устойчивой тактовой частотой ядра Palit RTX 3080 GamingPro OC и GeForce RTX 2080 SUPER Founders Edition оказалась немногим больше 50 МГц (1854 и 1907 МГц соответственно) под мощной нагрузкой в Crysis 3. Да, мы по-прежнему используем эту игру в качестве стресс-теста: достаточно сказать, что RTX 3080 стал первым ускорителем на нашей памяти, который добился в Crysis 3 фреймрейта 60 FPS при разрешении 4К (даже без полноэкранного сглаживания MSAA!). А вот по сравнению с чипом TU102 на плате GeForce RTX 2080 Ti новый GPU тактуется на 131 МГц выше, невзирая на полуторакратную разницу в транзисторных бюджетах. Жаль только, что универсальные программные инструменты для мониторинга и разгона видеокарт еще не получили доступ к датчикам питающего напряжения GPU, чтобы мы узнали, как смена техпроцесса подействовала на этот параметр.

Парадоксально, что NVIDIA раздала (избранным IT-изданиям, но тем не менее) комплекты для измерения мощности ускорителей именно в то время, когда ее потребительские устройства достигли беспрецедентно высоких TDP. Но может быть, в том-то и дело, что мы проверим мощность Ampere на практике и убедимся, что она не так страшна, как следует из его официальных ТТХ. Увы, по крайней мере Palit RTX 3080 GamingPro OC действительно расходует не меньше 314 из положенных по паспорту 320 Вт мощности. Единственная видеокарта, не считая «двухголовых» устройств, в нашей базе данных, которая превосходит по мощности RTX 3080, — это Radeon RX Vega 64 со штатной СЖО, а все предыдущие топ-модели NVIDIA (включая 250-ваттные RTX 2080 SUPER и RTX 2080 Ti) новинка оставила далеко позади.

При таком внушительном энергопотреблении и, следовательно, тепловыделении GPU нужно отдать должное системе охлаждения Palit. Температура в пределах 70 °C под нагрузкой еще не является признаком качества — просто именно так настроена автоматика кулера, а вот удержать уровень шума на отметке 38 дБА (ниже, чем у старших моделей Founders Edition прошлого поколения) куда сложнее.

Рабочие параметры под нагрузкой (Crysis 3)
Видеокарта Настройки Тактовая частота GPU, МГц Напряжение питания GPU, В Частота вращения вентиляторов, об/мин (% от макс.) Частота вращения вентиляторов 2, об/мин (% от макс.)
Средн. Макс. Средн. Макс. Средн. Средн.
Palit GeForce RTX 3080 GamingPro OC (1440/1740 МГц, 19 Гбит/с, 10 Гбайт) 1854 1950 Н/Д Н/Д 1823 (46%) 1823 (46%)
Palit GeForce RTX 3080 GamingPro OC (+50 МГц, 21,2 Гбит/с, 10 Гбайт) +9% мощности 1940 2010 Н/Д Н/Д 1894 (48%) 1894 (48%)
NVIDIA GeForce GTX 1080 Ti FE (1480/1582 МГц, 11000 Мбит/с, 11 Гбайт) 1735 1810 0,96 1,01 2377 (50%) Н/Д
NVIDIA GeForce RTX 2080 SUPER FE (1650/1815 МГц, 15,5 Гбит/с, 8 Гбайт) 1907 1920 1,03 1,04 1969 (53%) 1969 (53%)
NVIDIA GeForce RTX 2080 Ti FE (1350/1645 МГц, 14 Гбит/с, 11 Гбайт) 1723 1860 0,91 1,03 2082 (56%) 2082 (56%)
AMD Radeon VII (1800 МГц, 2000 Мбит/с, 16 Гбайт) 1756 1786 Н/Д Н/Д 2617 (Н/Д) Н/Д
AMD Radeon RX 5700 XT (1605/1905 МГц, 14 Гбит/с, 8 Гбайт) Термопаста ARCTIC MX-2 вместо графитовой прокладки 1795 1819 1,07 1,18 2102 (43%) Н/Д

Прим. Измерение всех параметров выполняется после прогрева GPU и стабилизации тактовых частот.

Мы не питали больших надежд на оверклокинг GeForce RTX 3080, и, как показал опыт, видеокарта действительно не поддается разгону, который выражается в сколько-нибудь значимом приросте игрового быстродействия. Начнем с того, что прошивка Palit GamingPro OC позволяет лишь на 9 % увеличить резерв мощности платы, который является главным препятствием для наращивания тактовых частот графического процессора. А в рамках установленного TDP автоматика GPU Boost уже практически исчерпывает частотный потенциал. Нам удалось добавить 50 МГц к проектной частоте Boost Clock, что выражается в 85 МГц реальной тактовой частоты под игровой нагрузкой (5 % от исходных 1854 МГц). Надо ли говорить, что это капля в море, которая едва ли повлияет даже на самые чувствительные бенчмарки. К тому же оверклокинг графического ядра влечет за собой рост и без того чрезвычайно высокой потребляемой мощности на 19 Вт — к счастью, хотя бы без последствий для температуры и шума системы охлаждения.

Быть может, в GeForce RTX 3080 выгоднее разгонять оперативную память? Задел для оверклокинга чипов GDDR6X со штатной пропускной способностью 19 Гбит/с, которые применяются в GeForce RTX 3080, существует, но раскрыть его не так-то просто. Для того, чтобы найти предел стандартных чипов GDDR6 при неизменных таймингах, достаточно постепенно увеличивать тактовую частоту, пока видеокарта не потеряет стабильность или не появятся графические артефакты на экране. GDDR6X ведет себя коварно: поначалу мы смогли довести пропускную способность чипов до 21,8 Гбит/с на контакт, но скоро обнаружили, что чем дальше она уходит за пределы 21,2 Гбит/с, тем сильнее не возрастает, а, наоборот, падает производительность. Все дело в коррекции ошибок (ECC), свойственной этому типу памяти.

Кстати, GPU-Z и подобные программы некорректно определяют командную частоту GDDR6X на уровне 1 188 МГц, хотя на самом деле она вдвое выше. Если в будущем не исправят эту ошибку, привыкайте умножать число на 16, а не на 8, как с GDDR6, чтобы получить итоговую пропускную способность чипов.

#Игровые тесты (1920 × 1080)

Постоянные читатели железного раздела 3DNews наверняка заметили, что состав тестовой методики для новых GPU сильно изменился. Мы исключили из программы синтетическую нагрузку — как 3DMark в разделе игрового 3D-рендеринга, так и аналогичные тесты вычислений общего назначения. Да, 3DMark неплохо подходит для того, чтобы быстро оценить разницу между близкими по характеристикам видеокартами. Но когда речь идет о новом поколении графических процессоров, которое претендует на качественно иной уровень производительности, изучать «попугаи» в 3DMark не имеет никакого смысла. Он давно перестал быть альтернативой играм, основанным на разных графических движках и работающим с разными API, и порой изрядно расходится с действительностью в оценках GPU той или иной архитектуры. Бенчмарки с трассировкой лучей и масштабированием DLSS в 3DMark неплохо иллюстрировали возможности ускорителей GeForce RTX 20-й серии в их первые месяцы, но теперь вдобавок к играм, использующим богатые функции «гибридного» рендеринга, появились полностью трассированные модификации Quake II и Minecraft. В итоге мы решили упразднить тесты в 3DMark и вместо них расширить арсенал настоящих игр, который теперь наполовину состоит из проектов, поддерживающих трассировку лучей в том или ином объеме.

С другой стороны, нужно пояснить, почему в списке тестов отсутствуют некоторые игровые новинки 2020 года, отличившиеся высокими запросами к железу и на первый взгляд идеально подходящие для проверки таких устройств, как GeForce RTX 3080. Речь идет о Horizon Zero Dawn и Microsoft Flight Simulator, которым на 3DNews посвящены масштабные сравнительные тесты. Дело в том, что обе игры вышли на PC относительно недавно и пока не отличаются высокой стабильностью вообще и быстродействия в частности. Рисковать повторяемостью результатов бенчмарков ради того, чтобы тестовая методика состояла из самых свежих игр, мы не готовы, так что Horizon Zero Dawn и MSFS придется постоять в очереди, пока не закончится первая волна патчей, исправляющих ошибки.

Итак, приступим к анализу тестовых результатов в стартовом разрешении 1080p, которое, честно говоря, совершенно не подходит для того, чтобы раскрыть потенциал ускорителей класса GeForce RTX 3080. А жаль, ведь именно в таком режиме современное железо может развивать кадровую частоту свыше 100 FPS не только в легких киберспортивных играх, но и в требовательных ААА-проектах, что положительно сказывается на времени реакции — особенно на экране с высокой частотой. Недавно мы отдельно разбирали этот вопрос в ходе аппаратного тестирования задержек с помощью LDAT и пришли к выводу, что FPS полезно наращивать за пределы частоты обновления монитора, будь у вас даже сверхскоростная матрица 240 Гц. Увы, среди тестовых игр только DOOM Eternal и Strange Brigade являются таким счастливым исключением.

Тем не менее даже в таких условиях GeForce RTX 3080 обеспечивает существенную прибавку в 20 % усредненной кадровой частоты по сравнению с бывшим флагманом потребительских видеокарт NVIDIA, GeForce RTX 2080 Ti, а если сравнивать с RTX 2080 SUPER, речь идет от дополнительных 38 % FPS. Наконец, старшие модели позапрошлого поколения — GTX 1080 и GTX 1080 Ti — новинка превосходит на целых 110 и 67 % соответственно. Нечего и говорить о «красных» топах до предстоящего релиза чипов Navi второй волны: GeForce RTX 2080 одержал победу над Radeon VII и Radeon RX 5700 XT с преимуществом в 64 и 69 %.

Игровые тесты (2560 × 1440, 3840 × 2160). Игровые тесты в разгоне

#Игровые тесты (2560 × 1440)

Переход к разрешению 1440p позволил мощным видеокартам вздохнуть свободнее, но соотношение между GeForce RTX 3080 и старшими моделями серии RTX 20 от этого принципиально не изменилось. Ускоритель на чипе Ampere превосходит GeForce RTX 2080 SUPER и RTX 2080 Ti по среднему FPS на 46 и 24 % соответственно. Другое дело, если сравнить RTX 3080 с прошлым поколением видеокарт NVIDIA: отрыв от GeForce GTX 1080 и GTX 1080 Ti увеличился до впечатляющих 134 и 79 %. То же касается «красных» ускорителей средне-высокой ценовой категории на базе современной архитектуры RDNA, представленных Radeon RX 5700 XT: RTX 3080 превосходит последний уже на 80 % FPS.

#Игровые тесты (3840 × 2160)

Тесты на 4К-экране должны поставить точку в сравнении ускорителей 30-й серии с их ближайшими предшественниками. В таких условиях бутылочным горлышком системы становится именно графический, а не центральный процессор. К тому же, коль скоро старшие модели поколения Turing считаются видеокартами, подходящими для разрешения 2160p, их эстафету должны перенять все три новинки: от GeForce RTX 3070 до RTX 3090.

Тем не менее игровая графика тоже не стоит на месте. Хотя мы больше не используем в бенчмарках ресурсоемкое полноэкранное сглаживание MSAA и подобного типа, которое повсеместно вытеснили легковесные разновидности TAA, только в шести из десяти тестовых проектов средняя частота смены кадров на GeForce RTX 3080 перевалила за 60 FPS. Прошло уже семь лет с тех пор, как NVIDIA и AMD официально открыли эпоху гейминга в 4К, а избавить передовые игры на максималках от костылей в виде масштабирования кадра с помощью DLSS или FidelityFX CAS по-прежнему невозможно. Хотя, справедливости ради, надо сказать, что среди всех игр только в Total War: THREE KINGDOMS — очередной серии вечно тормозящей стратегии — новый ускоритель не удержал фреймрейт как минимум на уровне 50 FPS.

Как ни крути, RTX 3080 все-таки сильно продвинулся к цели сделать 4К безоговорочно играбельным режимом, достигнув 55-процентного преимущества перед GeForce RTX 2080 SUPER. Конечно, это еще не такие рекордные показатели роста быстродействия между поколениями GPU, какими отличились ускорители семейства Pascal: к примеру, GeForce GTX 1080 в таких же условиях оказался на 72 % быстрее GeForce GTX 980. Однако нужно сделать поправку на то, что в то время чипмейкеры совершили гигантский прорыв в технологии производства GPU с нормы 28 нм к 14/16-нанометровой фотолитографии. Свидетелями такого прироста быстродействия мы вряд ли станем в обозримом будущем, если только TSMC и Samsung не столкнутся с очередным кризисом масштабирования транзисторов. С другой стороны, стоит учесть, что, в отличие от GeForce RTX 2080, и RTX 2080 SUPER новый GeForce RTX 3080 основан на чипе первого эшелона, пусть и сильно урезанном по числу активных исполнительных блоков, так что и спрос с него выше, чем с того же RTX 2080, который сумел предложить лишь на 37 % больше FPS по сравнению со своим прямым предшественником GeForce GTX 1080.

Разница между GeForce RTX 3080 и GeForce RTX 2080 Ti оценивается в 29 % средней кадровой частоты. Вряд ли даже такие числа убедят пользователей бывшей топ-модели в необходимости срочного апгрейда (предприимчивые читатели добавят, что от RTX 2080 Ti нужно было избавиться заранее, пока еще не рухнули цены), а вот перспектива смены GeForce GTX 1080 или даже GeForce GTX 1080 Ti на RTX 3080 для игры в 4К выглядит чрезвычайно привлекательно. Как ни крути, ему рукой подать до отметки 60 FPS в таких невероятно тяжелых играх, как Red Dead Redemption 2, при максимальном качестве графики, но и во всех остальных случаях RTX 3080 превосходит старшие модели семейства Pascal по среднему фреймрейту в 2–2,5 раза.

#Игровые тесты в разгоне

От жалких 5 % кадровой частоты GPU, которые мы смогли выжать из Palit RTX 3080 GamingPro OC в попытках оверклокинга, не приходится ожидать сколько-нибудь значительного влияния на игровую производительность. Оперативная память GDDR6X в RTX 3080 оказалась более перспективной целью для разгона: в конце концов, нам удалось увеличить ее пропускную способность с 19 до 21,2 Гбит/с на контакт шины, а это составляет целых 16 % от ее штатных характеристик. Как следствие, если мы сможем найти в бенчмарках разогнанного RTX 3080 какую-то полезную информацию, она будет ответом на вопрос, хватает ли урезанному чипу GA102 общей ПСП в 760 Гбайт/с, которой его наделила NVIDIA.

Как выяснилось, хватает, и наверняка с большим запасом. Почти во всех тестах при разрешении 4К дополнительная ПСП и символически разогнанный графический процессор принесли GeForce RTX 3080 ровно 1 % фреймрейта (что, кстати, говорит о надежности тестовой методики, в которую мы включили игры с наиболее стабильным быстродействием). Нечего и говорить, что при более низком разрешении разгон целиком будет перекрыт процессорозависимостью игр и погрешностью измерения. Не исключаем, что в будущем нам еще попадутся варианты GeForce RTX 3080, благосклонные к разгону, но уже сейчас можно предсказать, что за рамками самых экстремальных случаев это бессмысленная затея.

Игровые тесты с трассировкой лучей. Вычисления общего назначения. Кодирование/декодирование видео. Таблицы результатов. Выводы

#Игровые тесты с трассировкой лучей

GeForce RTX 3080 уже продемонстрировал нешуточный рост быстродействия в бенчмарках с традиционным растеризационным 3D-рендерингом, но мы ожидали получить самые яркие результаты в тестах игрового рейтрейсинга. В конце концов, именно рывок скорости трассировки лучей должен стать кульминацией всех изменений, которые NVIDIA заложила в архитектуру Ampere.

Так и получилось. Если не брать в расчет масштабирование кадра при помощи DLSS, RTX 3080 гораздо лучше выдерживает лавинообразный рост вычислительной нагрузки, который вызывает трассировка лучей. Как следствие, между новинкой и топовыми ускорителями 20-й серии возникает значительная дистанция даже при условно-низком разрешении 1080p: согласно результатам шести бенчмарков RTX 3080 на 48 % превосходит GeForce RTX 2080 SUPER и на 23 % — RTX 2080 Ti. Если двигаться дальше к режиму 1440p, разрыв увеличивается до 55 и 29 % соответственно и достигает пика в 4К с показателями 69 и 32 %. Вот теперь мы наконец-то имеем дело с ростом быстродействия по золотым стандартам архитектуры Pascal!

Впрочем, сила Ampere не столько в относительных, сколько в абсолютных числах. При разрешении 1440p трассировка лучей помешала GeForce RTX 3080 закрепиться на отметке 60 FPS только в бенчмарке Metro Exodus, и даже полностью трассированные модификации Quake II RTX и Minecraft ускоритель переварил без всяких проблем. Конечно, говорить о возможности игры с трассировкой лучей и без тормозов в честном 4К все еще преждевременно, но благодаря GeForce RTX 3080 это стало возможным по крайней мере в Battlefield V и, с некоторой натяжкой, в Shadow of the Tomb Raider.

Благо почти все игры, поддерживающие DXR (или библиотеки рейтрейсинга в API Vulkan), одновременно позволяют использовать DLSS. Технология масштабирования кадров при помощи нейросети прошла огромный путь от первых, откровенно неудачных реализаций в Battlefield V и Metro Exodus и научилась выдавать картинку, которую с трудом удается отличить невооруженным глазом от честного полнокадрового рендеринга. А вот в таких условиях достижения GeForce RTX 3080 уже не настолько впечатляют, как то, что мы увидели до этого. Не все игры позволяют включить DLSS на мощных ускорителях при разрешении экрана ниже 1440p или 2160p, но всегда действует одно правило: GeForce RTX 2080 и RTX 2080 Ti благодаря DLSS подтягиваются к GeForce RTX 3080 так, что в 4К преимущество новинки перед ее предшественниками сжимается до 52 и 23 % соответственно. Это по-прежнему сильный результат, но о достойных пресловутого «Паскаля» 69 и 32 % речь уже не идет.

#Вычисления общего назначения

Видеокарты на чипах Turing отлично чувствовали себя в задачах, связанных с расчетами общего назначения. Несмотря на игровую ориентацию GeForce 20-й серии, именно в сфере GP-GPU, где до того явным фаворитом была логика GCN от AMD, эта архитектура принесла наибольшие дивиденды. В этот раз NVIDIA обязана как минимум закрепить, а в лучшем случае повторить прошлый успех, ведь сырая вычислительная мощность Ampere благодаря громадному количеству шейдерных ALU и переработанным блокам трассировки лучей вышла на совершенно иной уровень.

Не все приложения одинаково эффективно распоряжаются ресурсами GPU, но уже в Adobe Premiere Pro новый ускоритель способен существенно уменьшить время рендеринга 4К-видео со сложными графическими эффектами по сравнению с рабочими станциями на GeForce RTX 2080 SUPER, а разница между Ampere и Pascal так и вовсе просто колоссальная («красные» видеокарты, как и следовало ожидать, держатся лучше). Заметим, что в этом тесте не используется возможность кодирования H.264 и H.265 силами аппаратного медиадвижка NVENC — нас интересует только производительность самого GPU.

Лучше всего мощь архитектуры Ampere раскрывают задачи оффлайнового рейтрейсинга — такие как рендеринг в Blender на движке Cycles. Здесь GeForce RTX 3080 продемонстрировал более чем двукратное преимущество в скорости отрисовки сцены перед «Тьюрингами» и Radeon VII, неважно, проводится ли рендеринг с использованием RT-ядер или исключительно софтверным методом. Впрочем, движок Radeon ProRender, который мы используем в качестве альтернативы строго тайловым рендеререам наподобие Cycles, не был настолько же впечатлен достижениями Ampere.

Прим. Для тестов новых видеокарт мы перешли на актуальную релизную версию Blender — 2.9 — и обнаружили, что Radeon RX 5700 XT снова потерял возможность работать с движком Cycles.

Напоследок прокомментируем результаты бенчмарка, использующего не только шейдерные ALU графического процессора, но и тензорные ядра — в данном случае для дебайеринга видеозаписей, снятых на профессиональную камеру RED. Здесь мы не ожидали от Ampere каких-либо чудес, ведь сильнейший рост пропускной способности на одно тензорное ядро новая архитектура сулит только в работе со структурно-разреженными сетями. Действительно, смена одного из старших «Тьюрингов» на GeForce RTX 3080 не повлияет на скорость декодирования R3D при разрешении 8К, но вот полоска 6К и в особенности 4К на графике просто выстреливает вперед.

Ускорители на чипах Ampere, вне всяких сомнений, должны вызвать большой интерес не только у геймеров, но и у профессионалов, занимающихся обработкой аудиовизуального контента. Однако более подробные тесты новых видеокарт мы приберегли для GeForce RTX 3090, который представляет собой скорее профессиональную, нежели игровую видеокарту.

#Кодирование/декодирование видео

Еще одним нововведением среди вычислительных функций кремния Ampere является декодирование видео стандарта AV1 силами специализированного ASIC NVDEC. Пожалуй, это первый кодек, настолько требовательный к вычислительным ресурсам, что распаковка потока AV1 при высоком разрешении, для которого он и предназначен, изрядно загружает даже мощный десктопный CPU, а на большинстве ноутбучных чипов попросту невозможна с плавной частотой смены кадров. Чипы Ampere решают проблему за счет быстрого аппаратного декодирования, но проверить эту функцию самостоятельно мы пока не можем: в большинстве программных кодировщиков поддержка AV1 еще не вышла из экспериментальной стадии и либо вовсе не позволяет создавать ролики с разрешением 8К, либо это происходит чрезвычайно медленно и занимает вплоть до нескольких суток на один файл.

Ну а пока мы обнаружили, что обновленный NVDEC существенно прибавил в скорости декодирования «старых» форматов HEVC и VP9, пусть она и без того была избыточно высокой для просмотра фильмов. Резерв нужен GPU для декодирования нескольких потоков в профессиональных задачах, а также быстрого перекодирования видео в другой формат с привлечением CPU или на связке NVDEC + NVENC. Кстати, NVENC не претерпел абсолютно никаких изменений в Ampere — это по-прежнему самый быстрый аппаратный кодировщик H.264 и HEVC, который можно найти в графических и центральных процессорах.

#Производительность на ватт и площадь GPU

О том, какие численные преимущества дал NVIDIA переход на техпроцесс 8 нм, преждевременно говорить, пока мы не провели тесты GeForce RTX 3090. Как ни крути, чип GA102 в составе RTX 3080 значительно урезали, а это не лучшим образом сказывается на его энергоэффективности. Тем не менее, если сфокусироваться не на процессорах, а на конкретных устройствах, можно сделать определенные предварительные выкладки. Во-первых, производительность на ватт у GeForce RTX 3080 все-таки увеличилась по сравнению с RTX 2080 SUPER, основанным на полностью функциональном чипе TU104, причем изрядно — на 23 %. А вот по сравнению с RTX 2080 Ti — всего лишь на 5 %, хотя, повторимся, здесь нужно отталкиваться от результатов RTX 3090.

Ну а самое главное, по удельному быстродействию на фоне RTX 3080 очень бледно смотрится не только Radeon VII, но и Radeon RX 5700 XT. Новинка обеспечивает на 36 % больше FPS в пересчете на ватт потребляемой мощности, хотя оба чипа — и GA102, и Navi 10 — производятся по технологическим нормам одного класса. Конечно, сравнивать по энергоэффективности GPU настолько разного масштаба не вполне корректно. Тем более мы знаем, что Radeon RX 5700 XT подвело сильно завышенное напряжение питания GPU. Но во всяком случае ясно, что AMD уже нельзя повторять подобные ошибки, если она намерена преодолеть технологическое отставание в одно поколение GPU и сделать из чипов Navi второго поколения конкурентов для NVIDIA Ampere.

ПроизводительNVIDIAAMD
Модель GeForce RTX 3080 GeForce GTX 1080 Ti GeForce RTX 2080 SUPER GeForce RTX 2080 Ti FE Radeon VII Radeon RX 5700 XT
Графический процессор GA102 GP102 TU104 TU102 Vega 20 XL Navi 10 XT
Микроархитектура Ampere Pascal Turing Turing GCN 5 поколения RDNA
Техпроцесс, нм 8 нм (8N) 16 нм FFN 12 нм FFN 12 нм FFN 7 нм FinFET 7 нм FinFET
Число транзисторов, млн 28 300 12 000 13 600 18 600 13 200 10 300
Площадь чипа, кв. мм 628 471 545 754 331 251
Средняя потребляемая мощность (Crysis 3), Вт 314 227 248 255 280 213
Производительность/Вт 100% −29% −18% −5% −37% −26%
Производительность/млн транзисторов 100% +22% +34% +18% +21% +37%
Производительность/кв. мм 100% −31% −26% −36% +7% +25%
Производительность/Вт (обратное сравнение) 100% +40% +23% +5% +58% +36%
Производительность/млн транзисторов (обратное сравнение) 100% −18% −25% −15% −17% −27%
Производительность/кв. мм (обратное сравнение) 100% +45% +35% +55% −7% −20%

#Результаты игровых тестов и рекомендованные цены

1920 × 1080
Полноэкранное сглаживание Palit GeForce RTX 3080 GamingPro OC NVIDIA GeForce GTX 1080 NVIDIA GeForce GTX 1080 Ti NVIDIA GeForce RTX 2080 SUPER NVIDIA GeForce RTX 2080 Ti FE AMD Radeon VII AMD Radeon RX 5700 XT
Assassin's Creed Odyssey TAA High 78 / 100 55 / 62 67 / 76 70 / 81 74 / 90 56 / 68 51 / 67
Battlefield V TAA High 153 / 177 107 / 127 124 / 140 147 / 159 142 / 167 133 / 154 125 / 151
Borderlands 3 TAA 124 / 142 55 / 63 72 / 83 83 / 94 98 / 111 80 / 89 81 / 89
Control TAA 137 / 152 59 / 63 78 / 83 96 / 105 118 / 129 87 / 95 78 / 87
DOOM Eternal TAA 189 / 295 71 / 122 87 / 156 141 / 221 165 / 253 102 / 167 106 / 171
Metro Exodus TAA 56 / 96 25 / 45 32 / 58 39 / 69 47 / 80 30 / 54 30 / 54
Red Dead Redemption 2 TAA High 77 / 84 29 / 31 38 / 41 49 / 54 53 / 63 40 / 44 38 / 42
Shadow of the Tomb Raider TAA 111 / 162 65 / 84 89 / 117 107 / 140 113 / 150 84 / 115 89 / 114
Strange Brigade AA Ultra 264 / 346 106 / 137 136 / 178 176 / 228 207 / 269 123 / 186 119 / 168
Total War: THREE KINGDOMS TAA 86 / 102 38 / 46 47 / 57 60 / 71 71 / 85 44 / 52 39 / 47
Макс. −28% −21% −10% −6% −13% −15%
Средн. −52% −40% −27% −16% −39% −41%
Мин. −63% −51% −36% −25% −49% −54%
2560 × 1440
Полноэкранное сглаживание Palit GeForce RTX 3080 GamingPro OC NVIDIA GeForce GTX 1080 NVIDIA GeForce GTX 1080 Ti NVIDIA GeForce RTX 2080 SUPER NVIDIA GeForce RTX 2080 Ti FE AMD Radeon VII AMD Radeon RX 5700 XT
Assassin's Creed Odyssey TAA High 77 / 92 44 / 49 56 / 62 54 / 64 66 / 77 43 / 53 47 / 56
Battlefield V TAA High 143 / 160 80 / 99 98 / 115 113 / 130 126 / 145 111 / 129 100 / 124
Borderlands 3 TAA 92 / 105 37 / 42 50 / 57 58 / 65 69 / 78 57 / 62 57 / 62
Control TAA 99 / 103 36 / 39 51 / 55 64 / 71 85 / 88 60 / 64 51 / 57
DOOM Eternal TAA 168 / 251 59 / 92 74 / 123 116 / 175 139 / 202 90 / 138 90 / 135
Metro Exodus TAA 49 / 81 21 / 36 27 / 47 33 / 56 40 / 66 27 / 45 26 / 44
Red Dead Redemption 2 TAA High 68 / 74 24 / 27 33 / 35 43 / 47 45 / 54 35 / 38 34 / 36
Shadow of the Tomb Raider TAA 110 / 139 44 / 55 62 / 78 77 / 96 89 / 111 61 / 81 61 / 76
Strange Brigade AA Ultra 210 / 262 77 / 94 102 / 127 135 / 164 159 / 196 99 / 138 93 / 121
Total War: THREE KINGDOMS TAA 60 / 70 25 / 29 32 / 38 40 / 47 49 / 57 30 / 34 26 / 31
Макс. −38% −28% −19% −9% −19% −23%
Средн. −57% −44% −32% −19% −42% −45%
Мин. −64% −53% −38% −27% −51% −56%
3840 × 2160
Полноэкранное сглаживание Palit GeForce RTX 3080 GamingPro OC NVIDIA GeForce GTX 1080 NVIDIA GeForce GTX 1080 Ti NVIDIA GeForce RTX 2080 SUPER NVIDIA GeForce RTX 2080 Ti FE AMD Radeon VII AMD Radeon RX 5700 XT
Assassin's Creed Odyssey TAA High 58 / 65 26 / 30 36 / 40 40 / 46 48 / 54 35 / 41 33 / 37
Battlefield V TAA High 100 / 114 44 / 55 55 / 68 67 / 80 77 / 91 64 / 76 55 / 68
Borderlands 3 TAA 53 / 60 20 / 22 27 / 31 32 / 35 38 / 43 29 / 32 29 / 34
Control TAA 53 / 55 17 / 19 25 / 27 32 / 36 43 / 45 31 / 33 25 / 28
DOOM Eternal TAA 118 / 159 38 / 52 49 / 69 73 / 98 90 / 117 62 / 85 47 / 62
Metro Exodus TAA 36 / 55 14 / 23 20 / 31 24 / 37 28 / 44 20 / 31 19 / 29
Red Dead Redemption 2 TAA High 51 / 54 18 / 19 24 / 25 31 / 34 35 / 40 26 / 28 24 / 26
Shadow of the Tomb Raider TAA 66 / 79 23 / 28 33 / 41 42 / 51 50 / 61 34 / 44 30 / 39
Strange Brigade AA Ultra 134 / 155 44 / 52 60 / 71 83 / 93 98 / 113 70 / 88 61 / 72
Total War: THREE KINGDOMS TAA 33 / 38 13 / 15 16 / 19 21 / 24 26 / 30 15 / 18 12 / 15
Макс. −52% −38% −29% −17% −33% −40%
Средн. −62% −48% −36% −23% −44% −50%
Мин. −67% −57% −42% −28% −53% −61%

#Результаты игровых тестов с трассировкой лучей

1920 × 1080
Полноэкранное сглаживание Palit GeForce RTX 3080 GamingPro OC NVIDIA GeForce RTX 2080 SUPER NVIDIA GeForce RTX 2080 Ti FE
Battlefield V TAA High 95 / 117 67 / 87 86 / 105
Control TAA 85 / 91 54 / 58 69 / 72
Metro Exodus TAA 47 / 75 34 / 54 41 / 64
Minecraft with RTX Beta Нет 103 / 115 61 / 70 75 / 85
Quake II RTX TAA Н/Д / 119 Н/Д / 72 Н/Д / 88
Shadow of the Tomb Raider TAA 90 / 121 62 / 89 75 / 105
Макс. −26% −10%
Средн. −32% −19%
Мин. −39% −26%
2560 × 1440
Полноэкранное сглаживание Palit GeForce RTX 3080 GamingPro OC NVIDIA GeForce RTX 2080 SUPER NVIDIA GeForce RTX 2080 Ti FE
Battlefield V TAA High 72 / 95 49 / 66 63 / 82
Control TAA 59 / 64 36 / 38 45 / 48
Metro Exodus TAA 38 / 57 26 / 39 32 / 47
Minecraft with RTX Beta Нет 66 / 72 37 / 42 45 / 51
Quake II RTX TAA Н/Д / 71 Н/Д / 42 Н/Д / 51
Shadow of the Tomb Raider TAA 67 / 90 42 / 60 51 / 72
Макс. −31% −14%
Средн. −36% −22%
Мин. −42% −29%
3840 × 2160
Полноэкранное сглаживание Palit GeForce RTX 3080 GamingPro OC NVIDIA GeForce RTX 2080 SUPER NVIDIA GeForce RTX 2080 Ti FE
Battlefield V TAA High 43 / 61 27 / 39 35 / 50
Control TAA 31 / 34 18 / 20 23 / 25
Metro Exodus TAA 23 / 34 14 / 21 19 / 27
Minecraft with RTX Beta Нет 30 / 34 17 / 18 21 / 24
Quake II RTX TAA Н/Д / 33 Н/Д / 19 Н/Д / 23
Shadow of the Tomb Raider TAA 38 / 50 21 / 30 28 / 39
Макс. −36% −18%
Средн. −41% −24%
Мин. −47% −30%
3840 × 2160 (DLSS)
Полноэкранное сглаживание (без DLSS) Palit GeForce RTX 3080 GamingPro OC NVIDIA GeForce RTX 2080 SUPER NVIDIA GeForce RTX 2080 Ti FE
Battlefield V TAA High 59 / 72 41 / 51 51 / 64
Control TAA 53 / 56 33 / 35 41 / 43
Metro Exodus TAA 34 / 48 23 / 33 29 / 41
Minecraft with RTX Beta Нет 87 / 95 49 / 56 61 / 69
Shadow of the Tomb Raider TAA 55 / 69 36 / 47 44 / 57
Макс. −29% −11%
Средн. −34% −19%
Мин. −41% −27%

#Выводы

В ближайшее время GeForce RTX 3080 предстоит выдержать сравнение не только с ускорителями NVIDIA прошлого поколения, но и с грядущими высокопроизводительными продуктами AMD. Однако неважно, чем закончится это противостояние, уже сейчас очевидно, что 30-я серия GeForce на чипах Ampere скорее вызовет согласие во мнениях, нежели ожесточенные споры, которые спровоцировала линейка RTX 20.

Теперь, когда все трудности с доставкой тестовых образцов остались позади и можно оперировать данным независимых измерений производительности, болельщикам зеленой команды, которые без колебаний поверили в заявления о двукратном превосходстве новинки над RTX 2080, и скептикам, твердившим о «фальшивых шейдерах», придется выработать компромиссный взгляд на быстродействие RTX 3080. Конечно, NVIDIA подобрала для рекламных материалов тесты, представляющие новое поколение в самом выгодном свете, а на практике среднее преимущество RTX 3080 перед GeForce RTX 2080 SUPER оценивается более скромными 55 % FPS, если взять игры в режиме 4К без трассировки лучей, и 52–69 % с трассировкой (в зависимости от того, используется ли DLSS). Можно возразить, что мы взяли GeForce RTX 2080 SUPER, а не оригинальный RTX 2080, отталкиваться от которого, разумеется, удобнее NVIDIA, но разница в быстродействии между последними не превышает 5 % и, следовательно, не меняет общую картину.

Как ни крути, в реальных играх RTX 3080 не настолько силен, как на бумаге, но повода для расстройства или злорадства мы в этом тоже не нашли. После серии чипов Turing — революционной в функциональном плане, но разочаровывающей с точки зрения прироста быстродействия — хочется вернуть назад цифры межпоколенческой разницы свыше 70 % FPS, но стоит напомнить, что Pascal был уникальным явлением, которое стало возможным благодаря рывку фотолитографии с норм 28 на 16 нм. Не факт, что технологии производства чипов в современном виде когда-либо позволят его повторить. Ampere усилил видеокарты NVIDIA больше, чем весьма успешная для своего времени архитектура Maxwell, а в тестах с трассировкой лучей и вправду можно отыскать результаты, близкие к достижениям Pascal.

Но главное в Ampere — это не столько количественный, сколько качественный характер, который приобретает рост производительности. GeForce RTX 3080 по силам любые игры (кроме самых сложных или скверно оптимизированных) в 4К на максималках, а при разрешении 1440p он в большинстве случаев не нуждается в DLSS даже для трассировки лучей. Впрочем, рейтрейсинг по-прежнему так сильно нагружает GPU, что без технологий масштабирования кадров резерва для будущих, еще более требовательных игр осталось немного даже у RTX 3080 (благо сама DLSS с каждой итерацией работает все лучше, и стремиться отбросить ее любой ценой бессмысленно). Как бы то ни было, теперь можно поставить точку в затянувшейся истории GeForce GTX 1080 Ti — владельцы этого ускорителя могут смело рассчитывать на двойную норму прежнего фреймрейта. Единственное противопоказание к апгрейду на RTX 3080 — если вы сидите за монитором с разрешением 1920 × 1080. Даже самый современный CPU не выжмет из старших Ampere быстродействия, на которое они рассчитаны, в таком графическом режиме.

Пожалуй, единственная претензия, которую мы можем предъявить к GeForce RTX 3080 с чисто технической стороны, касается энергопотребления, которое действительно доходит до честно указанных 320 Вт. Впору воскресить старинный мем «GTX — ПЕЧ», если бы не смена буквы в названии видеокарт. Впрочем, мы и в данном вопросе придерживаемся скорее позитивной, нежели негативной точки зрения. Palit — пожалуй, самый доступный бренд графических ускорителей в России, но плата RTX 3080 GamingPro OC, благодаря которой мы познакомились с Ampere, не испытывает ни малейших проблем c охлаждением и тишиной. А сам по себерасход электроэнергии пользователей хорошо вентилируемых (для RTX 3080 вообще и видеокарты Palit в особенности это принципиальное условие) настольных ПК волновать не должен. Только на разгон GeForce RTX 3080 лучше не рассчитывать — NVIDIA уже сделала это заранее.

Что вызывает настоящие опасения, так это доступность «зеленых» новинок в рознице и, как следствие, их реальные, а не паспортные цены. В прошлые годы мы еще не сталкивались с тем, чтобы свежих видеокарт нигде не было в продаже, хотя у партнерам чипмейкера дали масса времени, чтобы наладить выпуск собственных устройств. А Founders Edition недоступен в российском интернет-магазине NVIDIA даже по предзаказу. Кроме того, мы уже писали в первой части обзора потребительских Ampere, что эти ускорители в принципе не созданы дешевыми. Приготовьтесь к тому, что видеокарты из первых поставок GeForce RTX 3080 будут стоить намного больше соблазнительных рекомендованных значений. А лучше повремените с апгрейдом еще месяц-два. Тогда и дефицит пойдет на убыль, и станет ясно, чем ответит на дебют 30-й серии красный конкурент.



Оригинал материала: https://3dnews.ru/1021061