Оригинал материала: https://3dnews.ru/1021405

Обзор видеокарты NVIDIA GeForce RTX 3090: предмет зависти

Технические характеристики, комплект поставки, цены. Конструкция. Печатная плата

В следующем месяце, когда AMD выпустит ускорители Radeon 6000, противостояние между двумя производителям дискретных GPU развернется с новой силой, но уже сейчас очевидно, что NVIDIA сделала очень сильный первый ход. Конечно, поклонникам зеленой марки следовало охладить завышенные ожидания по поводу возможностей GeForce RTX 3080 — первой видеокарты нового семейства, представленной на суд публики. В реальных играх RTX 3080 оказался не настолько силен, как на презентациях чипмейкера, и тем не менее архитектура Ampere повлияла на производительность видеокарт NVIDIA сильнее, чем прорывной для своего времени Maxwell, а в бенчмарках при разрешении 4К или с трассировкой лучей приближается к эталонным достижениям Pascal. А главное, NVIDIA откорректировала ценовую модель RTX 20-й серии, которая не встретила горячего одобрения среди покупателей и, по сути, вынуждала делать апгрейд не ради производительности, не так уж сильно изменившейся по сравнению со старшими моделями GeForce 10 в пересчете на доллар стоимости, а исключительно ради новых функций рендеринга, связанных с аппаратной трассировкой лучей. И что по-настоящему обидно, игры с графическими эффектами на основе рейтрейсинга все еще можно пересчитать по пальцам.

Возможно, грядущие продукты AMD еще заставят нас увидеть Ampere в новом свете, но пока единственным поводом для недовольства новыми видеокартами является их ограниченная доступность и, как следствие, завышенные цены. Но если вдруг именно производительность GeForce RTX 3080 кажется недостаточной, а деньги — второстепенный вопрос, NVIDIA приберегла напоследок более убедительное предложение. Давайте выясним, на какого покупателя рассчитан беспрецедентно мощный (в плане и вычислительного потенциала, и энергопотребления) графический ускоритель, когда всю работу над ошибками прошлого поколения уже сделал, причем на твердую пятерку, RTX 3080.

#Технические характеристики GeForce RTX 3080

Мы посвятили отдельную статью подробному разбору графических процессоров Ampere, которые лежат в основе новых ускорителей NVIDIA, но для тех читателей, которые пропустили на данный момент самое значительное событие в IT-индустрии 2020 года и только сейчас познакомятся с 30-й серией GeForce, приведем краткое резюме основных характеристик графического процессора GA102 и двух старших моделей в линейке RTX 30.

Кристалл GA102 содержит рекордное для чипов потребительской направленности количество транзисторов (28 млрд) и по этому параметру является самым крупным ASIC, который производится в наши дни на коммерческой основе, после истинного флагмана архитектуры Ampere — GA100 (54 млрд). Однако GA100 зарезервирован ускорителями для дата-центров и совершенно не предназначен для игр. Прямой предшественник новинки, чип TU102 семейства Turing, который применяется в GeForce RTX 2080 Ti и TITAN RTX, содержит в полтора раза меньше транзисторов по сравнению с GA102. Тем не менее чипы Ampere отличаются меньшей площадью в пересчете на количество элементов по сравнению с Turing и повышенной энергоэффективностью благодаря миграции производства с 12-нанометрового конвейера TSMC на самсунговский техпроцесс 8 нм.

Структура полностью функционального кристалла GA102 представлена семью блоками GPC (Graphics Processing Cluster, крупнейшими масштабируемыми компонентами массива) вместо шести в составе TU102. Каждый из них по-прежнему содержит 12 потоковых мультипроцессоров (Streaming Multiprocessor), но одно из ключевых архитектурных отличий Ampere от Turing заключается в том, что массив 32-битных CUDA-ядер, обрабатывающих вещественные числа, внутри SM был удвоен. В результате формула главных исполнительных блоков GA102 включает 10 752 FP32-совместимых CUDA-ядра и 336 блоков наложения текстур.

Однако GeForce RTX 3080 комплектуется существенно урезанной разновидностью GA102, в которой осталось только шесть действующих модулей GPC. Кроме того, два из них не полностью укомплектованы SM’ами. В итоге GeForce RTX 3980 располагает 8 704 шейдерными ALU для операций FP32 и 272 блоками наложения текстур. Но даже в таком виде GA102 располагает колоссальным потенциалом сырой вычислительной мощности по сравнению с топ-моделями 20-й серии. NVIDIA вернулась к практике, принятой в годы Kepler и Maxwell, когда ускорители с модельным номером на -80 или -80 Ti по рекомендованной розничной цене $649–699 были основаны на кремнии первого эшелона — в отличие от семейства Turing — и обеспечивали выгодное соотношение быстродействия в играх и цены.

Для тех, кому требуется максимальная производительность для рабочих задач или попросту хочется иметь самое лучшее железо, NVIDIA создала серию TITAN, но в этот раз появление такой видеокарты осталось под вопросом. Дело в том, что флагманский продукт основной линейки GeForce — RTX 3090 — по всем характеристикам близок к пределу возможностей чипа GA102. В кристалле деактивированы только 2 потоковых мультипроцессора, которые в общей сложности содержат 256 CUDA-ядер FP32, или 2 % от всего массива вещественночисленных ALU. Сделано это скорее с целью обеспечить резерв для возможных дефектов фотолитографии, нежели для сегментации модельного ряда с расчетом на будущие продукты. GeForce RTX 3090 и так превосходит TITAN RTX в 2,2 раза по расчетной пропускной способности операций FP32, а если сравнивать с GeForce RTX 2080 Ti, то уже в 2,5 раза.

А вот от следующей по старшинству модели 30-й серии новый флагман отделяет лишь 20 % теоретического быстродействия. Конечно, мы-то уже знаем, какие числа набрал RTX 3090 в игровых бенчмарках, но читатели, знакомые с обзором RTX 3080, тоже вряд ли рассчитывают увидеть на графиках еще 20 % FPS. Недаром NVIDIA избегает прямых сравнений между GeForce RTX 3080 и RTX 3090 в презентациях, посвященных 30-й серии. Есть только диаграмма с данными трех игр (Control, Minecraft с трассировкой лучей и Borderlands 3), в которых RTX 3090 хвастается на 50 % большей FPS по сравнению с TITAN RTX, но их тоже следует оценивать скептически, ведь ни в одном из перечисленных проектов нет встроенного бенчмарка, а условия тестирования могли сильно повлиять на результат.

В качестве нагрузки, адекватной возможностям GeForce RTX 3090, NVIDIA видит игры на экране с разрешением 8К. Учитывая, что за семь лет видеокарты так и не справились с 4К (после каждого рывка производительности выходят проекты, вновь опускающие частоту смены кадров ниже 60 FPS на максималках), нелегко поверить, что RTX 3090 сразу покорится режим 8К. В конце концов, количество пикселов на таком мониторе или телевизоре не вдвое, а вчетверо больше по сравнению с 4К, поэтому NVIDIA ориентируется на сравнительно легкие игры (такие как Apex Legends, Forza Horizon 4 и World of Tanks), которые являются посильной задачей для RTX 3090 в 8К при высоких настойках графики. Для более требовательных проектов, в том числе с трассировкой лучей, ввели особый режим работы DLSS, который подразумевает масштабирование кадра, отрендеренного в разрешении 2560 × 1440, до полного размера в 7580 × 4320 пикселов, а количество пикселов при таком соотношении между внутренним и выходным разрешением отличается 8,8 раза. Конечно, современные реализации DLSS версии 2.0 работают намного лучше ранних попыток и синтезируют настолько качественное изображение в 4К, что только при внимательном рассмотрении фрагментов кадра можно обнаружить ошибки нейросети, но еще более агрессивные алгоритмы, необходимые для 8К, безусловно, являются для DLSS новым вызовом. Когда у нас появится возможность проверить GeForce RTX 3090 в связке с настоящим 8К-экраном, мы обязательно выясним, соответствуют ли притязания NVIDIA действительности, но сегодня ограничимся стандартным набором тестов при разрешении от 1080p до 2160p.

В любом случае RTX 3090 предназначен не только и не столько для игр, сколько для рабочих приложений. В таких задачах, как 3D-моделирование, кодирование видео и, разумеется, машинное обучение, вполне можно рассчитывать на близкий к проектным величинамрост быстродействия между TITAN RTX и GeForce RTX 3090 (особенно в свете архитектурных новшеств Ampere) или даже между RTX 3080 и RTX 3090. Но основным преимуществом RTX 3090 перед RTX 3080 являются 24 Гбайт оперативной памяти. Кроме того, для того, чтобы получить такой объем и обеспечить быстрый доступ к данным почти нетронутому кристаллу GA102, в нем активировали все контроллеры GDDR6X, а совокупная ПСП оценивается в 936 Гбайт/с. Более скоростным интерфейсом VRAM среди игровых и просьюмерских ускорителей может похвастаться только Radeon VII (1 Тбайт/с), оборудованный памятью HBM2.

Наконец, GeForce RTX 3090 оказался единственной видеокартой 30-го семейства, которая поддерживает интерфейс NVLink для прямой коммуникации между двумя GPU. Общая пропускная способность канала осталась практически такой же, как в потребительских ускорителях архитектуры Turing (112,5 Гбайт/ с против 100 Гбайт/с в обе стороны), но это уже другая версия интерфейса, который теперь состоит из четырех линий скоростью 28,13 Гбайт/с вместо двух прежних на 50 Гбайт/с и требует использовать мостики нового образца. Функцию NVLink в RTX 3090 тоже оставили не для игр, а для приложений GP-GPU, которые в состоянии ей воспользоваться, но размер кластера в любом случае ограничен двумя графическими процессорами. Поддержка технологии SLI никуда не делась, но со следующего года NVIDIA не будет выпускать профили для новых игр. Работу с несколькими GPU отдали на откуп разработчикам, которым придется реализовывать функцию mGPU самостоятельно в рамках эксплицитного режима Direct3D 12.

ПроизводительNVIDIA
Модель GeForce RTX 2080 GeForce RTX 2080 SUPER GeForce RTX 2080 Ti TITAN RTX GeForce RTX 3080 GeForce RTX 3090
Графический процессор
Название TU104 TU104 TU102 TU102 GA102 GA102
Микроархитектура Turing Turing Turing Turing Ampere Ampere
Техпроцесс 12 нм FFN 12 нм FFN 12 нм FFN 12 нм FFN 8 нм (8N) 8 нм (8N)
Число транзисторов, млн 13 600 13 600 18 600 18 600 28 300 28 300
Тактовая частота, МГц: Base Clock / Boost Clock 1 515/1 710 (Founders Edition: 1 515/1 800) 1 650/1 815 1 350/1 545 (Founders Edition: 1 350/1 635) 1 350/1 770 НД /1 710 НД /1 695
Шейдерные ALU 2 944 3 072 4 352 4 608 8 704 10 496
Блоки наложения текстур (TMU) 184 192 272 288 272 328
Блоки операций растеризации (ROP) 64 64 88 96 96 112
Тензорные ядра 368 384 544 576 272 328
RT-ядра 46 48 68 72 68 82
Оперативная память
Разрядность шины, бит 256 256 352 384 320 384
Тип микросхем GDDR6 SGRAM GDDR6 SGRAM GDDR6 SGRAM GDDR6 SGRAM GDDR6X SGRAM GDDR6X SGRAM
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с) 1 750 (14 000) 1 937,5 (15 500) 1 750 (14 000) 1 750 (14 000) 1 188 (19 000) 1 219 (19 500)
Объем, Мбайт 8 192 8 192 11 264 24 576 10 240 24 576
Шина ввода/вывода PCI Express 3.0 x16 PCI Express 3.0 x16 PCI Express 3.0 x16 PCI Express 3.0 x16 PCI Express 4.0 x16 PCI Express 4.0 x16
Производительность
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты) 10 069/10 598 (Founders Edition) 11 151 13 448/14 231 (Founders Edition) 16 312 29 768 35 581
Производительность FP64/FP32 1/32 1/32 1/32 1/32 1/32 1/32
Производительность FP16/FP32 2/1 2/1 2/1 2/1 1/1 1/1
Пропускная способность оперативной памяти, Гбайт/с 448 496 616 672 760 936
Вывод изображения
Интерфейсы вывода изображения DisplayPort 1.4a, HDMI 2.0b DL DVI-D, DisplayPort 1.4a, HDMI 2.0b DisplayPort 1.4a, HDMI 2.0b DisplayPort 1.4a, HDMI 2.0b DisplayPort 1.4a, HDMI 2.1 DisplayPort 1.4a, HDMI 2.1
TBP/TDP, Вт 215/225 (Founders Edition) 250 250/260 (Founders Edition) 280 320 350
Розничная цена (США, без налога), $ 699 (рекоменд.)/ 799 (Founders Edition) — в момент выхода 699 (рекоменд. в момент выхода) 999 (рекоменд.)/ 1 199 (Founders Edition) — в момент выхода 2 499 699 (рекоменд. в момент выхода) 1499 (рекоменд. в момент выхода)
Розничная цена (Россия), руб. 63 990 (Founders Edition в момент выхода) 56 990 (рекоменд. в момент выхода) 95 990 (Founders Edition в момент выхода) 221 990 (в момент выхода) 63 490 (nvidia.ru) 136 990 (nvidia.ru)

Последняя характеристика GeForce RTX 3090, которой осталось уделить внимание, прежде чем мы рассмотрим тестовый образец видеокарты, — это энергопотребление. Согласно оценкам чипмейкера, производительность чипов Ampere на ватт мощности в благоприятных случаях увеличилась на 90 % по сравнению с Turing. Однако в нашем собственном исследовании GeForce RTX 3080 всего лишь на 8 % превосходит по энергоэффективности GeForce RTX 2080 Ti и на 21 % — RTX 2080 SUPER, если речь идет об игровой нагрузке. Флагманская модель обязана превзойти эти результаты благодаря тому, что в ней используется почти целиком активированная версия GA102. И все же RTX 3090 — чрезвычайно прожорливая видеокарта, рассчитанная на энергопотребление вплоть до 350 Вт против 320 Вт у RTX 3080.

Наконец, стоит в очередной раз прокомментировать рекомендованные цены ускорителей 30-й серии. Чемпионскому ускорителю назначили беспрецедентно высокую по меркам потребительских видеокарт (по крайней мере, одночиповых) цену в $1 499. Тем не менее и эта новинка представляет собой более выгодное предложение по сравнению с ее прямым аналогом из прошлого поколения, TITAN RTX, который стоил уже $2 499. Не исключено, что чипмейкер вернется к прежним ценам, если выпустит настоящий TITAN на основе GA102, но появление такой видеокарты под вопросом из-за того, что NVIDIA пока не может предложить профессионалам, которым адресованы «Титаны», ощутимых преимуществ перед теми характеристиками, которыми обладает GeForce RTX 3090. Сам графический процессор здесь работает почти на пике своего потенциального быстродействия, а увеличить объем оперативной памяти до 48 Гбайт будет возможно лишь тогда, когда Micron откроет производство 16-гигабитных чипов GDDR6X. По слухам, такие видеокарты обязательно появятся, только с обычной памятью GDDR6 и в рамках серии Quadro, которой важнее именно объем, нежели повышенная пропускная способность GDDR6X.

В то время как ускорители TITAN производятся по заказу NVIDIA исключительно в референсном дизайне, партнерам чипмейкера дали добро на разработку собственных версий GeForce RTX 3090 наравне с младшими моделями 30-го семейства. Одно из таких устройств, Palit GeForce RTX 3090 GamingPro OC, представит действующий флагман игровых и просьюмерских решений NVIDIA в тестах производительности. Как и GeForce RTX 3080 того же производителя, эта видеокарта заранее разогнана, но о том, что заводской оверклокинг даст RTX 3090 несправедливое преимущество по сравнению с видеокартами прошлых поколений, беспокоиться не стоит. Оба устройства Palit — и RTX 3080, и RTX 3090 — разогнаны всего лишь на 30 МГц по расчетной тактовой частоте в типичной нагрузке (Boost Clock) и, что более важно для производительности современных ускорителей, работают в пределах штатного резерва мощности 320 и 350 Вт соответственно.

#Palit GeForce RTX 3090 GamingPro OC: конструкция, комплект поставки

По конструкции кулера и ряду основных характеристик версия GeForce RTX 3090, представленная Palit под маркой GamingPro, является копией RTX 3080, которую мы рассмотрели на прошлой неделе. В отличие от NVIDIA, которая предусмотрела в устройствах Founders Edition различные системы охлаждения — одну для RTX 3080 и другую, помощнее, для RTX 3090, большинство независимых производителей изготавливают видеокарты по одному и тому же шаблону.

Неспроста Palit водрузила на чип GA102 такую мощную систему охлаждения. Видеокарта занимает три корпусных слота расширения, а для того, чтобы под тяжестью радиатора не провисал свободный край печатной платы, нужно воспользоваться акриловой подпоркой, которая входит в комплект поставки RTX 3080 и RTX 3090 серии GamingPro OC.

Не будем утомлять читателей чрезмерно подробным описанием дизайна и системы охлаждения видеокарты, когда почти такое же устройство мы изучили на прошлой неделе, но вкратце перечислим его ключевые особенности. Palit известна российским покупателям доступными ценами, зачастую именно ее видеокарты занимают нижние строчки прайс-листов той или иной модели, но вместе с тем мы уже не раз убеждались в том, что эта компания умеет экономить на второстепенных функциях устройств, не пренебрегая качеством наиболее важных компонентов, и совершенствует свою продукцию с каждым поколением графических процессоров.

Ускорители на чипах GA102 требуют особой ответственности, ведь на этот раз NVIDIA не постеснялась увеличить потребляемую мощность вплоть до 350 Вт, а миграция на новый тип памяти GDDR6X влечет за собой отдельные сложности. Не удивительно, что Palit совершила очередной шаг вперед в конструкции системы охлаждения, достоинства которой не исчерпываются большим радиатором, который обдувают три вентилятора диаметром 95 мм.

Микросхемы GDDR6X нужно распаивать как можно ближе к подложке графического процессора в связи с повышенными требованиями интерфейса к соотношению «сигнал — шум». Как следствие, можно собирать видеокарты на укороченных печатных платах, а освободившуюся площадь использовать для сквозного продува радиатора — так сделано и в Founders Edition, и в Palit GamingPro.

В остальном перед нами вполне типичный, разве что очень крупный даже по стандартам предыдущего поколения, двухсекционный радиатор, пронизанный несколькими U-образными теплотрубками. В отличие от Founders Edition, здесь не используется такой дорогостоящий элемент, как испарительная камера, а тепло с графического процессора снимает никелированная медная подошва. Микросхемы памяти и силовые каскады регулятора напряжения накрыты массивной алюминиевой рамой, сопряженной с основным радиатором, а дроссели VRM — прямо с оребрением последнего через термопрокладки.

В связи с тем, что чипы оперативной памяти в GeForce RTX 3090 распаяны с обеих сторон печатной платы, крышка на обратной стороне установлена не только для красоты и защиты компонентов, но и для охлаждения VRAM.

Новый кулер видеокарт Palit со сквозным продувом радиатора хорошо зарекомендовал себя в тестах GeForce RTX 3080: он одновременно обеспечивает и умеренную температуру GPU, и низкий уровень шума. Тем не менее RTX 3090 в пике энергопотребления достигает уже не 320, а 350 Вт. Посмотрим, какие результаты нас ждут в этот раз. Во всяком случае, предупреждаем потенциальных владельцев GeForce RTX 3080 и особенно RTX 3090 о том, что корпус компьютера, в котором поселится такая видеокарта, должен иметь исключительно качественную вентиляцию. Воздух, насквозь проходящий через радиатор GPU, попадает в зону центрального процессора, а средств для того, чтобы извлекать тепло наружу, у Palit GamingPro нет: все радиаторные ребра проходят параллельно крепежной планке видеокарты, а прорези в ней, таким образом, являются чисто декоративными.

#Palit GeForce RTX 3090 GamingPro OC: печатная плата

Судя по разводке печатных плат GeForce RTX 3080, фотографии которых появились в интернете после релиза 30-й серии, многие производители, включая Palit, взяли за основу PCB референсный дизайн (не путать с картами Founders Edition, выделяющимся из основой массы еще сильнее, чем в 20-й серии), который NVIDIA распространила среди партнеров, чтобы поскорее наладить выпуск ускорителей нового поколения.

Палитовский вариант GeForce RTX 3090 представляет собой то же самое, только с поправкой на увеличенное число микросхем оперативной памяти, которые распаяны с двух сторон текстолита и работают в clamshell-режиме. Кстати, чипов GDDR6X с номинальной пропускной способностью 19,5 Гбит/с Micron не производит. Все разновидности RTX 3090 комплектуются памятью, рассчитанной на 21 Гбит/с, но ее действительную пропускную способность уменьшили до 19,5 в интересах стабильности, а это неплохой задел для разгона.

Помимо 24 Гбайт оперативной памяти, печатная плата Palit GeForce RTX 3090 GamingPro OC отличается от PCB следующей по старшинству модели того же производителя усиленными регуляторами напряжения. Разводка PCB позволяет организовать 16-фазное питание графического процессора при помощи двух восьмифазных контроллеров On Semiconductor NCP81610, каждый из которых обслуживает свою порцию кристалла GA102. Памяти GDDR6X выделено вплоть до четырех фаз, но компоненты одной фазы питания GPU и одной VRAM — то, на чем Palit нашла возможность сэкономить. В фазах питания графического процессора применяются силовые каскады AOZ5311NQI от Alpha & Omega с номинальным током 50 А.

Методика тестирования. Тактовые частоты, энергопотребление, температура, уровень шума и разгон. Игровые тесты (1920 × 1080)

#Тестовый стенд, методика тестирования

Тестовый стенд
CPU Intel Core i9-9900K (4,9 ГГц, 4,8 ГГц в AVX, фиксированная частота)
Материнская плата ASUS MAXIMUS XI APEX
Оперативная память G.Skill Trident Z RGB F4-3200C14D-16GTZR, 2 × 8 Гбайт (3200 МГц, CL14)
ПЗУ Intel SSD 760p, 1024 Гбайт
Блок питания Corsair AX1200i, 1200 Вт
Система охлаждения CPU Corsair Hydro Series H115i
Корпус CoolerMaster Test Bench V1.0
Монитор NEC EA244UHD
Операционная система Windows 10 Pro x64
ПО для GPU AMD
Все видеокарты AMD Radeon Software Adrenalin 2020 Edition 20.8.3
ПО для GPU NVIDIA
Все видеокарты NVIDIA GeForce Game Ready Driver 456.38/356.38
Игры
Игра (в порядке даты выхода) API Метод тестирования Настройки графики Полноэкранное сглаживание
Strange Brigade Vulkan Встроенный бенчмарк Макс. качество графики AA Ultra
Shadow of the Tomb Raider DirectX 12 Встроенный бенчмарк Макс. качество графики. DXR выкл., DLSS выкл. TAA
Assassin's Creed Odyssey DirectX 11 Встроенный бенчмарк Макс. качество графики AA High (TAA)
Battlefield V DirectX 12 Миссия Liberte + OCAT Макс. качество графики. DXR выкл., DLSS выкл. TAA High
Metro Exodus DirectX 12 Встроенный бенчмарк Макс. качество графики. DXR выкл., DLSS выкл. Shading Rate 100% TAA
Total War: THREE KINGDOMS DirectX 12 Встроенный бенчмарк (Battle Benchmark) Макс. качество графики TAA
Control DirectX 12 OCAT Макс. качество графики TAA
Borderlands 3 DirectX 12 Встроенный бенчмарк Макс. качество графики TAA
Red Dead Redemption 2 Vulkan Встроенный бенчмарк Макс. качество графики TAA High
DOOM Eternal Vulkan Начало миссии Mars Core + OCAT Макс. качество графики TAA
Игры (с трассировкой лучей)
Игра (в порядке даты выхода) API Метод тестирования Полноэкранное сглаживание
Battlefield V DirectX 12 Миссия Liberté + OCAT Макс. качество графики. DXR Raytrace Reflection Quality: Ultra TAA/DLSS
Shadow of the Tomb Raider DirectX 12 Встроенный бенчмарк Макс. качество графики. Ray Traced Shadows Quality: Ultra TAA/DLSS
Metro Exodus DirectX 12 Встроенный бенчмарк Макс. качество графики. Shading Rate 100%. Ray Trace: Ultra TAA/DLSS
Quake II RTX Vulkan Timedemo, запись demo1.dm2 Макс. качество графики TAA
Control DirectX 12 OCAT Ray Tracing Preset: High TAA/DLSS 2.0
Minecraft with RTX Beta DirectX 12 Бенчмарк в мире Portal Pioneers + OCAT Макс. дальность рендеринга геометрии и частиц Нет/DLSS 2.0

В большинстве тестовых игр показатели средней и минимальной кадровых частот выводятся из массива времени рендеринга индивидуальных кадров, который записывает встроенный бенчмарк (или утилита OCAT, если его нет).

Средняя частота смены кадров на диаграммах является величиной, обратной среднему времени кадра. Для оценки минимальной кадровой частоты вычисляется количество кадров, сформированных в каждую секунду теста. Из этого массива чисел выбирается значение, соответствующее 1-му процентилю распределения. Red Dead Redemption 2 является исключением: ее встроенный бенчмарк регистрирует 1-й процентиль времени рендеринга кадра, из которого выводится соответствующая кадровая частота.

Вычисления общего назначения, кодирование/декодирование видео
Приложение Настройки API
AMD NVIDIA AMD NVIDIA
Adobe Premiere Pro CC 2020 PugetBench for Premiere Pro 0.88 GPU Effects: воспроизведение (ProRes 422, 4K@59,94 FPS) OpenCL CUDA
GPU Effects: экспорт в H.264 40 Мбит/с и ProRes 422HQ (4K@59,94 FPS)
Blender 2.9 Демо Class Room с сайта Blender Foundation Рендерер Cycles. Feature Set: Supported. Размер тайла: 256 × 256 OpenCL CUDA/OptX
Демо Nissan GTR от AMD Рендерер AMD Radeon ProRender OpenCL
DXVA Checker 4.1.2, Decode Benchmark H.264 (Microsoft H264 Video Decoder) 1920 × 1080 (High Profile, L4.1); 3840 × 2160 (High Profile, L5.1) D3D11VA
H.265 (Microsoft HEVC Video Extensions) 1920 × 1080 (Main Profile, L4.0); 3840 × 2160 (Main Profile, L5.0); 7680 × 4320 (Main Profile, L6.0)
VP9 (Microsoft VP9 Video Extensions) 1920 × 1080; 3840 × 2160; 7680 × 4320
AV1 (Microsoft AV1 Video Extension)
FFmpeg 4.2.1, кодирование H.264 1920 × 1080 -c:v h264_amf -quality speed -coder cabac -level 4.1 -refs 1 -b:v 3M -c:v h264_nvenc -preset fast -coder cabac -level 4.1 -refs 1 -b:v 3M AMF NVENC
3840 × 2160 -c:v h264_amf -quality speed -coder cabac -level 5.1 -refs 1 -b:v 7.5M -c:v h264_nvenc -preset fast -coder cabac -level 5.1 -refs 1 -b:v 7.5M
FFmpeg 4.2.1, кодирование H.265 1920 × 1080 -c:v hevc_amf -quality speed -level 4 -b:v 3M -c:v hevc_nvenc -preset fast -level 4 -b:v 3M
3840 × 2160 -c:v hevc_amf -quality speed -level 5 -b:v 7.5M -c:v hevc_nvenc -preset fast -level 5 -b:v 7.5M
7680 × 4320 Н/Д -c:v hevc_nvenc -preset fast -level 6 -refs 1 -b:v 20M
REDCINE-X PRO Декодирование файлов RED R3D с разрешением 4К, 6К и 8К OpenCL CUDA

Мощность видеокарт регистрируется отдельно от CPU и прочих компонентов ПК с помощью устройства NVIDIA PCAT. В качестве тестовой нагрузки для тестов мощности и уровня шума используется игра Crysis 3 при разрешении 3840 × 2160 без полноэкранного сглаживания и с максимальными параметрами качества графики, а также стресс-тест FurMark с наиболее агрессивными настройками (разрешение 3840 × 2160, MSAA 8x). Замеры всех параметров выполняются после прогрева видеокарты, когда температура GPU и тактовые частоты стабилизируются.

#Участники тестирования

В тестировании производительности приняли участие следующие видеокарты:

Прим. В скобках после названий видеокарт указаны базовая и boost-частота согласно спецификациям каждого устройства. Видеокарты нереференсного дизайна приведены в соответствие с референсными параметрами (или приближены к последним) при условии, что это можно сделать без ручной правки кривой тактовых частот. В противном случае (ускорители серии NVIDIA GeForce 16, а также GeForce RTX 2070/2080/2080 Ti Founders Edition) используются настройки производителя.

#Тактовые частоты, энергопотребление, температура, уровень шума и разгон

Обе новые видеокарты на чипах NVIDIA — и GeForce RTX 3080, и RTX 3090 — в наших тестах представлены устройствами Palit, их обслуживает одинаковая система охлаждения, обе слегка (буквально для галочки) разогнаны на 30 МГц по частоте Boost Clock, но работают в границах референсного TDP: 320 и 350 Вт соответственно. Это идеальные условия для сравнения реальных тактовых частот под нагрузкой и тепловыделения RTX 3080 и RTX 3090, ведь большинство партнеров NVIDIA сделали выбор в пользу унифицированного дизайна старшей и младшей модели вместо того, чтобы дополнительно усиливать систему охлаждения RTX 3090, как сделано в устройствах Founders Edition.

Как показала практика, по перечисленным параметрам RTX 3090 не так уж сильно отличается от RTX 3080. Да, потребляемая мощность флагмана выше на 24–28 Вт, однако тактовым частотам GPU она почти не вредит: разброс стабильной тактовой частоты в играх между двумя разновидностями GA102 составляет около 38 МГц, а 1950 МГц — универсальный предел авторазгона при штатных настройках. А вот кулер, возможно, и стоило заменить чем-то посерьезнее. Нельзя сказать, что Palit GeForce RTX 3090 GamingPro OC перегревается или работает слишком громко, но все-таки по уровню шума видеокарта недалеко ушла от турбинной версии GeForce GTX 1080 Ti, а это, как вы понимаете, не очень лестное сравнение. RTX 3080 того же производителя работает намного тише.

Рабочие параметры под нагрузкой (Crysis 3)
Видеокарта Настройки Тактовая частота GPU, МГц Напряжение питания GPU, В Частота вращения вентиляторов, об/мин (% от макс.) Частота вращения вентиляторов 2, об/мин (% от макс.)
Средн. Макс. Средн. Макс. Средн. Средн.
Palit GeForce RTX 3090 GamingPro OC (1395/1725 МГц, 19,5 Гбит/с, 24 Гбайт) 1816 1950 Н/Д Н/Д 2039 (53%) 2038 (53%)
Palit GeForce RTX 3090 GamingPro OC (+50 МГц, 21,8 Гбит/с, 24 Гбайт) +4% мощности 1865 1995 Н/Д Н/Д 2104 (55%) 2104 (55%)
Palit GeForce RTX 3080 GamingPro OC (1440/1740 МГц, 19 Гбит/с, 10 Гбайт) 1854 1950 Н/Д Н/Д 1823 (46%) 1823 (46%)
Palit GeForce RTX 3080 GamingPro OC (+50 МГц, 21,2 Гбит/с, 10 Гбайт) +9% мощности 1940 2010 Н/Д Н/Д 1894 (48%) 1894 (48%)
NVIDIA GeForce GTX 1080 Ti FE (1480/1582 МГц, 11000 Мбит/с, 11 Гбайт) 1735 1810 0,96 1,01 2377 (50%) Н/Д
NVIDIA GeForce RTX 2080 SUPER FE (1650/1815 МГц, 15,5 Гбит/с, 8 Гбайт) 1907 1920 1,03 1,04 1969 (53%) 1969 (53%)
NVIDIA GeForce RTX 2080 Ti FE (1350/1645 МГц, 14 Гбит/с, 11 Гбайт) 1723 1860 0,91 1,03 2082 (56%) 2082 (56%)
NVIDIA TITAN RTX (1350/1770 МГц, 14 Гбит/с, 24 Гбайт) 1735 1830 0,91 0,99 2099 (57%) 2099 (57%)
AMD Radeon VII (1800 МГц, 2000 Мбит/с, 16 Гбайт) 1756 1786 Н/Д Н/Д 2617 (Н/Д) Н/Д
AMD Radeon RX 5700 XT (1605/1905 МГц, 14 Гбит/с, 8 Гбайт) Термопаста ARCTIC MX-2 вместо графитовой прокладки 1795 1819 1,07 1,18 2102 (43%) Н/Д

Прим. Измерение всех параметров выполняется после прогрева GPU и стабилизации тактовых частот.

В плане оверклокинга мы рассчитывали на GeForce RTX 3090 еще меньше, чем на RTX 3080, но оказалось, что флагманская модель разгоняется чуть лучше. Нам вновь не удалось повысить целевой параметр тактовой частоты GPU более чем на 50 МГц, но благодаря тому, что резерв мощности устройства можно сдвинуть не на 4, а уже на 9 %, фактическая прибавка стабильной тактовой частоты под нагрузкой достигла 85 МГц против 49 МГц у RTX 3080. Кроме того, оперативная память GDDR6X на этот раз не была такой привередливой. GeForce RTX 3090 укомплектован чипами, которым положено работать на скорости 21 Гбит/с, поэтому сильный разгон со штатных для RTX 3090 19,5 до 21,8 Гбит/с не вызывает ни потери стабильности, ни просадок быстродействия. Подумать только, теперь совокупная ПСП видеокарты составляет 1046 Гбайт/с — даже больше, чем у Radeon VII с чипами HBM2.

И все-таки оверклокинг GeForce RTX 3090 представляет скорее академический, нежели практический интерес. По крайней мере, если речь идет об ускорителе Palit GamingPro OC. К тому же ценой дополнительной ПСП и 85 МГц тактовой частоты ядра стал рост энергопотребления еще на 14–21 Вт — вплоть до пугающих 358–356 Вт. К счастью, GPU по-прежнему избегает перегрева, а ощутить разницу в уровне шума системы охлаждения можно только под стрессовой нагрузкой.

#Игровые тесты (1920 × 1080)

Как мы уже выяснили в обзоре GeForce RTX 3080, от таких мощных видеокарт немного пользы в разрешении 1080p. Если только не нагружать GPU трассировкой лучей (этот вопрос мы раскроем отдельно), но пока такие игры можно пересчитать по пальцам, покупка GeForce RTX 3090 для игры на мониторе Full HD выглядит нелепо. Конечно, новый флагман даже в невыгодных для себя условиях продемонстрировал серьезный межпоколенческий рост производительности: он опередил GeForce RTX 2080 Ti и TITAN RTX на 30 и 24 % усредненной кадровой частоты, обеспечивает на 81 % больше FPS по сравнению с любимым в народе GeForce GTX 1080 Ti и на 76 % больше по сравнению с просьюмерским ускорителем Radeon VII.

И все-таки это не те числа, на которые имеет право рассчитывать покупатель самой дорогостоящей модели новой волны, тем более что разница между RTX 3080 и RTX 3090 колеблется вокруг 9 % кадров в секунду. Если рассматривать GeForce RTX 3090 как игровой, а не профессиональный ускоритель (что само по себе не вполне справедливо), нужно ориентироваться на игры с рейтресингом или при более высоком разрешении экрана. Блок тестовых результатов в 1080p является иллюстрацией этого правила, а не укором RTX 3090, и все-таки обидно, что в наше время, когда существуют мониторы с частотой обновления вплоть до 360 Гц, связка GPU и центрального процессора оказалась бутылочным горлышком системы, сдерживающим скорость реакции в графическом режиме, который больше всего располагает к высокому фреймрейту.

Игровые тесты (2560 × 1440, 3840 × 2160). Игровые тесты в разгоне

#Игровые тесты (2560 × 1440)

Раньше, когда в играх преобладали ресурсоемкие методы полноэкранного сглаживания MSAA и SSAA, бенчмарки при разрешении 1440p вызывали нагрузку на GPU, эквивалентную тестам на 4К-экране, но без сглаживания. Теперь, когда почти все новые игры полагаются на быстрые временные алгоритмы сглаживания, во многих случаях фреймрейт в 1080p и 1440p на мощных видеокартах различается незначительно. Преимущество GeForce RTX 3090 перед топовыми «зелеными» моделями предыдущего поколения возросло до 36 % средней частоты смены кадров, если взять за точку отсчета GeForce RTX 2080 Ti, и 29 % в случае TITAN RTX, но серьезной прибавки FPS по сравнению с GeForce RTX 3080 флагман не принес, если не считать таковой 10 % среднего фреймрейта.

Зато при смене разрешения с 1080p на 1440p нарастает дистанция между RTX 3090 и более слабыми ускорителями. Теперь GeForce RTX 3090 практически вдвое превосходит по быстродействию GeForce GTX 1080 Ti и Radeon RX 5700 XT, а GeForce GTX 1080 без приставки Ti — уже в 2,5 раза. Тем не менее бенчмарки в режиме 1440p — это все еще не совсем подходящая среда для испытаний устройства, которое обещает вытянуть современные игры на 8К-экране. Нам еще предстоит выяснить, соответствует ли GeForce RTX 3090 таким громким заявлениям, как только мы получим в свое распоряжение монитор или телевизор с подходящими параметрами.

Тем более даже 4К еще ни в коем случае нельзя считать пройденным этапом. В нашей базе тестовых результатов еще нет ни одной видеокарты, которая гарантирует твердые 60 FPS во всех современных играх при максимальных настройках детализации при разрешении 2160p. Быть может, не хватало именно GeForce RTX 3090, чтобы исправить эту недоработку?

#Игровые тесты (3840 × 2160)

В тестах при разрешении 4К разрыв между GeForce RTX 3080 и RTX 3090 приобретает наибольшие значения. Конечно, есть такие упрямые игры, как Assassin’s Creed Odyssey, которые по-прежнему не могут извлечь из почти нетронутого кристалла GA102 на плате RTX 3090 более чем 2 % дополнительных FPS. Впрочем, ACO — единственная игра в подборке бенчмарков, которая держится за устаревший API Direct3D 11. В технически современных тайтлах разница между GeForce RTX 3080 и RTX 3090 составляет 9–14 % (12% в среднем) частоты смены кадров. На большее уже вряд ли можно рассчитывать при игровой нагрузке, и только в избранных профессиональных приложениях, возможно, мы все-таки увидим числа, близкие к 20 %, которыми оценивается пропускная способность RTX 3090 в операциях FP32 по сравнению с RTX 3080.

Тем не менее именно 9–14 % FPS недоставало GeForce RTX 3080, чтобы пробить планку 60 FPS в таких чрезвычайно требовательных играх, как Control, Metro Exodus и Red Dead Redemption 2. 60 FPS все еще не даются современному железу в Total War: THREE KINGDOMS, однако в данном случае у нас больше вопросов к оптимизации графического движка, который используется в стратегиях данной серии.

В 4К поистине впечатляющих масштабов достигло преимущество RTX 3090 перед экс-топовыми моделями NVIDIA. Новый флагман мог бы заменить сразу три GeForce GTX 1080 при условии, если бы они эффективно работали в режиме тройного SLI, а GeForce GTX 1080 Ti он превосходит вдвое, и еще 16 % FPS сверх того. То же относится к самым мощным предложениям AMD в преддверии релиза Radeon 6000-й серии: GeForce RTX 3090 на 123 % FPS опередил Radeon RX 5700 XT и выдал дойную норму быстродействия по сравнению с Radeon VII, который, как известно, именно при разрешении 4К работает наиболее эффективно.

GeForce RTX 3090 выглядит очень солидно даже на фоне самых мощных ускорителей семейства GeForce RTX 20: он на 44 % быстрее GeForce RTX 2080 Ti и дает на 36 % больше FPS по сравнению с TITAN RTX.

#Игровые тесты в разгоне

Как мы и предполагали, при скромном разгоне GPU на 85 МГц стабильной тактовой частоты под игровой нагрузкой практически значимого роста быстродействия в играх быть не может. Не факт, что более значительную роль в экспериментах с GeForce RTX 3090 не играет оперативная память GDDR6X, набранная чипами со штатной пропускной способностью 21 Гбит/с на контакт, которую очень легко восстановить, отталкиваясь от заниженных 19,5 Гбит/с, и даже превысить. В общей сложности Palit GeForce RTX 3080 GamingPro OC лучше поддается разгону, чем RTX 3080 под той же маркой, но даже в режиме 4К, наиболее чувствительном к производительности графической карты, средняя прибавка кадровой частоты сводится к 4 % FPS.

Игровые тесты с трассировкой лучей. Вычисления общего назначения. Кодирование/декодирование видео. Таблицы результатов. Выводы

#Игровые тесты с трассировкой лучей

Трассировка лучей, особенно при разрешениях 1440p и 4К, помогла GeForce RTX 3080 дальше всего оторваться старших «Тьюрингов» по кадровой частоте в играх. Если взять за точку отсчета именно топовые видеокарты на чипе TU102, GeForce RTX 2080 Ti и TITAN RTX, преимущество новой архитектуры никуда не делось и предсказуемым образом возросло. GeForce RTX 3090 обеспечивает рост фреймрейта на величину от 33 до 45 % по сравнению с уровнем GeForce RTX 2080 Ti и от 29 до 40 % по сравнению с TITAN RTX.

RTX 3090 даже не нуждается в DLSS для того, чтобы поднять средний фреймрейт выше 60 FPS на экране c разрешением 1440p в таких играх, как Metro Exodus, а полностью трассированный Minecraft и Quake II RTX в 1440p на нем просто летают. Пожалуй, если бы игр с поддержкой трассировки лучей было больше, чем в данный момент, можно было бы сказать, что GeForce RTX 3080 и RTX 3090 — вполне рациональная покупка не только для обладателей мониторов 1440p и 4K, но и для основной массы геймеров, сидящих за экранами Full HD.

В режиме 2160p нашлась только одна игра, в которой GeForce RTX 3090 выдает больше 60 FPS без масштабирования кадров силами DLSS, — Battlefield V, а в Shadow of the Tomb Raider ему не хватило 6 кадров в секунду до критической отметки. В других проектах с рейтрейсингом обе новые видеокарты вырвались за предел 30 FPS, что само по себе является важным достижением, но по большому счету игры с трассировкой лучей в 4К и без DLSS еще не являются в полной мере рабочим сценарием даже для GPU такого класса, как GA102. В свою очередь, с DLSS новый флагман по-прежнему значительно, но уже не так сильно превосходит по быстродействию своих предшественников: он на 36 % быстрее GeForce RTX 2080 Ti и на 30 % FPS опередил TITAN RTX.

В таких условиях идет борьба за разницу в единицы FPS, не ослабевающая даже на верхушке самого 30-го семейства. В игровой трассировке лучей GeForce RTX 3090, может быть, лишь на 11 % лучше RTX 3080 (и это самый благоприятный исход), но другой видеокарты, которая сделает, к примеру, Control безоговорочно играбельным в 4К на максималках (пусть и с DLSS, которая в этой игре работает весьма качественно), пока просто не существует.

#Вычисления общего назначения

Хотя GeForce RTX 3090 формально отделен от прочих моделей 30-й серии только высокой ценой, по объему оперативной памяти и, если честно, по скромной прибавке FPS в играх можно понять, что это устройство предназначено скорее для работы в профессиональных приложениях, нежели для развлечения. Пока не появились устройства Quadro на базе GA102, которым, по слухам, достанется 48 Гбайт оперативной памяти, видеокарты с более широкими возможностями для рабочих станций просто не существует.

Первой сферой применения GeForce RTX 3090, в которой дополнительные 20 % вычислительной мощности FP32 могут иметь решающее значение даже без учета вдвое большего объема VRAM по сравнению с GeForce RTX 3080, является видеомонтаж и кодирование видео высокого разрешения. Живое воспроизведение роликов, отягощенных сложными эффектами, в Adobe Premiere Pro по-прежнему невозможно в полном разрешении 4К с кадровой частотой 60 FPS, но RTX 3090 уже вплотную приблизился к отметке 50, в то время как GeForce RTX 2080 Ti и TITAN RTX ограничены 41–42 FPS. Но основное преимущество почти целиком функционального чипа GA102 состоит в ускорении кодирования. В то время как GeForce RTX 3080 в этой задаче оказался ничем не лучше TITAN RTX, RTX 3090 удалось нарастить скорость рендеринга в ProRes на 19 %. Другая, и довольно неожиданная, находка состоит в том, что активация выделенного кодировщика NVENC для экспорта в H.264 не принесла никаких преимуществ всем участвующим в сравнении картам NVIDIA, за исключением RTX 3090. Похоже, в остальных случаях быстродействие просто упирается в шейдерный массив GPU, а дополнительные CUDA-ядра RTX 3090 устраняют бутылочное горлышко и позволяют выполнить задачу на 19% быстрее, чем без помощи NVENC. Заметим, что речь идет о тестах с тяжелыми эффектами, рассчитанными на максимальную загрузку GPU. В других условиях кодирование на NVENC может ускорить рендеринг еще сильнее — конечно, при условии, что пользователь готов пойти на компромисс в качестве изображения, так как программный метод здесь по-прежнему вне конкуренции.

GeForce RTX 3090 произвел еще более сильное впечатление в задачах оффлайновой трассировки лучей. Бенчмарк тайлового рендерера Cycles оценил производительность RTX 3090 на 25 % выше, чем RTX 3080, а по сравнению с TITAN RTX скорость прорисовки увеличилась более чем вдвое — независимо от того, используется ли целиком программный рейтрейсинг под API CUDA или аппаратные RT-ядра под OptX.

В бенчмарке на движке ProRender новый флагман выступил не настолько ярко, но ощутимый рост быстродействия по-прежнему имеет место: GeForce RTX 3090 на 15% опередил RTX 3080 и на 40 % — TITAN RTX.

Прим. Для тестов новых видеокарт мы перешли на актуальную релизную версию Blender — 2.9 — и обнаружили, что Radeon RX 5700 XT снова потерял возможность работать с движком Cycles.

Наконец, библиотеки REDCINEX-PRO, предназначенные для аппаратного декодирования и дебайеринга файлов RED R3D с привлечением тензорных ядер чипов NVIDIA, уже не особенно чувствительны к разнице между GeForce RTX 3080 и RTX 3090. Благо любая из двух видеокарт более чем в два раза ускоряет обработку записей в разрешении 4К, а в 6К GeForce RTX 3090 на 25 % быстрее по сравнению с TITAN RTX.

#Кодирование/декодирование видео

В тестах GeForce RTX 3080, которые были опубликованы на прошлой неделе, мы обошли стороной одну из новых функций кремния Ampere — аппаратное декодирование видеопотока AV1. Дело в том, что бесплатные программные кодировщики нового стандарта AV1, которыми мы пытались воспользоваться, пока не вышли из экспериментального статуса и работают настолько медленно, что на создание тестового файла с разрешением 8К (которое, собственно говоря, и требует высокой компрессии, возможной в рамках AV1) ушло бы столько времени, что материал для бенчмарка не успел бы и к обзору RTX 3090. Такое происходит именно при кодировании в 8К, причем дело не в производительности центрального процессора. К счастью, мы отыскали в Сети запись AV1 примерно с таким же битрейтом, как у тестовых 8К-роликов в HEVC и VP9, и можем смело сравнивать скорость обработки разных форматов силами обновленного модуля NVDEC.

Кодек AV1 предназначен в первую очередь для стриминга видео с высоким разрешением и HDR по сети и призван заменить в этой роли VP9. Однако ценой высокой степени сжатия при одновременно высоком качестве изображения является вычислительная мощность, необходимая для декодирования потока. Видео AV1 в 8К с кадровой частотой 30 FPS загружает восьмиядерный CPU тестового стенда (Intel Core i9-9900K, работающий на постоянной частоте 4,8 ГГц с применением инструкций AVX) на 50 %, когда файл воспроизводится из локального хранилища, и на 60 % через браузер. Конечно, большинству пользователей попросту не на чем смотреть видео в 8К, но, с другой стороны, и такие компьютеры есть далеко не у всех.

Как показали тесты, аппаратный декодер NVDEC в чипах Ampere обрабатывает AV1 даже быстрее прочих методов компрессии и достигает пропускной способности 110 кадров в секунду при разрешении 8К без HDR. Кроме того, новая версия NVDEC еще эффективнее обращается с потоком HEVC и VP9, чем ASIC, встроенный в процессоры Turing. Не сомневаемся, что способность декодировать AV1 приобретут все будущие продукты 30-й серии на основе младших чипов Ampere, которые со временем найдут применение не только в дискретных видеокартах для ПК, но и в мобильных устройствах.

Что касается аппаратного кодировщика H.264 и HEVC, то в GA102 используется та же версия NVENC, что в «Тьюрингах», но жаловаться на ее производительность не приходится — в быстром режиме можно кодировать хоть 8К при 60 FPS в реальном времени.

#Производительность на ватт и площадь GPU

Теперь, когда мы можем оперировать результатами тестов GeForce RTX 3090, в котором используется графический процессор с минимальными потерями активных вычислительных блоков и полной 384-битной шиной памяти, вернемся к оценке энергоэффективности чипа GA102. Перед нами открылась довольно любопытная картина. Ни один продукт на чипах Turing не дает в сравнении с RTX 3090 таких чисел, как 90-процентная разница в производительности на ватт, о которой говорят презентации NVIDIA. Если отталкиваться от GeForce RTX 2080 SUPER на полностью активном чипе TU104, речь идет о росте энергоэффективности на 27 %. Однако чем меньше внутри чипа вычислительных блоков, оказывающих прямое влияние на быстродействие (потоковых мультипроцессоров и шейдерных ALU), тем больше вклад в потребляемую мощность тех частей GPU, которые не настолько хорошо масштабируются.

Стоит перейти к GeForce RTX 2080 Ti и TITAN RTX, и преимущество GeForce RTX 3090 в энергоэффективности падает до 9 и 5 % соответственно. Кроме того, мы обнаружили, что по удельному игровому быстродействию на число транзисторов RTX 3090 уступает 11 % в пользу TITAN RTX. Теоретически полностью функциональный кристалл GA102 мог бы дать немного иные числа, но в RTX 3090 чип утратил всего лишь 2 % потенциальной вычислительной мощности. Нельзя сослаться и на игры с трассировкой лучей, ведь при разрешении 4К соотношение в производительности между рассматриваемыми устройствами от этого фактора зависит слабо.

ПроизводительNVIDIAAMD
Модель GeForce RTX 3090 GeForce RTX 3080 GeForce GTX 1080 Ti GeForce RTX 2080 SUPER GeForce RTX 2080 Ti FE TITAN RTX Radeon VII Radeon RX 5700 XT
Графический процессор GA102 GA102 GP102 TU104 TU102 TU102 Vega 20 XL Navi 10 XT
Микроархитектура Ampere Ampere Pascal Turing Turing Turing GCN 5 поколения RDNA
Техпроцесс, нм 8 нм (8N) 8 нм (8N) 16 нм FFN 12 нм FFN 12 нм FFN 12 нм FFN 7 нм FinFET 7 нм FinFET
Число транзисторов, млн 28 300 28 300 12 000 13 600 18 600 18 600 13 200 10 300
Площадь чипа, кв. мм 628 628 471 545 754 754 331 251
Средняя потребляемая мощность (Crysis 3), Вт 337 314 227 248 255 262 280 213
Производительность/Вт 100% −4% −31% −21% −8% −5% −39% −29%
Производительность/млн транзисторов 100% −10% +9% +20% +5% +12% +9% +23%
Производительность/кв. мм 100% −10% −38% −33% −42% −39% −4% +12%
Производительность/Вт (обратное сравнение) 100% +4% +45% +27% +9% +5% +64% +41%
Производительность/млн транзисторов (обратное сравнение) 100% +12% −8% −17% −5% −11% −8% −19%
Производительность/кв. мм (обратное сравнение) 100% +12% +62% +50% +73% +63% +4% −11%

Прим. Игры при разрешении 3840 × 2160 без трассировки лучей и DLSS.

Почти удвоенная оценка энергоэффективности не выглядит адекватно даже в сравнении GA102 с флагманским GPU, который NVIDIA использовала в потребительских видеокартах серии GeForce 10: RTX 3090 обеспечивает только на 45 % больше FPS на ватт, чем GeForce GTX 1080 Ti, хотя переход чипов с конвейера 16 нм TSMC на самсунговские 8 нм представляет собой один полный шаг производственной нормы. Как ни крути, Ampere (по крайней мере, в его потребительской версии на базе техпроцесса 8N) покорил новые высоты быстродействия в первую очередь за счет простого наращивания вычислительных блоков, которое позволила осуществить передовая фотолитография и новая компоновка логики внутри SM, а не за счет повышенной энергоэффективности. Впрочем, мы все еще далеки от того, чтобы поставить точку в этом вопросе: если фокусироваться именно на быстродействии на ватт, лучше всего взять для сравнения будущий GeForce RTX 3070, который ближе всего стоит к продуктам на базе TU102 по количеству транзисторов GPU и потребляемой мощности.

Кроме того, NVIDIA по-прежнему находится в выгодном положении по сравнению с продуктами конкурента: чип Navi 10 не догнал по энергоэффективности даже Turing, а GeForce RTX 3090 опережает Radeon RX 5700 XT уже на 41 % удельного быстродействия. Следует вновь сделать поправку на разный масштаб сравниваемых процессоров, но AMD явно предстоит выполнить определенную работу над ошибками, чтобы сократить или, в идеале, устранить технологическое отставание своего кремния.

#Результаты игровых тестов и рекомендованные цены

1920 × 1080
Полноэкранное сглаживание Palit GeForce RTX 3090 GamingPro OC Palit GeForce RTX 3080 GamingPro OC NVIDIA GeForce GTX 1080 NVIDIA GeForce GTX 1080 Ti NVIDIA GeForce RTX 2080 SUPER NVIDIA GeForce RTX 2080 Ti FE NVIDIA TITAN RTX AMD Radeon VII AMD Radeon RX 5700 XT
Assassin's Creed Odyssey TAA High 81 / 106 78 / 100 55 / 62 67 / 76 70 / 81 74 / 90 75 / 90 56 / 68 51 / 67
Battlefield V TAA High 154 / 175 153 / 177 107 / 127 124 / 140 147 / 159 142 / 167 150 / 171 133 / 154 125 / 151
Borderlands 3 TAA 130 / 156 124 / 142 55 / 63 72 / 83 83 / 94 98 / 111 106 / 120 80 / 89 81 / 89
Control TAA 153 / 168 137 / 152 59 / 63 78 / 83 96 / 105 118 / 129 117 / 131 87 / 95 78 / 87
DOOM Eternal TAA 201 / 321 189 / 295 71 / 122 87 / 156 141 / 221 165 / 253 176 / 266 102 / 167 106 / 171
Metro Exodus TAA 63 / 109 56 / 96 25 / 45 32 / 58 39 / 69 47 / 80 51 / 87 30 / 54 30 / 54
Red Dead Redemption 2 TAA High 85 / 94 77 / 84 29 / 31 38 / 41 49 / 54 53 / 63 63 / 67 40 / 44 38 / 42
Shadow of the Tomb Raider TAA 111 / 167 111 / 162 65 / 84 89 / 117 107 / 140 113 / 150 113 / 155 84 / 115 89 / 114
Strange Brigade AA Ultra 292 / 376 264 / 346 106 / 137 136 / 178 176 / 228 207 / 269 220 / 287 123 / 186 119 / 168
Total War: THREE KINGDOMS TAA 94 / 112 86 / 102 38 / 46 47 / 57 60 / 71 71 / 85 75 / 89 44 / 52 39 / 47
Макс. +1% −27% −20% −9% −5% −2% −12% −14%
Средн. −8% −56% −45% −33% −23% −19% −43% −45%
Мин. −12% −67% −56% −43% −33% −29% −54% −58%
2560 × 1440
Полноэкранное сглаживание Palit GeForce RTX 3090 GamingPro OC Palit GeForce RTX 3080 GamingPro OC NVIDIA GeForce GTX 1080 NVIDIA GeForce GTX 1080 Ti NVIDIA GeForce RTX 2080 SUPER NVIDIA GeForce RTX 2080 Ti FE NVIDIA TITAN RTX AMD Radeon VII AMD Radeon RX 5700 XT
Assassin's Creed Odyssey TAA High 73 / 94 77 / 92 44 / 49 56 / 62 54 / 64 66 / 77 66 / 80 43 / 53 47 / 56
Battlefield V TAA High 137 / 168 143 / 160 80 / 99 98 / 115 113 / 130 126 / 145 136 / 149 111 / 129 100 / 124
Borderlands 3 TAA 102 / 117 92 / 105 37 / 42 50 / 57 58 / 65 69 / 78 75 / 84 57 / 62 57 / 62
Control TAA 114 / 119 99 / 103 36 / 39 51 / 55 64 / 71 85 / 88 82 / 90 60 / 64 51 / 57
DOOM Eternal TAA 187 / 281 168 / 251 59 / 92 74 / 123 116 / 175 139 / 202 149 / 214 90 / 138 90 / 135
Metro Exodus TAA 55 / 92 49 / 81 21 / 36 27 / 47 33 / 56 40 / 66 44 / 70 27 / 45 26 / 44
Red Dead Redemption 2 TAA High 77 / 81 68 / 74 24 / 27 33 / 35 43 / 47 45 / 54 54 / 58 35 / 38 34 / 36
Shadow of the Tomb Raider TAA 114 / 147 110 / 139 44 / 55 62 / 78 77 / 96 89 / 111 93 / 118 61 / 81 61 / 76
Strange Brigade AA Ultra 232 / 289 210 / 262 77 / 94 102 / 127 135 / 164 159 / 196 169 / 208 99 / 138 93 / 121
Total War: THREE KINGDOMS TAA 68 / 79 60 / 70 25 / 29 32 / 38 40 / 47 49 / 57 52 / 61 30 / 34 26 / 31
Макс. −2% −41% −32% −23% −14% −11% −23% −26%
Средн. −9% −61% −49% −38% −27% −23% −47% −49%
Мин. −13% −67% −57% −44% −33% −28% −57% −61%
3840 × 2160
Полноэкранное сглаживание Palit GeForce RTX 3090 GamingPro OC Palit GeForce RTX 3080 GamingPro OC NVIDIA GeForce GTX 1080 NVIDIA GeForce GTX 1080 Ti NVIDIA GeForce RTX 2080 SUPER NVIDIA GeForce RTX 2080 Ti FE NVIDIA TITAN RTX AMD Radeon VII AMD Radeon RX 5700 XT
Assassin's Creed Odyssey TAA High 56 / 66 58 / 65 26 / 30 36 / 40 40 / 46 48 / 54 52 / 57 35 / 41 33 / 37
Battlefield V TAA High 115 / 130 100 / 114 44 / 55 55 / 68 67 / 80 77 / 91 84 / 99 64 / 76 55 / 68
Borderlands 3 TAA 60 / 68 53 / 60 20 / 22 27 / 31 32 / 35 38 / 43 41 / 46 29 / 32 29 / 34
Control TAA 62 / 64 53 / 55 17 / 19 25 / 27 32 / 36 43 / 45 41 / 46 31 / 33 25 / 28
DOOM Eternal TAA 133 / 180 118 / 159 38 / 52 49 / 69 73 / 98 90 / 117 95 / 125 62 / 85 47 / 62
Metro Exodus TAA 41 / 63 36 / 55 14 / 23 20 / 31 24 / 37 28 / 44 31 / 47 20 / 31 19 / 29
Red Dead Redemption 2 TAA High 56 / 60 51 / 54 18 / 19 24 / 25 31 / 34 35 / 40 40 / 42 26 / 28 24 / 26
Shadow of the Tomb Raider TAA 73 / 87 66 / 79 23 / 28 33 / 41 42 / 51 50 / 61 53 / 64 34 / 44 30 / 39
Strange Brigade AA Ultra 149 / 174 134 / 155 44 / 52 60 / 71 83 / 93 98 / 113 106 / 122 70 / 88 61 / 72
Total War: THREE KINGDOMS TAA 37 / 42 33 / 38 13 / 15 16 / 19 21 / 24 26 / 30 28 / 32 15 / 18 12 / 15
Макс. −2% −55% −39% −30% −18% −14% −38% −44%
Средн. −10% −66% −54% −42% −31% −26% −49% −55%
Мин. −14% −71% −62% −49% −37% −32% −57% −66%

#Результаты игровых тестов с трассировкой лучей

1920 × 1080
Полноэкранное сглаживание Palit GeForce RTX 3090 GamingPro OC Palit GeForce RTX 3080 GamingPro OC NVIDIA GeForce RTX 2080 SUPER NVIDIA GeForce RTX 2080 Ti FE NVIDIA TITAN RTX
Battlefield V TAA High 103 / 125 95 / 117 67 / 87 86 / 105 84 / 103
Control TAA 93 / 98 85 / 91 54 / 58 69 / 72 69 / 75
Metro Exodus TAA 53 / 84 47 / 75 34 / 54 41 / 64 43 / 68
Minecraft with RTX Beta Нет 114 / 127 103 / 115 61 / 70 75 / 85 76 / 88
Quake II RTX TAA Н/Д / 131 Н/Д / 119 Н/Д / 72 Н/Д / 88 Н/Д / 93
Shadow of the Tomb Raider TAA 94 / 126 90 / 121 62 / 89 75 / 105 79 / 109
Макс. −4% −29% −16% −13%
Средн. −8% −38% −25% −22%
Мин. −11% −45% −33% −31%
2560 × 1440
Полноэкранное сглаживание Palit GeForce RTX 3090 GamingPro OC Palit GeForce RTX 3080 GamingPro OC NVIDIA GeForce RTX 2080 SUPER NVIDIA GeForce RTX 2080 Ti FE NVIDIA TITAN RTX
Battlefield V TAA High 81 / 102 72 / 95 49 / 66 63 / 82 62 / 82
Control TAA 66 / 70 59 / 64 36 / 38 45 / 48 48 / 51
Metro Exodus TAA 42 / 64 38 / 57 26 / 39 32 / 47 34 / 50
Minecraft with RTX Beta Нет 73 / 80 66 / 72 37 / 42 45 / 51 49 / 55
Quake II RTX TAA Н/Д / 77 Н/Д / 71 Н/Д / 42 Н/Д / 51 Н/Д / 55
Shadow of the Tomb Raider TAA 71 / 96 67 / 90 42 / 60 51 / 72 54 / 76
Макс. −6% −35% −20% −20%
Средн. −8% −42% −29% −25%
Мин. −11% −48% −36% −31%
3840 × 2160
Полноэкранное сглаживание Palit GeForce RTX 3090 GamingPro OC Palit GeForce RTX 3080 GamingPro OC NVIDIA GeForce RTX 2080 SUPER NVIDIA GeForce RTX 2080 Ti FE NVIDIA TITAN RTX
Battlefield V TAA High 49 / 67 43 / 61 27 / 39 35 / 50 37 / 50
Control TAA 34 / 37 31 / 34 18 / 20 23 / 25 24 / 26
Metro Exodus TAA 28 / 38 23 / 34 14 / 21 19 / 27 20 / 28
Minecraft with RTX Beta Нет 35 / 38 30 / 34 17 / 18 21 / 24 23 / 26
Quake II RTX TAA Н/Д / 36 Н/Д / 33 Н/Д / 19 Н/Д / 23 Н/Д / 24
Shadow of the Tomb Raider TAA 41 / 54 38 / 50 21 / 30 28 / 39 30 / 41
Макс. −7% −42% −25% −24%
Средн. −9% −46% −31% −28%
Мин. −11% −53% −37% −33%
3840 × 2160 (DLSS)
Полноэкранное сглаживание (без DLSS) Palit GeForce RTX 3090 GamingPro OC Palit GeForce RTX 3080 GamingPro OC NVIDIA GeForce RTX 2080 SUPER NVIDIA GeForce RTX 2080 Ti FE NVIDIA TITAN RTX
Battlefield V TAA High 65 / 80 59 / 72 41 / 51 51 / 64 53 / 65
Control TAA 57 / 60 53 / 56 33 / 35 41 / 43 43 / 45
Metro Exodus TAA 39 / 54 34 / 48 23 / 33 29 / 41 31 / 43
Minecraft with RTX Beta Нет 96 / 106 87 / 95 49 / 56 61 / 69 67 / 74
Shadow of the Tomb Raider TAA 60 / 75 55 / 69 36 / 47 44 / 57 46 / 60
Макс. −7% −36% −20% −19%
Средн. −9% −40% −26% −23%
Мин. −11% −47% −35% −30%

#Выводы

Можно сколько угодно возмущаться тем, как дорого стоит GeForce RTX 3090, но боль утихнет, если поместить чемпионское устройство NVIDIA в исторический контекст. В действительности компания просто вернулась к старой сегментации потребительской линейки видеокарт, в которой место флагмана для геймеров занимал ускоритель на базе соответствующим образом урезанного GPU первого эшелона (GK110, GM200, GP102) по цене от 649 до 699 долларов США. В то же время для тех, кому требовалась максимально высокая производительность или специфические преимущества для профессиональных задач (таких как удвоенный массив оперативной памяти), Санта-Клара предлагала очередной «Титан». Только теперь он называется по-другому и формально является частью игровой серии GeForce. Впрочем, не исключено, что NVIDIA планирует выпустить в будущем полноправный TITAN — возможно, с полностью функциональным чипом GA102 и 48 Гбайт памяти GDDR6X на борту (как только Micron наладит производство 16-мегабитных чипов нового типа).

Но если рассматривать GeForce RTX 3090 именно в качестве преемника марки TITAN, о полном возврате к прежней ценовой политике, которую сломало поколение видеокарт на чипах Turing, речи не идет. При рекомендованной цене в $1 499 новинка значительно дешевле TITAN RTX, который NVIDIA отпускала за $2 499. Но корни серии TITAN уходят к устройствам за $999. И все же послабления, которые вслед за младшими моделями из первой троицы «Амперов» — GeForce RTX 2070 и RTX 2080 — распространились на RTX 3090, можно только приветствовать.

Тем более что геймерам, которым посчастливилось купить GeForce RTX 3080 в первую неделю после релиза, вопреки названию обзора совершенно нечему завидовать в RTX 3090. Сверх производительности RTX 3080 вы могли бы получить около 12 % FPS в самом благоприятном случае, при игре на 4К-экране, за доплату в $800. И это при условии, что розничные цены новинок NVIDIA хотя бы через некоторое время подтянутся к рекомендованным. Если RTX 3080 мгновенно оказался дефицитным товаром, то купить RTX 3090, тем более за выгодную сумму, будет еще сложнее.

С другой стороны, попробуйте назвать еще одну видеокарту, которая располагает производительностью на 12 % больше, чем у GeForce RTX 3080. Последнему не хватило именно этих 12 % FPS, чтобы можно было запускать практически любые тайтлы, включая такие чрезвычайно требовательные, как Control, Metro Exodus и Red Dead Redemption 2 (первые два без трассировки лучей), на максималках и в 4К с фреймрейтом 60 FPS или полностью избавиться от необходимости в DLSS при игре в режиме 1440p c рейтрейсингом. Масштабирования кадров при помощи DLSS по-прежнему не избежать, чтобы получить все и сразу: разрешение 4К, максимальные настройки детализации, трассировку лучей и твердые 60 FPS. Но если учесть, что в своих последних итерациях DLSS работает практически безупречно, эта и подобные технологии обосновались в играх надолго, если вообще куда-либо денутся в обозримом будущем.

И все-таки будем честны: GeForce RTX 3090 очень трудно назвать рациональным приобретением исключительно для развлечений. Даже аргумент в виде 24 Гбайт оперативной памяти пока имеет вес только в контексте игры на телевизорах и мониторах с разрешением 8К, которыми владеет исчезающе малый процент геймеров. А гипотетический вариант RTX 3080 с 20 Гбайт VRAM все равно обойдется дешевле. Зато GeForce RTX 3090 сполна отрабатывает свою стоимость в тех ситуациях, когда время равно деньгам, то есть в профессиональных задачах, которым требуется максимум вычислительной мощности и большой объем оперативной памяти графического процессора. В программах для монтажа видео с высоким разрешением и сложными эффектами RTX 3090 может значительно уменьшить время рендеринга даже по сравнению с RTX 3080. Рейтрейсинг в Blender он выполняет на 25 % быстрее RTX 3080 или более чем вдвое быстрее, если сравнивать с предыдущим просьюмерским решением NVIDIA — TITAN RTX. Кроме того, есть ряд задач, которые по большому счету закрыты для ускорителей с меньшим объемом локальной памяти, — например, 3D-моделирование сложных проектов или монтаж видео с наложением эффектов в разрешении 8К. Наконец, GeForce RTX 3090 остается единственной видеокартой NVIDIA, которая формально относится к потребительской серии, но сохранила разъем NVLink, который теперь, в связи с прекращением работ над новыми профилями SLI, утратил игровую ценность, но может быть полезен для специфических приложений GP-GPU.

Напоследок скажем пару слов о видеокарте Palit GamingPro OC, которая представляет GeForce RTX 3090 в нашем обзоре. Palit использовала одну и ту же конструкцию системы охлаждения и похожие печатные платы в своих версиях RTX 3080 и RTX 3090, только усилила VRM в соответствии с повышенным энергопотреблением старшей модели. Как следствие, почти все, что мы уже сказали про Palit GeForce RTX 3080 GamingPro OC, относится к родственному RTX 3090. Видеокарта производит впечатление качественного продукта и обеспечивает чипу GA102 адекватное охлаждение. Тем не менее рост потребляемой мощности не прошел бесследно для уровня шума (350 Вт — это не шутки), а на вентиляцию компьютера покупателю флагманской модели нужно обратить самое пристальное внимание, так как почти весь горячий воздух кулер оставляет внутри корпуса.



Оригинал материала: https://3dnews.ru/1021405