Итоги 2022 года: игровые видеокарты / Видеокарты

⇡#Intel Arc

Появления дискретных видеокарт от Intel ждали с большим энтузиазмом, и неспроста. Ключевые подробности архитектуры Xe-HPG, на которой основаны «синие» GPU, были обнародованы заранее, и сложилось впечатление, что она по большому счету не уступает решениям конкурентов, а в некоторых аспектах и превосходит их (устройство Xe-HPG мы подробно разбирали в обзорах Arc A380 и Arc A770). К тому же мы успели проверить в деле ускоритель Intel Iris Xe DG1 и остались довольны результатами. Эту экзотическую видеокарту можно было встретить только в составе некоторых предварительно собранных ПК, а сам графический процессор Xe DG1 является образцом мобильной графики Xe LP, «вырезанной» из мобильных CPU Tiger Lake и, следовательно, имеет немного общего с кремнием Arc. Тем не менее при чрезвычайно низком энергопотреблении — в пределах 25 Вт — у Iris Xe DG1 просто не было и нет аналогов среди десктопных «затычек» ни по игровой производительности, ни по арсеналу функций. Серия Arc в первом поколении тоже не распространяется на высокие категории цены и быстродействия. Сначала Intel анонсировала пять моделей с рекомендованной стоимостью от $139 до $349, а впоследствии — самую младшую, Arc A310, которая должна стоить еще дешевле.

В пересчете на основную масштабируемую единицу GPU — Xe-Core, которую можно условно приравнять к SM в чипах NVIDIA архитектуры Ampere (GeForce 30) и Ada (GeForce 40) либо CU в RDNA 3 (Radeon 7000-й серии), кремний Intel обладает такой же пропускной способностью шейдерных операций над числами FP32 и вдвое большей при целочисленных вычислениях. Преимущество Xe-HPG перед старой версией RDNA 2 (Radeon RX 6000) по обоим признакам является двукратным. При этом Intel сделала большой акцент на матричных (тензорных) операциях, а соответствующие компоненты логики Xe-HPG на бумаге опять-таки сулят вдвое большую производительность по сравнению с Ampere и находятся на одном уровне с Ada. Что касается трассировки лучей, то в этой дисциплине продукты Intel пока не могут соревноваться с «зелеными», но явно превосходят возможности Radeon RX 6000.

Обширные ресурсы матричной логики Intel задействовала в собственном алгоритме масштабирования кадров XeSS на основе глубинного обучения. XeSS обеспечивает впечатляющее качество изображения и, помимо Intel Arc, совместим практически со всеми более-менее современными GPU других производителей. На «чужом» железе используется упрощенная нейросеть, но даже в такой ситуации XeSS обеспечивает лучший результат по сравнению с распространенной технологией FSR первого поколения — это мы проверили в сравнительном тестировании видеокарт в Call of Duty: Modern Warfare II.

Наконец, чипы Arc имеют чрезвычайно быстрый декодер всех распространенных форматов доставки видео, приличную скорость кодирования (в том числе формата AV1) и поддерживают вывод сигнала DisplayPort 2.0 (а референсные карты Arc старших моделей — еще и HDMI 2.1).

GUNNIR Intel Arc A380 Photon

Увы, на практике все оказалось не так радужно, как в теории. Мы пока успели испытать только Arc A380 и Arc A770 и вынуждены констатировать, что в соответствующих ценовых категориях Intel не удалось сделать покупателям предложение, от которого невозможно отказаться. Младшая модель, несмотря на громадное преимущество по числу вычислительных блоков и 8 Гбайт VRAM, пасует в играх перед Radeon RX 6500 XT, который при этом и стоит ненамного больше. Вдвое большая скорость рейтрейсинга, нежели у RX 6500 XT, конечно, впечатляет, но для бюджетной видеокарты точно не является решающим преимуществом. Особенно обидно, что Arc A380 не хватает производительности даже для того, чтобы эффективно использовать фирменный апскейлинг XeSS (все алгоритмы на основе нейросети не бесплатны с точки зрения вычислительных ресурсов).

Как бы то ни было, Arc A380 ориентирована главным образом на китайский рынок и плохо представлена в других частях света. A750 и A770, в свою очередь, были выпущены в мировую розницу и даже доступны в виде референсных устройств с претензией на премиальную конструкцию от самой Intel. Arc A770 рассчитана на гейминг при разрешении 1080p на максималках, по быстродействию без трассировки лучей является аналогом GeForce RTX 3060 и ненамного уступает Radeon RX 6600 XT. Что касается рейтрейсинга, Intel опять переиграла AMD c разгромным счетом и по меньшей мере не отстает от NVIDIA в условиях гибридного рендеринга. Наконец, в отличие от младшей модели, Arc A770 способна извлечь большую пользу из апскейлинга XeSS.

Таким образом, в лице Arc A770 вырисовывается достойный конкурент GeForce RTX 3060: новинка и быстрее, и дешевле при условии, что мы рассматриваем версию A770 с 8, а не 16 Гбайт памяти. В то же время недавняя коррекция цен сделала Radeon RX 6600 XT более выгодным приобретением, если оставить за скобками игры с трассировкой лучей.

Intel Arc A770 Limited Edition

К сожалению, Intel пока не может позволить себе играть в осторожные игры с небольшим преимуществом по цене или производительности. Дело в том, что линейка Arc в ее текущем состоянии — это не более чем продукт для энтузиастов и ценителей экзотики. Интеловский драйвер все время после релиза колебался между состояниями «ужасный» и «проблемный», и даже сейчас, когда самые вопиющие баги остались в прошлом, опыт эксплуатации видеокарт Arc не будет гладким для рядового покупателя. Кроме того, все модели серии имеют общее ограничение: они настолько привязаны к функции Resizable BAR шины PCI Express, что без нее теряют значительную (от 14 до 34 % по результатам Arc A380) долю игрового фреймрейта и, как следствие, не годятся для апгрейда старых компьютеров.

⇡#NVIDIA GeForce RTX 40

Работая над следующим поколением графических процессоров, NVIDIA положила все силы на экстенсивный рост характеристик и внесла лишь точечные функциональные изменения. Благодаря передовой фотолитографии TSMC 4N ей удалось увеличить транзисторный бюджет GPU до ранее немыслимых величин, а тактовые частоты устремились к символической отметке 3 ГГц.

С точки зрения микроархитектуры кремний Ada Lovelace, который лег в основу 40-й серии GeForce, обладает точно такой же удельной пропускной способностью шейдерных операций, как предыдущие чипы Ampere, а существенному апгрейду в очередной раз подверглись только блоки трассировки лучей и тензорная логика: NVIDIA вновь рапортует об удвоенной скорости некоторых операций рейтрейсинга и обработки данных методами глубинного обучения. Кроме того, вслед за ускорителями Intel Arc «зеленые» GPU впервые приобрели возможность кодировать в железе стандарт видео AV1. Подробнее мы разбирали архитектурные особенности и характеристики 40-й серии в обзоре GeForce RTX 4090.

Титульной функцией Ada является мощный интегрированный ASIC для вычислений оптического потока, который используется не только в целях обработки видео, но и новой, уже третьей по счету, версией апскейлинга DLSS. Пусть DLSS остается золотым стандартом качества изображения и гарантирует крупный прирост игрового фреймрейта в любой весовой категории графических процессоров, для настолько мощных ускорителей, как топы нового семейства, его возможностей уже недостаточно: ограничителем кадровой частоты довольно быстро становится центральный процессор. DLSS 3.0 решает эту проблему путем генерации промежуточных кадров на основе векторов движения и анализа оптического потока. Ну а для будущих средних и младших моделей линейки это просто еще один источник «бесплатных» FPS.

Производитель	NVIDIA
Модель	GeForce RTX 4070 Ti	GeForce RTX 4080	GeForce RTX 4090
Графический процессор
Название	AD104	AD103	AD102
Микроархитектура	Ada Lovelace	Ada Lovelace	Ada Lovelace
Техпроцесс	TSMC 4N	TSMC 4N	TSMC 4N
Число транзисторов, млрд	35,8	45,9	76,3
Тактовая частота, МГц: Base Clock / Boost Clock	2 310/2 610	2 210/2 505	2 230/2 520
Шейдерные ALU FP32	7 680	9 728	16 384
Блоки наложения текстур (TMU)	240	304	512
Блоки операций растеризации (ROP)	80	112	176
Тензорные ядра	240	304	512
RT-ядра	60	76	128
Оперативная память
Разрядность шины, бит	192	256	384
Тип микросхем	GDDR6X SGRAM	GDDR6X SGRAM	GDDR6X SGRAM
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с)	1 313 (21 000)	1 400 (22 400)	1 313 (21 000)
Объем, Мбайт	12 228	16 384	24 576
Объем кеша L2, Мбайт	48	64	96
Шина ввода/вывода	PCI Express 4.0 x16	PCI Express 4.0 x16	PCI Express 4.0 x16
Производительность
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты)	40 090	48 737	82 575
Производительность FP64/FP32	1/64	1/64	1/64
Производительность FP16/FP32	1/1	1/1	1/1
Пропускная способность оперативной памяти, Гбайт/с	504	717	1 008
Вывод изображения
Интерфейсы вывода изображения	DisplayPort 1.4a, HDMI 2.1	DisplayPort 1.4a, HDMI 2.1	DisplayPort 1.4a, HDMI 2.1
TBP/TDP, Вт	285	320	450
Розничная цена (США, без налога), $	799 (рекоменд. в момент выхода)	1 199 (рекоменд. в момент выхода)	1 599 (рекоменд. в момент выхода)
Розничная цена (Россия), руб.	Н/Д	Н/Д	Н/Д

NVIDIA успела выпустить три GPU нового поколения (AD102, AD103 и AD104) и три соответствующие видеокарты (RTX 4090, RTX 4080, RTX 4070 Ti). Все новинки демонстрируют огромный рост характеристик по сравнению со своими формальными предшественниками, особенно GeForce RTX 4090, который отличился умопомрачительным компонентным бюджетом GPU в 76,3 млрд транзисторов и формулой основных вычислительных блоков, которая включает 16 384 FP32-совместимых CUDA-ядра. Таким образом, теоретическое быстродействие флагмана оценивается в 2,3 раза выше по сравнению с GeForce RTX 3090 Ti, правда, при столь же чудовищном энергопотреблении вплоть до 450 Вт. Другая примета чипов Ada состоит в том, что, несмотря на использование компанией NVIDIA скоростных чипов памяти GDDR6X с номиналом 21 либо 22,4 Гбит/с, общей пропускной способности VRAM таким видеокартам уже недостаточно, однако дефицит ПСП компенсирует большой объем кеша второго уровня — вплоть до 72 Мбайт.

MSI GeForce RTX 4090 SUPRIM X

В абсолютных числах игровой производительности GeForce RTX 4090 стал первой видеокартой за долгие годы, которая тянет практически все актуальные игры в режиме 4К на максималках, удерживая кадровую частоту выше 60 FPS, а большинство из них — даже с рейтрейсингом без всякого масштабирования кадров. В свою очередь, по относительным оценкам GeForce RTX 4090 превосходит аналогичную модель прошлого поколения, GeForce RTX 3090, на 62 либо 72 % в зависимости от того, активна ли трассировка лучей. А главное, несмотря на традиционно высокую для просьюмерских устройств рекомендованную стоимость ($1 599), RTX 4090 предлагает на 50–60 % больше FPS в пересчете на доллар MSRP по сравнению с RTX 3090. В данный момент новинка пользуется ажиотажным спросом и потому продается дороже рекомендованного значения — она стоит более 2 тысяч долларов. Однако уже наметилась тенденция к нормализации цен, а никаких производственных трудностей у NVIDIA, судя по всему, нет.

К сожалению, GeForce RTX 4090 пока является единственным представителем нового поколения, который сделал то, что от него требовалось, — обеспечил крупный сдвиг в стоимости игровых FPS. И это при том, что RTX 4090 — в неменьшей степени рабочая, чем геймерская видеокарта. Про следующие новинки такого не скажешь. GeForce RTX 4080 также обладает гигантской вычислительной мощностью, которой достаточно для комфортной игры в 4К без масштабирования кадров, а в ряде случаев еще и с трассировкой лучей. Вот только у GeForce RTX 4080, который оценили в $1 199, есть более высокий ориентир производительности на доллар — оригинальная версия RTX 3080. По этому параметру старая и новая видеокарта в лучшем случае равны (когда действует рейтрейсинг), а в худшем (без трассировки лучей) NVIDIA теперь продает каждый FPS дороже, чем раньше.

Palit GeForce RTX 4080 GameRock OC

GeForce RTX 4070 Ti попал в точно такую же ситуацию несмотря на то, что ближе к середине модельного ряда обычно располагаются наиболее выгодные покупки. С технической точки зрения к RTX 4070 Ti нет никаких претензий: видеокарта располагает по большому счету такой же производительностью, как GeForce RTX 3090, хотя потребляет лишь 285 вместо 350 Вт мощности, позволяет играть в режиме 1440p без компромиссов, а с помощью апскейлинга — и в 4К. А вот по сравнению с GeForce RTX 3070 Ti (изначально переоцененной видеокартой!) новинка, получившая беспрецедентно высокий для своей категории ценник $799, развивает от силы 16 % бонусного фреймрейта в пересчете на доллар MSRP.

У всех топовых представителей 40-й линейки есть и другая проблема, которая, возможно, обойдет стороной младшие модели. Дело в том, что они используют для питания разъем 12VHPWR, предусмотренный спецификациями PCI Express 5.0 и блоков питания ATX 3.0. Новый разъем рассчитан на передачу вплоть до 600 Вт мощности по одному кабелю, хотя имеет всего лишь 16 силовых контактов вместо 32, распределенных по четырем старым восьмиконтактным разъемам такого же совокупного номинала. Это обстоятельство само по себе снижает запас прочности 12VHPWR, но вдобавок ко всему большинству пользователей теперь придется запитывать видеокарту через переходник с двух, трех или четырех восьмиконтактных розеток на один 12VHPWR. А где переходники, там опасность плохих соединений, перегрузки кабелей и в конце концов запах горящего пластика. Напомним, что сажать питание GeForce RTX 4080 или тем более RTX 4090 на разветвляющиеся кабели старого БП с двумя штекерами недопустимо, а лучше этого не делать и с RTX 4070 Ti.

Palit GeForce RTX 4070 Ti GameRock OC Classic

⇡#Radeon RX 7000

В отличие от продуктов NVIDIA, «красным» GPU предстояла глубокая модернизация. Несмотря на высокую энергоэффективность ускорителей Radeon RX 6000, уже в прошлом поколении «зеленая» архитектура была значительно мощнее, не говоря уже о посредственном быстродействии RDNA 2 в игровом рейтрейсинге и отсутствии специализированных матричных (тензорных) массивов ALU.

AMD Radeon RX 7900 XTX

На фундаментальном уровне логика RDNA 3 совершила такой же переход, как «зеленый» Ampere: число FP32-совместимых шейдерных ALU внутри каждого Compute Unit’а было удвоено, а целочисленные расчеты GPU выполняет в половинном темпе. Таким образом, между основными строительными блоками RDNA 3 с одной стороны и Ampere/Ada с другой по этому параметру можно поставить знак равенства. Кроме того, максимальное количество CU на одном кристалле увеличили с 80 до 96, что означает максимум 12 288 вещественночисленных шейдерных ALU стандартной точности (хотя AMD по непонятной причине указывает в спецификациях 6 114 — без удвоения). В свою очередь, модернизированные блоки трассировки лучей, по утверждению AMD, развивают производительность на 80 % больше, нежели в RDNA 2. «Красные» чипы нового поколения по-прежнему лишены выделенной логики для матричных операций — вычисления такого рода ложатся на шейдерные ALU, однако теперь должны происходить в 2,7 раза быстрее. Как бы то ни было, у AMD нет и такой программной инфраструктуры, как у NVIDIA, чтобы оправдать инвестиции транзисторного бюджета в собственный аналог отдельных тензорных ядер.

Зато, как уже происходило раньше, AMD лидирует в новых методах физического исполнения CPU и GPU. Флагманский чип нового поколения, Navi 31, на котором основаны модели Radeon RX 7900 XT и RX 7900 XTX, стал первым графическим процессором, созданным по принципам чиплетной компоновки. Контроллеры памяти, хранилище Infinity Cache и другие плохо масштабируемые uncore-детали распределили по шести кристаллам MCD, в то время как ядро GPU (чиплет GCD) осталось монолитным. При этом чиплеты двух типов производятся по различной технологической норме: MCD довольствуются старой фотолитографией TSMC N6, а GCD выпускается на передовой линии TSMC N5 (вариацию этого узла под названием 4N использует NVIDIA для производства кристаллов Ada). В общей сложности чипсет Navi 31 содержит 57,7 млрд транзисторов.

Для того чтобы насытить данными такой мощный графический процессор, AMD пришлось вернуться к 384-битной шине памяти, которую дополняет чрезвычайно высокая скорость чипов GDDR6 (20 Гбит/с) и кеш третьего уровня объемом 96 Мбайт. Среди вторичных функций отметим контроллер DisplayPort 2.1 (которого, кстати, нет в GeForce 40) и HDMI 2.1, а также обязательное с недавних пор кодирование AV1 силами выделенного ASIC.

Производитель	AMD
Модель	Radeon RX 7900 XT	Radeon RX 7900 XTX
Графический процессор
Название	Navi 31 XT	Navi 31 XTX
Микроархитектура	RDNA 3	RDNA 3
Техпроцесс, нм	TSMC N5/N6	TSMC N5/N6
Число транзисторов, млрд	57,7	57,7
Тактовая частота, МГц: Base Clock / Game Clock / Boost Clock	1 500 /2 025/2 394	1 855 /2 269/2 499
Шейдерные ALU FP32	5 376 (10 752)	6 144 (12 228)
Блоки наложения текстур (TMU)	326	384
Блоки операций растеризации (ROP)	192	192
Оперативная память
Разрядность шины, бит	320	384
Тип микросхем	GDDR6 SGRAM	GDDR6 SGRAM
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с)	2 500 (20 000)	2 500 (20 000)
Объем, Мбайт	20 480	24 576
Объем Infinity Cache, Мбайт	80	96
Шина ввода/вывода	PCI Express 4.0 x16	PCI Express 4.0 x16
Производительность
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты)	25 740 (51 481)	30 708 (61 116)
Производительность FP64/FP32	1/32 (1/64)	1/32 (1/64)
Производительность FP16/FP32	2/1	2/1
Пропускная способность оперативной памяти, Гбайт/с	800	960
Вывод изображения
Интерфейсы вывода изображения	DisplayPort 2.1, HDMI 2.1a	DisplayPort 2.1, HDMI 2.1a
TBP/TDP, Вт	315	335
Розничная цена (США, без налога), $	899 (рекоменд. на дату выхода)	999 (рекоменд. на дату выхода)
Розничная цена (Россия), руб.	Н/Д	Н/Д

Что касается теоретических оценок быстродействия, то флагманский Radeon RX 7900 XTX находится в промежутке между GeForce RTX 4080 и RTX 4090 при энергопотреблении 355 Вт, хотя стоит дешевле первого — $999. В свою очередь, урезанный по всем ключевым признакам (конфигурация GPU, разрядность шины памяти и ее объем в 20 вместо 24 Гбайт) и до $899 в цене Radeon RX 7900 XT также превосходит GeForce RTX 4080 на бумаге и рассчитан на потребляемую мощность 315 Вт.

А вот насколько теория сходится с практикой, мы проверим самостоятельно в ближайшее время. После новогодних каникул у нас большие планы по тестированию видеокарт, в которые входит Intel Arc A750 и, разумеется, кастомные модификации новых устройств от партнеров AMD и NVIDIA.

← Предыдущая страница