Смогла: обзор видеокарт AMD Radeon RX 6800 и Radeon RX 6800 XT

AMD удалось сдержать обещания о производительности на уровне передовых решений NVIDIA, которые геймеры слышат уже не первый год. Теперь, наконец, не стыдно собрать игровую машину на красных чипах — как CPU, так и GPU. Впрочем, и на этот раз все-таки не обошлось без разочарований, причем нетрудно догадаться, каких именно

Архитектура RDNA 2 и графический процессор Navi 21

Конец этого года оказался чрезвычайно плодотворным для IT-индустрии и тех, кто следит за ее развитием. Дебют чипов Ryzen 5000-й серии, видеокарт NVIDIA на базе кремния Ampere и, совсем недавно, мобильных SoC от Apple, которые намерены поколебать установившуюся иерархию в мире потребительских CPU — все это произошло буквально за один-два месяца. Не будем забывать и про консоли нового поколения, которые также имеют прямое отношение к инициативам AMD. На наших глазах проходит, пожалуй, самый горячий сезон новинок за последние несколько лет, как по количеству событий, так и по их значимости. Неспроста все передовое железо мгновенно оказалось в той или иной степени дефицитным товаром.

До сегодняшнего дня в картине отсутствовал только один важный элемент — давно обещанные видеокарты Radeon на большом чипе Navi, которые, на наш взгляд, заслуживают центрального места в ряду осенних релизов. Дело в том, что AMD со времен противостояния Radeon R9 Fury X и GeForce GTX 980 Ti фактически устранилась от борьбы за корону наивысшей производительности среди игровых GPU. Попытки вернуться на ринг, которые с тех пор предпринимал чипмейкер, сопровождались щедрыми обещаниями, но каждый раз надежды сторонников красной марки оказывались разбиты. Однако благодаря архитектуре RDNA у AMD появились все предпосылки для того, чтобы устранить технологическое отставание от кремния NVIDIA, а в каких-то аспектах даже занять лидирующую позицию.

Видеокарты Radeon 5000-й серии, пускай они несут на себе черты продуктов переходного периода, уже доказали свою конкурентоспособность в средней и средне-высокой ценовой категории, а теперь амбиции AMD вновь распространились на высший ценовой сегмент. Причем речь идет не только о соревновании в рамках традиционных метрик производительности, но и о возвращении функционального паритета между кремнием NVIDIA и AMD, ведь «большой Navi» тоже выполняет аппаратно-ускоренную трассировку лучей.

AMD анонсировала три видеокарты на базе чипа Navi 21. Сегодня мы рассмотрим две младшие модели — Radeon RX 6800 и Radeon RX 6800 XT, которые должны поступить в продажу в то время, когда вы читаете эту статью, по рекомендованным ценам $579 и $649 соответственно. Их прямые конкуренты со стороны продуктов NVIDIA очевидны — это GeForce RTX 3070 и RTX 3080, оцененные в $499 и $699. Флагманская модель семейства, Radeon RX 6900 XT, задерживается до 8 декабря и сулит быстродействие в одной категории с GeForce RTX 3090 за подобающую сумму $999.

Дебют Radeon RX 6800 и Radeon RX 6800 XT опирается на устройства референсного дизайна, которые изменились до неузнаваемости по сравнению с предшествующими и, прямо скажем, не слишком удачными эталонными решениями AMD, а появление партнерских версий ожидается позднее. Референсные видеокарты будут представлять чип Navi 21 в бенчмарках, но сперва нам предстоит обстоятельный разговор про его архитектуру, далекую от простых количественных изменений ядра RDNA предыдущего поколения.

⇡#Геометрический процессор с поддержкой Mesh Shaders

Логика RDNA 2, хоть и несет в себе немало нового, не претерпела столь же масштабных преобразований в принципах работы графического процессора, которые дистанцировали RDNA 1 от архитектуры Graphics CoreNext, служившей AMD почти восемь лет, со времен Radeon HD 7970 и вплоть до выхода Radeon 5000-й серии. Мы подробно анализировали различия между RDNA и GCN в обзоре Radeon RX 5700 XT и не будем заострять на них внимание сегодня, ведь GCN с тех пор не только ушла из потребительских продуктов AMD (лишь интегрированная графика процессоров Ryzen по-прежнему содержит блоки GCN), но и в серверных решениях для задач GP-GPU вот-вот отправится на пенсию и уступит место следующей архитектуре CDNA. Вместо этого рассмотрим структуру чипа в направлении от front-end’а к back-end’у конвейера рендеринга, освежим знания о принципах работы RDNA, оставшихся неизменными, и выделим те нововведения, что отличают логику Navi 21 от логики Navi 10 — кристалла, который лежит в основе Radeon RX 5600, RX 5700 и RX 5700 XT.

В начале цепочки лежат командные процессоры для шейдеров и вычислений общего назначения, геометрический процессор и аппаратный планировщик, который с недавних пор научилась использовать ОС Windows. Здесь же находится блок DMA, служащий для прямого доступа к памяти GPU по шине PCI Express в рамках совместной работы нескольких ускорителей, а также определенных новаторских функций Navi 21: Smart Access Memory на платформе Ryzen 5000 и поддержки DirectStorage — им мы уделим внимание позже. Однако главное изменение front-end’а GPU на качественном уровне все-таки связано с тем, как Navi 21 обращается с обработкой геометрии.

AMD использует распределенную топологию блоков, участвующих в подготовке примитивов для шейдинга, когда геометрический процессор выполняет общие этапы работы, а преобладающая часть операций до и после тесселяции ложится на блоки Primitive Unit, находящиеся внутри масштабируемых разделов GPU. В то время как геометрический процессор в старой архитектуре GCN тесно связан с моделью программирования Direct3D, RDNA научилась отсекать невидимые треугольники на ранних стадиях рендеринга и может принять до восьми примитивов за такт, чтобы отдать на растеризацию четыре. Условием для этого являются т. н. примитивные шейдеры — высокоэффективные программы, занимающие место доменных и геометрических шейдеров Direct3D в последовательности операций графического API.

Примитивные шейдеры задействуются в устройствах RDNA на уровне компилятора, и большая часть соответствующих вычислений проходит через них. Кроме того, в чипах Navi реализованы быстрые шейдеры поверхности (Surface Shaders), которые по решению компилятора заменяют часть шейдерной цепочки, вовлеченной в тесселяцию (Vertex Shaders и Hull Shaders) перед тем, как данные передаются самому тесселятору — блоку фиксированной функциональности. Описанные функции, которые в терминологии чипмейкера носят имя NGG (Next Generation Geometry), заменяют проблемные порции геометрического конвейера, свойственного Direct3D, на лету перекодируя старый тип шейдеров в новый, и таким образом выполняют прежнюю работу более эффективно без необходимости в эксплицитной поддержке со стороны разработчиков графических приложений.

Тем не менее нельзя скрыть тот факт, что пропорция между мощностью геометрического front-end’a и масштабируемых ресурсов GPU, которые занимаются текстурированием и работой шейдерных kernel’ов, обычная для чипа Navi 10, изменилась не в лучшую сторону. Графический процессор Navi 21 с увеличенным вдвое массивом шейдерных ALU по-прежнему вынужден довольствоваться четырьмя примитивами, прошедшими фильтрацию невидимых поверхностей. К счастью, в дополнение к оптимизациям, представленным в RDNA первого поколения, Navi 21 может воспользоваться совершенно новой моделью программирования геометрии — Mesh Shaders. Шейдеры такого рода были впервые реализованы в графических процессорах Turing от NVIDIA, но затем превратились в индустриальный стандарт и вошли в состав требований к железу, которые выдвигает DirectX 12 Ultimate (feature level 12_2).

В предыдущих версиях Direct3D полигонная сетка (mesh) какого-либо объекта сцены обсчитывается целиком: все числа буфера индексов, который определяет положение вершин, рассматриваются в последовательном порядке. Таким образом, нагрузка на ранние этапы конвейера рендеринга возрастает линейно вместе с геометрической сложностью сцены. Модель Mesh Shaders параллелизирует данную задачу путем разделения полигонной сетки на фрагменты (meshlets), каждым из которых занимается отдельная группа потоков инструкций. Рука об руку с Mesh Shaders идут Amplifications Shaders, определяющие, как много групп инструкций будет запущено, и отдают последним необходимые данные. Как намекает название этого этапа рендеринга, Amplifications Shaders позволяют размножать геометрию на лету путем быстрого дублирования полигонных сеток — раньше это уже демонстрировала NVIDIA в качестве коронной функции Mesh Shaders. Кроме того, Mesh Shaders под управлением Amplifications Shaders выполняют раннее отсечение невидимых поверхностей и автоматический выбор необходимого уровня детализации (LOD) прямо на GPU.

В перспективе новая модель должна полностью заменить этап тесселяции поверхностей, который сегодня выполняется блоками фиксированной функциональности, или по крайней мере дополнить его в тех случаях, когда уместно более гибкое решение. Единственное, что сейчас сдерживает миграцию игровой графики на Mesh Shaders, — это необходимость эксплицитной поддержки технологии в каждой новой игре.

⇡#Удвоенный массив шейдерных ALU и полная поддержка DirectX 12 Ultimate

Несмотря на массу качественных, а кое в чем откровенно революционных изменений, которые принесла архитектура RDNA 2, главное, что привлекает внимание в характеристиках чипа Navi 21, — это удвоенный массив шейдерных ALU и блоков наложения текстур по сравнению с Navi 10, который лежит в основе флагманской модели предыдущего поколения, Radeon RX 5700 XT.

Инженеры AMD сделали именно то, на что указывали слухи про «большой Navi» с самого начала: произошел возврат к конфигурации с четырьмя Shader Engines, являющейся визитной карточкой топовых «красных» GPU еще со времен чипа Hawaii (серия Radeon R9 290). Shader Engine является крупнейшим масштабируемым компонентом архитектуры GCN или RDNA, вмещающим ряд Compute Unit’ов — по сути аналогов отдельного ядра в центральных процессорах. Число CU варьирует в зависимости от того или иного GPU и в данном случае составляет 20 штук. Полностью функциональный кристалл Navi 21 содержит в общей сложности 80 активных CU, что соответствует 5120 шейдерным ALU.

Таким образом, «большой Navi» и вправду стал самым крупным дискретным GPU от AMD с точки зрения сырой вычислительной мощности в количестве операций FP32 на такт. AMD не впервой производить графические процессоры подобного калибра. Так, чипы Fiji и Vega 10/20 уже достигали отметки в 4096 шейдерных ALU, что, кстати говоря, производит сильное впечатление в ретроспективе. Однако RDNA — архитектура, несравненно лучше оптимизированная для 3D-рендеринга, не говоря уже об инновациях второго поколения и высоких тактовых частотах, которые обещаны новому кремнию.

Производитель	AMD
Название	Navi 14	Navi 10	Navi 21
Где используется	Radeon RX 5300 – Radeon RX 5500 XT	Radeon RX 5600 XT; Radeon RX 5700; Radeon RX 5700 XT	Radeon RX 6800; Radeon RX 6800 XT; Radeon RX 6900 XT
Микроархитектура	RDNA	RDNA	RDNA 2
Техпроцесс, нм	7 нм FinFET	7 нм FinFET	7 нм FinFET
Число транзисторов, млн	6 400	10 300	26 800
Площадь чипа, мм²	158	251	519,8
Число CU/WGP/SA/SE
Compute Units (CU)	24	40	80
Workgroup Processors (WGP)	12	20	40
Shader Arrays (SA)	2 (?)	4	Нет
Shader Engines (SE)	1	2	4
Конфигурация Compute Unit'а
Векторные SIMD	2	2	2
Векторные ALU	2 × 32	2 × 32	2 × 32
Скалярные ALU	2	2	2
ALU специального назначения (SFU)	2 × 8	2 × 8	2 × 8
Блоки трассировки лучей (Ray Accelerators)	Нет	Нет	1
Блоки наложения текстур (TMU)	4	4	4
Векторные (vGPR)/скалярные регистры	1024/2560	1024/2560	1024/2560
Объем кеша L0, Кбайт	16	16	16
Конфигурация Workgrpoup Processor (WGP)
Local Data Store (LDS)	128 (общее для 2 CU)	128 (общее для 2 CU)	128 (общее для 2 CU)
Кеш инструкций, Кбайт	32	32	32
Скалярный кеш, Кбайт	16	16	16
Объем кеша L1, Кбайт	128 (общий для 12 CU ?)	128 (общий для 10 CU)	256 (общий для 20 CU)
Программируемые вычислительные блоки GPU
Векторные ALU	1 536	2 560	5 120
Скалярные ALU	48	80	160
ALU специального назначения (SFU)	192	320	640
Блоки GPU фиксированной функциональности
Блоки наложения текстур (TMU)	96	160	320
Блоки операций растеризации (ROP)	32	64	128
Конфигурация памяти
Объем кеша L2, Кбайт	2 048	4 096	4 096
Объем Infinity Cache, Мбайт	Нет	Нет	128
Разрядность шины RAM, бит	128	256	256
Тип микросхем RAM	GDDR6	GDDR6	GDDR6

Интерфейс PCI Express	4.0 x8	4.0 x16	4.0 x16

В состав Shader Engine также входит секция кеша L1 и блок примитивов, ответственный за сборку треугольников из вершин и тесселяцию, и растеризатор, который осуществляет переход от операций над геометрическими данными к пиксельным. Наконец, здесь же лежат комбинированные Render Backends, выполняющие функцию отдельно стоящих ROP. И вот сейчас те немногочисленные читатели, которые могут по памяти нарисовать блок-схему предыдущих чипов AMD, должны кое-что заметить в строении Navi 21. Внутри Shader Engine исчезло разделение пополам на Shader Arrays, каждый из которых содержит 10 Compute Unit’ов, ассоциированные с ними блоки примитивов, RB и растеризаторы, то есть пропорция между количеством этих элементов и шейдерных ALU резко изменилась.

Складывается впечатление, что растеризаторы стали потенциально узким местом в конвейере Navi 21. Поскольку AMD не говорит о каких-либо изменениях в их пропускной способности, резонно предположить, что каждый растеризатор по-прежнему выдает 16 пикселов за такт. Таким образом устанавливается неоптимальное соотношение 1:2 между скоростью растеризации и пиксельным филлрейтом. Впрочем, так это в действительности или нет, мы не можем утверждать с уверенностью, пока AMD не опубликует whitepaper новой архитектуры.

Что касается RB, то Navi 21 поддерживает необходимый мощному шейдерному ядру пиксельный филлрейт за счет того, что каждый блок теперь способен семплировать, тестировать и смешивать восемь32-битных пикселов за такт вместо четырех, что дает графическому процессору эквивалент 128 отдельных ROP.

Кроме того, благодаря изменениям в RB ускоритель приобрел еще одну функцию, необходимую для соответствия стандарту DirectX 12 Ultimate, — Variable Rate Shading. Она открывает возможность гибко и произвольно регулировать вычислительные ресурсы, выделенные на рендеринг отдельных фрагментов изображения, которым требуется повышенная точность или для которых, наоборот, допустимо падение качества. Принцип работы VRS похож на полноэкранное сглаживание методом MSAA с суперсемплингом, когда на каждый пиксел экрана приходится несколько выборок цвета, каждый из которых вызывает пиксельный шейдер, только наоборот — количество выборок снижается произвольным образом. Имплементация VRS в Navi 21 поддерживает оба уровня функции, предусмотренные в рамках Direct3D feature level 12_2, то есть может быть задана точность шейдинга для отдельного вызова на отрисовку полигонной сетки (draw call), отдельного примитива или просто участка изображения. Допустимы различные сетки разреженных выборок, включая 1 × 2, 1 × 2 и 2 × 2.

Кроме того, RDNA 2 поддерживает шейдинг в текстурном пространстве. Стандартный прямой рендеринг подразумевает, что GPU растеризирует геометрию в экранные пикселы, исполняет пиксельный шейдер для каждого пиксела и отправляет результат в кадровый буфер. В рамках Texture Space Shading результат пиксельных шейдеров сохраняется в виде текселов текстурного пространства, что позволяет использовать их многократно и тем сам экономить такты на дальнейших шейдерных вычислениях. А кроме того, повысить качество рендеринга в отдельных ситуациях, поскольку TSS разрушает привязку к координатам экранного пространства, и шейдеры могут выполняться за пределами графического конвейера как такового.

Условие эффективной эксплуатации TSS заключается в том, чтобы заранее определить, какие объекты целесообразно затенять в текстурном пространстве. Чтобы решить эту проблему, а также снизить общие требования рендерера к объему локальной памяти видеокарты, в рамках DirectX Ultimate существует механизм Samper Feedback. Каждый раз, когда GPU запрашивает определенный тайл (в случае, когда используются тайловые ресурсы) или MIP-уровень текстуры, в специальном буфере делается пометка, что данный ресурс был запрошен, причем с определенным уровнем детализации, и он подгружается в VRAM. В противном случае память содержит только низкодетализированные копии ресурсов.

⇡#RDNA 2 против Turing и Ampere

Теперь погрузимся глубже в устройство чипов RDNA 2, на уровень логики, занимающейся шейдерными вычислениями. Отдельный Compute Unit содержит 64 т. н. векторных ALU, разделенных на два блока SIMD (Single Instruction Multiple Data). Каждый SIMD за один такт выполняет одну инструкцию из группы 32 потоков операций (wavefront в терминологии AMD). Благодаря отдельным планировщикам, обслуживающим собственные SIMD’ы, и одновременной отдаче двух инструкций каждый такт, RDNA характеризуется пониженной латентностью исполнения индивидуальных инструкций по сравнению со старой архитектурой GCN. При этом RDNA допускает работу со старым, 64-поточным форматом wavefront’а — в таком случае SIMD исполняет одну инструкцию в течение двух тактов, и это несет свои преимущества: таким образом у CU появляется временное окно, чтобы дождаться получения данных, необходимых следующей инструкции, — например, из оперативной памяти GPU. Ширину wavefront'a для исполнения программ определяет компилятор. Вычислительные шейдеры обычно компилируются в формате Wave32, пиксельные — Wave64.

RDNA выполняет операции FP16 на своих SIMD’ах в удвоенном темпе, и то же относится к целочисленным операциям INT16. Кроме того, архитектура поддерживает несколько разновидностей смешанной точности, когда инструкция FMA требует перемножения двух матриц сниженной точности (FP16 для вещественных чисел и вплоть до INT4 для целых) и последующего сложения с матрицей FP32 или INT32. Такие вычисления происходят в ускоренном темпе кратно потере разрядности в исходных операндах (см. иллюстрацию). Согласно whitepaper RDNA графический процессор дополнительно оснащается специализированными ALU для расчетов двойной точности (FP64), которых может быть от 2 до 16 на каждый векторный SIMD, и темп исполнения инструкций меняется соответствующим образом — от 1/2 до 1/16 по отношению к FP32. Для Navi 21 справедливо последнее, ведь это в первую очередь игровой графический процессор, а высокую скорость обработки FP64 следует искать в представленных на днях устройствах архитектуры CDNA.

На самом деле здесь AMD приводит данные о пропускной способности одного WGP (Workgroup Processor), то есть пары CU, а не одного из них

В дополнение к векторным SIMD каждый Compute Unit имеет двойной скалярный конвейер, который используется операциями условного ветвления, перехода и подобной целочисленной арифметики. В таких случаях все значения операций одной инструкции waverfront’а одинаковы и происходит т. н. скаляризация в одну операцию, чтобы не тратить энергию, загружая SIMD ’ы одинаковыми вычислениями. Скалярные блоки RDNA могут получать свою инструкцию параллельно векторной инструкции соответствующего SIMD’а — недавно нам наконец-то удалось добиться от инженеров AMD подтверждения того, что параллелизм такого рода в RDNA действительно существует.

Наконец, еще один тип исполнительных блоков (SFU), который присутствует в Compute Unit’е, выполняет т. н. операции специального назначения: тригонометрические функции, которые нередко используются в задачах 3D-рендеринга. SFU представляет собой отдельный SIMD, который привязан к каждому из основных векторных SIMD’ов. Он служит резервным путем для инструкции wavefront’а и исполняет ее в темпе 1/4 по сравнению с обычными векторными инструкциями. Чтобы CU мог загрузить SFU, векторный SIMD пропускает один такт, а затем готов принимать и исполнять инструкции в стандартном режиме.

Таблица ниже резюмирует теоретическую пропускную способность CU в рамках архитектуры RDNA и RDNA 2 по сравнению с современной логикой Turing и Ampere от NVIDIA, а также решениями на чипах GCN, которые являются подходящими кандидатами для замены свежими ускорителями Radeon 6000-й серии. Мы взяли за единицу времени промежуток в 8 тактов GPU, чтобы минимизировать количество дробных чисел, и не стремились охватить все возможные комбинации типов инструкций: в данном случае нас интересуют только операции над вещественными и целыми числами стандартной точности (FP32 и INT32), а также расчет тригонометрических функций (SF) и арифметика с плавающей запятой сниженной точности (FP16).

RDNA 2 не удостоилась отдельной колонки в таблице, т. к. AMD не сообщает о каких-либо глубоких изменениях в работе Compute Unit’a. Говорят лишь о том, что CU прибавил 30 % быстродействия в пересчете на ватт потребляемой мощности за счет повышенных тактовых частот. Но это уже относится к энергоэффективности чипа Navi 21, которую мы обсудим (а затем измерим самостоятельно) позже.

	Compute Unit (GCN 5 поколения)	Compute Unit (RDNA 1/RDNA 2)	Streaming Multiprocessor (Turing)	Streaming Multiprocessor (Ampere)
Исполнительные блоки	4 × векторных SIMD16; 4 × векторных SIMD4 SFU; 1 × скалярное ALU; 4 × TMU (блока фильтрации текстур)	2 × векторных SIMD32; 2 × векторных SIMD8 (SFU); 2 – 16 × ALU (FP64); 2 × скалярных ALU; 1 × Ray Accelerator (только в RDNA 2); 4 × TMU (блока фильтрации текстур)	4 × секции 16 ALU (FP32); 4 × секции 16 ALU (INT32); 2 × ALU (FP64); 4 × секции 4 SFU; 4 × скалярных ALU; 4 × секции 2 тензорных ядер (или 4 × секции 32 FP16 ALU); 1 × RT-ядро; 4 × TMU (блока фильтрации текстур)	8 × секции 16 ALU (FP32); 4 × секции 16 ALU (INT32); 2 × ALU (FP64); 4 × секции 4 SFU; 4 × скалярных ALU; 4 × тензорных ядер (эквивалент 128 × FP16 ALU); 1 × RT-ядро; 4 × TMU (блока фильтрации текстур)
Пропускная способность, инструкций за 8 тактов	8 × FP32 (64 рабочие единицы) + 8 × скалярных ИЛИ 8 × FP16 (2 × 64 рабочие единицы) + 8 × скалярных ИЛИ 4 × 1/2 SF FP32 (64 рабочих единицы) + 8 × скалярных	16 × FP32 (32 рабочие единицы) + 16 × скалярных ИЛИ 16 × FP16 (2 × 32 рабочие единицы) + 16 × скалярных ИЛИ 12 × FP32 (32 рабочие единицы) + 4 × SF FP32 (32 рабочие единицы) + 16 × скалярных	16 × FP32 (32 рабочие единицы) + 16 × INT32 (32 рабочие единицы) ИЛИ 32 × FP16 (32 рабочие единицы) ИЛИ 4 × (3 + 1/2) FP32 (32 рабочие единицы) + 4 × (3 + 1/2) INT32 (32 рабочие единицы) + 4 × SF FP32 (32 рабочие единицы)	32 × FP32 (32 рабочие единицы) ИЛИ 16 × FP32 (32 рабочие единицы) + 16 × INT32 (32 рабочие единицы) ИЛИ 32 × FP16 (32 рабочие единицы) ИЛИ 8 × (3 + 1/2) FP32 (32 рабочие единицы) + 4 × SF FP32 (32 рабочие единицы) ИЛИ 4 × (3 + 1/2) FP32 (32 рабочие единицы) + 4 × (3 + 1/2) INT32 (32 рабочие единицы) + 4 × SF FP32 (32 рабочие единицы)
8 × FP32 (64 рабочие единицы) + 16 × скалярных ИЛИ 8 × FP16 (2 × 64 рабочие единицы) + 16 × скалярных ИЛИ 6 × FP32 (64 рабочие единицы) + 2 × SF FP32 (64 рабочие единицы) + 16 × скалярных
Пропускная способность, операций за 8 тактов	512 × FP32/INT32 + 8 скалярных ИЛИ 1024 × FP16/INT16 + 8 скалярных ИЛИ 128 × SF FP32 + 8 скалярных	512 × FP32/INT32 + 16 скалярных ИЛИ 1024 × FP16/INT16 + 16 скалярных ИЛИ 384 × FP32/INT32 + 128 × SF FP32 + 16 × скалярных	512 × FP32 + 512 × INT32 ИЛИ 1024 × FP16 ИЛИ 448 × FP32 + 448 × INT32 + 128 × SF FP32	1024 × FP32 ИЛИ 512 × FP32 + 512 × INT32 ИЛИ 1024 × FP16 ИЛИ 892 × FP32 + 128 × SF FP32 ИЛИ 448 × FP32 + 448 × INT32 + 128 × SF FP32

Compute Unit (GCN 5 поколения)

Compute Unit (RDNA 1/RDNA 2)

Streaming Multiprocessor (Turing)

Streaming Multiprocessor (Ampere)

Исполнительные блоки

4 × векторных SIMD16;

4 × векторных SIMD4 SFU;

1 × скалярное ALU;

4 × TMU (блока фильтрации текстур)

2 × векторных SIMD32;

2 × векторных SIMD8 (SFU); 2 – 16 × ALU (FP64);

2 × скалярных ALU;

1 × Ray Accelerator (только в RDNA 2);

4 × TMU (блока фильтрации текстур)

4 × секции 16 ALU (FP32);

4 × секции 16 ALU (INT32);

2 × ALU (FP64); 4 × секции 4 SFU;

4 × скалярных ALU; 4 × секции 2 тензорных ядер (или 4 × секции 32 FP16 ALU);

1 × RT-ядро;

4 × TMU (блока фильтрации текстур)

8 × секции 16 ALU (FP32);

4 × секции 16 ALU (INT32);

2 × ALU (FP64);

4 × секции 4 SFU;

4 × скалярных ALU;

4 × тензорных ядер (эквивалент 128 × FP16 ALU);

1 × RT-ядро;

4 × TMU (блока фильтрации текстур)

Пропускная способность, инструкций за 8 тактов

8 × FP32 (64 рабочие единицы) + 8 × скалярных

ИЛИ

8 × FP16 (2 × 64 рабочие единицы) + 8 × скалярных

ИЛИ

4 × 1/2 SF FP32 (64 рабочих единицы) + 8 × скалярных

16 × FP32 (32 рабочие единицы) + 16 × скалярных

ИЛИ

16 × FP16 (2 × 32 рабочие единицы) + 16 × скалярных

ИЛИ

12 × FP32 (32 рабочие единицы) + 4 × SF FP32 (32 рабочие единицы) + 16 × скалярных

16 × FP32 (32 рабочие единицы) + 16 × INT32 (32 рабочие единицы)

ИЛИ

32 × FP16 (32 рабочие единицы)

ИЛИ

4 × (3 + 1/2) FP32 (32 рабочие единицы) + 4 × (3 + 1/2) INT32 (32 рабочие единицы) + 4 × SF FP32 (32 рабочие единицы)

32 × FP32 (32 рабочие единицы)

ИЛИ

16 × FP32 (32 рабочие единицы) + 16 × INT32 (32 рабочие единицы)

ИЛИ

32 × FP16 (32 рабочие единицы)

ИЛИ

8 × (3 + 1/2) FP32 (32 рабочие единицы) + 4 × SF FP32 (32 рабочие единицы)

ИЛИ

4 × (3 + 1/2) FP32 (32 рабочие единицы) + 4 × (3 + 1/2) INT32 (32 рабочие единицы) + 4 × SF FP32 (32 рабочие единицы)

8 × FP32 (64 рабочие единицы) + 16 × скалярных ИЛИ 8 × FP16 (2 × 64 рабочие единицы) + 16 × скалярных ИЛИ 6 × FP32 (64 рабочие единицы) + 2 × SF FP32 (64 рабочие единицы) + 16 × скалярных

Пропускная способность, операций за 8 тактов

512 × FP32/INT32 + 8 скалярных

ИЛИ

1024 × FP16/INT16 + 8 скалярных

ИЛИ

128 × SF FP32 + 8 скалярных

512 × FP32/INT32 + 16 скалярных

ИЛИ

1024 × FP16/INT16 + 16 скалярных

ИЛИ

384 × FP32/INT32 + 128 × SF FP32 + 16 × скалярных

512 × FP32 + 512 × INT32

ИЛИ

1024 × FP16

ИЛИ

448 × FP32 + 448 × INT32 + 128 × SF FP32

1024 × FP32

ИЛИ

512 × FP32 + 512 × INT32

ИЛИ

1024 × FP16

ИЛИ

892 × FP32 + 128 × SF FP32

ИЛИ

448 × FP32 + 448 × INT32 + 128 × SF FP32

Как видите, архитектура RDNA эквивалентна Turing по теоретическому быстродействию в операциях FP32/INT32, FP16/INT16 или SFU, когда нагрузка состоит исключительно из одного типа инструкций. Однако бросается в глаза то, что RDNA/RDNA 2 не имеет возможности параллельно выполнять расчеты FP32 и INT32, которую приобрел Turing, или просто-напросто удвоить пропускную способность FP32, как сделано в Ampere. Впрочем, у RDNA есть ряд своих уникальных преимуществ. Так, скаляризация инструкций не увеличивает производительность чипов NVIDIA и служит только для экономии потребляемой мощности, в то время как в RDNA скалярные и векторные инструкции отдаются на исполнение одновременно. Далее, клиентами планировщика в «зеленых» GPU также являются тензорные ядра, блок ветвлений и группа блоков load/store. Чтобы задействовать какой-либо из них, в этот такт планировщик не может отправить инструкцию для исполнения на шейдерных CUDA-ядрах.

Не удивительно, что в контексте реальных приложений, а не теоретических оценок быстродействия весьма нелегко целиком раскрыть потенциал чипов Ampere. О результатах, приближающихся к паспортным значениям, речь может идтитолько при исключительно вещественночисленной нагрузке. Действительно, ни один игровой бенчмарк не повторил такой колоссальной разницы в производительности между продуктами Ampere и ускорителями предыдущего поколения, как, например, тесты в рейтрейсере Blender. Складывается впечатление, что графические архитектуры, которые развивают NVIDIA и AMD, поменялись местами: когда-то на стороне «красных» был перевес по числу шейдерных ALU, который ярче всего проявлялся в задачах GP-GPU. Теперь то же самое можно сказать про Ampere, явно тяготеющий к нагрузке расчетного типа, несмотря на преимущественно игровую ориентацию чипов GA102 и GA104.

А вот что AMD пока нечем крыть — так это вышеупомянутые тензорные ядра, предназначенные для чрезвычайно быстрого исполнения операций FMA над данными сниженной разрядности, которые используются главным образом в эксплуатации (а с некоторых пор и тренировке) нейронных сетей. Чипы на основе RDNA вынуждены делать эту работу сравнительно медленно силами векторных SIMD’ов. И пусть RDNA развивает двойной темп исполнения инструкций половинной точности, один CU за такт совершает не более 128 операций FP16, в то время как один потоковый мультипроцессор NVIDIA — целых 512 при условии, что это операции в тензорном формате. Вдобавок ко всему, пока задействованы тензорные ядра, шейдерные ALU тожене обязаны простаивать.

⇡#Аппаратная трассировка лучей

Про аппаратно ускоренный рейтрейсинг — одну из коронных функций архитектуры RDNA второго поколения, как бы странно это ни прозвучало, мы можем сообщить не так уж много. Точно так же, как соперничающие архитектуры Turing и Ampere от NVIDIA, RDNA 2 опирается на распространенный алгоритм Bounding Volume Hierarchy для оптимизации поиска пересечений между лучом и полигонами сцены. Алгоритм BVH заранее сортирует примитивы по вложенным друг в друга боксам. Таким образом, чтобы быстро найти точку пересечения луча с поверхностью примитива, программе нужно рекурсивным образом пройти сквозь древовидную структуру BVH и только затем вычислить барицентрические координаты пересечения луча с плоскостью вместо того, чтобы выполнять крайне неэффективный перебор всех треугольников сцены.

Тем не менее рейтрейсинг даже с помощью BVH по-прежнему остается чрезвычайно ресурсоемкой задачей, когда он выполняется на универсальных шейдерных ALU, поэтому в архитектуре Turing от NVIDIA и появились (а затем были усилены в чипах Ampere) блоки фиксированной функциональности, предназначенные именно для прохождения структуры BVH и расчетов пересечения луча с примитивами внутри наименьшего бокса. Аналогичные по назначению блоки под названием Ray Accelerators (RA) стали дополнением к архитектуре RDNA в чипе Navi 21. Одна часть RA занимается BVH, другая поиском координат на полигоне, а темп выполнения расчетов составляет 4 и 1 пересечение луча за такт соответственно. Увы, для сравнения с RDNA 2 у нас нет подобной информации об RT-блоках в чипах NVIDIA, но известно по крайней мере то, что Ampere (в отличие от Turing и RDNA 2) позволяет двум частям RT-блока в одно и то же время отслеживать разные лучи. Кроме того, Ampere содержит специфические оптимизации для ускорения трассированного размытия в движении, которые в RDNA 2 также отсутствуют.

Согласно данным внутреннего тестирования AMD ускоритель на базе Navi 21 развивает производительность в 10 раз больше за счет аппаратного рейтрейсинга по сравнению с исключительно софтверным рендерингом на том же оборудовании. Однако эти числа еще ничего не говорят о быстродействии реальных приложений. Чипмейкер избегает прямого сравнения новых видеокарт с предложениями NVIDIA в игровых бенчмарках с трассировкой лучей, и это неспроста. А абсолютные числа кадровой частоты не сопровождаются достаточно подробными комментариями о методике тестирования, чтобы мы могли сопоставить их с уже хорошо известными показателями Turing и Ampere. Впрочем, мы скоро выясним, как обстоят дела в действительности. Ведь главное, что аппаратно ускоренный рейтрейсинг, который прежде был невозможен на «красном» железе, теперь стал реальностью, а отставание от первопроходца вполне простительно для ранних решений AMD.

Более серьезной проблемой для Radeon c аппаратным рейтрейсингом является отсутствие настолько же эффективных инструментов масштабирования кадра, как DLSS версии 2.0 у видеокарт NVIDIA. Даже новейшие модели GeForce RTX 30-й серии при высоком разрешении далеко не всегда поддерживают комфортный фреймрейт без апскейлинга, и, судя по всему, разработчики игр уже привыкают закладывать в требования графического движка прибавку быстродействия, которую обеспечивает DLSS. Это ставит железо AMD, явно более слабое в трассировке лучей, в невыгодное положение. В настоящее время компания работает над очередным расширением библиотек FidelityFX под названием Super Resolution, которое является более качественным средством реконструкции деталей, чем существующий алгоритм FidelityFX CAS, но, как ни крути, рынок игр остается фрагментированным, и далеко не все игровые студии будут тратить силы на интеграцию двух соперничающих технологий.

Как и RT-ядра в чипах Turing и Ampere, RDNA 2 позволяет задействовать функции аппаратно ускоренного рейтрейсинга под управлением стандартных графических интерфейсов программирования DXR и аналогичных расширений Vulkan. В задачах профессиональной визуализации блоки Ray Accelerators активируют плагин RadeonProRender версии 3.0 (он еще находится в статусе бета-версии) для нескольких программ 3D-моделирования, а в будущем поддержка распространится на рендерер Cycles в пакете Blender. Здесь опять-таки NVIDIA успела пройти большую дистанцию со времен дебюта чипов Turing, и ускорение рейтрейсинга на видеокартах GeForce и Quadro теперь используется практически везде, где только можно. AMD придется наверстывать упущенное, но, с другой стороны, NVIDIA уже сыграла роль ледокола, и в результате программная инфраструктура игр и рабочих приложений теперь гораздо лучше приспособлена к аппаратным решениям такого рода.

Кстати, не будем удивлены, если одной из первых компаний, которые предоставят чипам архитектуры RDNA 2 софтверную платформу для рейтрейсинга, станет Apple. «Домашние» чипы этой фирмы выглядят многообещающе, но Apple наверняка еще нескоро обойдется без чужих графических процессоров в своих высокопроизводительных десктопах и рабочих станциях.

⇡#Иерархия памяти Navi 21 и Infinity Cache

Теперь пора, наконец, обсудить безоговорочно главное нововведение архитектуры RDNA 2 — стек локальной памяти, который включает громадный кеш третьего уровня. Все остальные хранилища, ближайшие к шейдерным ALU, не претерпели почти никаких изменений по сравнению с тем, что уже было сделано в чипах Navi первого поколения. Compute Unit’ы RDNA связаны в пары (Workgroup Processors), имеющие общий LDS (Local DataShare) объемом 128 Кбайт (если бы он вырос, AMD наверняка сообщила бы), который представляет собой наиболее быстрый тип памяти после регистров векторных SIMD’ов, а также 32-килобайтный кеш инструкций и скалярный кеш объемом в 16 Кбайт. Кеш нулевого уровня является эксклюзивным для каждого CU. Остался прежним и объем секции L1 в пределах каждого Shader Engine — четыре из них дают в сумме 1 Мбайт кеша первого уровня.

Имеет место даже определенный регресс характеристик: стала вдвое меньше пропускная способность в направлении от L0 к L1, а кеш L2, общий для блоков Shader Engine и командных процессоров, несмотря на удвоенный вычислительный потенциал Navi 21, сохранил объем 4 Мбайт. Однако все это с лихвой искупают меры, которые AMD приняла в отношении последних уровней памяти, доступных графическому процессору.

GPU такого калибра, как Navi 21, нуждаются в скоростном доступе к большим объемам данных. Чтобы обеспечить эту потребность, AMD могла пойти проторенной дорогой памяти HBM2, которая принесла Radeon VII все еще действующий среди потребительских видеокарт рекорд пропускной способности памяти в 1 Тбайт/с, или использовать 512-битную шину, которая в сочетании с обычными микросхемами GDDR6 гарантирует не меньшую ПСП. Но оба указанных решения проблематичны каждое по своим причинам, общей среди которых является цена. Наконец, существуют также далеко не дешевые в стоимости конечного продукта чипы GDDR6X, но пусть данный стандарт формально не является эксклюзивным для продуктов NVIDIA, Micron работала над ним в сотрудничестве с последней, и третий в этой истории наверняка был бы лишним.

Благо AMD нашла свой и, кажется, наиболее перспективный подход к проблеме. Компания оставила попытки ускорить внешнюю динамическую память и применяет в новых ускорителях банальные чипы GDDR6 с пропускной способностью 16 Гбит/с на 256-битной шине, что в совокупности дает 512 Гбайт/с. Таким образом, устройства 6000-й серии недалеко ушли от Radeon RX 5700 XT с его 448 Гбайт/с. Однако в дополнение к дискретной DRAM на самом кристалле GPU теперь расположен массивный кеш третьего уровня объемом 128 Мбайт под названием Infinity Cache.

Infinity Cache существенно отличается от кешей L1 и L2, которые являются неотъемлемой частью любого современного GPU, тем, что внутренние хранилища CU и Shader Engines больше заточены под высокую пропускную способность, нежели объем и, соответственно, хитрейт. Так, в RDNA канал между L1 и Compute Unit’ами в пределах Shader Engine передает в общей сложности 4096 байт за такт, а между всеми секциями L1 и L2 — 2048 байт. В пересчете на весь GPU эти величины составляют десятки терабайт в секунду, но в силу скромного объема кешей процент попаданий в них сравнительно мал. А главное, масштабировать такую структуру было бы чрезвычайно затратно с точки зрения площади кристалла. Вместо этого Navi 21 получил кеш последнего уровня в качестве прокладки между L2 и внешней динамической памятью, который создан по образцу L3 в центральных процессорах архитектуры Zen и отличается чрезвычайно высокой плотностью компоновки (вчетверо меньшая площадь относительно емкости, чем у L2-чипов Navi).

Сплошные горизонтальные блоки сверху и снизу — это Infinity Cache

В действительности решения такого рода, как Infinity Cache, — далеко не новость. Крупным массивом статической (или высокоскоростной динамической) памяти для нужд GPU — прямо на чипе или в виде отдельной микросхемы — не раз оснащали SoC игровых консолей, а также до недавнего времени он использовался в интеловских мобильных CPU. Но среди дискретных графических процессоров для ПК Navi 21 все-таки стал первопроходцем.

Жаль только, что AMD не сообщила, какую именно долю площади кристалла занимает Infinity Cache, и у нас нет реальных фотографий без диффузионного барьера, чтобы замерить ее хотя бы приблизительно (стачивать абразивом чип тестовой видеокарты, извините, рука не поднимается). Но вот сам кристалл получился ожидаемо крупным для такого количества вычислительных блоков. Navi 21 содержит в общей сложности 26,8 млрд транзисторов и, таким образом, не слишком отстает от флагмана среди потребительских чипов NVIDIA — GA102 (28,3 млрд). Вместе с тем Navi 21 не только в 2,6 раза превосходит Navi 10 по количеству транзисторов, но и отличается более высокой плотностью компонентов, что стоит отнести как раз на счет компактных библиотек SRAM, из которых сложен Infinity Cache, ведь оба процессора производятся на одном и том же 7-нанометровом конвейере TSMC.

Кеш L3 соединяется с кешем второго уровня шиной Infinity Fabric, которая состоит из 16 каналов шириной 64 байт и разгоняется до тактовой частоты 1,94 ГГц. Пропускная способность интерфейса существенно меньше по сравнению с более глубокими слоями стека памяти, но все равно достигает внушительной величины в 1,99 Тбайт/с, а это почти в четыре раза больше по сравнению с чипами GDDR6 на 256-битной шине (512 Гбайт/с в случае новых ускорителей AMD). Infinity Cache также расположен в собственном домене тактовой частоты, которая снижается — вплоть до 1,4 ГГц — в то время, когда частый доступ к L3 не происходит. Кроме того, благодаря высокой пропускной способности Infinity Fabric, клиентами которой являются контроллеры GDDR6, ускорился даже некешированный доступ к оперативной памяти.

Численные оценки быстродействия Infinity Cache говорят о том, что его латентность на 48 % ниже, чем у памяти GDDR6 на скорости 14 Гбит/с, которая применяется в Radeon RX 5700 XT, а средняя латентность L3 и VRAM в ускорителях 6000-й серии снизилась на 34 % по сравнению с предыдущим поколением. Объема Infinity Cache хватает, чтобы вместить значительную часть данных, необходимых блокам трассировки лучей для прохождения структур BVH. Также, по данным чимпейкера, общая частота попаданий в L3 достигает 58 %, если речь идет об играх в режиме 4К, то есть вплоть до 58 % запросов GPU обслуживаются с чрезвычайно высокой скоростью, которая уступает лишь ПСП новейших серверных GPU с памятью HBM2.

Конечно, 58 % — это наиболее оптимистичная оценка, а гарантом высокого хитрейта в данном случае являются алгоритмы драйвера. AMD не требует от программного обеспечения прямых указаний, какие данные следует поместить в L3, хотя такая возможность имеется, так что все существующие приложения автоматически пользуются преимуществами новой архитектуры памяти.

Мы ожидаем, что эффективность Navi 21 в разных играх и профессиональном ПО не будет одинаково высокой и наверняка возрастет в будущем по мере того, как будет происходить оптимизация драйверов и приложений. Как бы то ни было, Infinity Cache уже позволил AMD смело удвоить количество шейдерных ALU и резко увеличить тактовые частоты графического процессора, не беспокоясь о ПСП, и одновременно повысить энергоэффективность памяти по сравнению с альтернативными решениями, подразумевающими разводку чипов GDDR6 на 384- или 512-битной шине.

Наконец, AMD объявила о поддержке API DirectStorage в среде Windows, который обеспечивает прямую загрузку игровых ресурсов с твердотельных накопителей в локальную память графического процессора. К сожалению, чипмейкер далеко не так подробно рассказывает об особенностях имплементации DirectStorage в собственных продуктах, как его конкурент об аналогичной технологии RTX IO. В частности, не упоминается аппаратная декомпрессия данных силами шейдерных ALU, которая является важной частью решения NVIDIA. Кроме того, DirectStorage производит впечатление прежде всего программного продукта, который не опирается на принципиально новые аппаратные инструменты. Так, RTX IO будет работать не только на свежих видеокартах GeForce 30-й серии, но с таким же успехом и на GeForce RTX 20. AMD, в свою очередь, не уточнила, распространяется ли совместимость с DirectStorage на чипы RDNA первого поколения, хотя мы не видим никаких технических причин, которые могли бы этому воспрепятствовать.

Нельзя обойти вниманием следующую функцию RDNA 2 под названием Smart Access Memory, принцип работы которой пока тоже не до конца ясен. Судя по тому, как SAM характеризуют ее создатели, она открывает центральному процессору прямой доступ к полному объему локальной памяти видеокарты. В типичных игровых компьютерах небольшая часть VRAM всегда является частью адресного пространства системной памяти, но SAM, как мы предполагаем, просто дает возможность целиком отображать VRAM в RAM, что позволит избежать ненужного копирования данных. Для того чтобы извлечь из этого максимальные дивиденды, приветствуется оптимизация программного обеспечения, но уже сейчас технология сулит, по усредненным оценкам AMD, дополнительные 6 % FPS в популярных играх при максимуме вплоть до 11 %. SAM доступна ускорителям Radeon 5000-й и 6000-й серий, но есть подвох: с ней могут работать только процессоры Ryzen 5000 и материнские платы на чипсете B550 или X570 (потребуется обновить BIOS и активировать SAM в его настройках).

Недавно стало известно, что NVIDIA трудится над собственным аналогом Smart Access Memory, который будет работать совместно с чипами Intel и, если AMD не будет возражать, Ryzen. Если так и получится, не исключено, что AMD снимет ограничения с SAM на стороне видеокарт, и полный доступ к VRAM, будем надеяться, рано или поздно будет открыт для любых комбинаций CPU и GPU.

⇡#Декодирование AV1 и выход HDMI 2.1

Судя по официальным оценкам производительности, мультимедийный блок Navi 21 не претерпел никаких изменений по сравнению с аналогичным компонентом чипов Navi первого поколения в части декодирования и кодирования видео стандартов H.264, HEVC и VP9, хотя надо сказать, что AMD преуменьшает его потенциал: в собственных бенчмарках мы получили от Radeon RX 5700 XT более высокие результаты. Однако Navi 21 приобрел возможность кодировать HEVC с разрешением 8К, которой у «красных» GPU не было раньше, и поддержку B-frames (одного из типов промежуточных кадров) в рамках H.264. Что более важно, Navi 21 научился декодировать передовой и чрезвычайно ресурсоемкий стандарт AV1 с кадровой частотой 30 FPS при разрешении 8К (пусть это и не 60 FPS или больше, как в кремнии Ampere от NVIDIA).

Наконец, передовой видеоинтерфейс HDMI 2.1 уже достиг коммерческого внедрения в телевизорах и мониторах, а теперь его осваивают и видеокарты. Контроллер дисплея Navi 21 использует полную пропускную способность HDMI 2.1 для вывода изображения с разрешением 8К и кадровой частотой 60 Гц или, что более актуально, 4К с частотой 120 Гц без необходимости в компрессии данных.

Технические характеристики, цены. Конструкция референсных видеокарт

⇡#Технические характеристики, цены

По грубым количественным оценкам, AMD удалось создать графический процессор, который вполне можно поставить в один ряд с флагманским кристаллом NVIDIA семейства Ampere — GA102. Полностью функциональный чип Navi 21 содержит 5120 FP32-совместимых шейдерных ALU, 320 блоков наложения текстур и 128 ROP. Конечно, GA102, который описывается формулой 10 752:336:112, превосходит новоявленного соперника по вычислительному потенциалу шейдеров, но стоит в очередной раз напомнить, что Ampere потрясающе эффективен в расчетных задачах, но двойной массив CUDA-ядер FP32, который является ключевой особенностью данной архитектуры, вовсе не удваивает игровой фреймрейт.

На основе одного и того же чипа Navi 21 AMD создала три потребительские видеокарты, отличающиеся друг от друга количеством активных блоков GPU, энергопотреблением и, разумеется, ценой. Их спецификации вы можете найти в таблице ниже.

Производитель	AMD
Модель	Radeon VII	Radeon RX 5700 XT	Radeon RX 6800	Radeon RX 6800 XT	Radeon RX 6900 XT
Графический процессор
Название	Vega 20 XL	Navi 10 XT	Navi 21 XL	Navi 21 XT	Navi 21 XTX
Микроархитектура	GCN 5-го поколения	RDNA	RDNA 2	RDNA 2	RDNA 2
Техпроцесс, нм	7 нм FinFET	7 нм FinFET	7 нм FinFET	7 нм FinFET	7 нм FinFET
Число транзисторов, млн	13 200	10 300	26 800	26 800	26 800
Тактовая частота, МГц: Base Clock / Game Clock / Boost Clock	1 400/1 750	1 605/ 1755/1 905	Н/Д/1 815/2 105	Н/Д/2 015/2 250	Н/Д/2 015/2 250
Шейдерные ALU	3 840	2 560	3 840	4 608	5 120
Блоки наложения текстур (TMU)	240	160	240	288	320
Блоки операций растеризации (ROP)	64	64	96	128	128
Оперативная память
Разрядность шины, бит	4096	256	256	256	256
Тип микросхем	HBM2	GDDR6 SDRAM	GDDR6 SDRAM	GDDR6 SDRAM	GDDR6 SDRAM
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с)	1 000 (2 000)	1 750 (14 000)	2 000 (16 000)	2 000 (16 000)	2 000 (16 000)
Объем, Мбайт	16 192	8 096	16 192	16 192	16 192
Объем Infinity Cache, Мбайт	Нет	Нет	128	128	128
Шина ввода/вывода	PCI Express 3.0 x16	PCI Express 4.0 x16		PCI Express 4.0 x16	PCI Express 4.0 x16
Производительность
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты)	13 440	9 754	16 166	20 736	23 040
Производительность FP64/FP32	1/4	1/16	1/16	1/16	1/16
Производительность FP16/FP32	2/1	2/1	2/1	2/1	2/1
Пропускная способность оперативной памяти, Гбайт/с	1024	448	512	512	512
Вывод изображения
Интерфейсы вывода изображения	HDMI 2.0b, DisplayPort 1.4	DisplayPort 1.4, HDMI 2.0b	DisplayPort 1.4, HDMI 2.1	DisplayPort 1.4, HDMI 2.1	DisplayPort 1.4, HDMI 2.1
TBP/TDP, Вт	300	225	250	300	300
Розничная цена (США, без налога), $	699 (рекоменд. на дату выхода)	399 (рекоменд. на дату выхода)	579 (рекоменд. на дату выхода)	649 (рекоменд. на дату выхода)	999 (рекоменд. на дату выхода)
Розничная цена (Россия), руб.	Н/Д	29 499 (рекоменд. на дату выхода)	53 590 (рекоменд. на дату выхода)	59 900 (рекоменд. на дату выхода)	Н/Д

Базовая модель Radeon RX 6800 поступила в продажу по рекомендованной стоимости $579, а подходящим соперником для нее AMD видит GeForce RTX 2080 Ti. Судя по результатам внутреннего тестирования, Radeon RX 6800 регулярно превосходит RTX 2080 Ti в популярных игровых бенчмарках при разрешении 1440p и 2160p без рейтрейсинга, однако настоящей мишенью в данном случае является 499-долларовый GeForce RTX 3070, который во время анонса Radeon 6000-й серии еще не появился на рынке, но его возможности наверняка были хорошо известны конкуренту.

Однако есть фактор, который бросает тень на притязания NVIDIA. Radeon RX 6800 дали фору в виде технологии Smart Access Memory на платформе с процессором Ryzen 5000, а она, как мы помним, обещает увеличить фреймрейт на среднее значение 6 % FPS. Кроме того, заметим, что чип Navi 21 очень серьезно — с 80 до 60 CU — урезали для того, чтобы вписаться в характеристики Radeon RX 6800, и это наверняка ударило по его энергоэффективности. Но что поделать, подходящего GPU между Navi 10 и Navi 21 у AMD пока нет.

Важнее то, что чипмейкер достаточно уверен в превосходстве Radeon RX 6800 над GeForce RTX 3070, чтобы назначить ему более высокую розничную цену. Когда писались эти строки, мы не знали, насколько хорошо RX 6800 выступит в наших тестах, но одно преимущество устройства AMD не подлежит сомнению. Все три новинки, и RX 6800 в том числе, имеют 16 Гбайт VRAM, а это вдвое больше скромных 8 Гбайт у GeForce RTX 3070.

В свою очередь, Radeon RX 6800 XT отличается от младшей модели существенно повышенными тактовыми частотами, энергопотреблением, а главное, количеством активных CU (72 из 80) на чипе Navi 21. Неспроста AMD выделила Radeon RX 6800 XT для того, чтобы продемонстрировать межпоколенческий прогресс кремния Navi: новой видеокарте пророчат вдвое большее быстродействие по сравнению с Radeon RX 5700 XT.

По предварительным оценкам, Radeon RX 6800 XT обеспечивает игровой фреймрейт, в среднем эквивалентный фреймрейту GeForce RTX 3080 с перевесом в пользу того или другого устройства в отдельных тайтлах (причем на этот раз без Smart Access Memory). Однако в данном случае «красные» снова разыгрывают карту более доступной цены. Новинка на $50 дешевле 699-долларового соперника, невзирая на преимущество в объеме VRAM, и несложно догадаться почему. Хотя трассировка лучей в реальном времени является одной из ключевых функций, которые отличают архитектуру RDNA 2 от предыдущего железа AMD, чипмейкер избегает любых сравнений с ее соперниками в дисциплине игрового рейтрейсинга.

Наконец, серию новых ускорителей венчает Radeon RX 6900 XT, который мы увидим не раньше 8 декабря, да и затем вряд ли стоит рассчитывать на широкую доступность этой видеокарты. Radeon RX 6900 XT продемонстрирует во всей красе целиком активированный кристалл Navi 21 с 80 Compute Unit’ами. Это самая мощная потребительская видеокарта, созданная AMD, и, без сомнения, одно из самых высокопроизводительных решений в своем классе. Вот только складывается впечатление, что RX 6900 XT стал позднейшим дополнением к 6000-й линейке и является в первую очередь символом достижений новой архитектуры, от которого компания не ожидает большого коммерческого успеха. Как и младшие модели, флагман обрел подходящего соперника среди устройств NVIDIA — GeForce RTX 3090, но мы бы не поставили на победу «красных» в этой схватке. AMD опубликовала слайд с оценками быстродействия, на котором два ускорителя обменялись ударами, но в пользу Radeon RX 6900 XT здесь играет не только Smart Access Memory на платформе Ryzen 5000, но и просто-напросто разгон графического процессора.

Дело в том, что в интерфейсе драйвера Radeon RX 6800 и 6900 XT есть такая опция, как Rage Mode, представляющая собой не что иное, как заводской оверклокинг с повышенным резервом мощности. AMD уже использовала этот прием в прошлом, когда чувствовала превосходство соперника, а вот, например, у RX 6800 разгона одной кнопкой нет. Кроме того, продукты такого рода интересны в первую очередь не геймерам, а пользователям рабочих станций. Но в сфере GP-GPU сейчас как никогда сильна NVIDIA, что относится не только к производительности, но и к программной инфраструктуре. Наконец, Radeon RX 6900 XT не может похвастаться таким объемом локальной памяти, как RTX 3090 (16 против 24 Гбайт). С другой стороны, и цена флагманского Radeon вполне соответствует ожиданиям от его возможностей: как ни крути, тысяча долларов меньше полутора тысяч.

Для производства графических процессоров AMD по-прежнему использует конвейер TSMC с нормой 7 нм, но в этот раз компания гораздо лучше распорядилась возможностями передового техпроцесса. Благодаря массе различных оптимизаций чипы Navi второго поколения далеко ушли от своих предшественников и, по заявлению AMD, потребляют на 50 % меньше мощности в пересчете на количество Compute Unit’ов и тактовую частоту. Результирующий прирост удельного быстродействия относительно Navi 10 оценивается в 54 %, среди которых 16 % относят на счет высокоскоростных библиотек логики, а 17 % — на счет механизмов отключения неактивных блоков GPU и устранения ненужной переноски данных. Наконец, еще 21 % энергоэффективности дал кеш L3, обновленный front-end и back-end конвейера рендеринга.

Как следствие, теперь AMD может себе позволить увеличить тактовые частоты на 30 % в отношении к потребляемой мощности и количеству CU, и это хорошо заметно в спецификациях новинок. Параметр GameClock (ориентир тактовой частоты в типичных играх) двух старших моделей составляет 2015 МГц, а Boost Clock (оппортунистическая частота в условиях не исчерпанного резерва мощности) достигает 2250 МГц. Базовая версия Radeon RX 6800 ограничена частотами 1815 и 2105 МГц. Базовую частоту GPU производитель теперь даже не указывает, т. к. на практике современные чипы работают настолько медленно лишь в условиях жесткого температурного или мощностного троттлинга.

Как бы то ни было, одновременный рост тактовых частот и транзисторного бюджета GPU не прошел бесследно для абсолютных показателей потребляемой мощности. Radeon RX 6800 работает в термопакете 250 Вт, и это, на самом деле, потрясающий результат, ведь несравненно более слабый с вычислительной точки зрения Radeon RX5700 XT рассчитан на 225 Вт. А вот Radeon RX 6800 XT и 6900 XT уже способны развивать нешуточную мощность в 300 Вт. Конечно, «зеленые» видеокарты последнего поколения оказались еще прожорливее, но теперь нет сомнений, что энергопотребление около 300–350 окончательно закрепилось в качестве нормы для графических ускорителей высшей категории.

⇡#Radeon RX 6800 и Radeon RX 6800 XT: конструкция

Как мы уже сказали, в продажу сперва поступят референсные видеокарты, брендированные партнерами чипмейкера. Кастомные модели от некоторых производителей уже появились на горизонте, но они дойдут до прилавков с некоторой задержкой. AMD всегда поступает так с продуктами на базе совершенно нового кремния, и отсутствие партнерских модификаций прямо на старте продаж уже не раз осложняло первые месяцы жизни «красных» новинок. Дело в том, что по-настоящему удачные образцы референсного дизайна у AMD можно пересчитать по пальцам, и почти все они представляют собой видеокарты с водяным охлаждением: Radeon R9 295 X2, Radeon RX Vega 64 LC, и, если бы не частые поломки помпы, можно было бы добавить в список Radeon Fury X. Делать качественные воздушные кулеры AMD до последнего времени так и не научилась.

К счастью, в 6000-й серии компания твердо намерена исправить репутацию эталонных моделей Radeon. AMD не пошла настолько далеко, чтобы придумать для них отдельную торговую марку наподобие Founders Edition, но, судя по эстетике продуктов и характеристикам системы охлаждения, они ее вполне заслуживают.

AMD Radeon RX 6800

Для Radeon RX 6800, с одной стороны, и RX 6800 XT/6900 XT, с другой, сконструировали два похожих кулера, которые различаются главным образом размерами и, соответственно, глубиной оребрения радиаторов. Младшая модель занимает в корпусе ПК строго два слота расширения, старшая — два с половиной. Остальные габариты у них одинаковы. В частности, длина устройств составляет 267 мм, так что они поместятся практически в любой современный корпус, рассчитанный на полноформатные материнские платы ATX. Вместе с тем видеокарты немало весят из-за крупного радиатора, покрывающего почти всю площадь печатной платы, и металлического кожуха: наши весы показали 1397 г для Radeon RX 6800 и 1517 г для версии XT.

AMD Radeon RX 6800 XT

В отличие от референсных образцов Radeon RX 5700 и RX 5700 XT, которые, несмотря на презентабельный внешний вид, отличались высокими температурами и высоким уровнем шума, новые видеокарты обслуживает заведомо более эффективная СО открытой конструкции с тремя вентиляторами диаметром 80 мм. Лопасти каждого вентилятора охватывает кольцо, фокусирующее поток воздуха в осевом направлении. При простое GPU вентиляторы останавливаются, и устройство охлаждается пассивно. AMD пообещала, что под нагрузкой новый кулер работает на 6 дБА тише, чем турбина Radeon RX 5700 XT. Так это или нет, мы проверим в тестах, но предварительно заверим, что шума действительно стало намного меньше.

Кожух системы охлаждения устроен таким образом, что нагретый воздух покидает вентилятор через широкие окна по длинным сторонам радиатора. Монтажная пластина здесь глухая, но не беда: ребра вентилятора все равно проходят перпендикулярно ей. Главное — обеспечить адекватную вентиляцию компьютерного корпуса: новые видеокарты развивают мощность в 250–300 Вт, и все тепло остается внутри ПК. Смущает только крупный выступ, который частично перекрывает отток воздуха в центре (в большей степени это относится к базовой модели Radeon RX 6800) и существует только затем, чтобы нашлось место для светящегося логотипа Radeon. AMD явно переняла некоторые черты конструкции, включая это не самое практичное решение, у «зеленых» видеокарт Founders Edition прошлого поколения.

Есть и еще одна особенность, позаимствованная у Founders Edition 20-й серии, причем, с нашей точки зрения, не вполне своевременно. Один из выходов DisplayPort здесь поменяли на USB Type-C для передачи сигнала и питания шлемов виртуальной реальности в рамках стандарта VirtualLink. Вряд ли много покупателей будут горевать о потере одного полноформатного разъема DisplayPort, но, с другой стороны, пользователей HMD (тем более с унифицированным подключением по USB Type-C) еще меньше. Кроме того, технология VirtualLink так и не взлетела, несмотря на поддержку со стороны NVIDIA и производителей VR-оборудования. Неспроста сама же NVIDIA отказалась от нее в ускорителях GeForce 30. Благо миниатюрный коннектор по-прежнему можно использовать как обычный высокоскоростной разъем USB, в том числе для подключения мониторов в режиме проброса DisplayPort. VirtualLink ничего не меняет в распиновке коннектора и только повышает пропускную способность линий USB, которые идут параллельно с сигналом DisplayPort, с уровня 2.0 до USB 3.1 Gen 2 — при условии, что используется подходящий кабель.

В основании радиатора эталонных видеокарт 6000-й серии лежит крупная испарительная камера, которая примыкает к чипу графического процессора и распределяет тепло по ребрам. AMD опять использовала графитовый термоинтерфейс вместо термопасты, но по этому поводу вряд ли стоит беспокоиться: он работает не хуже большинства термопаст в Radeon VII и референсных версиях Radeon RX 5700 (XT). Кроме того, графитовая прокладка толще, чем слой жидкого термоинтерфейса, и это можно рассматривать как преимущество для кулеров с испарительной камерой, основание которых сложнее выровнять, чем у обычных радиаторов на теплотрубках, запрессованных в медный сэндвич теплосъемника.

В свою очередь, микросхемы GDDR6 и ключи регуляторов напряжения накрыты массивной рамой, сцепленной с основным радиатором. Обратная сторона PCB защищена алюминиевой пластиной, которая также принимает участие в отводе тепла от горячих участков текстолита.

К сожалению, карты прибыли к нам на тестирование с большим опозданием, и у нас совершенно не хватило времени, чтобы аккуратно демонтировать кулер и сделать собственные фотографии печатной платы. Кроме того, у нас есть опасения, что в этот раз замена кремниевой прокладки термопастой не пройдет безболезненно, и необходимого прижима радиатора к кристаллу GPU винты больше не дадут.

⇡#Печатная плата

На что AMD никогда не жалеет денег, так это на оснастку эталонных печатных плат для высокопроизводительных GPU, и 6000-я серия не стала исключением. PCB допускает разводку в общей сложности 16 фаз регуляторов напряжения для питания графического процессора и чипов оперативной памяти. Полный набор силовых каскадов и фильтров мы наверняка увидим только в топовой модели Radeon RX 6900 XT. У RX 6800 и 6800 XT изъяли одну фазу питания GPU — осталось 12 фаз для графического процессора и три для питания чипов GDDR6.

Нельзя пожаловаться и на подбор фильтрующих компонентов в цепях перед силовыми каскадами и после них. Везде используются только SMD-конденсаторы, а с обратной стороны от GPU — целый лес мелких алюминиевых электролитов (SP-CAP).

Однако нашлось и несколько поводов для недовольства. Во-первых, на PCB по-прежнему нет токоизмерительных шунтов, чтобы BIOS видеокарты позволил напрямую регистрировать и контролировать общее энергопотребление устройства. Автоматика наблюдает только за мощностью кристалла GPU по падению напряжения на выходных дросселях VRM. Во-вторых, AMD, похоже, не намерена возвращать такую полезную для энтузиастов опцию, как дублирующая микросхема BIOS. Наконец, сам BIOS (в наше-то время!) не поддерживает режим UEFI.

Методика тестирования. Тактовые частоты, энергопотребление, температура, уровень шума и разгон. Игровые тесты (1920 × 1080)

⇡#Тестовый стенд, методика тестирования

Тестовый стенд
CPU	Intel Core i9-9900K (4,9 ГГц, 4,8 ГГц в AVX, фиксированная частота)
Материнская плата	ASUS MAXIMUS XI APEX
Оперативная память	G.Skill Trident Z RGB F4-3200C14D-16GTZR, 2 × 8 Гбайт (3200 МГц, CL14)
ПЗУ	Intel SSD 760p, 1024 Гбайт
Блок питания	Corsair AX1200i, 1200 Вт
Система охлаждения CPU	Corsair Hydro Series H115i
Корпус	CoolerMaster Test Bench V1.0
Монитор	NEC EA244UHD
Операционная система	Windows 10 Pro x64
ПО для GPU AMD
Все видеокарты	AMD Radeon Software Adrenalin 20.45.01.12-11.6 Beta 4
ПО для GPU NVIDIA
Все видеокарты	NVIDIA GeForce Game Ready Driver 457.30

Игры
Игра (в порядке даты выхода)	API	Метод тестирования	Настройки графики	Полноэкранное сглаживание
Strange Brigade	Vulkan	Встроенный бенчмарк	Макс. качество графики	AA Ultra
Shadow of the Tomb Raider	DirectX 12	Встроенный бенчмарк	Макс. качество графики. DXR выкл., DLSS выкл.	TAA
Assassin's Creed Odyssey	DirectX 11	Встроенный бенчмарк	Макс. качество графики	AA High (TAA)
Battlefield V	DirectX 12	Миссия Liberte + OCAT	Макс. качество графики. DXR выкл., DLSS выкл.	TAA High
Metro Exodus	DirectX 12	Встроенный бенчмарк	Макс. качество графики. DXR выкл., DLSS выкл., Shading Rate 100%	TAA
Total War: THREE KINGDOMS	DirectX 12	Встроенный бенчмарк (Battle Benchmark)	Макс. качество графики	TAA
Control	DirectX 12	OCAT	Макс. качество графики	TAA
Borderlands 3	DirectX 12	Встроенный бенчмарк	Макс. качество графики	TAA
Red Dead Redemption 2	Vulkan	Встроенный бенчмарк	Макс. качество графики	TAA High
DOOM Eternal	Vulkan	Начало миссии Mars Core + OCAT	Макс. качество графики	TAA

Игры с трассировкой лучей
Игра (в порядке даты выхода)	API	Метод тестирования	Настройки графики	Полноэкранное сглаживание
Battlefield V	DirectX 12	Миссия Liberté + OCAT	Макс. качество графики. DXR Raytrace Reflection Quality: Ultra	TAA/DLSS 1.0
Shadow of the Tomb Raider	DirectX 12	Встроенный бенчмарк	Макс. качество графики. Ray Traced Shadows Quality: Ultra	TAA/DLSS 1.0
Metro Exodus	DirectX 12	Встроенный бенчмарк	Макс. качество графики. Shading Rate 100%. Ray Trace: Ultra	TAA/DLSS 1.0
Control	DirectX 12	OCAT	Макс. качество графики. Ray Tracing Preset: High	TAA/DLSS 2.0 (Quality)

В большинстве тестовых игр показатели средней и минимальной кадровых частот выводятся из массива времени рендеринга индивидуальных кадров, который записывает встроенный бенчмарк (или утилита OCAT, если его нет).

Средняя частота смены кадров на диаграммах является величиной, обратной среднему времени кадра. Для оценки минимальной кадровой частоты вычисляется количество кадров, сформированных в каждую секунду теста. Из этого массива чисел выбирается значение, соответствующее 1-му процентилю распределения. Red Dead Redemption 2 является исключением: ее встроенный бенчмарк самостоятельно регистрирует 1-й процентиль времени рендеринга кадра, из которого выводится соответствующая кадровая частота.

Вычисления общего назначения, кодирование/декодирование видео
Приложение		Настройки		API
Приложение		AMD	NVIDIA	AMD	NVIDIA
Blender 2.9	Демо Class Room с сайта Blender Foundation	Рендерер Cycles. Feature Set: Supported. Размер тайла: 256 × 256		OpenCL	CUDA/OptX
Blender 2.9	Демо Nissan GTR от AMD	Рендерер AMD Radeon ProRender		OpenCL
DXVA Checker 4.1.2, Decode Benchmark	H.264 (Microsoft H264 Video Decoder)	1920 × 1080 (High Profile, L4.1); 3840 × 2160 (High Profile, L5.1)		D3D11VA
	H.265 (Microsoft HEVC Video Extensions)	1920 × 1080 (Main Profile, L4.0); 3840 × 2160 (Main Profile, L5.0); 7680 × 4320 (Main Profile, L6.0)
	VP9 (Microsoft VP9 Video Extensions)	1920 × 1080; 3840 × 2160; 7680 × 4320
	AV1 (Microsoft AV1 Video Extension)	1920 × 1080; 3840 × 2160; 7680 × 4320
FFmpeg 4.2.1, кодирование H.264	1920 × 1080	-c:v h264_amf -quality speed -coder cabac -level 4.1 -refs 1 -b:v 3M	-c:v h264_nvenc -preset fast -coder cabac -level 4.1 -refs 1 -b:v 3M	AMF	NVENC
FFmpeg 4.2.1, кодирование H.264	3840 × 2160	-c:v h264_amf -quality speed -coder cabac -level 5.1 -refs 1 -b:v 7.5M	-c:v h264_nvenc -preset fast -coder cabac -level 5.1 -refs 1 -b:v 7.5M
FFmpeg 4.2.1, кодирование H.265	1920 × 1080	-c:v hevc_amf -quality speed -level 4 -b:v 3M	-c:v hevc_nvenc -preset fast -level 4 -b:v 3M
	3840 × 2160	-c:v hevc_amf -quality speed -level 5 -b:v 7.5M	-c:v hevc_nvenc -preset fast -level 5 -b:v 7.5M
	7680 × 4320	Н/Д	-c:v hevc_nvenc -preset fast -level 6 -refs 1 -b:v 20M
REDCINE-X PRO	Декодирование файлов RED R3D с разрешением 4К, 6К и 8К	—	—	OpenCL	CUDA

Мощность видеокарт регистрируется отдельно от CPU и прочих компонентов ПК с помощью устройства NVIDIA PCAT. В качестве тестовой нагрузки для тестов мощности и уровня шума используется игра Crysis 3 при разрешении 3840 × 2160 без полноэкранного сглаживания и максимальных параметрах качества графики, а также стресс-тест FurMark с наиболее агрессивными настройками (разрешение 3840 × 2160, MSAA 8x). Замеры всех параметров выполняются после прогрева видеокарты, когда температура GPU и тактовые частоты стабилизируются.

⇡#Участники тестирования

В тестировании производительности приняли участие следующие видеокарты:

AMD Radeon RX 6800 XT (2015/2250 МГц, 16 Гбит/с, 16 Гбайт);
AMD Radeon RX 6800 (1815/2105 МГц, 16 Гбит/с, 16 Гбайт);
AMD Radeon VII (1400/1750 МГц, 2 Гбит/с, 16 Гбайт);
AMD Radeon RX 5700 XT (1605/1905 МГц, 14 Гбит/с, 8 Гбайт);
NVIDIA GeForce RTX 3090 FE (1395/1695 МГц, 19,5 Гбит/с, 24 Гбайт);
NVIDIA GeForce RTX 3080 FE (1440/1710 МГц, 19 Гбит/с, 10 Гбайт);
NVIDIA GeForce RTX 3070 FE (1500/1730 МГц, 14 Гбит/с, 8 Гбайт);
NVIDIA GeForce RTX 2080 Ti FE (1350/1645 МГц, 14 Гбит/с, 11 Гбайт);
NVIDIA GeForce RTX 2080 SUPER FE (1650/1815 МГц, 15,5 Гбит/с, 8 Гбайт);
NVIDIA GeForce GTX 1080 Ti FE (1480/1582 МГц, 11 Гбит/с, 11 Гбайт).

Прим. В скобках после названий видеокарт указаны базовая и boost-частота согласно спецификациям каждого устройства, а в случае видеокарт серии Radeon 6000 — Game Clock и Boost Clock. Видеокарты с заводским разгоном приведены в соответствие с референсными параметрами (или приближены к последним) при условии, что это можно сделать без ручной правки кривой тактовых частот. В противном случае (ускорители серии NVIDIA GeForce 16, а также GeForce RTX 2070/2080/2080 Ti Founders Edition) используются настройки производителя.

Тактовые частоты, энергопотребление, температура, уровень шума и разгон

AMD нисколько не преувеличивает, когда говорит, насколько высокие тактовые частоты покорились кремнию Navi 21. Даже в играх, способных разогреть GPU так же хорошо, как вечнозеленый Crysis 3, обе модели Radeon RX 6800 — базовая и XT — легко пересекли отметку 2 ГГц: устойчивые показатели составляют 2076 МГц у младшей и 2104 у старшей.

При этом, хотя у «красных» видеокарт по-прежнему нет шунтов для измерения тока на линиях питания 12 В, внешний ваттметр показывает, что они идеально вписываются в рамки паспортного резерва мощности. Энергопотребление Radeon RX 6800 XT не превышает 300 Вт, а базовой модели на поверку хватает 224 из 250 Вт, что попросту шокирует, когда видишь рядом на графике полоску 213 Вт, принадлежащую Radeon RX 5700 XT.

Рабочие параметры под нагрузкой (Crysis 3)
Видеокарта	Настройки	Тактовая частота GPU, МГц		Напряжение питания GPU, В		Частота вращения вентиляторов, об/мин (% от макс.)	Частота вращения вентиляторов 2, об/мин (% от макс.)
Видеокарта	Настройки	Средн.	Макс.	Средн.	Макс.	Средн.	Средн.
AMD Radeon RX 6800 (1815/2105 МГц, 16 Гбит/с, 16 Гбайт)		2076	2198	Н/Д	Н/Д	1603 (48%)	Н/Д
AMD Radeon RX 6800 (+200 МГц, 17,2 Гбит/с, 16 Гбайт)	+15% мощности	2176	2375	Н/Д	Н/Д	1667 (50%)	Н/Д
AMD Radeon RX 6800 XT (2015/2250 МГц, 16 Гбит/с, 16 Гбайт)		2104	2182	Н/Д	Н/Д	1179 (35%)	Н/Д
AMD Radeon RX 6800 XT (2015/2250 МГц, 16 Гбит/с, 16 Гбайт)	Rage Mode	2193	2341	Н/Д	Н/Д	1283 (38%)	Н/Д
AMD Radeon RX 6800 XT (+200 МГц, 17,2 Гбит/с, 16 Гбайт)	+15% мощности	2306	2550	Н/Д	Н/Д	1547 (47%)	Н/Д
AMD Radeon RX 5700 XT (1605/1905 МГц, 14 Гбит/с, 8 Гбайт)	Термопаста ARCTIC MX-2 вместо графитовой прокладки	1795	1819	1,07	1,18	2102 (43%)	Н/Д
AMD Radeon VII (1800 МГц, 2000 Мбит/с, 16 Гбайт)		1756	1786	Н/Д	Н/Д	2617 (Н/Д)	Н/Д
NVIDIA GeForce GTX 1080 Ti FE (1480/1582 МГц, 11000 Мбит/с, 11 Гбайт)		1735	1810	0,96	1,01	2377 (50%)	Н/Д
NVIDIA GeForce RTX 2080 SUPER FE (1650/1815 МГц, 15,5 Гбит/с, 8 Гбайт)		1907	1920	1,03	1,04	1969 (53%)	1969 (53%)
NVIDIA GeForce RTX 2080 Ti FE (1350/1645 МГц, 14 Гбит/с, 11 Гбайт)		1723	1860	0,91	1,03	2082 (56%)	2082 (56%)
NVIDIA GeForce RTX 3070 FE (1500/1730 МГц, 14 Гбит/с, 8 Гбайт)		1919	1935	1,00	1,01	1767 (50%)	1766 (50%)
NVIDIA GeForce RTX 3080 FE (1440/1710 МГц, 19 Гбит/с, 10 Гбайт)		1900	1920	1,04	1,06	1747 (49%)	1747 (52%)
NVIDIA GeForce RTX 3090 FE (1395/1695 МГц, 19,5 Гбит/с, 24 Гбайт)		1987	2010	1,04	1,08	1141 (43%)	1141 (43%)

Прим. Измерение всех параметров выполняется после прогрева GPU и стабилизации тактовых частот.

Естественно, такие результаты побуждают еще сильнее разогнать графический процессор. Тем более AMD все так же дружественно настроена к оверклокингу своих продуктов, как и прежде. Стороннее ПО — разнообразные утилиты на основе Riva Tuner или редактор таблиц PowerPlay — еще не умеет обращаться с «большим Navi», поэтому нам придется отложить на потом такие эксперименты, как андерволтинг или разгон с превышением мощности, заданной прошивкой ускорителя. Но интерфейс драйвера Radeon Software уже содержит базовые инструменты для управления тактовыми частотами GPU и видеопамяти, а главное, позволяет увеличить резерв мощности любой из двух видеокарт на 15 %.

Начнем с базовой модели Radeon RX 6800. В отличие от RX 6800 XT и флагманского Radeon RX 6900 XT, она лишена функции однокнопочного разгона — Rage Mode, а максимальное напряжение питания GPU зафиксировано на уровне 1,025 В. Кроме того, вкладка оверклокинга в панели управления видеокартой больше не позволяет вручную менять форму кривой тактовых частот, как у видеокарт 5000-й серии. Тем не менее нам удалось без всякого вреда для стабильности увеличить предел тактовой частоты с 2224 до 2424 МГц. Но, увы, без возможности сдвинуть резерв мощности более чем на 15 % половина разгона осталась на бумаге, а в требовательных играх GPU прибавил всего лишь 100 МГц.

Пропускная способность оперативной памяти здесь увеличивается вплоть до заданного в прошивке лимита 17,2 Гбит/с со штатных 16 Гбит/с, но мы не рассчитываем, что дополнительная ПСП несет осязаемую пользу архитектуре с громадным кешем L3. О том, что разгон Radeon RX 6800 не увенчался большим успехом, говорят и замеры потребляемой мощности, которая увеличилась в стресс-тесте FurMark, но в ресурсоемких играх осталась почти неизменной.

А вот Radeon RX 6800 XT разогнался на ура. BIOS старшей модели также позволяет увеличить мощность на 15 %, но в силу того, что GPU здесь начинает с более высокой позиции, а напряжение питания достигает 1,15 В, у видеокарты есть большой оверклокерский потенциал, невзирая на скудные программные возможности, с которыми мы пока вынуждены мириться. Пиковую частоту ядра 2394 МГц, установленную по умолчанию, удалось сместить на 200 МГц вверх, и то же самое произошло с частотой под игровой нагрузкой, которая в результате колеблется вокруг отметки 2306 МГц и совершает кратковременные броски за пределы 2,5 ГГц. Разгон оперативной памяти Radeon RX 6800 XT столкнулся с теми же ограничениями, что у Radeon RX 6800. Тем не менее и старшая модель по-прежнему не использует полностью весь отведенный ей резерв мощности: да, в играх она возросла до 326 Вт, но результаты стресс-теста оценивают максимум энергопотребления с 15-процентной прибавкой в 353 Вт.

Однокнопочный разгон Rage Mode представляет собой промежуточное состояние между штатными рабочими характеристиками Radeon RX 6800 XT и оверклокингом в ручном режиме: он повышает устойчивую тактовую частоту графического процессора на 89 МГц за счет инъекции дополнительных 20–29 Вт мощности.

Рады заметить, что достоинства референсной версии Radeon RX 6800 XT не сводятся к разгону. AMD наконец-то удалось сделать качественную воздушную систему охлаждения. Мало того, что 6800 XT поддерживает низкие температуры GPU, он оказался самым тихим среди высокопроизводительных ускорителей в нашей базе данных (опять-таки не считая устройств с «водянкой»), причем не только в штатном режиме, но и в Rage Mode. Даже после разгона вручную видеокарта работает тише старших моделей Founders Edition 20-й серии, не говоря уже о референсных изделиях обеих компаний с турбинным кулером.

Базовая модель Radeon RX 6800, конечно, не настолько хороша — радиатор уменьшенной глубины дает о себе знать. И тем не менее с разгоном или без разгона RX 6800 шумит не так сильно, как, например, GeForce RTX 2080 SUPER или GeForce RTX 2080 Ti Founders Edition.

Жаль только, что BIOS новинок не позволяет отслеживать температуру чипов GDDR6 и ключей регулятора напряжения. Будем надеяться, что такова особенность референсных видеокарт, а будущие партнерские устройства мы все-таки сможем проверить на качество охлаждения этих компонентов.

⇡#Игровые тесты (1920 × 1080)

Судя по данным первого же блока игровых тестов при разрешении 1080p, можно убедиться в том, что чуда не произошло: в двух тестовых играх из десяти (Battlefield V и Borderlands 3) Radeon RX 6800 XT опередил GeForce RTX 3080 по среднему фреймрейту, но усредненное соотношение результатов все-таки склоняется на 5 % FPS в сторону NVIDIA, а GeForce RTX 3090 уже на 17 % впереди.

Кроме того, апгрейд Radeon RX 5700 XT или GeForce GTX 1080 Ti на Radeon 6800 XT обеспечивает солидную прибавку в 63 или 61 % FPS, но обещанным удвоением производительности по сравнению с Radeon RX 5700 XT (и, соответственно, Radeon VII) пока не пахнет. Впрочем, не будем спешить с выводами, ведь тесты при разрешении 1920 × 1080 уже давно не раскрывают истинных различий между GPU столь разных весовых категорий. Наконец, то ли драйверы для «большого Navi» еще сыроваты, то ли нашлось слабое место архитектуры с Infinity Cache, но среди тестовых игр есть аномалия: на быстродействие Assassin’s Creed Odyssey практически не влияет переключение разрешения между 1080p и 1440p, поэтому фреймрейт ускорителей 6000-й серии выглядит явно заниженным.

В остальном базовая версия Radeon RX 6800 выполнила все поставленные перед ней задачи. Да, XT обеспечивает в среднем еще 12 % FPS, но и без того RX 6800 превосходит на 19 % GeForce RTX 2080 SUPER, а от ближайших соперников — RTX 2080 Ti и RTX 3070 — его отделяют 3 и 5 % средней кадровой частоты соответственно.

Игровые тесты (2560 × 1440, 3840 × 2160)

⇡#Игровые тесты (2560 × 1440)

Что и говорить, тесты видеокарт высшей категории быстродействия, к которой принадлежит Radeon RX 6800 XT, мало что говорят о его реальных возможностях. Стоило поменять разрешение на 2560 × 1440, как дистанция между 6800 XT и видеокартами прошлого поколения резко увеличилась. Если взять для сравнения плотную группу, в которую входят Radeon RX 5700 XT, Radeon VII и GeForce GTX 1080 Ti, мы обнаружим на стороне Radeon RX 6800 XT преимущество от 70 до 78 % фреймрейта. Однако позиции старших видеокарт NVIDIA 30-й серии по-прежнему непоколебимы: RTX 3080 превосходит 6800 XT на 3 % FPS, RTX 3090 — на 18.

Рост экранного разрешения пошел на пользу и базовой модели Radeon RX 6800: она ушла вперед от ближайших по быстродействию «зеленых» видеокарт — GeForce RTX 2080 Ti и RTX 3070 — на 7 и 10 % средней кадровой частоты соответственно и обошла RTX 2080 SUPER ни много ни мало на 27 % FPS.

⇡#Игровые тесты (3840 × 2160)

Насчет того, подходит ли Radeon RX 6800 XT для игры в современные тайтлы на 4К с максимальными настройками графики, можно сказать примерно то же самое, что уже было сказано ранее про GeForce RTX 3080. Только в шести из десятка тестовых игр новинка удержала среднюю частоту смены кадров выше отметки 60 FPS, а ведь мы еще не приступили к бенчмаркам с аппаратным рейтрейсингом.

С другой стороны, а вот и обещанный двойной прирост фреймрейта по сравнению с Radeon RX 5700 XT: 6800 XT дает в среднем на 91 % больше кадров в секунду. Старые видеокарты с широкой 384-битной шиной памяти или микросхемами HBM2 держатся лучше: новый Radeon опережает GeForce GTX 1080 Ti и Radeon VII на 85 и 69 % FPS соответственно.

Однако если взять для Radeon RX 6800 XT более достойного соперника, бенчмарки в 4К не помогают склонить чашу весов на сторону AMD: среди всех тайтлов только Borderlands 3 по-прежнему отдает предпочтение «красному» ускорителю, а в совокупности игровые тесты присудили GeForce RTX 3080 победу с преимуществом в 7 % FPS. GeForce RTX 3090 — единственная видеокарта, которая годится для игры в 4К без всяких компромиссов, — лидирует с отрывом в 24 % FPS.

А вот у Radeon RX 6800 без приставки XT дела по-прежнему идут в гору. Он оторвался от ближайших преследователей — GeForce RTX 2080 Ti и GeForce RTX 3070 — на 8 и 11 % FPS соответственно.

Игровые тесты в разгоне. Игровые тесты с трассировкой лучей

⇡#Игровые тесты в разгоне

Каких бы тактовых частот ни достигали современные видеокарты в разгоне, это занятие уже давно лишилось практического смысла, когда речь идет о предложениях высшего эшелона по цене и быстродействию. Оверклокинг графического процессора и оперативной памяти дал в среднем 5 % FPS обеим новинкам AMD. Это помогло Radeon RX 6800 XT сократить отставание от GeForce RTX 3080 до 2 %, однако не будем упускать из виду, что сам RTX 3080 пусть и не настолько хорошо, но все-таки разгоняется. Когда оба соперника работают на повышенных тактовых частотах, между ними вновь возникает дистанция в 5 % FPS.

⇡#Игровые тесты с трассировкой лучей

Видеокарты Radeon 6000-й серии полностью совместимы с играми, которые опираются на универсальный интерфейс программирования DXR или официальное расширение Vulkan для рендеринга трассированных эффектов. Но как выяснилось, есть тайтлы, которые привязаны к железу NVIDIA и отказываются работать на ускорителях AMD, — это трассированная бета-версия Minecraft и Quake II RTX. Не знаем, насколько глубоко обе игры укоренены в экосистеме NVIDIA: быть может, запустить их на Radeon 6000 мешает простая проверка видеокарты по списку, а может, наоборот, они содержат вызовы CUDA или NVAPI, и тогда вход для «красных» закрыт навсегда. В конце концов, чего еще можно ожидать от игр с аббревиатурой RTX в названии (прим.: как выяснилось, трассировка в Minecraft на AMD работать все-таки должна — проблема в нашей тестовой системе, которую мы будем решать после публикации обзора)?

В списке бенчмарков остаются четыре игры, которые, в отличие от Minecraft with RTX и Quake II RTX, не содержат полностью трассированного окружения и опираются на компромиссную гибридную модель, когда рейтрейсинг применяется только для рендеринга избранных эффектов: теней, отражений, глобального освещения и т. д. Как бы то ни было, по результатам тестов хорошо видно, что железо AMD на одно поколение отстает от конкурентов в скорости аппаратно ускоренного RT. В зависимости от разрешения GeForce RTX 3080 на 30–38 % FPS превосходит Radeon RX 6800 XT, а преимущество RTX 3090 составляет 43–64 % FPS. Это попросту устройства иной весовой категории, когда дело доходит до игр с DXR.

GeForce RTX 2080 Ti и RTX 3070 — вот подходящий предмет для сравнения с Radeon RX 6800 XT. Ускоритель AMD регулярно превосходит их в Shadow of the Tomb Raider — игре с, пожалуй, самой скупой дозой рейтрейсинга в тестовой подборке. Но и в требовательном Metro Exodus ему удалось продемонстрировать не менее высокий уровень быстродействия, а в среднем преимущество RTX 2080 Ti и RTX 3070 перед RX 6800 XT сводится к 2–6 % FPS.

Однако основная проблема заключается вовсе не в недостатке сырого быстродействия, а в том, что AMD пока не располагает технологией апскейлинга, аналогичной DLSS (особенно DLSS версии 2.0). С повышенной нагрузкой, которую создает рейтрейсинг, GPU вынужден бороться в полном разрешении экрана. Как следствие, уже в режиме 1440p игроку не гарантирована частота смены кадров выше 60 FPS, да и в 1080p при максимальных настройках детализации Radeon RX 6800 XT балансирует на грани комфортного фреймрейта в таких тяжелых тайтлах, как Metro Exodus и Control.

Что касается базовой версии Radeon RX 6800, то ее ближайшим аналогом среди видеокарт NVIDIA, участвующих в тестировании, является GeForce RTX 2080 SUPER. RTX 3070, потерпевший поражение в бенчмарках без рейтрейсинга, лидирует со средним преимуществом в 11–23 %, причем он отрывается от RX 6800 на максимальное расстояние именно при разрешении 1080p, с которым, судя по всему, придется смириться покупателям новинки, чтобы запустить передовые игры с эффектами DXR.

Вычисления общего назначения. Кодирование/декодирование видео. Таблицы результатов. Выводы

⇡#Вычисления общего назначения

AMD еще предстоит отполировать драйверы для видеокарт Radeon 6000-й серии, поэтому дебютное тестирование новинок не обошлось без проблем совместимости с теми или иными приложениями. В этот раз мы не смогли запустить на системе с Radeon RX 6800 (XT) тестовый пакет для видеоредактора Premiere Pro, поэтому основным тестом их возможностей в среде GP-GPU будет Blender. К сожалению, без аппаратно ускоренного рейтрейсинга: мы не смогли найти даже бета-версии плагина ProRender с поддержкой блоков Ray Accelerator, скомпилированной под Windows, а интеграция в движок Cycles произойдет в будущих релизах редактора.

Как и следовало ожидать, позиции игровых видеокарт AMD уже не так сильны в рабочих приложениях, как было во времена архитектуры GCN. Но если сделать поправку на количество шейдерных ALU в чипах Navi 21 и GA102, новинки отлично справились с бенчмарком Cycles, заняв места в промежутке между GeForce RTX 3070 и RTX 3080.

В рейтинге скорости рендерера Radeon ProRender старшей версии Radeon RX 6800 XT также досталось высокое место сразу за GeForce RTX 3080 после победы над RTX 2080 Ti, а вот Radeon RX 6080 уже пасует перед RTX 3070. Что более показательно, RX 6800 XT в обоих тестах почти в два раза сократил время рендеринга по сравнению с просьюмерской видеокартой архитектуры GCN — Radeon VII.

Декодирование записей RED R3D — совершенно невыгодный тест для ускорителей AMD в силу того, что он использует тензорные ядра NVIDIA для дебайеринга исходников, тогда как чипы Navi вынуждены переложить задачу на центральный процессор. Но удивительно не это, а то, что обе новинки здесь уступили место старой видеокарте Radeon VII.

⇡#Кодирование/декодирование видео

Хотя AMD не говорит ни о каких изменениях в работе выделенного ASIC для декодирования видео, Radeon RX 6800 прибавил в скорости обработки форматов H.264, HEVC и VP9. Порой весьма значительно, хотя отобрать пальму первенства у NVIDIA ему удалось лишь в тесте кодека H.264. Благо производительности медиаблока Navi 21 вполне достаточно, чтобы декодировать HEVC и VP9 даже при разрешении 8К с фреймрейтом 46–49 FPS.

Примерно с такой же скоростью новинка обрабатывает передовой и чрезвычайно ресурсоемкий формат AV1. Да, о кадровой частоте 60 FPS речи не идет, но и сам контент в 8К — пока большая редкость.

На стороне кодирования Navi 21 приобрел возможность создавать файлы HEVC с разрешением 8К. Но похоже, что вернулись проблемы с работой декодера, от которых страдали ранние драйверы для видеокарт 5000-й серии: сейчас новые ускорители экспортируют видео медленнее старых.

Производительность на ватт и площадь GPU

Хотя утверждения AMD о превосходстве кремния Navi 21 в энергоэффективности на целых 54 % над Navi 10, чипом предыдущего поколения, не оправдались, все равно преимущество в 38 % перед Radeon RX 5700 XT, которое продемонстрировал Radeon RX 6800 XT в рамках той же нормы 7 нм, является громадным достижением. Что более важно, наконец-то восстановлен давно утраченный паритет игрового быстродействия на ватт мощности между близкими устройствами NVIDIA и AMD: в этом RX 6800 XT и GeForce RTX 3080 практически эквивалентны, хотя RTX 3090 на основе почти нетронутого чипа GA102 сохранил за собой преимущество в 7 %.

При этом базовая версия Radeon RX 6800 без приставки XT, вопреки нашим ожиданиям, не только не уступает старшей модели, но и превосходит ее в энергоэффективности на 15 %, что, по всей видимости, связано с напряжением питания, которое требуется, чтобы запустить чип Navi 21 на повышенных тактовых частотах.

Производитель	AMD				NVIDIA
Модель	Radeon RX 6800 XT	Radeon RX 6800	Radeon RX 5700 XT	Radeon VII	GeForce GTX 1080 Ti	GeForce RTX 2080 SUPER	GeForce RTX 2080 Ti FE	GeForce RTX 3070	GeForce RTX 3080	GeForce RTX 3090
Графический процессор	Navi 21 XT	Navi 21 XL	Navi 10 XT	Vega 20 XL	GP102	TU104	TU102	GA104	GA102	GA102
Микроархитектура	RDNA 2	RDNA 2	RDNA	GCN 5-го поколения	Pascal	Turing	Turing	Ampere	Ampere	Ampere
Техпроцесс, нм	7 нм FinFET	7 нм FinFET	7 нм FinFET	7 нм FinFET	16 нм FFN	12 нм FFN	12 нм FFN	8 нм (8N)	8 нм (8N)	8 нм (8N)
Число транзисторов, млн	26 800	26 800	10 300	13 200	12 000	13 600	18 600	17 400	28 300	28 300
Площадь чипа, кв. мм	519,8	519,8	251	331	471	545	754	392,5	628	628
Средняя потребляемая мощность (Crysis 3), Вт	294	224	213	280	227	248	255	229	317	344
Производительность/Вт	100%	+15%	−28%	−38%	−30%	−19%	−6%	+1%	−1%	+7%
Производительность/млн транзисторов	100%	−13%	+36%	+20%	+21%	+34%	+17%	+21%	+1%	+19%
Производительность/кв. мм	100%	−13%	+8%	−7%	−40%	−35%	−44%	+4%	−12%	+4%

Производительность/Вт (обратное сравнение)	100%	−13%	+38%	+61%	+43%	+24%	+7%	−1%	+1%	−7%
Производительность/млн транзисторов (обратное сравнение)	100%	+14%	−27%	−17%	−17%	−25%	−14%	−18%	−1%	−16%
Производительность/кв. мм (обратное сравнение)	100%	+14%	−8%	+8%	+68%	+55%	+79%	−4%	+13%	−4%

⇡#Результаты игровых тестов и цены

1920 × 1080
	Полноэкранное сглаживание	AMD Radeon RX 6800 XT	AMD Radeon RX 6800	AMD Radeon RX 5700 XT	AMD Radeon VII	NVIDIA GeForce GTX 1080 Ti	NVIDIA GeForce RTX 2080 SUPER	NVIDIA GeForce RTX 2080 Ti FE	NVIDIA GeForce RTX 3070	NVIDIA GeForce RTX 3080	NVIDIA GeForce RTX 3090
Assassin's Creed Odyssey	TAA High	76 / 87	74 / 85	52 / 66	55 / 68	68 / 75	70 / 81	74 / 90	72 / 89	76 / 99	77 / 104
Battlefield V	TAA High	145 / 181	158 / 178	125 / 152	133 / 155	124 / 140	147 / 159	142 / 166	152 / 174	149 / 175	161 / 179
Borderlands 3	TAA	140 / 157	118 / 134	82 / 89	80 / 89	73 / 83	83 / 94	98 / 112	94 / 108	128 / 145	140 / 161
Control	TAA	134 / 150	114 / 131	77 / 87	86 / 95	78 / 83	97 / 105	116 / 130	108 / 117	133 / 152	151 / 171
DOOM Eternal	TAA	199 / 299	174 / 280	107 / 171	102 / 168	86 / 156	139 / 220	164 / 252	154 / 252	192 / 309	203 / 335
Metro Exodus	TAA	53 / 91	45 / 76	30 / 54	30 / 54	32 / 58	39 / 68	47 / 80	44 / 79	55 / 97	63 / 113
Red Dead Redemption 2	TAA High	69 / 75	60 / 66	38 / 42	40 / 44	38 / 41	49 / 54	53 / 64	61 / 66	78 / 83	90 / 98
Shadow of the Tomb Raider	TAA	120 / 168	118 / 159	89 / 115	83 / 115	89 / 118	108 / 140	112 / 151	116 / 151	114 / 167	116 / 171
Strange Brigade	AA Ultra	210 / 316	177 / 269	120 / 168	121 / 186	135 / 177	176 / 226	205 / 267	199 / 255	267 / 345	306 / 396
Total War: THREE KINGDOMS	TAA	76 / 95	66 / 82	39 / 48	44 / 52	47 / 57	61 / 71	70 / 85	63 / 76	85 / 102	97 / 116
Макс.			−2%	−16%	−14%	−14%	−7%	+3%	+2%	+14%	+31%
Средн.			−11%	−39%	−36%	−38%	−25%	−13%	−15%	+5%	+17%
Мин.			−16%	−49%	−45%	−48%	−40%	−29%	−31%	−8%	−1%

2560 × 1440
	Полноэкранное сглаживание	AMD Radeon RX 6800 XT	AMD Radeon RX 6800	AMD Radeon RX 5700 XT	AMD Radeon VII	NVIDIA GeForce GTX 1080 Ti	NVIDIA GeForce RTX 2080 SUPER	NVIDIA GeForce RTX 2080 Ti FE	NVIDIA GeForce RTX 3070	NVIDIA GeForce RTX 3080	NVIDIA GeForce RTX 3090
Assassin's Creed Odyssey	TAA High	75 / 87	71 / 82	47 / 55	44 / 52	55 / 62	53 / 64	65 / 78	69 / 77	71 / 90	72 / 95
Battlefield V	TAA High	154 / 174	144 / 171	100 / 125	110 / 129	99 / 115	113 / 130	126 / 145	127 / 148	157 / 167	163 / 178
Borderlands 3	TAA	105 / 116	88 / 97	56 / 62	58 / 62	50 / 57	58 / 64	69 / 78	68 / 77	93 / 105	108 / 124
Control	TAA	97 / 106	84 / 92	51 / 56	61 / 64	51 / 55	64 / 71	84 / 89	74 / 80	97 / 105	113 / 122
DOOM Eternal	TAA	173 / 256	147 / 224	90 / 136	90 / 138	75 / 122	117 / 175	141 / 202	135 / 207	178 / 263	196 / 295
Metro Exodus	TAA	46 / 76	39 / 65	26 / 44	27 / 45	27 / 47	33 / 56	40 / 65	38 / 65	50 / 81	59 / 97
Red Dead Redemption 2	TAA High	60 / 65	53 / 57	34 / 36	35 / 38	32 / 35	43 / 47	46 / 54	52 / 56	67 / 74	84 / 87
Shadow of the Tomb Raider	TAA	111 / 141	97 / 123	60 / 76	60 / 80	62 / 78	78 / 96	89 / 111	87 / 109	111 / 140	112 / 152
Strange Brigade	AA Ultra	174 / 238	144 / 201	93 / 121	98 / 138	103 / 127	133 / 163	159 / 195	151 / 185	206 / 257	242 / 306
Total War: THREE KINGDOMS	TAA	53 / 64	46 / 55	26 / 31	30 / 34	32 / 38	40 / 47	49 / 57	44 / 51	61 / 70	71 / 84
Макс.			−2%	−28%	−26%	−29%	−25%	−10%	−11%	+14%	+34%
Средн.			−12%	−44%	−41%	−43%	−31%	−18%	−20%	+3%	+18%
Мин.			−16%	−52%	−47%	−52%	−45%	−33%	−34%	−9%	+2%

3840 × 2160
	Полноэкранное сглаживание	AMD Radeon RX 6800 XT	AMD Radeon RX 6800	AMD Radeon RX 5700 XT	AMD Radeon VII	NVIDIA GeForce GTX 1080 Ti	NVIDIA GeForce RTX 2080 SUPER	NVIDIA GeForce RTX 2080 Ti FE	NVIDIA GeForce RTX 3070	NVIDIA GeForce RTX 3080	NVIDIA GeForce RTX 3090
Assassin's Creed Odyssey	TAA High	56 / 64	54 / 60	33 / 37	35 / 41	36 / 40	40 / 46	48 / 53	42 / 50	60 / 66	65 / 73
Battlefield V	TAA High	96 / 119	85 / 105	54 / 69	65 / 75	56 / 68	68 / 80	77 / 91	78 / 97	106 / 122	120 / 138
Borderlands 3	TAA	58 / 64	49 / 55	29 / 34	29 / 33	27 / 31	32 / 36	38 / 43	38 / 43	55 / 61	64 / 72
Control	TAA	52 / 56	44 / 48	25 / 28	31 / 33	25 / 26	32 / 35	43 / 45	38 / 41	51 / 56	60 / 67
DOOM Eternal	TAA	110 / 146	96 / 128	48 / 62	63 / 85	49 / 69	74 / 99	89 / 117	92 / 120	121 / 165	144 / 193
Metro Exodus	TAA	34 / 52	30 / 44	19 / 29	20 / 31	20 / 31	24 / 37	28 / 44	27 / 43	36 / 54	43 / 68
Red Dead Redemption 2	TAA High	44 / 47	39 / 42	24 / 26	25 / 28	23 / 26	32 / 34	35 / 40	38 / 41	52 / 54	60 / 64
Shadow of the Tomb Raider	TAA	62 / 76	54 / 66	30 / 40	34 / 44	33 / 41	42 / 51	51 / 61	49 / 59	65 / 79	77 / 93
Strange Brigade	AA Ultra	113 / 140	96 / 119	61 / 72	71 / 88	60 / 71	83 / 93	97 / 113	96 / 108	137 / 155	163 / 186
Total War: THREE KINGDOMS	TAA	28 / 32	24 / 28	12 / 15	15 / 18	16 / 19	21 / 24	26 / 30	23 / 26	33 / 38	40 / 45
Макс.			−6%	−42%	−36%	−38%	−25%	−6%	−13%	+19%	+41%
Средн.			−13%	−48%	−41%	−46%	−32%	−19%	−21%	+7%	+26%
Мин.			−15%	−58%	−48%	−54%	−44%	−33%	−33%	−5%	+13%

⇡#Результаты игровых тестов с трассировкой лучей

1920 × 1080
	Полноэкранное сглаживание	AMD Radeon RX 6800 XT	AMD Radeon RX 6800	NVIDIA GeForce RTX 2080 SUPER	NVIDIA GeForce RTX 2080 Ti FE	NVIDIA GeForce RTX 3070	NVIDIA GeForce RTX 3080	NVIDIA GeForce RTX 3090
Battlefield V	TAA High	65 / 101	56 / 91	67 / 87	86 / 105	87 / 108	110 / 128	125 / 139
Control	TAA	56 / 61	48 / 52	54 / 58	69 / 72	66 / 71	90 / 94	93 / 102
Metro Exodus	TAA	42 / 65	36 / 54	34 / 54	41 / 64	39 / 69	49 / 80	58 / 94
Shadow of the Tomb Raider	TAA	73 / 106	62 / 94	62 / 89	75 / 105	74 / 102	90 / 122	98 / 132
Макс.			−10%	−5%	+18%	+16%	+54%	+67%
Средн.			−13%	−13%	+5%	+6%	+30%	+43%
Мин.			−17%	−17%	−2%	−4%	+15%	+25%

2560 × 1440
	Полноэкранное сглаживание	AMD Radeon RX 6800 XT	AMD Radeon RX 6800	NVIDIA GeForce RTX 2080 SUPER	NVIDIA GeForce RTX 2080 Ti FE	NVIDIA GeForce RTX 3070	NVIDIA GeForce RTX 3080	NVIDIA GeForce RTX 3090
Battlefield V	TAA High	45 / 80	39 / 70	49 / 66	63 / 82	61 / 84	80 / 103	95 / 116
Control	TAA	40 / 42	34 / 36	36 / 38	45 / 48	44 / 48	61 / 65	71 / 75
Metro Exodus	TAA	33 / 48	28 / 40	26 / 39	32 / 47	31 / 47	40 / 61	48 / 73
Shadow of the Tomb Raider	TAA	51 / 77	44 / 66	42 / 60	51 / 72	50 / 69	67 / 91	78 / 105
Макс.			−13%	−10%	+14%	+14%	+55%	+79%
Средн.			−14%	−17%	+2%	+2%	+32%	+53%
Мин.			−17%	−22%	−6%	−10%	+18%	+36%

3840 × 2160
	Полноэкранное сглаживание	AMD Radeon RX 6800 XT	AMD Radeon RX 6800	NVIDIA GeForce RTX 2080 SUPER	NVIDIA GeForce RTX 2080 Ti FE	NVIDIA GeForce RTX 3070	NVIDIA GeForce RTX 3080	NVIDIA GeForce RTX 3090
Battlefield V	TAA High	24 / 47	21 / 41	27 / 39	35 / 50	28 / 46	50 / 68	57 / 77
Control	TAA	20 / 22	18 / 19	18 / 20	23 / 25	22 / 24	32 / 34	38 / 41
Metro Exodus	TAA	20 / 27	17 / 23	14 / 21	19 / 27	18 / 26	25 / 36	31 / 43
Shadow of the Tomb Raider	TAA	28 / 42	24 / 36	21 / 30	28 / 39	25 / 34	38 / 51	46 / 61
Макс.			−13%	−9%	+14%	+9%	+55%	+86%
Средн.			−14%	−19%	+3%	−4%	+38%	+64%
Мин.			−15%	−29%	−7%	−19%	+21%	+45%

⇡#Выводы

Ну что ж, можно поздравить AMD с очередными достижениями, которые, похоже, уже воспринимаются как нечто само собой разумеющееся, если речь идет о новинках этой компании. Архитектура RDNA, основы которой AMD заложила в 5000-й серии видеокарт Radeon, проявила недюжинный потенциал для роста, и теперь, впервые за без малого пятилетний срок, под красной маркой появились устройства, способные бросить вызов топовым ускорителям NVIDIA.

Да, Radeon RX 6800 XT медленнее, чем GeForce RTX 3080, на величину от 3 до 7 % FPS в играх без трассировки лучей, но в последний раз мы видели подобный результат еще во времена Radeon R9 Fury X. Что не менее важно, удалось полностью восстановить давно утраченный паритет между «красными» и «зелеными» чипами в производительности на ватт. Логика RDNA 2 сделала для кремния AMD то, что когда-то сделала архитектура Maxwell для NVIDIA. Наконец, стоит отдать должное элегантному решению Infinity Cache, благодаря которому GPU такого калибра, как Navi 21, обошелся дешевой 256-битной шиной памяти.

Уязвимым местом Radeon RX 6800 и RX 6800 XT остается трассировка лучей. Все, чего пока смогла добиться AMD на этом поприще, — повторить успехи GeForce RTX 2080 Ti двухлетней давности. С другой стороны, RTX 2080 Ti еще два месяца назад считался лучшей игровой видеокартой, так что и в этом преуменьшать старания AMD ни в коем случае нельзя. Более серьезной проблемой является отсутствие на стороне Radeon решений для апскейлинга, сравнимых по качеству изображения с DLSS 2.0. Следовательно, когда дело доходит до трассированных игр, но хочется сохранить высокий фреймрейт, Radeon RX 6800 XT заперт в разрешении 1440p, если не 1080p. «Зато продукт AMD дешевле» — а вот этот лозунг не теряет актуальности.

Что касается базовой версии Radeon RX 6800, то здесь у AMD нет никаких причин зазывать покупателя экономией. Младшая модель безоговорочно лидирует в игровых тестах по сравнению с GeForce RTX 3070 (на 5–11 % FPS в зависимости от разрешения), несет вдвое больше локальной памяти, и потому она ожидаемо дороже. Правда, нужно сделать такую же поправку на игры с трассировкой лучей, в которых ближайшим эквивалентом RX 6800 являются видеокарты прошлого поколения GeForce RTX 2080 и RTX 2080 SUPER.

Наконец, с радостью объявляем, что AMD наконец-то поняла, как сделать эффективную и тихую систему охлаждения для своих референсных видеокарт. Двухслотовый кулер Radeon RX 6800 — это уже громадный шаг вперед по сравнению с турбинками 5000-й серии. А Radeon RX 6800 XT так и вовсе оказался одной из самых тихих и холодных видеокарт, с которыми мы имели дело, несмотря на внушительное энергопотребление (под 300 Вт), которое, судя по всему, останется ориентиром мощности для всех будущих ускорителей высшего эшелона — привыкайте. А AMD — награда за Infinity Cache и отличный референс 6800 XT.