Авторы:
Дмитрий Софронов, Владимир Романченко
Свершилось! Сегодня компания AMD официально представила новое поколение 3D графики
ATI Radeon HD 2000, ранее известное под рабочим названием
R600, и анонсировала начало продаж новинок в пяти сериях. Сказать, что анонс прилично затянулся – практически, ничего не сказать, но, принимая во внимание тот факт, что особенным наплывом каких-либо DirectX 10 приложений на рынке "не пахнет" до сих пор, в принципе, в длительной доводке Radeon HD 2000 можно найти резон.
Сегодня мы предлагаем вашему вниманию результаты подробных исследований производительности первых карт Radeon HD 2000, но перед этим никак не обойтись без теоретических выкладок об архитектуре новых графических процессоров Radeon. Изменения действительно радикальные, более того, в какой-то степени есть смысл говорить не столько об изменениях, сколько о нововведениях, впервые реализованных в новых чипах. Те, кого интересуют исключительно факты – конкретные цифры, полученные в результате испытаний и сравнительных тестирований, могут традиционно открывать последние страницы статьи, но читателям, интересующимся
почему получились такие результаты, всё же советуем потратить несколько минут на изучение характеристик новых чипов.
В отличие от типичных анонсов прошлых лет, AMD одновременно анонсировала всю линейку новых видеокарт во всех ценовых сегментах – от бюджетного до high-end. Базовыми из новых серий можно назвать три:
- ATI Radeon HD 2400 - видеокарты нижнего ценового сегмента для массовых ПК
- ATI Radeon HD 2600 - графика для решений среднего ценового уровня
- ATI Radeon HD 2900 - высокопроизводительные решения для энтузиастов
Разумеется, в первую очередь всех интересует характеристики "топовых", наиболее производительных видеокарт, получивших от AMD название
ATI Radeon HD 2900 XT, чипы которых выполнены на производственных линиях с соблюдением норм 80 нм техпроцесса. Впрочем, линейки ATI Radeon 2400 (рабочее название чипа RV610) и ATI Radeon 2600 (рабочее название чипа RV630) не менее любопытны, так как, следуя уже сложившейся традиции, производятся на линиях с ещё более прецизионным – 65 нм техпроцессом. Полностью список пяти новых серий выглядит так:
- Radeon HD 2900 XT, для экстремальных геймеров
- Radeon HD 2600 XT
- Radeon HD 2600 Pro
- Radeon HD 2400 XT
- Radeon HD 2400 Pro
|
ATI Radeon HD 2400 |
ATI Radeon HD 2600 |
ATI Radeon HD 2900 |
Транзисторов |
180 млн. |
390 млн. |
700 млн. |
Потоковых процессоров |
40 |
120 |
320 |
Тактовая частота ядра |
525 - 700 МГц |
600 - 800 МГц |
742 МГц |
Частота памяти |
400 - 800 МГц |
400 - 1100 МГц |
828 МГц |
Пропускная способность шины памяти |
6,4- 1 2,8 Гб/с |
12,8 - 35,2 Гб/с |
106 Гб/с |
Текстурных блоков |
4 |
8 |
16 |
Модулей рендеринга |
4 |
4 |
16 |
Память |
256 Мб GDDR3;
128/256 Мб DDR2 |
256 Мб DDR2, GDDR3, GDDR4 |
512 Мб GDDR3 |
Интерфейс памяти |
64-битный |
128-битный |
512-битный |
Техпроцесс |
65nm |
65nm |
80nm |
TDP |
25 - 35 ВТ |
45 Вт |
215 Вт |
Несмотря на разные уровни производительности и другие технические отличия, все серии объединяет ключевая особенность – поддержка DirectX 10. Наряду с этим декларирован ряд новых ключевых технологий: унифицированная шейдерная архитектура Unified Shader Architecture (какая интересная аббревиатура складывается!) с использованием до 320 "потоковых процессоров" и поддержкой Shader Model 4.0, функция тесселяции (Tessellation), поддержка памяти GDDR2/GDDR3 (и GDDR4 у HD 2600), HDMI/HDCP, новая инкарнация функции Avivo в исполнении Avivo HD и многое другое, о чём подробнее чуть дальше.
Видеокарты серий
Radeon HD 2400 Pro и
Radeon HD 2400 XT позиционируются как наиболее доступные решения с поддержкой DirectX 10, технологии ATI Avivo HD. Карты обладают встроенным аудиочипом, что позволяет полностью задействовать возможности разъёма HDMI без дополнительных подключений. Ядро RV610, содержащее 180 млн. транзисторов, содержит 40 потоковых процессоров с унифицированной шейдерной архитектурой, а ключевая разница между версиями Pro и XT заключается в тактовых частотах ядра – 525 МГц и 700 МГц соответственно. Типичный вариант поддержки памяти для таких карт – 128 Мб или 256 Мб 64-битной GDDR2, хотя также ожидаются варианты с 256 Мб GDDR3. Тактовые частоты у версии Pro будут позиционироваться на уровне 400 МГц, у XT - на уровне 800 МГц, а нижний ценовой порог будет располагаться даже ниже $99.
Что касается видеокарт на чипах серии RV630 -
Radeon HD 2600 Pro и
Radeon HD 2600 XT, помимо стандартной для всех новинок поддержки DirectX 10, они поддерживают технологию Avivo HD с аппаратной обработкой HD видео, обладают 5.1-канальным аудио выходом на HDMI, работают в конфигурациях CrossFire. Чипы Radeon HD 2600 содержат порядка 390 млн. транзисторов, 120 потоковых процессоров. Тактовые частоты чипов Radeon HD 2600 Pro - 600 МГц, чипов Radeon HD 2600 XT - 800 МГц. Шина памяти новых карт 128-битная, можно ожидать самые разнообразные варианты с 256 Мб памяти DDR2, GDDR3 или GDDR4. Тактовые частоты памяти стартуют от 400 МГц для версий Pro и до 1100 МГц для моделей XT. Цены карт Radeon HD 2600 Pro обещаны в диапазоне $99 - $129, карт Radeon HD 2600 XT – в диапазоне $179 - $199.
Самое интересное – это, конечно же, High-end карты ATI Radeon HD 2900 XT, выпущенные "на борьбу" со своим непосредственным конкурентом – картами NVIDIA GeForce 8800 GTX. Чипы Radeon HD 2900 XT выполнены на базе примерно 700 млн. процессоров, обладают
320 потоковыми процессорами, поддерживают 64-битный режим HDR (128-битная обработка текстур с плавающей запятой), улучшенный режим HQ анизотропной фильтрации и текстуры до 8192x8192 HR. Всё это дополняется 512-битным интерфейсом памяти - восемь 64-битных каналов. Поддерживается режим CrossFire, есть встроенный выход HDMI с собственным интегрированным 5.1-канальным звуком. В версии с 512 Мб 512-битной памяти DDR3, карты ATI Radeon HD 2900 XT изначально обещают в рознице по интересной цене - порядка $399, и это не шутка, поскольку в некоторых европейских стоках такие карты уже фигурируют по цене порядка 350 евро.
Чип |
2900XT |
2600XT |
2600Pro |
2400XT |
2400Pro |
Ширина шины памяти |
512 бит |
128 бит |
64 бит |
Поддерживаемая память |
GDDR3 |
GDDR4/GDDR3/DDR2 |
GDDR3/DDR2 |
Частота памяти |
1,65 ГГц |
2,2 ГГц |
800 МГц |
1,6 ГГц |
800 МГц |
Типичный объём памяти |
512 Мб |
256 Мб |
Также стоит отметить энергопотребление чипов ATI Radeon HD 2900, 2600 и 2400. Согласно предварительным данным, пиковый TDP составит более 200 Вт, около 45 Вт и на уровне 25-35 Вт соответственно.
Архитектура нового поколения
Подробного исследования, конечно же, заслуживает структура старшего чипа - ATI Radeon HD 2900. В AMD называют его архитектуру
вторым поколением архитектуры унифицированных шейдеров (Unified Shader), с уточнением, что первое поколение этой архитектуры было реализовано в чипе
Xenos для игровой приставки XBOX 360.
Чип R600 оснащён новым "распределяющим процессором" – диспетчером задач (dispatch processor), распределяющим потоки на 64 суперскалярных потоковых процессора, каждый из которых содержит пять дискретных независимых потоковых модуля обработки и модуль ветвлений – итого 320 шейдерных унифицированных процессоров в 5-компонентных модулях SPU (Streaming Processing Unit), обеспечивающих обработку до 5 инструкций класса Multiply-Add за такт, плюс, один из процессоров может обрабатывать более сложные команды (SIN/COS/LOG). Динамический баланс загрузки шейдерных процессоров вертексными, геометрическими и пиксельными операциями обеспечивается автоматически аппаратным планировщиком.
Таким образом, AMD декларирует теоретическую производительность HD 2900 XT при тактовой частоте 742 МГц до 475 ГигаFLOPS на ядро, до 237 млрд. операций с плавающей запято одинарной точности, до 950 GigaFLOPS в конфигурации CrossFire.
Обособленные самостоятельные текстурные модули, коих в R600 четыре, отвечают за выборку текстурных и вертексных данных, они в свою очередь характеризуются наличием четырёх модулей выборки и четырёх модулей адресации в каждом – в сумме 16/16 для чипа HD2900, 4/8 для HD2600 и 4/4 для HD2400. Старшие чипы HD2900 и HD2600 также обладают двухуровневым кэшем L1 и L2, при этом у чипа HD2400 реализован единый объединённый кэш вертексных и текстурных данных.
Текстурные модули работают с реализованным в DirectX10 новым 32-битным HDR форматом текстур (RGBE 9:9:9:5), поддерживают полноскоростную 64-битных HDR текстур с билинейной фильтрацией и 128-битную выборку и фильтрацию текстур на половинной скорости; трилинейная и анизотропная фильтрация поддерживается для всех форматов, при этом максимальный размер поддерживаемых текстур декларируется как 67 мегатекселей (8192 x 8192).
Дизайн интерфейса памяти чипов ATI Radeon HD 2900, хоть и напоминает уже известную по Radeon X1800 кольцевую внутреннюю архитектуру, но подвёргся радикальной переработке. Теперь он не 256-битный, а 512-битный, с 1024-битной внутренней кольцевой шиной – 512 бит на чтение и 512 бит на запись, пиковая производительность контроллера памяти HD 2900 XT по всем восьми 64-битным каналам может достигать 106 Гб/с.
Одно из наиболее интересных нововведений – программируемый модуль тесселяции (Tessellation), который имеется во всех чипах серии ATI Radeon HD 2000. Модуль тесселяции, реализованный также ATI в графическом чипе для игровой приставки Xbox 360, позволяет добиться более детализированной и реалистичной анимации объектов, создать более сложные поверхности и шейдерные эффекты, при этом обеспечить эффективное сжатие геометрических данных на аппаратном уровне и разгрузить таким образом CPU и шины данных.
Иными словами, тесселяция – это способ
динамического превращения простых структур в более сложные полигональные модели.
В новых чипах ATI также реализовано новое поколение технологий антиалиазинга и новые режимы. Так, помимо 8x Multi-Sample AA, карты ATI Radeon HD 2900 поддерживают очень интересный режим CSAA (Custom Filter Anti-Aliasing) – до 24x AA, при этом заявлена работа с HDR, очень высокое качество сглаживания, отсутствие размытия при детализации, программное обновление драйверами Catalyst. Карты также поддерживают режимы HDR+AA, Adaptive SSAA/MSAA, Temporal AA, Super AA и режим коррекции гаммы.
Для карт ATI Radeon HD 2900 и 2600 характерна полная поддержка CrossFire, теперь без специальной "мастер-карты", за счёт наличия специального интегрированного модуля, нового алгоритма детектирования AFR и специальных CrossFire-перемычек. Режим CrossFire поддерживает разрешения до 2560x2048 @ 60 Гц, при этом доступна plug-n-play установка и двойной интерфейс DVI. Поддерживаются все ранее доступные режимы CrossFire - Alternate Frame Rendering, SuperTile, Scissor, SuperAA.
Наконец, несколько слов о технологии ATI Avivo HD и поддержке интерфейсов. Для высококачественной аппаратной обработки HD видео технология ATI Avivo HD задействует специальные модули – универсальный видео декодер UVD (Universal Video Decoder) и расширенный видео процессор AVP (Advanced Video Processor). Обработка видеоконтента с помощью ATI Avivo HD в целом схожа с возможностями нынешнего поколения технологии NVIDIA PureVideo HD, правда, потоковый процессор, встроенный в модуль UVD от ATI, поддерживает обработку VC-1, в то время как внешний в PureVideo HD - только H.264. Сделано это, разумеется, с прицелом разгрузки CPU при работе с современным HD DVD/Blu-ray видео контентом.
В завершение стоит упомянуть, что новые видеокарты обладают поддержкой HDMI и HDCP, при этом реализована полноценная поддержка HDMI дисплеев с высоким разрешением. Благодаря наличию встроенных HD аудио контроллеров, семейство видеокарт ATI Radeon HD 2000 обладает возможностью вывода высококачественного 5.1-канального звука (ATI Radeon HD 2900 XT и ATI Radeon 2600) в формате AC3 через порт HDMI.
Карты комплектуются адаптером DVI -> HDMI, что также позволяет выводить защищённое HDCP видео и цифровой 5.1-канальный аудио сигнал через HDMI.
Помимо решений для настольных ПК новая линейка 3D графики от AMD также включает в себя ряд решений для мобильных ПК, такие как ATI Mobility Radeon HD 2300, ATI Mobility Radeon HD 2400, ATI Mobility Radeon HD 2600.
Рассказу об этих новинках, поддерживающих, как и "настольные" собратья, ключевые нововведения, плюс новую технологию энергосбережения PowerPlay, будет посвящён один из следующих наших материалов.
Внешний вид и внутреннее устройство Radeon HD2900XT
Многократные «утечки» фотографий Radeon HD2900 демонстрировали нам очень длинную видеокарту, однако вариант HD2900XT, предназначенный для розничного рынка, выглядит несколько по другому.
Видеокарта Radeon HD2900XT занимает два стандартных слота PCI, имеет два выхода Dual-Link DVI и выход S-Video/HDTV-out, к тому же обладающий поддержкой функциtq видеозахвата Video-In.
Видеокарта Radeon HD2900XT оснащена полупрозрачным красным кулером, который почти полностью закрывает поверхность печатной платы. Кулер выполнен по классической схеме – алюминиевое основание охлаждает чипы видеопамяти и силовые элементы, а для охлаждения GPU используется медный радиатор с тепловыми трубками.
Опасения по поводу невероятной длины нового Radeon и, как следствие, ограниченной совместимости с большинством современных корпусов, оказались напрасными. Обратите внимание на фото - видеокарта HD2900XT (на заднем плане) лишь на пару сантиметров длиннее видеокарты GeForce 8800GTS (на переднем плане), так что никаких проблем с установкой в стандартный ATX корпус возникать не должно.
Как видите, обратная сторона видеокарты HD2900XT также оснащена радиатором, что довольно редко встречается в последнее время. Для чего же нужен этот радиатор?
Во-первых, металлическая рамка служит для фиксации кулера видеокарты. Во-вторых, она используется для охлаждения чипов видеопамяти, расположенных на обратной стороне PCB. Однако, давненько не приходилось такого видеть. Причина этому, как вы уже догадались – использование шины памяти с шириной 512-бит. Разместить все 16 микросхем видеопамяти на лицевой стороне PCB чрезвычайно проблематично, поэтому половина чипов переехала на другую сторону печатной платы. Монтаж довольно плотный, и относительно свободное место остается разве что в левой части, в области подсистемы питания.
На лицевой стороне PCB плотность элементов еще выше, однако нашлось место и для чипа видеозахвата Rage Theatre. Здесь мы также видим вторую восьмерку чипов видеопамяти и «сердце» видеокарты – графический процессор R600. Подсистема питания тоже значительно усложнена и, помимо увеличенного числа силовых элементов, использует два разъема дополнительного питания, один 6-контактный, второй 8-контактный. Несмотря на различие в числе контактов, 8-контактный разъем спокойно принимает стандартный 6-контактный коннектор, так что проблем с подключением не будет. Можно использовать обычные 6-контактные разъемы для питания видеокарт, если блок питания ими оборудован, или же использовать стандартные переходники. По утверждениям разработчиков, дополнительную пару штырьков 8-контактного разъема следует задействовать при разгоне видеокарты, однако практика показывает, что это не является необходимым условием, и видеокарта HD2900XT спокойно разгоняется и при стандартной схеме подключения питания.
«Красный кулер» оказывается красным и с обратной стороны. Первое впечатление обманчиво и может показаться, что основание кулера выполнено из пластика, как и верхняя крышка. На самом деле, основание кулера, конечно же, выполнено из алюминия. Чипы видеопамяти и силовые элементы системы питания охлаждаются через термопрокладки. Медный радиатор для охлаждения GPU не закреплен на алюминиевом основании жестким образом, а может в некоторых пределах перемещаться относительно него. Эта независимость радиаторов друг от друга обеспечивает их хороший тепловой контакт с охлаждаемыми элементами и защиту от возможных перекосов при установке. Качество обработки основания медного радиатора оставляет желать лучшего, что несколько диссонирует с любовно окрашенной в красный цвет алюминиевой подошвой. Но, может, это издержки инженерного образца?
Ну а это другой вид рамки-радиатора с обратной стороны PCB. Здесь мы также можем видеть термопрокладки для теплового контакта с чипами видеопамяти.
Вот, собственно, и «сердце» видеокарты HD2900XT – графический процессор R600. Первые фотографии чипа, появившиеся в Интернет довольно давно, удивили нестандартным расположением кристалла GPU на подложке, но оказывается, что это действительно так. Тем не менее, физические размеры чипа R600 не сильно отличаются от R580. Как подложка, так и кристалл чипа практически совпадают по размеру с R580. Разумеется, отличия находятся гораздо глубже. Видеочип R600 на карте HD2900XT работает на частоте 506 МГц в 2D-режиме и 743 МГц в 3D-режиме.
Общий объем видеопамяти 512 Мб набран 16-ю микросхемами стандарта DDR3 производства Hynix. Плотность чипов 256 Мбит, каждый из чипов подключается по шине 32 бит, таким образом 16 микросхем в сумме образуют 512-битную шину памяти. Что интересно, время выборки на установленных чипах составляет 1,0 нс, что соответсвует номинальной частоте 2000 МГц DDR. Но штатная частота видеопамяти на карте HD2900XT равна всего лишь 1656 МГц DDR в 3D-режиме. В режиме 2D она еще меньше и равна 1026 МГц DDR. Не совсем понятно, в чем причина столько низкой рабочей частоты по сравнению с номинальной. Экономически это не совсем оправданно, если конечно отпускные цены на чипы памяти DDR1600 и DDR2000 не одинаковы. С другой стороны, нам грех жаловаться, остается изрядный запас для разгона. Впрочем, это совсем другая история. Очевидно, что в использованной схеме можно легко заменить чипы памяти с плотностью 256 Мбит на чипы памяти с плотностью 512 Мбит, тем самым без труда увеличить общий объем видеопамяти до 1 Гб. Вполне возможно, что в скором времени мы сможем увидеть и такого рода продукты.
Но пока давайте теперь посмотрим, на что способен Radeon HD2900XT в том виде, какой он есть сейчас. Переходим к тестам.
Тестовый стенд
Конфигурация «железа» тестового стенда не изменилась. Поскольку для тестирования видеокарт ряд тестов требует наличия DirectX 10, в дополнение к Windows XP мы также будем использовать Windows Vista 64 Ultimate.
Тестовый стенд
Шина
|
PCI-Express
|
CPU
|
|
MB
|
|
Memory
|
|
OS
|
WinXP + SP2 + DirectX 9.0c; Windows Vista 64 Ultimate + DirectX 10
|
PSU
|
Thermaltake ToughPower 750 Wt
|
Тестирование проводилось с помощью драйверов ForceWare 158.22 и Catalyst ver. 8.37.4.
Синтетические тесты в DirectX 10
DX10 Shader Tests
Этот набор тестов демонстрирует производительность шейдерных блоков GPU при выполнении элементарных операций. Данный тест был разработан инженерами компании AMD. И хотя может возникнуть некая предубежденность типа «на их собственных тестах результаты их видеокарты конечно будут выше», исходные коды открыты, так что любой может ознакомиться с особенностями данного теста и поискать «фирменные» закладки, если они есть. Скачать полную версию теста с исходниками можно
отсюда. Результаты приводятся следующим образом – сначала идет название теста, потом краткое описание от разработчика, затем диаграмма и наши комментарии. Итак, приступим.
Тест №1. "float MAD serial" - Зависимые скалярные инструкции
Комментарий разработчика:
Тест выдает пакет скалярных инструкций «сложение-умножение», которые выполняются последовательно. Это наихудший случай для суперскалярной архитектуры, поскольку из имеющихся 5 вычислительных блоков HD2900XT может использоваться только один. Код, выполняемый в этом тесте, можно условно выразить следующим образом:
x = x * x + x
x = x * x + x
. . .
Видеокарта 8800GTS демонстрирует в этом тесте невероятную производительность при исполнении пиксельных шейдеров, однако результат вертексных шейдеров оказывается в разы ниже. Результаты нового GPU от AMD занимают золотую середину и практически идентичны как для пиксельных, так и для вертексных шейдеров.
Тест №2. "float4 MAD parallel" – Векторные инструкции
Комментарий разработчика:
Тест выдает две последовательности инструкций «сложение-умножение» над четырехмерными векторами (float4). «Умный» компилятор в драйвере способен разбить 4D-векторы на составные инструкции, чтобы заполнить все 5 вычислительных слотов. Это пример одного из наилучших вариантов использования суперскалярной архитектуры и довольно характерен для цепочек инструкций, которые можно видеть во многих шейдерах. Этот пример также демонстрирует гибкость архитектуры, которая может обрабатывать не только тривиальные случаи типа 3+2 или 4+1. Код, выполняемый в этом тесте, можно условно выразить следующим образом:
xyzw1 = xyzw1 * xyzw1 + xyzw1
xyzw2 = xyzw2 * xyzw2 + xyzw2
xyzw1 = xyzw1 * xyzw1 + xyzw1
. . .
В этом тесте с завидным преимуществом лидирует HD2900XT. Что интересно, в этот раз небольшая разница в скорости исполнения пиксельных и вертексных шейдеров присутствует и у HD2900XT, но у 8800GTS эта разница достигает практически двукратного размера.
Тест №3. "float SQRT serial" – Специальная функция
Комментарий разработчика:
Этот тест использует 5-й специальный вычислительный слот, который наряду со стандартными операциями «сложение-умножение» и т.д. способен выполнять трансцендентные операции. Код, выполняемый в этом тесте, использует операцию извлечения квадратного корня:
x = sqrt(x)
x = sqrt(x)
. . .
По всей видимости, преимущество HD2900XT в этом тесте обусловлено наличием того самого специального блока, который оказывается вовсе не «пятым колесом», а эффективным средством выполнения трансцендентных операций.
Тест №4. "float 5-instruction issue" - Независимые скалярные инструкции
Комментарий разработчика:
Этот тест использует 5 типов скалярных инструкций (умножение, сложение, минимум, максимум, извлечение квадратного корня), каждая из которых использует свой операнд, а все вместе они скомпонованы в одну супер-скалярную инструкцию. Это представляет типичный случай объединения инструкций компилятором драйвера с максимальной эффективностью.
Комментарии излишни. Подавляющее преимущество Radeon HD2900XT.
Тест №5. "int MAD serial" – зависимые DX10 скалярные инструкции
Комментарий разработчика:
Тест аналогичен тесту №1, но вместо инструкций с плавающей точкой используются целочисленные.
Тест №6. "int4 MAD parallel" – DX10 целочисленные векторные инструкции
Комментарий разработчика:
Тест аналогичен тесту №2, но вместо инструкций с плавающей точкой используются целочисленные.
Итоговая диаграмма тестов DX10 Shader tests
Для полноты картины мы свели результаты всех тестов в одну диаграмму. Видно, что из всех тестов 8800GTS оказывается впереди только при выполнении пиксельного шейдера с последовательными инструкциями типа «float MAD». Но на этой диаграмме можно отметить куда более интересный момент. Смотрите, в каждом тесте HD2900XT эффективно выполняет как пиксельные, так и вертексные шейдеры, причем с очень близкой производительностью. Что это означает? Это говорит о том, что мы имеем дело с действительно унифицированной шейдерной архитектурой, которая с равной эффективностью выполняет шейдер любого типа, будь он пиксельный или вертексный.
N-Patches
Помимо эффективного выполнения пиксельных и вертексных шейдеров, архитектура Radeon HD2900XT способна весьма эффективно работать с «геометрией» объекта. Встроенный в GPU блок аппаратной тесселяции позволяет «на лету» преобразовывать грубую угловатую малополигональную модель во вполне приличный «гладкий» объект. Давайте посмотрим, как это получается.
В данном тесте вычислительная задача для GPU состоит в рендеринге большого количества человечков, представляющих собой довольно грубые модели. На скриншоте ниже показано, как это выглядит в действительности.
Модели действительно «угловаты» и примитивны. Чтобы было понятнее, почему так получается, приведем скриншот в режиме wire-frame.
Что будет, если применить к таким объектам метод тесселяции? С повышением уровня количество полигонов в объекте возрастает как квадрат от значения уровня тесселяции. Но одного увеличения количества полигонов в объекте мало. Допустим, у нас был исходный треугольник, и мы разбили его на несколько меньших, все они окажутся по-прежнему в одной плоскости, и «угловатость» никуда не исчезнет, если не сделать следующий шаг. Далее, надо сместить вершины новых полигонов так, чтобы объект приобрел более сглаженную форму. Есть разные способы таких преобразований, например по методу Безье, кубическими сплайнами, с помощью N-Patches и т.д. Сейчас мы рассмотрим метод N-Patches. Опуская промежуточные шаги, сразу приведем скриншот с уровнем тесселяции «8», который максимально возможен для этого теста (аппаратно GPU HD2900XT поддерживает уровень тесселяции вплоть до 15).
Смотрите, как преобразились модели! Вместо несуразных угловатых кубиков мы получили очень приличные сглаженные фигурки.
А вот так это выглядит в привычном нам виде. Прелесть данной технологии в том, что разработчики могут оперировать довольно простыми моделями, экономя время и ресурсы, а видеопроцессор с блоком аппаратной тесселяции «на лету» преобразует объекты в красивую картинку. Если раньше это было как в детском стишке - «палка, палка, огуречик, вот и вышел человечек», то с помощью Radeon HD2900XT при том же «алгоритме» без труда получаем Памелу Андерсен.
На этой диаграмме показано изменение производительности, измеряемое в FPS, при увеличении уровня тесселяции. Как видите, при отсутствии тесселяции видеокарта 8800GTS прекрасно справляется с этим несложным заданием и заметно опережает HD2900XT, однако даже самый минимальный уровень тесселяции кардинально меняет расстановку сил. Производительность 8800GTS драматически падает, в то время как производительность HD2900XT падает всего лишь на 25%. Оно и понятно, у него же имеется блок аппаратной тесселяции. Дальнейшее повышение уровня тесселяции приводит к плавному снижению FPS у Radeon HD2900XT, но даже в самом «тяжелом» случае значение FPS не опускается ниже 200. Прекрасный результат.
Все, что мы пока видели, это тесты, предоставленные компанией AMD. Неудивительно, что видеокарта HD2900XT в них выглядит весьма впечатляюще. Теперь давайте попробуем испытать видеокарты в тестах, которые не являются порождением какого-либо производителя видеокарт.
Синтетические тесты в DirectX 9
Тесты D3D RightMark
Мы решили остановиться на тестовом пакете
D3D RightMark. Последняя бета-версия пакета включает в себя возможность тестирования с использованием шейдеров версии 3.0. В качестве мерила производительности мы будем использовать скорость рендеринга сцены в кадрах/с (FPS), как наиболее понятную и привычную величину для неискушенного пользователя.
Тест №1. Измеряется производительность пиксельных шейдеров при освещении квадратной комнаты, выложенной «плиткой», тремя движущимися источниками света.
С этим заданием Radeon HD2900XT справляется примерно в 1,7 раза лучше, чем 8800GTS.
Тест №2 и №3. . Здесь используется рельефное текстурирование с использованием параллаксмаппинга и имитация меха с при помощи процедурных текстур (задаются в виде функций).
И здесь Radeon HD2900XT оказывается на высоте, но в тесте с процедурными текстурами превосходство над 8800GTS уже не так впечатляюще.
Тест №4. Точечные спрайты. Изображение формируется с помощью множества мелких спрайтов. Используется анимация объекта и диффузное освещение от двух точечных источников света. Версия вертексных шейдеров 2.0.
И опять Radeon HD2900XT оказывается впереди.
Тест №5. Отсечение невидимых поверхностей.
При низком уровне геометрии сцены, превосходство HD2900XT над 8800GTS составляет пару десятков процентов. Но при высоком уровне геометрии оно увеличивается в разы. Примечательно, что производительность Radeon HD2900XT практически не зависит от уровня геометрии в этом тесте. Впечатляет.
Тест №6. Скорость обработки геометрии
И действительно, скорость обработки геометрии у HD2900XT примерно в 6 раз выше, чем у 8800GTS.
Синтетика синтетикой, но настало время проверить, как Radeon HD2900XT проявит себя в играх.
Тестирование в играх DirectX 9
Пока нет официально выпущенных игр с поддержкой DirectX 10, волей неволей придется «сидеть» на DirectX 9. Давайте посмотрим, на что в этом случае можно рассчитывать с Radeon HD2900XT. Мы включили результаты тестирования в 3DMark в этот раздел, поскольку эти тесты хотя и синтетические, но базируются на «движках» более близких к реальным играм, чем чистые синтетические тесты, с которыми мы познакомились ранее.
Ну что же, в 3DMark все складывается очень неплохо для Radeon HD2900XT. По производительности в этих тестах он заметно обходит 8800GTS и флагмана ATI предыдущего поколения.
В Need for Speed Carbon видеокарта HD2900XT сохраняет преимущество, но назвать значительным его нельзя.
В игре Elder Scrolls IV: Oblivion мы использовали режим HDR одновременно с полноэкранным сглаживанием, благо обе видеокарты это поддерживают. Забавно, но незадолго до даты официального анонса обе компании, и AMD, и NVIDIA, выпустили драйверы, значительно улучшающие производительность в этой игре. В среднем, прирост составил около 10 FPS по сравнению с драйверами предыдущей версии, для каждого из продуктов. Ну а что получилось, вы видите. Несмотря на продвинутую архитектуру, Radeon HD2900XT заметно отстает от 8800GTS.
В игре Serious Sam II ситуация для Radeon HD2900XT еще хуже. Он не только значительно отстает от 8800GTS, но в разрешении 1600x1200 умудряется пропустить вперед предшественника X1950XTX.
Тем не менее, в Quake 4 Radeon HD2900XT реабилитируется, и способен обогнать 8800GTS.
В игре Prey ситуация похожа на предыдущую, HD2900XT лидирует, но отрыв становится меньше.
Результаты в игре F.E.A.R. разочаровывают. Игра очень чувствительна как к производительности шейдерных блоков, так и пропускной способности шины памяти. Но ни новая архитектура, ни более высокая частота работы, ни шина памяти 512-бит не могут помочь HD2900XT.
И все же, реванш состоялся. В безумно «тяжелой» по графике игре Call of Juarez видеокарта HD2900XT чувствует себя более чем уверенно и демонстрирует почти двукратный рост по сравнению с X1950XTX.
Что же получается, новая архитектура HD2900XT способна проявить себя только в новых играх, например, под DirectX 10? К сожалению, таких игр пока нет. Но есть демка Call of Juarez для DirectX 10! Битва продолжается.
Тестирование в DirectX 10
Как уже неоднократно отмечалось, инструментарий для корректного сравнения видеокарт в DirectX 10 на данный момент чрезвычайно скуден. Одни тесты разработаны инженерами AMD, другие – NVIDIA. Мы попробовали запустить демку Cascades на HD2900XT, но она жестко требует видеокарту совместимую с 8800 и отказывается работать на Radeon’e. К сожалению, и с демкой Call of Juarez не обошлось без ложки дегтя. Оказалось, что в имеющейся у нас версии невозможно провести тестирование 8800GTS с использованием полноэкранного сглаживания. Поэтому придется довольствоваться более простыми режимами.
В этом режиме используется максимально легкие настройки, доступные в данной демке. Как видите, поначалу 8800GTS лидирует, но начиная с разрешения 1280х1024 вперед выходит HD2900XT и эта разница в 5-7% сохраняется и далее.
При включении теней разница в производительности чуть-чуть увеличивается в пользу Radeon HD2900XT.
При установке максимального уровня теней картина принципиально не изменяется. Фактически, в этой демке мы наблюдаем паритет производительности HD2900XT и 8800GTS.
Разумеется, с доступностью большего количества тестов под DirectX 10 мы еще не раз вернемся к теме тестирования и сравнения видеокарт с поддержкой этой технологии, но это будет позже. А пока подведем итоги.
Выводы
Согласно устоявшейся, но неофициальной традиции, каждый новый флагман, выпускаемый NVIDIA или ATI, превосходил конкурента из противоположного лагеря. Сегодня мы наблюдаем совсем другую картину. И рекомендованная цена в $399, и уровень производительности делают Radeon HD2900XT прямым соперником GeForce 8800GTS, но он и не позиционируется как топовый продукт. Безусловно, армия фанатов ATI ожидала от R600 большего. Но давайте отвлечемся от ожиданий и посмотрим, что же мы все-таки получили? Новинка от AMD обладает достойной производительностью за свои деньги и лучше всего проявляет себя в более новых и тяжелых играх. Архитектурные новшества R600 лучше всего проявляют себя на задачах, связанных с большим объемом вычислений и «тяжелой» геометрией, причем такие впечатляющие технологии как тесселяция - реализованы аппаратно. Унифицированная шейдерная архитектура R600 архитектура выглядит действительно универсальной и показывает изумительную производительность на самых разных задачах. Все это готовит хорошую базу для будущих инноваций и по настоящему кинематографичной графики в реальном времени.
Что же касается производительности в старых играх, то чудес не случилось. А может, новому Radeon просто тесно в «старых штанишках»?
Обсудить материал на форуме.
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.