Сегодня 20 апреля 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Видеокарты

Radeon HD2900XT – неоправдавшиеся надежды и фундаментальные инновации

⇣ Содержание
Авторы: Дмитрий Софронов, Владимир Романченко
 R600
Свершилось! Сегодня компания AMD официально представила новое поколение 3D графики ATI Radeon HD 2000, ранее известное под рабочим названием R600, и анонсировала начало продаж новинок в пяти сериях. Сказать, что анонс прилично затянулся – практически, ничего не сказать, но, принимая во внимание тот факт, что особенным наплывом каких-либо DirectX 10 приложений на рынке "не пахнет" до сих пор, в принципе, в длительной доводке Radeon HD 2000 можно найти резон. Сегодня мы предлагаем вашему вниманию результаты подробных исследований производительности первых карт Radeon HD 2000, но перед этим никак не обойтись без теоретических выкладок об архитектуре новых графических процессоров Radeon. Изменения действительно радикальные, более того, в какой-то степени есть смысл говорить не столько об изменениях, сколько о нововведениях, впервые реализованных в новых чипах. Те, кого интересуют исключительно факты – конкретные цифры, полученные в результате испытаний и сравнительных тестирований, могут традиционно открывать последние страницы статьи, но читателям, интересующимся почему получились такие результаты, всё же советуем потратить несколько минут на изучение характеристик новых чипов. В отличие от типичных анонсов прошлых лет, AMD одновременно анонсировала всю линейку новых видеокарт во всех ценовых сегментах – от бюджетного до high-end. Базовыми из новых серий можно назвать три:
  • ATI Radeon HD 2400 - видеокарты нижнего ценового сегмента для массовых ПК
  • ATI Radeon HD 2600 - графика для решений среднего ценового уровня
  • ATI Radeon HD 2900 - высокопроизводительные решения для энтузиастов
 R600
Разумеется, в первую очередь всех интересует характеристики "топовых", наиболее производительных видеокарт, получивших от AMD название ATI Radeon HD 2900 XT, чипы которых выполнены на производственных линиях с соблюдением норм 80 нм техпроцесса. Впрочем, линейки ATI Radeon 2400 (рабочее название чипа RV610) и ATI Radeon 2600 (рабочее название чипа RV630) не менее любопытны, так как, следуя уже сложившейся традиции, производятся на линиях с ещё более прецизионным – 65 нм техпроцессом. Полностью список пяти новых серий выглядит так:
  • Radeon HD 2900 XT, для экстремальных геймеров
  • Radeon HD 2600 XT
  • Radeon HD 2600 Pro
  • Radeon HD 2400 XT
  • Radeon HD 2400 Pro
ATI Radeon
HD 2400
ATI Radeon
HD 2600
ATI Radeon
HD 2900
Транзисторов 180 млн. 390 млн. 700 млн.
Потоковых процессоров 40 120 320
Тактовая частота ядра 525 - 700 МГц 600 - 800 МГц 742 МГц
Частота памяти 400 - 800 МГц 400 - 1100 МГц 828 МГц
Пропускная способность шины памяти 6,4- 1 2,8 Гб/с 12,8 - 35,2 Гб/с 106 Гб/с
Текстурных блоков 4 8 16
Модулей рендеринга 4 4 16
Память 256 Мб GDDR3;
128/256 Мб DDR2
256 Мб DDR2, GDDR3, GDDR4 512 Мб GDDR3
Интерфейс памяти 64-битный 128-битный 512-битный
Техпроцесс 65nm 65nm 80nm
TDP 25 - 35 ВТ 45 Вт 215 Вт
Несмотря на разные уровни производительности и другие технические отличия, все серии объединяет ключевая особенность – поддержка DirectX 10. Наряду с этим декларирован ряд новых ключевых технологий: унифицированная шейдерная архитектура Unified Shader Architecture (какая интересная аббревиатура складывается!) с использованием до 320 "потоковых процессоров" и поддержкой Shader Model 4.0, функция тесселяции (Tessellation), поддержка памяти GDDR2/GDDR3 (и GDDR4 у HD 2600), HDMI/HDCP, новая инкарнация функции Avivo в исполнении Avivo HD и многое другое, о чём подробнее чуть дальше. Видеокарты серий Radeon HD 2400 Pro и Radeon HD 2400 XT позиционируются как наиболее доступные решения с поддержкой DirectX 10, технологии ATI Avivo HD. Карты обладают встроенным аудиочипом, что позволяет полностью задействовать возможности разъёма HDMI без дополнительных подключений. Ядро RV610, содержащее 180 млн. транзисторов, содержит 40 потоковых процессоров с унифицированной шейдерной архитектурой, а ключевая разница между версиями Pro и XT заключается в тактовых частотах ядра – 525 МГц и 700 МГц соответственно. Типичный вариант поддержки памяти для таких карт – 128 Мб или 256 Мб 64-битной GDDR2, хотя также ожидаются варианты с 256 Мб GDDR3. Тактовые частоты у версии Pro будут позиционироваться на уровне 400 МГц, у XT - на уровне 800 МГц, а нижний ценовой порог будет располагаться даже ниже $99.
 ATI Radeon HD 2400 Pro
 ATI Radeon HD 2400 XT
Что касается видеокарт на чипах серии RV630 - Radeon HD 2600 Pro и Radeon HD 2600 XT, помимо стандартной для всех новинок поддержки DirectX 10, они поддерживают технологию Avivo HD с аппаратной обработкой HD видео, обладают 5.1-канальным аудио выходом на HDMI, работают в конфигурациях CrossFire. Чипы Radeon HD 2600 содержат порядка 390 млн. транзисторов, 120 потоковых процессоров. Тактовые частоты чипов Radeon HD 2600 Pro - 600 МГц, чипов Radeon HD 2600 XT - 800 МГц. Шина памяти новых карт 128-битная, можно ожидать самые разнообразные варианты с 256 Мб памяти DDR2, GDDR3 или GDDR4. Тактовые частоты памяти стартуют от 400 МГц для версий Pro и до 1100 МГц для моделей XT. Цены карт Radeon HD 2600 Pro обещаны в диапазоне $99 - $129, карт Radeon HD 2600 XT – в диапазоне $179 - $199.
 ATI Radeon HD 2600 XT
 ATI Radeon HD 2600 Pro
Самое интересное – это, конечно же, High-end карты ATI Radeon HD 2900 XT, выпущенные "на борьбу" со своим непосредственным конкурентом – картами NVIDIA GeForce 8800 GTX. Чипы Radeon HD 2900 XT выполнены на базе примерно 700 млн. процессоров, обладают 320 потоковыми процессорами, поддерживают 64-битный режим HDR (128-битная обработка текстур с плавающей запятой), улучшенный режим HQ анизотропной фильтрации и текстуры до 8192x8192 HR. Всё это дополняется 512-битным интерфейсом памяти - восемь 64-битных каналов. Поддерживается режим CrossFire, есть встроенный выход HDMI с собственным интегрированным 5.1-канальным звуком. В версии с 512 Мб 512-битной памяти DDR3, карты ATI Radeon HD 2900 XT изначально обещают в рознице по интересной цене - порядка $399, и это не шутка, поскольку в некоторых европейских стоках такие карты уже фигурируют по цене порядка 350 евро.
 ATI Radeon HD 2900 XT
Чип
2900XT
2600XT
2600Pro
2400XT
2400Pro
Ширина шины памяти
512 бит
128 бит
64 бит
Поддерживаемая память
GDDR3
GDDR4/GDDR3/DDR2
GDDR3/DDR2
Частота памяти
1,65 ГГц
2,2 ГГц
800 МГц
1,6 ГГц
800 МГц

Типичный объём памяти

512 Мб
256 Мб
Также стоит отметить энергопотребление чипов ATI Radeon HD 2900, 2600 и 2400. Согласно предварительным данным, пиковый TDP составит более 200 Вт, около 45 Вт и на уровне 25-35 Вт соответственно.

Архитектура нового поколения

 ATI Radeon HD 2900
Подробного исследования, конечно же, заслуживает структура старшего чипа - ATI Radeon HD 2900. В AMD называют его архитектуру вторым поколением архитектуры унифицированных шейдеров (Unified Shader), с уточнением, что первое поколение этой архитектуры было реализовано в чипе Xenos для игровой приставки XBOX 360.
 ATI Unified Shader
Чип R600 оснащён новым "распределяющим процессором" – диспетчером задач (dispatch processor), распределяющим потоки на 64 суперскалярных потоковых процессора, каждый из которых содержит пять дискретных независимых потоковых модуля обработки и модуль ветвлений – итого 320 шейдерных унифицированных процессоров в 5-компонентных модулях SPU (Streaming Processing Unit), обеспечивающих обработку до 5 инструкций класса Multiply-Add за такт, плюс, один из процессоров может обрабатывать более сложные команды (SIN/COS/LOG). Динамический баланс загрузки шейдерных процессоров вертексными, геометрическими и пиксельными операциями обеспечивается автоматически аппаратным планировщиком.
 ATI Streaming Processing Unit
Таким образом, AMD декларирует теоретическую производительность HD 2900 XT при тактовой частоте 742 МГц до 475 ГигаFLOPS на ядро, до 237 млрд. операций с плавающей запято одинарной точности, до 950 GigaFLOPS в конфигурации CrossFire.
 ATI текстурные модулиr
Обособленные самостоятельные текстурные модули, коих в R600 четыре, отвечают за выборку текстурных и вертексных данных, они в свою очередь характеризуются наличием четырёх модулей выборки и четырёх модулей адресации в каждом – в сумме 16/16 для чипа HD2900, 4/8 для HD2600 и 4/4 для HD2400. Старшие чипы HD2900 и HD2600 также обладают двухуровневым кэшем L1 и L2, при этом у чипа HD2400 реализован единый объединённый кэш вертексных и текстурных данных. Текстурные модули работают с реализованным в DirectX10 новым 32-битным HDR форматом текстур (RGBE 9:9:9:5), поддерживают полноскоростную 64-битных HDR текстур с билинейной фильтрацией и 128-битную выборку и фильтрацию текстур на половинной скорости; трилинейная и анизотропная фильтрация поддерживается для всех форматов, при этом максимальный размер поддерживаемых текстур декларируется как 67 мегатекселей (8192 x 8192).
 Дизайн интерфейса памяти чипов ATI Radeon HD 2900
Дизайн интерфейса памяти чипов ATI Radeon HD 2900, хоть и напоминает уже известную по Radeon X1800 кольцевую внутреннюю архитектуру, но подвёргся радикальной переработке. Теперь он не 256-битный, а 512-битный, с 1024-битной внутренней кольцевой шиной – 512 бит на чтение и 512 бит на запись, пиковая производительность контроллера памяти HD 2900 XT по всем восьми 64-битным каналам может достигать 106 Гб/с.
 Дизайн интерфейса памяти чипов ATI Radeon HD 2900
Одно из наиболее интересных нововведений – программируемый модуль тесселяции (Tessellation), который имеется во всех чипах серии ATI Radeon HD 2000. Модуль тесселяции, реализованный также ATI в графическом чипе для игровой приставки Xbox 360, позволяет добиться более детализированной и реалистичной анимации объектов, создать более сложные поверхности и шейдерные эффекты, при этом обеспечить эффективное сжатие геометрических данных на аппаратном уровне и разгрузить таким образом CPU и шины данных. Иными словами, тесселяция – это способ динамического превращения простых структур в более сложные полигональные модели.
 ATI Tessellation
В новых чипах ATI также реализовано новое поколение технологий антиалиазинга и новые режимы. Так, помимо 8x Multi-Sample AA, карты ATI Radeon HD 2900 поддерживают очень интересный режим CSAA (Custom Filter Anti-Aliasing) – до 24x AA, при этом заявлена работа с HDR, очень высокое качество сглаживания, отсутствие размытия при детализации, программное обновление драйверами Catalyst. Карты также поддерживают режимы HDR+AA, Adaptive SSAA/MSAA, Temporal AA, Super AA и режим коррекции гаммы.
 ATI CSAA (Custom Filter Anti-Aliasing)
 ATI Anti-Aliasing
Для карт ATI Radeon HD 2900 и 2600 характерна полная поддержка CrossFire, теперь без специальной "мастер-карты", за счёт наличия специального интегрированного модуля, нового алгоритма детектирования AFR и специальных CrossFire-перемычек. Режим CrossFire поддерживает разрешения до 2560x2048 @ 60 Гц, при этом доступна plug-n-play установка и двойной интерфейс DVI. Поддерживаются все ранее доступные режимы CrossFire - Alternate Frame Rendering, SuperTile, Scissor, SuperAA.
 ATI CrossFire
Наконец, несколько слов о технологии ATI Avivo HD и поддержке интерфейсов. Для высококачественной аппаратной обработки HD видео технология ATI Avivo HD задействует специальные модули – универсальный видео декодер UVD (Universal Video Decoder) и расширенный видео процессор AVP (Advanced Video Processor). Обработка видеоконтента с помощью ATI Avivo HD в целом схожа с возможностями нынешнего поколения технологии NVIDIA PureVideo HD, правда, потоковый процессор, встроенный в модуль UVD от ATI, поддерживает обработку VC-1, в то время как внешний в PureVideo HD - только H.264. Сделано это, разумеется, с прицелом разгрузки CPU при работе с современным HD DVD/Blu-ray видео контентом.
 ATI ATI Avivo HD
В завершение стоит упомянуть, что новые видеокарты обладают поддержкой HDMI и HDCP, при этом реализована полноценная поддержка HDMI дисплеев с высоким разрешением. Благодаря наличию встроенных HD аудио контроллеров, семейство видеокарт ATI Radeon HD 2000 обладает возможностью вывода высококачественного 5.1-канального звука (ATI Radeon HD 2900 XT и ATI Radeon 2600) в формате AC3 через порт HDMI.
 ATI  DVI -> HDMI
Карты комплектуются адаптером DVI -> HDMI, что также позволяет выводить защищённое HDCP видео и цифровой 5.1-канальный аудио сигнал через HDMI.
 ATI Mobility Radeon
Помимо решений для настольных ПК новая линейка 3D графики от AMD также включает в себя ряд решений для мобильных ПК, такие как ATI Mobility Radeon HD 2300, ATI Mobility Radeon HD 2400, ATI Mobility Radeon HD 2600.
 ATI Mobility Radeon
Рассказу об этих новинках, поддерживающих, как и "настольные" собратья, ключевые нововведения, плюс новую технологию энергосбережения PowerPlay, будет посвящён один из следующих наших материалов.

Внешний вид и внутреннее устройство Radeon HD2900XT

Многократные «утечки» фотографий Radeon HD2900 демонстрировали нам очень длинную видеокарту, однако вариант HD2900XT, предназначенный для розничного рынка, выглядит несколько по другому.
 Radeon HD2900XT общий вид
Видеокарта Radeon HD2900XT занимает два стандартных слота PCI, имеет два выхода Dual-Link DVI и выход S-Video/HDTV-out, к тому же обладающий поддержкой функциtq видеозахвата Video-In.
 Radeon HD2900XT вид спереди
Видеокарта Radeon HD2900XT оснащена полупрозрачным красным кулером, который почти полностью закрывает поверхность печатной платы. Кулер выполнен по классической схеме – алюминиевое основание охлаждает чипы видеопамяти и силовые элементы, а для охлаждения GPU используется медный радиатор с тепловыми трубками.
 Radeon HD2900XT по сравнению с 8800GTS
Опасения по поводу невероятной длины нового Radeon и, как следствие, ограниченной совместимости с большинством современных корпусов, оказались напрасными. Обратите внимание на фото - видеокарта HD2900XT (на заднем плане) лишь на пару сантиметров длиннее видеокарты GeForce 8800GTS (на переднем плане), так что никаких проблем с установкой в стандартный ATX корпус возникать не должно.
 Radeon HD2900XT вид сзади
Как видите, обратная сторона видеокарты HD2900XT также оснащена радиатором, что довольно редко встречается в последнее время. Для чего же нужен этот радиатор?
 Radeon HD2900XT вид сзади без кулера
Во-первых, металлическая рамка служит для фиксации кулера видеокарты. Во-вторых, она используется для охлаждения чипов видеопамяти, расположенных на обратной стороне PCB. Однако, давненько не приходилось такого видеть. Причина этому, как вы уже догадались – использование шины памяти с шириной 512-бит. Разместить все 16 микросхем видеопамяти на лицевой стороне PCB чрезвычайно проблематично, поэтому половина чипов переехала на другую сторону печатной платы. Монтаж довольно плотный, и относительно свободное место остается разве что в левой части, в области подсистемы питания.
 Radeon HD2900XT вид спереди без кулера
На лицевой стороне PCB плотность элементов еще выше, однако нашлось место и для чипа видеозахвата Rage Theatre. Здесь мы также видим вторую восьмерку чипов видеопамяти и «сердце» видеокарты – графический процессор R600. Подсистема питания тоже значительно усложнена и, помимо увеличенного числа силовых элементов, использует два разъема дополнительного питания, один 6-контактный, второй 8-контактный. Несмотря на различие в числе контактов, 8-контактный разъем спокойно принимает стандартный 6-контактный коннектор, так что проблем с подключением не будет. Можно использовать обычные 6-контактные разъемы для питания видеокарт, если блок питания ими оборудован, или же использовать стандартные переходники. По утверждениям разработчиков, дополнительную пару штырьков 8-контактного разъема следует задействовать при разгоне видеокарты, однако практика показывает, что это не является необходимым условием, и видеокарта HD2900XT спокойно разгоняется и при стандартной схеме подключения питания.
 Radeon HD2900XT кулер
«Красный кулер» оказывается красным и с обратной стороны. Первое впечатление обманчиво и может показаться, что основание кулера выполнено из пластика, как и верхняя крышка. На самом деле, основание кулера, конечно же, выполнено из алюминия. Чипы видеопамяти и силовые элементы системы питания охлаждаются через термопрокладки. Медный радиатор для охлаждения GPU не закреплен на алюминиевом основании жестким образом, а может в некоторых пределах перемещаться относительно него. Эта независимость радиаторов друг от друга обеспечивает их хороший тепловой контакт с охлаждаемыми элементами и защиту от возможных перекосов при установке. Качество обработки основания медного радиатора оставляет желать лучшего, что несколько диссонирует с любовно окрашенной в красный цвет алюминиевой подошвой. Но, может, это издержки инженерного образца?
 Radeon HD2900XT кулер, задняя рамка
Ну а это другой вид рамки-радиатора с обратной стороны PCB. Здесь мы также можем видеть термопрокладки для теплового контакта с чипами видеопамяти.
 Radeon HD2900XT видеочип
Вот, собственно, и «сердце» видеокарты HD2900XT – графический процессор R600. Первые фотографии чипа, появившиеся в Интернет довольно давно, удивили нестандартным расположением кристалла GPU на подложке, но оказывается, что это действительно так. Тем не менее, физические размеры чипа R600 не сильно отличаются от R580. Как подложка, так и кристалл чипа практически совпадают по размеру с R580. Разумеется, отличия находятся гораздо глубже. Видеочип R600 на карте HD2900XT работает на частоте 506 МГц в 2D-режиме и 743 МГц в 3D-режиме.
Radeon HD2900XT видеопамять
Общий объем видеопамяти 512 Мб набран 16-ю микросхемами стандарта DDR3 производства Hynix. Плотность чипов 256 Мбит, каждый из чипов подключается по шине 32 бит, таким образом 16 микросхем в сумме образуют 512-битную шину памяти. Что интересно, время выборки на установленных чипах составляет 1,0 нс, что соответсвует номинальной частоте 2000 МГц DDR. Но штатная частота видеопамяти на карте HD2900XT равна всего лишь 1656 МГц DDR в 3D-режиме. В режиме 2D она еще меньше и равна 1026 МГц DDR. Не совсем понятно, в чем причина столько низкой рабочей частоты по сравнению с номинальной. Экономически это не совсем оправданно, если конечно отпускные цены на чипы памяти DDR1600 и DDR2000 не одинаковы. С другой стороны, нам грех жаловаться, остается изрядный запас для разгона. Впрочем, это совсем другая история. Очевидно, что в использованной схеме можно легко заменить чипы памяти с плотностью 256 Мбит на чипы памяти с плотностью 512 Мбит, тем самым без труда увеличить общий объем видеопамяти до 1 Гб. Вполне возможно, что в скором времени мы сможем увидеть и такого рода продукты. Но пока давайте теперь посмотрим, на что способен Radeon HD2900XT в том виде, какой он есть сейчас. Переходим к тестам.

Тестовый стенд

Конфигурация «железа» тестового стенда не изменилась. Поскольку для тестирования видеокарт ряд тестов требует наличия DirectX 10, в дополнение к Windows XP мы также будем использовать Windows Vista 64 Ultimate.

Тестовый стенд
Шина
PCI-Express
CPU
MB
Memory
OS
WinXP + SP2 + DirectX 9.0c; Windows Vista 64 Ultimate + DirectX 10
PSU
Thermaltake ToughPower 750 Wt
Тестирование проводилось с помощью драйверов ForceWare 158.22 и Catalyst ver. 8.37.4.

Синтетические тесты в DirectX 10

DX10 Shader Tests

Этот набор тестов демонстрирует производительность шейдерных блоков GPU при выполнении элементарных операций. Данный тест был разработан инженерами компании AMD. И хотя может возникнуть некая предубежденность типа «на их собственных тестах результаты их видеокарты конечно будут выше», исходные коды открыты, так что любой может ознакомиться с особенностями данного теста и поискать «фирменные» закладки, если они есть. Скачать полную версию теста с исходниками можно отсюда. Результаты приводятся следующим образом – сначала идет название теста, потом краткое описание от разработчика, затем диаграмма и наши комментарии. Итак, приступим. Тест №1. "float MAD serial" - Зависимые скалярные инструкции
Комментарий разработчика:
Тест выдает пакет скалярных инструкций «сложение-умножение», которые выполняются последовательно. Это наихудший случай для суперскалярной архитектуры, поскольку из имеющихся 5 вычислительных блоков HD2900XT может использоваться только один. Код, выполняемый в этом тесте, можно условно выразить следующим образом:
x = x * x + x
x = x * x + x
. . .
 dx10_shader_test1.gif
Видеокарта 8800GTS демонстрирует в этом тесте невероятную производительность при исполнении пиксельных шейдеров, однако результат вертексных шейдеров оказывается в разы ниже. Результаты нового GPU от AMD занимают золотую середину и практически идентичны как для пиксельных, так и для вертексных шейдеров. Тест №2. "float4 MAD parallel" – Векторные инструкции
Комментарий разработчика:
Тест выдает две последовательности инструкций «сложение-умножение» над четырехмерными векторами (float4). «Умный» компилятор в драйвере способен разбить 4D-векторы на составные инструкции, чтобы заполнить все 5 вычислительных слотов. Это пример одного из наилучших вариантов использования суперскалярной архитектуры и довольно характерен для цепочек инструкций, которые можно видеть во многих шейдерах. Этот пример также демонстрирует гибкость архитектуры, которая может обрабатывать не только тривиальные случаи типа 3+2 или 4+1. Код, выполняемый в этом тесте, можно условно выразить следующим образом:
xyzw1 = xyzw1 * xyzw1 + xyzw1
xyzw2 = xyzw2 * xyzw2 + xyzw2
xyzw1 = xyzw1 * xyzw1 + xyzw1
. . .
 dx10_shader_test2.gif
В этом тесте с завидным преимуществом лидирует HD2900XT. Что интересно, в этот раз небольшая разница в скорости исполнения пиксельных и вертексных шейдеров присутствует и у HD2900XT, но у 8800GTS эта разница достигает практически двукратного размера. Тест №3. "float SQRT serial" – Специальная функция
Комментарий разработчика:
Этот тест использует 5-й специальный вычислительный слот, который наряду со стандартными операциями «сложение-умножение» и т.д. способен выполнять трансцендентные операции. Код, выполняемый в этом тесте, использует операцию извлечения квадратного корня:
x = sqrt(x)
x = sqrt(x)
. . .
 dx10_shader_test3.gif
По всей видимости, преимущество HD2900XT в этом тесте обусловлено наличием того самого специального блока, который оказывается вовсе не «пятым колесом», а эффективным средством выполнения трансцендентных операций. Тест №4. "float 5-instruction issue" - Независимые скалярные инструкции
Комментарий разработчика:
Этот тест использует 5 типов скалярных инструкций (умножение, сложение, минимум, максимум, извлечение квадратного корня), каждая из которых использует свой операнд, а все вместе они скомпонованы в одну супер-скалярную инструкцию. Это представляет типичный случай объединения инструкций компилятором драйвера с максимальной эффективностью.
 dx10_shader_test4.gif
Комментарии излишни. Подавляющее преимущество Radeon HD2900XT. Тест №5. "int MAD serial" – зависимые DX10 скалярные инструкции
Комментарий разработчика:
Тест аналогичен тесту №1, но вместо инструкций с плавающей точкой используются целочисленные.
 dx10_shader_test5.gif
Тест №6. "int4 MAD parallel" – DX10 целочисленные векторные инструкции
Комментарий разработчика:
Тест аналогичен тесту №2, но вместо инструкций с плавающей точкой используются целочисленные.
 dx10_shader_test6.gif
Итоговая диаграмма тестов DX10 Shader tests
 dx10-shader-test.gif
Для полноты картины мы свели результаты всех тестов в одну диаграмму. Видно, что из всех тестов 8800GTS оказывается впереди только при выполнении пиксельного шейдера с последовательными инструкциями типа «float MAD». Но на этой диаграмме можно отметить куда более интересный момент. Смотрите, в каждом тесте HD2900XT эффективно выполняет как пиксельные, так и вертексные шейдеры, причем с очень близкой производительностью. Что это означает? Это говорит о том, что мы имеем дело с действительно унифицированной шейдерной архитектурой, которая с равной эффективностью выполняет шейдер любого типа, будь он пиксельный или вертексный.

N-Patches

Помимо эффективного выполнения пиксельных и вертексных шейдеров, архитектура Radeon HD2900XT способна весьма эффективно работать с «геометрией» объекта. Встроенный в GPU блок аппаратной тесселяции позволяет «на лету» преобразовывать грубую угловатую малополигональную модель во вполне приличный «гладкий» объект. Давайте посмотрим, как это получается. В данном тесте вычислительная задача для GPU состоит в рендеринге большого количества человечков, представляющих собой довольно грубые модели. На скриншоте ниже показано, как это выглядит в действительности.
 npatch-0-full.gif
Модели действительно «угловаты» и примитивны. Чтобы было понятнее, почему так получается, приведем скриншот в режиме wire-frame.
 npatch-0-wireframe.gif
Что будет, если применить к таким объектам метод тесселяции? С повышением уровня количество полигонов в объекте возрастает как квадрат от значения уровня тесселяции. Но одного увеличения количества полигонов в объекте мало. Допустим, у нас был исходный треугольник, и мы разбили его на несколько меньших, все они окажутся по-прежнему в одной плоскости, и «угловатость» никуда не исчезнет, если не сделать следующий шаг. Далее, надо сместить вершины новых полигонов так, чтобы объект приобрел более сглаженную форму. Есть разные способы таких преобразований, например по методу Безье, кубическими сплайнами, с помощью N-Patches и т.д. Сейчас мы рассмотрим метод N-Patches. Опуская промежуточные шаги, сразу приведем скриншот с уровнем тесселяции «8», который максимально возможен для этого теста (аппаратно GPU HD2900XT поддерживает уровень тесселяции вплоть до 15).
 npatch-8-wireframe.gif
Смотрите, как преобразились модели! Вместо несуразных угловатых кубиков мы получили очень приличные сглаженные фигурки.
 npatch-8-full.gif
А вот так это выглядит в привычном нам виде. Прелесть данной технологии в том, что разработчики могут оперировать довольно простыми моделями, экономя время и ресурсы, а видеопроцессор с блоком аппаратной тесселяции «на лету» преобразует объекты в красивую картинку. Если раньше это было как в детском стишке - «палка, палка, огуречик, вот и вышел человечек», то с помощью Radeon HD2900XT при том же «алгоритме» без труда получаем Памелу Андерсен.
 n-patches-test.gif
На этой диаграмме показано изменение производительности, измеряемое в FPS, при увеличении уровня тесселяции. Как видите, при отсутствии тесселяции видеокарта 8800GTS прекрасно справляется с этим несложным заданием и заметно опережает HD2900XT, однако даже самый минимальный уровень тесселяции кардинально меняет расстановку сил. Производительность 8800GTS драматически падает, в то время как производительность HD2900XT падает всего лишь на 25%. Оно и понятно, у него же имеется блок аппаратной тесселяции. Дальнейшее повышение уровня тесселяции приводит к плавному снижению FPS у Radeon HD2900XT, но даже в самом «тяжелом» случае значение FPS не опускается ниже 200. Прекрасный результат. Все, что мы пока видели, это тесты, предоставленные компанией AMD. Неудивительно, что видеокарта HD2900XT в них выглядит весьма впечатляюще. Теперь давайте попробуем испытать видеокарты в тестах, которые не являются порождением какого-либо производителя видеокарт.

Синтетические тесты в DirectX 9

Тесты D3D RightMark

Мы решили остановиться на тестовом пакете D3D RightMark. Последняя бета-версия пакета включает в себя возможность тестирования с использованием шейдеров версии 3.0. В качестве мерила производительности мы будем использовать скорость рендеринга сцены в кадрах/с (FPS), как наиболее понятную и привычную величину для неискушенного пользователя. Тест №1.
Измеряется производительность пиксельных шейдеров при освещении квадратной комнаты, выложенной «плиткой», тремя движущимися источниками света.
 PixelShading-lighting.jpg
 3D-rightmark-PS.gif
С этим заданием Radeon HD2900XT справляется примерно в 1,7 раза лучше, чем 8800GTS. Тест №2 и №3. .
Здесь используется рельефное текстурирование с использованием параллаксмаппинга и имитация меха с при помощи процедурных текстур (задаются в виде функций).
 PixelShading-parallax-mappi.jpg
 PixelShading-fur-procedural.jpg
 3D-rightmark-PS3.gif
И здесь Radeon HD2900XT оказывается на высоте, но в тесте с процедурными текстурами превосходство над 8800GTS уже не так впечатляюще. Тест №4.
Точечные спрайты. Изображение формируется с помощью множества мелких спрайтов. Используется анимация объекта и диффузное освещение от двух точечных источников света. Версия вертексных шейдеров 2.0.
 PointSprites16x18x46.jpg
 3D-rightmark-point-sprites.gif
И опять Radeon HD2900XT оказывается впереди. Тест №5.
Отсечение невидимых поверхностей.
 3D-rightmark-HSR.gif
При низком уровне геометрии сцены, превосходство HD2900XT над 8800GTS составляет пару десятков процентов. Но при высоком уровне геометрии оно увеличивается в разы. Примечательно, что производительность Radeon HD2900XT практически не зависит от уровня геометрии в этом тесте. Впечатляет. Тест №6.
Скорость обработки геометрии
 3D-rightmark-GPS.gif
И действительно, скорость обработки геометрии у HD2900XT примерно в 6 раз выше, чем у 8800GTS. Синтетика синтетикой, но настало время проверить, как Radeon HD2900XT проявит себя в играх.

Тестирование в играх DirectX 9

Пока нет официально выпущенных игр с поддержкой DirectX 10, волей неволей придется «сидеть» на DirectX 9. Давайте посмотрим, на что в этом случае можно рассчитывать с Radeon HD2900XT. Мы включили результаты тестирования в 3DMark в этот раздел, поскольку эти тесты хотя и синтетические, но базируются на «движках» более близких к реальным играм, чем чистые синтетические тесты, с которыми мы познакомились ранее.
Radeon HD2900XT результаты тестирования 3DMark
Ну что же, в 3DMark все складывается очень неплохо для Radeon HD2900XT. По производительности в этих тестах он заметно обходит 8800GTS и флагмана ATI предыдущего поколения.
 Radeon HD2900XT результаты тестирования Need for Speed Carbon
В Need for Speed Carbon видеокарта HD2900XT сохраняет преимущество, но назвать значительным его нельзя.
 Radeon HD2900XT результаты тестирования Elder Scrolls IV - Oblivion
В игре Elder Scrolls IV: Oblivion мы использовали режим HDR одновременно с полноэкранным сглаживанием, благо обе видеокарты это поддерживают. Забавно, но незадолго до даты официального анонса обе компании, и AMD, и NVIDIA, выпустили драйверы, значительно улучшающие производительность в этой игре. В среднем, прирост составил около 10 FPS по сравнению с драйверами предыдущей версии, для каждого из продуктов. Ну а что получилось, вы видите. Несмотря на продвинутую архитектуру, Radeon HD2900XT заметно отстает от 8800GTS.
 Radeon HD2900XT результаты тестирования Serious Sam 2
В игре Serious Sam II ситуация для Radeon HD2900XT еще хуже. Он не только значительно отстает от 8800GTS, но в разрешении 1600x1200 умудряется пропустить вперед предшественника X1950XTX.
 Radeon HD2900XTрезультаты тестирования Quake 4
Тем не менее, в Quake 4 Radeon HD2900XT реабилитируется, и способен обогнать 8800GTS.
 Radeon HD2900XT результаты тестирования Prey
В игре Prey ситуация похожа на предыдущую, HD2900XT лидирует, но отрыв становится меньше.
 Radeon HD2900XT результаты тестирования F.E.A.R.
Результаты в игре F.E.A.R. разочаровывают. Игра очень чувствительна как к производительности шейдерных блоков, так и пропускной способности шины памяти. Но ни новая архитектура, ни более высокая частота работы, ни шина памяти 512-бит не могут помочь HD2900XT.
 Radeon HD2900XTрезультаты тестирования Call of Juarez
И все же, реванш состоялся. В безумно «тяжелой» по графике игре Call of Juarez видеокарта HD2900XT чувствует себя более чем уверенно и демонстрирует почти двукратный рост по сравнению с X1950XTX. Что же получается, новая архитектура HD2900XT способна проявить себя только в новых играх, например, под DirectX 10? К сожалению, таких игр пока нет. Но есть демка Call of Juarez для DirectX 10! Битва продолжается.

Тестирование в DirectX 10

Как уже неоднократно отмечалось, инструментарий для корректного сравнения видеокарт в DirectX 10 на данный момент чрезвычайно скуден. Одни тесты разработаны инженерами AMD, другие – NVIDIA. Мы попробовали запустить демку Cascades на HD2900XT, но она жестко требует видеокарту совместимую с 8800 и отказывается работать на Radeon’e. К сожалению, и с демкой Call of Juarez не обошлось без ложки дегтя. Оказалось, что в имеющейся у нас версии невозможно провести тестирование 8800GTS с использованием полноэкранного сглаживания. Поэтому придется довольствоваться более простыми режимами.
Radeon HD2900XTрезультаты тестирования Call of Juarez DX10 Demo shadow level=0 (disabled)
В этом режиме используется максимально легкие настройки, доступные в данной демке. Как видите, поначалу 8800GTS лидирует, но начиная с разрешения 1280х1024 вперед выходит HD2900XT и эта разница в 5-7% сохраняется и далее.
Radeon HD2900XT результаты тестирования Call of Juarez DX10 Demo shadow level=1 (low)
При включении теней разница в производительности чуть-чуть увеличивается в пользу Radeon HD2900XT.
 Radeon HD2900XT результаты тестирования Call of Juarez DX10 Demo shadow level=3 (high)
При установке максимального уровня теней картина принципиально не изменяется. Фактически, в этой демке мы наблюдаем паритет производительности HD2900XT и 8800GTS. Разумеется, с доступностью большего количества тестов под DirectX 10 мы еще не раз вернемся к теме тестирования и сравнения видеокарт с поддержкой этой технологии, но это будет позже. А пока подведем итоги.

Выводы

Согласно устоявшейся, но неофициальной традиции, каждый новый флагман, выпускаемый NVIDIA или ATI, превосходил конкурента из противоположного лагеря. Сегодня мы наблюдаем совсем другую картину. И рекомендованная цена в $399, и уровень производительности делают Radeon HD2900XT прямым соперником GeForce 8800GTS, но он и не позиционируется как топовый продукт. Безусловно, армия фанатов ATI ожидала от R600 большего. Но давайте отвлечемся от ожиданий и посмотрим, что же мы все-таки получили? Новинка от AMD обладает достойной производительностью за свои деньги и лучше всего проявляет себя в более новых и тяжелых играх. Архитектурные новшества R600 лучше всего проявляют себя на задачах, связанных с большим объемом вычислений и «тяжелой» геометрией, причем такие впечатляющие технологии как тесселяция - реализованы аппаратно. Унифицированная шейдерная архитектура R600 архитектура выглядит действительно универсальной и показывает изумительную производительность на самых разных задачах. Все это готовит хорошую базу для будущих инноваций и по настоящему кинематографичной графики в реальном времени. Что же касается производительности в старых играх, то чудес не случилось. А может, новому Radeon просто тесно в «старых штанишках»?
Обсудить материал на форуме.

 
 
⇣ Содержание
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.

window-new
Soft
Hard
Тренды 🔥
Новая статья: Atom Bomb Baby: рассказываем, почему Fallout — идеальная экранизация видеоигрового материала, и почему этот сериал не стоит пропускать 8 мин.
Bethesda готовит «несколько очень хороших обновлений» для Starfield, а Fallout 5 не в приоритете 2 ч.
Apple откроет сторонним приложениям доступ к NFC 2 ч.
В Dota 2 стартовало сюжетное событие «Павшая корона» с уникальными наградами, новыми «арканами» и комиксом 2 ч.
Связанные одной шиной: «Лаб СП» и «Фактор-ТС» представили отечественную интеграционную платформу Integration Gears 3 ч.
Paradox отказала Prison Architect 2 в досрочном освобождении — релиз отложили ещё на четыре месяца 4 ч.
Спустя 17 лет после релиза Team Fortress 2 получила поддержку 64 бит — выросла производительность и даже боты пропали 5 ч.
Kingdom Come: Deliverance 2 переведут на русский, но есть нюанс 6 ч.
Netflix резко нарастила аудиторию и прибыль, запретив совместное использование аккаунтов 6 ч.
Российские студенты победили в чемпионате мира по программированию ICPC 7 ч.
Гиперщит с ИИ: Cisco представила систему безопасности Hypershield 2 ч.
Highpoint представила карту расширения на восемь SSD: до 64 Тбайт со скоростью до 56 Гбайт/с 2 ч.
Китайские экспериментальные лунные навигационные спутники прислали фотографии обратной стороны Луны 2 ч.
Налоговая служба Швеции закрыла 18 дата-центров за незаконный майнинг криптовалют 3 ч.
LG выпустила флагманский саундбар S95TR за $1500 с поддержкой Dolby Atmos и настройкой с помощью ИИ 5 ч.
Corsair представила обновлённые доступные проводные гарнитуры HS35 v2 для геймеров 6 ч.
Tesla отзовёт все проданные электромобили Cybertruck для замены залипающей педали газа 8 ч.
Galax выпустила полностью белую низкопрофильную GeForce RTX 4060 с крошечным заводским разгоном 9 ч.
Razer представила игровые контроллеры Kishi Ultra и Kishi V2 для смартфонов, планшетов и ПК 9 ч.
5 ГВт уже есть, ещё 2,5 ГВт на подходе: Microsoft стремительно наращивает ёмкость ЦОД и скупает ИИ-ускорители 9 ч.