Результаты тестирования: Синтетические тесты
По традиции начинаем с нашего, коренным образом измененного пакета синтетических тестовых программ.
ShaderMark v2.0
Дежавю? Результаты этого синтетического бенчмарка, анализирующего скорость выполнения различных шейдеров уже можно сказать набили оскомину в том плане, что уже давно всем известна аксиома о том, что шейдеры версий 2.0 выполняются на акселераторах архитектуры NVIDIA GeForce FX совсем плохо и нынешним чипам вряд ли что-то поможет кроме разве плотной работы с разработчиками игр, которые смогут оптимизировать код своих движков специально под архитектуру плат NVIDIA, что в общем-то сейчас с успехом и делается (результаты уже говорят сами за себя, вспомним хотя бы наши совсем недавние тесты игры FarCry, которая входит в программу NVIDIA под названием "The way it`s meant to be played" - платы на чипах NVIDIA отстали от плат на чипах ATI совсем не намного). Однако, повторимся, такой подход экстенсивен по самой своей сути и NVIDIA сможет кардинально поправить своё положение только выпуском нового чипа.
Мы же пока констатируем порой трёхкратное проседание чипов NVIDIA в этом тесте по отношению к сходным по позиционированию чипам ATI.
D3D RightMark: Geometry Processing Speed
Тест позволяет оценить скорость обработки геометрии акселератором. Тест позволяет выбирать следующие моделей освещения (вычисляемые на уровне вершин):
- Ambient Lighting — простейшее константное освещение
- 1 Diffuse Light — один диффузный источник света
- 2 Diffuse Lights — два диффузных источника света
- 3 Diffuse Lights — три диффузных источника света
- 1 Diffuse + Specular Light — один диффузно-спекулярный источник
- 2 Diffuse + Specular Lights — два диффузно-спекулярных источника
- 3 Diffuse + Specular Lights — три диффузно-спекулярных источника
Использовался же наиболее сложный режим с тремя диффузно-спекулярными источниками света в связке с тремя различными режимами работы: традиционный TCL (Fixed-Function
Pipeline), вершинные шейдеры 1.1 и пиксельные шейдеры 1.1, вершинные шейдеры 2.0 и пиксельные шейдеры 2.0 а также наиболее простой режим с амбиентным освещением также в связке с тремя различными режимами работы: традиционный TCL (Fixed-Function Pipeline), вершинные шейдеры 1.1 и пиксельные шейдеры 1.1, вершинные шейдеры 2.0 и пиксельные шейдеры 2.0. В случае Ambient освещения (простейшее константное освещение) и трансформации мы получаем практический предел пропускной способности карты по обработке треугольников.
Посмотрим на результаты тестов. Итак первый случай - наиболее простой режим с амбиентным освещением в связке с тремя различными режимами работы: традиционный TCL (Fixed-Function Pipeline), вершинные шейдеры 1.1 и пиксельные шейдеры 1.1, вершинные шейдеры 2.0 и пиксельные шейдеры 2.0. Несмотря на большее число вершинных процессоров у чипа NVIDIA (у NVIDIA GeForce FX 5700 и NVIDIA GeForce FX 5700 Ultra их 3, в то время как у ATI Radeon 9600 Pro и у ATI Radeon 9600 Pro их только 2) обработка геометрии в случае самого просто источника освещения у чипа NVIDIA получается лучше. Причём результаты не отличаются при переходе из режима эмуляции аппаратного T&L на использование
шейдеров версий 1.1 и 2.0. Однозначный лидер здесь это ATI Radeon 9600 XT. Всё достаточно закономерно в том плане, что в режиме амбиентного освещения результаты в большей степени зависят от частоты графического чипа, а она из всех, представленных здесь акселераторов, большая именно у ATI Radeon 9600XT. Чип же NVIDIA GeForce FX 5700 явно не блещет в плане обработки геометрии и находится на последнем месте.
А теперь переходим от самого простого режима освещения к самой сложной модели с тремя диффузно-спекулярными источниками освещения. Здесь картина уже кардинально меняется в различных режимах и требует дополнительного пояснения. В режиме Fixed-Function Pipeline мы имеем значительное лидерство плат NVIDIA. Это достаточно закономерная победа чипов NVIDIA в том плане, что чипы ATI не имеют аппаратной поддержки для эмуляции T&L, а у чипов NVIDIA реализация аппаратных блоков, отвечающих за расчёт источников освещения,
имеется.
С переходом же на 1.1 версию вершинных шейдеров результаты NVIDIA резко падают в своих пиковых значениях сразу в 2 раза. И, наконец, самое интересное - вершинные шейдеры 2.0: чипы ATI выходят в лидеры! Вполне закономерно в том плане, что исполнение любых функций на основе пиксельных и вершинных шейдеров версии 2.0 на чипах NVIDIA идёт поразительно медленнее, чем на DX 8.1 версии шейдеров. Дают знать о себе промашки в архитектуре NVIDIA GeForce FX в этом плане.
Pixel Filling
Тест выполняет множество различных задач, но нас больше всего интересовала возможность измерения производительности закраски буфера кадров. Мы использовали две схемы при тестировании в этом тесте: как в случае одной текстуры размером 256х256 так и при отсутствии таковой.
Значения скорости закраски буфера кадров, полученные в данном тесте у чипа ATI, немного не совпадают с теоретическим максимумом, заявленным самой ATI, а вот у NVIDIA всё практически полностью верно в случае режима Texelrate (Color+Z).
В данном тесте очевидна архитектура 4x1 NVIDIA GeForce FX 5700 Ultra, а также NVIDIA GeForce FX 5700, которые показывают, как уже отмечалось выше, результаты полностью соответствующие данной конфигурации числа пиксельных процессоров и текстурников вкупе с тактовой частотой чипа. Пиковые значения отличаются всего лишь на 40-50 миллионах пикселов в секунду от теоретически допустимых, что можно смело считать в свете получаемых абсолютных значений небольшой погрешностью. Однако чипы ATI в данном тесте не показывают своей теоретической заявленной пропускной способности пиксельного заполнения. Судите сами, к примеру, у чипа ATI Radeon 9600XT заявлено 500х4 = 2,0 Гигапиксель/с,
а мы получаем только 1.1 Гигапиксель/с, что, как хорошо видно, почти вдвое меньше теоретического максимума. Мы не знаем с чем связано подобное поведение чипов ATI в данном тесте, однако это уже не впервые, так как при тестировании ATI Radeon 9800XT мы получили точно такие же странные результаты.
В случае добавления выборки одной простой билинейной текстуры пиковые значения скорости пиксельного заполнения упали, но общая картина осталась на прежнем уровне.
Pixel Shading
Данный тест тестового пакета D3D RightMark позволяет оценить производительность выполнения различных пиксельных шейдеров второй версии. В тесте максимально упрощена геометрия, для того, чтобы свести к минимуму зависимость результатов данного теста от геометрической производительности чипа, и проверить работу сугубо пиксельных конвейеров. Приведены режимы работы как с 16 бит точностью работы с плавающей запятой, так и с 32 бит точностью работы с плавающей запятой (переключения точности работы актуально только для чипов NVIDIA).
Чипы NVIDIA просто разгромлены при исполнении шейдера версии 2.0 при использовании точности работы с плавающей запятой в 32 бит. Да мы можем сделать оговорку на то, что чип ATI работал в это время со своей неизменной 24 бит точностью, но давайте посмотрим на значения fps при 16-битной точности работы с плавающей запятой. В данном случае в более выгодном положении находится чип NVIDIA, так как он использует меньшую точность работы, нежели чип ATI (у которого абсолютные значения, как то и следует, не меняются
- он работает с неизменными 24 бит).
Да значения фпс у NVIDIA, как того и следовало ожидать подросли, но в конечном итоге опять, увы, фиаско. NVIDIA по результатам теста исполняет пиксельные программы более чем в два раза медленнее чем ATI.
Point Sprites
Тест направлен на выявление скорости акселератора при выводе точечных спрайтов. Перечислим настраиваемые параметры теста:
- Разрешение
- Оконный или полноэкранный режим
- Время тестирования (накопления статистики) в секундах
- Режим программной эмуляции вершинных шейдеров
- Режим работы:
- Vertex Shaders 1.1 и Fixed Function Blend Stages
- Vertex Shaders 2.0 и Fixed Function Blend Stages
- Режим анимации:
- Режим освещения:
В настройках теста нами использовались 2 диффузных источника освещения и включённая анимация, так же мы исследовали зависимость скорости выполнения операций при выводе точечных спрайтов от версии используемого вершинного шейдера.
В этом плане чипы NVIDIA в общем зачёте явные аутсайдеры. Судите сами: NVIDIA GeForce FX 5700 Ultra показывает результаты ровно на уровне ATI Radeon 9600Pro, с которым должен по логике вещей конкурировать NVIDIA GeForce FX 5700, который в этом тесте "просел" и весьма существенно (видимо, не последнюю роль сыграли низкие тактовые частоты работы).
Hidden Surface Removal
Тест позволяет оценить эффективность удаления акселератором невидимых точек и примитивов. Сцена, генерируемая рандомно, затем будет выводиться в одном из трех выбранных режимов:
- Сортированные по удалению, от ближних к дальним (sorted, front to back order)
- Сортированные по удалению, от дальних к ближним (sorted, back to front order)
- Хаотически, без сортировки (unsorted)
Также мы опять таки проводим исследование зависимость эффективности удаления акселератором невидимых точек и примитивов от версии используемого вершинного шейдера (1.1 или 2.0).
Вне конкуренции чип NVIDIA GeForce FX 5700 Ultra. Чип NVIDIA GeForce FX 5700 смотрится в этом плане также весьма и весьма неплохо, однако здесь на руку чипам NVIDIA играют наши настройки тестов - мы производим текстурную выборку, что может не дать нам 100% правильного результата при оценке эффективности HSR блока чипа. В ближайшем будущем мы добавим в этой части нашего анализа работы акселератора ещё один режим оценки эффективности HSR, дабы получать более ясную картину в этом плане.
Версия вершинных программ не привнесла в расстановку сил никаких изменений.
Codecreatures
Хорошо нам знакомый тест Codecreatures показывает нам заметное лидерство плат MSI на чипах NVIDIA. Оптимизации NVIDIA вкупе с хорошими характеристиками самих чипов NVIDIA GeForce FX 5700 и NVIDIA GeForce FX 5700 Ultra дают неплохой результат - NVIDIA GeForce FX 5700 Ultra безоговорочный лидер, а NVIDIA GeForce FX 5700 показывает результаты на уровне (!) ATI Radeon 9600XT.
Тесты в режиме с антиалиасингом не привносят в расстановку сил между платами что-либо новое.
А вот в силу особенностей реализации алгоритмов анизотропной фильтрации у чипов NVIDIA расстановка сил немного меняется и ATI Radeon 9600XT наконец-то обгоняет плату MSI на базе чипа NVIDIA GeForce FX 5700.
3DMark 2003 v340
Традиционно баловство с 3DMark-ом :). Мы уже неоднократно имели повод усомнится в результатах этого бенчмарка, а потому не будем в очередной раз вспоминать кто же в этом споре был прав, а кто виноват, а просто приведем результаты тестирования в данном комплексном пакете для так сказать общего ознакомления :).
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.