Источник: Компьютерное обозрение > ELSA Gladiac
В нашей тестовой лаборатории - одна из первых карт на новом графическом чипе NVidia GeForce 2 GTS: "ELSA Gladiac". Выхода GeForce 2 ждали все: большой успех предыдущего чипа NVidia GeForce 256, с одной стороны, внушал изрядную долю оптимизма, с другой же - сомнения в том, что NVidia сможет через такой короткий промежуток времени создать нечто еще более мощное. Спецификация GeForce 2 впечатляет: частота ядра 200 MHz; четыре конвейера рендеринга с двумя модулями текстурирования на каждом; поддержка частот шины памяти до 200 MHz; fillrate 800 млн. пикселов в секунду; пиковая производительность модуля Hardware Transformation & Lighting (HW T&L) до 25 млн. полигонов в секунду; Environmental Mapped Bump Mapping (EMBM), до этого аппаратно реализованная только в Matrox G400; а также технология Pixel Shaders, которая пока что нигде не используется, но ее поддержка должна войти в MS DirectX 8.0. Однако работать в компьютерах предстоит не спецификациям, а конкретным видеокартам, и поэтому все мы с нетерпением ждали момента, когда у нас появится возможность исследовать законченный продукт на основе нового чипа NVidia.
Карта со звучным названием "Gladiac", предоставленная нам немецкой фирмой ELSA AG, базируется на графическом чипе NVidia GeForce 2 GTS и оснащена 32 MB DDR RAM, работающей на частоте 166 MHz (пропускная способность которой соответствует частоте 333 MHz). На самой карте гнезда Video in/out отсутствуют, но специальный разъем позволяет подключить дочернюю плату (естественно, тоже производства ELSA), которая реализует данные функции. Мы уже имели дело с видеокартами этой фирмы ранее, и, по нашим впечатлениям, продукты ELSA вполне подходят для знакомства с новыми технологиями: прославленный немецкий педантизм просто не позволяет выпускать в свет что-либо "сырое" или некачественное.
Тестовая платформа
На роль основной тестовой платформы претендовали два "кандидата": материнская плата ASUS P3V4X на чипсете VIA Apollo Pro133A и плата той же фирмы P3B-F на чипсете Intel 440BX. В конечном итоге, мы остановились все же на P3V4X, поскольку тестировать видеокарту, поддерживающую AGP4x и AGP Fast Writes, на чипсете, в котором эти функции не реализованы, нам показалось не очень корректным. К тому же отсутствие официальной поддержки PC133 SDRAM в i440BX не позволяет установить на него наиболее быструю на сегодняшний день память, нам же нужна была платформа максимально производительная, чтобы новый 3D-акселератор смог продемонстрировать себя "во всей красе".Процессором эталонной платформы был избран Intel Pentium III 733EB (133 MHz FSB). Дополнительных тестовых платформ было три: AMD Athlon 700 MHz + VIA Apollo KX133 (плата EPoX 7KXA), Pentium III 700E (100 MHz FSB) + i440BX (ASUS P3B-F) и Celeron 300A, разогнанный до 450 MHz (100 MHz FSB) на той же ASUS P3B-F. На все системы устанавливалось по 192 MB PC133 SDRAM, правда, на i440BX она, по понятным причинам, работала на частоте 100 MHz. Для сравнения производительности GeForce 2 GTS со своим предшественником использовалась видеокарта ASUS V6800 Deluxe -- одна из самых быстрых карт на GeForce 256, также оснащенная 32 MB DDR RAM.
Тестирование
Естественно, мы начали тесты с наиболее "животрепещущего" вопроса, который волновал нас отнюдь не меньше, чем наших читателей: какую производительность покажет GeForce 2 GTS в Quake III Arena?Как видно из диаграммы (рис. 1), производительность GeForce 256 DDR при повышении разрешения в 16-битовом цвете начинает падать сразу же, и график падения почти линейный, т. е. быстродействие напрямую зависит от разрешения. В случае с GeForce 2 GTS ситуация совершенно иная: до 1152 x 864 кривая падения производительности очень гладкая, и лишь на более высоких видеорежимах начинает вырисовываться картина, аналогичная GeForce 256. Следовательно, вплоть до этого порога основным узким местом системы является не видеокарта, а скорее CPU. GeForce 2 GTS показывает очень высокий fillrate, в Quake III для него действительно практически нет разницы между разрешениями ниже 1152 x 864 x 16.
Рис. 1. Падение производительности в Quake III 16 bit
Посмотрите, насколько сильно отличается картина падения производительности в 32-битовом цвете по сравнению с 16-битовым (рис. 2). При общем количественном преимуществе график GeForce 2 GTS практически повторяет график GeForce 256, и даже изменения "гладкости" кривых у них происходят в идентичных участках. Это еще раз подтверждает тот факт, что когда массивы графических данных достигают определенного объема, высокий fillrate уже "не спасает", поскольку основным тормозящим фактором является не он, а пропускная способность видеопамяти. Естественно, за счет более быстрого графического движка GeForce 2 GTS даже в этой ситуации превосходит GeForce 256, но уже не столь значительно.
Рис. 2. Падение производительности в Quake III 32 bit
Tirtanium - сравнительно "молодой", но очень быстро развивающийся тест производительности 3D-графики. Мы специально решили немного разнообразить методику тестирования, не замыкаясь на признанных "грандах" - Quake III для OpenGL и 3DMark2000 для Direct3D. Все-таки скорость в тестах связана не только с мощностью графического движка видеокарты, но и с конкретными алгоритмами работы программ, поэтому всегда интересно сравнить показатели производительности, полученные с помощью распространенных тестов, с результатами других, менее известных. Tirtanium характерен тем, что его графика достаточно примитивна, основной упор делается на объем используемых текстур и работу со всевозможными аппаратными расширениями - поддерживается Hardware T&L (через Direct3D) и набор инструкций процессоров AMD (3DNow!). Но, как видите (рис. 3), результаты, показанные GeForce 256 DDR и GeForce 2 GTS в Tirtanium D3D 32 bit, примерно повторяют картину изменения производительности в Quake III 32 bit - те же гладкие кривые, одинаковые для обеих видеокарт, и даже те же пороговые точки. Таким образом, в данном случае результаты мало зависят от используемого тестового ПО и от 3D API (Quake III - OpenGL, Tirtanium - Direct3D). И снова мы бы хотели акцентировать внимание на том, что в 32-битовом цвете высокий fillrate GeForce 2 GTS гораздо менее заметен даже в низких разрешениях - видимо, полоса пропускания видеопамяти все же важнее.
Рис. 3. Падение производительности в Tirtanium 1.90 32 bit
Демонстрационная программа grove.exe распространяется NVidia специально для того, чтобы пользователи могли оценить результаты использования HW T&L на чипах GeForce. В процессе показа виртуальная "камера" перемещается вокруг дерева, возле которого, в свою очередь, летают "светлячки" -- точечные источники света числом до восьми. Естественно, нам было интересно, как покажут себя две видеокарты на чипах NVidia в демо-программе, написанной специально для них. В первом случае мы измеряли падение производительности, увеличивая сложность сцены от 1 до 10 при фиксированном количестве источников света (4), во втором -- при фиксированной глубине (5) число источников света изменялось от 1 до 8 (указанные граничные параметры глубины и количества источников обусловлены ограничениями самой программы). Результаты, которые вы видите на графиках (рис. 4), совершенно определенно свидетельствуют, что GeForce 2 GTS, кроме скорости, практически ничем не отличается от GeForce 256 -- кривые графиков похожи как близнецы-братья с поправкой на более высокую производительность GeForce 2 GTS. Наиболее показателен график с изменением количества источников освещения, ведь это -- основная функция геометрического сопроцессора на картах семейства GeForce. Если бы архитектура самого сопроцессора была каким-либо образом изменена, то, по идее, его график тоже должен был бы отличаться, но в данном случае кривая GeForce 2 GTS выглядит абсолютно идентично, как будто график GeForce 256 просто немного "приподняли" по оси Y, и это позволяет сделать вывод, что геометрический сопроцессор GeForce 2 -- просто "разогнанный" вариант того же, что был на GeForce 256.
Рис. 4. Производительность в демо Grove
Как уже было сказано выше, если не принимать во внимание конкретные цифры, а отслеживать общую тенденцию, то результаты сравнения GeForce 2 GTS с GeForce 256 мало разнятся в зависимости от используемого для тестирования ПО. И результаты 3DMark2000 (рис. 5) -- еще одно тому подтверждение. Хорошо видно, что до разрешения 800 x 600 в тесте Game1 карты идут практически вровень, но уже в режиме 1024 x 768 GeForce 256 постепенно "сдает позиции", в то время как показатели GeForce 2 GTS остаются по-прежнему неизменными, и только на отметке 1280 x 1024 они тоже начинают падать. Такая картина полностью подтверждает наш вывод: чрезвычайно высокий fillrate, который демонстрирует GeForce 2, позволяет ему показывать высокую производительность в больших разрешениях, чем GeForce 256. В тесте Bump Mapping аналогичная тенденция выражена слабее, но все равно GeForce 2 удалось "продержаться" хотя бы до режима 800 x 600, а у GeForce 256 скорость начинает снижаться сразу.
Рис. 5. Производительность в 3DMark2000
Всем известно, что full scene anti-aliasing (FSAA, полноэкранный антиалиасинг) в предыдущих чипах NVidia работал очень медленно. После выхода GeForce 2 GTS компания заявила, что новый чипсет будет значительно лучше справляться с этой функцией. И, конечно же, мы не могли не протестировать FSAA на GeForce 2. Результаты, приведенные на диаграмме (рис. 6а), мы бы назвали несколько двойственными: с одной стороны, падение производительности при включении FSAA у нового чипсета NVidia действительно меньше, но… явно не настолько, чтобы этот режим приобрел популярность. Обратите внимание: скорость с включенным FSAA в разрешении 640 x 480 практически совпадает со скоростью в режиме 1280 x 1024 без FSAA. Возникает естественный вопрос: не проще ли в таком случае действительно использовать более высокое разрешение, при котором потребность в полноэкранном антиалиасинге практически не ощущается?
Рис. 6а. FSAA на GeForce 2 GTSи GeForce 256
А вот это уже очень интересный факт (рис. 6б). Похоже, сомнения относительно "аппаратности" FSAA в чипсетах GeForce-серии нашли еще одно подтверждение, потому что иначе результаты данного тестабыли бы труднообъяснимы: Athlon, явно проигрывающий Pentium III с выключенным FSAA, начинает выигрывать у него после включения! Напрашивается вывод, что основная нагрузка по обсчету FSAA ложится все-таки на драйвер (т. е. -- фактически на CPU), и в результате более мощный FPU (или же оптимизация драйверов NVidia под 3DNow!) помогает выиграть Athlon.
Рис. 6б. FSAA на Pentium IIIи Athlon (GeForce 2 GTS)
Дискуссии о том, насколько нужен модуль Hardware Transformation & Lighting (HW T&L), также называемый иногда "геометрическим сопроцессором", до сих пор не смолкают и в Internet, и на страницах печатных изданий. Поэтому мы воспользовались возможностью, предоставляемой тестом 3DMark2000, и сравнили производительность GeForce 2 GTS в тесте Game1 с включенной HW T&L-оптимизацией и без нее. Графики (рис. 7) достаточно красноречивы: в низких разрешениях, когда производительность блока формирования изображения с лихвой покрывает потребности системы, дополнительная помощь в виде геометрического сопроцессора позволяет существенно поднять быстродействие, ну а в более высоких, когда именно текстурный конвейер становится основным тормозящим фактором, естественно, последствия применения HW T&L уже практически незаметны. Однако разница более чем в 30 fps в режиме 640 x 480, как нам кажется, на основной вопрос отвечает вполне определенно: грамотно организованная поддержка Transformation & Lighting в играх действительно может повысить скорость, и весьма существенно.
Рис. 7. Влияние T&L на производительность
А теперь о грустном: "хит всех low-end геймерских систем" Celeron 300A, разогнанный до 450 MHz, уже явно уходит в прошлое. Этот процессор не в состоянии загрузить работой такой мощный акселератор, как GeForce 2 GTS, что совершенно очевидно демонстрируют диаграммы (рис. 8) -- незначительная разница между скоростью в самом высоком и самом низком разрешениях однозначно свидетельствует о том, что узким местом в такой системе является именно процессор. Результаты, показанные AMD Athlon, в общем-то, закономерны: все же его частота на 33 MHz ниже, чем у CPU основной тестовой системы, да и асинхронный режим работы памяти (100 MHz FSB/133 MHz SDRAM) отнюдь не прибавляет производительности. Более интересны результаты i440BX. Конечно же, основная тестовая система находилась в более выигрышном положении, поскольку работала с частотой FSB и SDRAM 133 MHz (соответственно, и CPU функционировал на частоте 733 MHz, а не 700, как на i440BX), однако это преимущество обусловливается уже самим чипсетом, для которого такой режим является штатным. i440BX в неразогнанном состоянии позволяет установить частоту FSB и SDRAM максимум в 100 MHz, и, как мы наблюдаем, в этом режиме он проигрывает VIA Apollo Pro133A. Что ж, выводы очевидны: либо вы осознанно выбираете разгон (на i440BX), либо VIA Apollo Pro133A за счет поддержки современных стандартов и технологий все же выглядит привлекательнее и обеспечивает более высокую производительность (естественно, когда его возможности задействованы в полном объеме).
Рис. 8. Сравнение производительности GeForce 2 GTS на разных платформах
Выводы
Конечно же, в рамках одной статьи нельзя охватить все особенности нового чипа NVidia. В предлагаемом вашему вниманию обзоре мы решили сосредоточиться на сравнении производительности GeForce 2 GTS с предыдущим чипом данной серии -- GeForce 256, так как, нам кажется, именно этот аспект наиболее интересен при исследовании только что вышедшего 3D-акселератора. И производительность GeForce 2 GTS действительно впечатляет -- очень сильно вырос fillrate, увеличилась и скорость геометрического сопроцессора. Хотя никаких особых нововведений не заметно (впрочем, тут "виновата" не столько NVidia, сколько разработчики игр, явно не спешащие закладывать в свои продукты поддержку новых возможностей современных видеокарт), быстродействие возросло очень существенно. Напрашивается параллель: как за Riva TNT через некоторое время последовал Riva TNT2, так и за GeForce 256 последовал GeForce 2 GTS -- продукт, не содержащий большого количества новых функций, но зато основательно "ускоренный". И, по большому счету, для GeForce 256, и так уже поддерживающего почти все необходимые функции (многие из них еще только предстоит востребовать разработчикам игр), именно скорость являлась тем параметром, который нужно увеличивать в первую очередь, что и было сделано.
ELSA Gladiac
Поскольку эта статья -- первое "серьезное" исследование видеокарт на чипсете NVidia GeForce 2 GTS в нашем журнале, "основной виновник торжества" -- видеокарта ELSA Gladiac -- невольно остался в стороне, и речь шла в основном о самом графическом чипе. Однако некоторые моменты, присущие именно этой карте, все же хотелось бы отметить. Во-первых, драйверы ELSA выполнены на базе самой последней на данный момент версии референс-драйвера от NVidia (5.16), и в этом отношении оперативность ELSA достойна всяческих похвал -- всем известно, насколько критичны новые графические чипы к версии драйверов. Во-вторых, в них присутствует закладка для разгона частот работы видеопамяти и собственно чипа, и, конечно же, мы не преминули этим воспользоваться для проверки ELSA Gladiac на "разгоняемость".Максимальная частота 380 MHz обусловлена не тем, что память отказалась работать на более высокой, а ограничением драйверов - увеличивать частоту памяти дальше они не позволяют. Результаты разгона (рис. 9) производят сильное впечатление - "одним мановением руки" производительность в достаточно большом разрешении с глубиной цвета 32 бита возрастает на целых 13%! Несомненно, такая высокая "разгоняемость" делает карту от ELSA весьма привлекательной для любителей "скорости без компромиссов". Как это уже стало традиционным для всех видеокарт на чипах NVidia, разгон чипа на скорость повлиял очень слабо, поэтому мы не будем приводить результаты этого теста полностью, скажем только, что при частоте памяти 380 MHz увеличение рабочей частоты чипа со стандартных 210 MHz до 230 прибавило еще 0,4 fps, а на частоте 240 MHz карта уже не стала работать.
Рис. 9. Разгон памяти на Elsa Gladiac
Несколько удивил принудительный перевод шины AGP из режима 4x в режим 2х, наблюдаемый после установки драйверов, но, с одной стороны, работа AGP4x на платах с чипсетом VIA Apollo Pro133A во многих случаях нестабильна, а с другой -- использование его на нынешних чипсетах, как мы уже писали ранее, практически не дает никакого прироста производительности, поэтому вполне можно понять ELSA, заботящуюся о стабильной работе своей видеокарты.
Стоит также отметить наличие на карте специального разъема для подключения дочерней платы, реализующей функции Video in/out. В целом же ELSA Gladiac оставила у нас приятное впечатление: качественно сделанная, хорошо разгоняемая видеокарта, лишенная тех недостатков, которые мы в свое время отметили у ELSA Erazor X.