Тестирование GeForce4 Ti и GeForce4 MX / Видеокарты

Использованы материалы тестирования: THG, Anandtech, FiringSquad

С самого Нового года мы предвкушали появление новых чипов от nVidia. ATi, главный конкурент nVidia, смогла сравниться с технологией GeForce3, и сейчас настало время следующего рывка вперед для разработчика GPU из Санта-Клары.

nVidia довольно сильно везет, поскольку ситуация на рынке 3D графики отличается от положения дел на рынке процессоров. Покупателя все труднее убедить в покупке нового процессора, поскольку даже купленный год назад "камень" до сих пор прекрасно работает. На самом деле вряд ли кому сейчас нужны 2+ ГГц монстры от AMD и Intel.

Но если вы обратите свой взор на рынок 3D графики, то заметите явное отличие, поскольку на этом рынке есть куда развиваться. И хотя 3D карты сейчас могут работать в играх на высоком разрешении с нормальной частотой кадров, им еще далеко до реалистичности фильма.

По этой причине nVidia еще немножко приподнимает планку 3D реализма с выпуском GeForce4 Ti. Нам предстоит насладиться более реалистичным сценами и более жизненными движениями в демах последнего продукта от nVidia.

Однако большинство людей вряд ли захочет выкладывать кругленькую сумму за новый уровень 3D реализма. Сегодня люди с удовольствием играют в игры, изданные даже год назад. Для таких людей nVidia анонсировала GeForce4 MX, дальнейшее развитие линейки GeForce2 MX, характеризующееся отсутствием многих приятных возможностей GeForce3 и GeForce4 Ti.

NV25 - линейка GeForce4 Ti

И начнем мы с high-end видеокарты, получившей имя GeForce4 Ti. Флагманом линейки является карта, широко разосланная nVidia по обозревателям - GeForce4 Ti4600.

Как видите, сейчас на многих картах nVidia будет устанавливаться новая эталонная система охлаждения.

Кроме GeForce4 Ti4600 в линейке присутствуют GeForce4 Ti4400 и GeForce4 Ti4200. В следующей таблице вы сможете сравнить характеристики всех карт линейки GeForce4 Ti между собой и с бывшим флагманом nVidia - GeForce3 Ti500. Кстати, третья модель, GeForce4 Ti4200 будет объявлена примерно через 8 недель, дабы совсем не удавить GeForce3 Ti500.

	GeForce4 Ti4600	GeForce4 Ti4400	GeForce4 Ti4200	GeForce3 Ti500
Частота чипа	300 МГц	275 МГц	225 МГц	240 МГц
Частота памяти	650 МГц (DDR)	550 МГц	500 МГц	500 МГц
Объем памяти	128 Мб	128 Мб	128 Мб	64 Мб
Пропускная способность	10,400 Мбайт/с	8,800 Мбайт/с	8,000 Мбайт/с	8,000 Мбайт/с
Теоретическая скорость заполнения	1,200 Мпиксель/с	1,100 Мпиксель/с	900 Мпиксель/с	960 Мпиксель/с
Цена	$399	$299	$199	$299

Перед тем, как мы погрузимся в новые технологии GeForce4 Ti, давайте пробежимся по основным спецификациям NV25.

63 млн транзисторов (только на 3 млн больше GeForce3);
Изготовитель: TSMC по 0,15 мкм техпроцессу;
Частота чипа: 225-300 МГц;
Частота памяти: 500-650 МГц;
Пропускная способность памяти: 8.000 - 10.400 Мбайт/с;
T&L производительность: 75-100 млн вершин/с;
128 Мб кадровый буфер по умолчанию;
Движок nFiniteFX II;
Сглаживание Accuview;
Архитектура памяти Lightspeed II;
nView.

Карты на GeForce4 Ti будут выполнены по 8-слойному дизайну, в качестве памяти используются чипы 4Mx32 от Samsung в упаковке micro-BGA (для 4600 - 2,8 нс).

Для видеовыхода все еще используется сторонний чип.

По проведенному тестированию GeForce4 Ti4600 оказывается ощутимо быстрее GeForce3 Ti500. Такой впечатляющий отрыв в производительности NV25 был достигнут не благодаря какой-то принципиально новой технологии, а по причине дальнейшей отладки и настройки существующих в GeForce3 (NV20) технологий. Имейте в виду, что ядро GeForce4 всего на 5% больше ядра NV20 при равном техпроцессе (0,15 мкм).

Вершинные шейдеры nfiniteFX II

Читайте так же:

Пиксельное затенение и вершинные эффекты на GeForce3

Технология T&L

Что такое T&L. Часть 1

Что такое T&L. Часть 2

Если вы помните, что понималось под технологией nfiniteFX в GeForce3, то вам будет понятна и nfiniteFX II. nVidia выбрала имя nfiniteFX для своего движка программируемых пиксельных и вершинных шейдеров в GeForce3.

Если вы не знаете, что такое "вершинные шейдеры", то вы можете почитать эту статью.

Если GeForce3 имела только один модуль вершинных шейдеров, то в GeForce4 Ti их уже два. Впрочем, вряд ли вас это удивит, поскольку в чипе nVidia для Microsoft Xbox также присутствует два модуля вершинных шейдеров. Разве что в NV25 модули были улучшены.

Очевидно, что два параллельно работающих модуля вершинных шейдеров могут обработать больше вершин в единицу времени. Для этого чип сам раскладывает вершины на два потока, поэтому новый механизм прозрачен для приложений и API. Диспетчеризация инструкций осуществляется NV25, при этом чип должен убедиться, что каждый модуль вершинных шейдеров работает над своей вершиной. Улучшение модулей вершинных шейдеров со времен GeForce3 привело к уменьшению задержек при обработке инструкций.

В итоге GeForce4 Ti4600 может обработать примерно в 3 раза больше вершин, чем GeForce3 Ti500 по причине наличия двух модулей вершинных шейдеров, их улучшения и работе на более высокой тактовой частоте.

Пиксельные шейдеры nfiniteFX II

Более подробно почитать о пиксельных шейдерах можно здесь.

nVidia смогла улучшить функциональность пиксельных шейдеров в GeForce4 Ti.
Новый чип поддерживает пиксельные шейдеры 1.2 и 1.3, но не расширение ATi 1.4.

Ниже приведены новые режимы пиксельных шейдеров.

OFFSET_PROJECTIVE_TEXTURE_2D_NV
OFFSET_PROJECTIVE_TEXTURE_2D_SCALE_NV
OFFSET_PROJECTIVE_TEXTURE_RECTANGLE_NV
OFFSET_PROJECTIVE_TEXTURE_RECTANGLE_SCALE_NV
OFFSET_HILO_TEXTURE_2D_NV
OFFSET_HILO_TEXTURE_RECTANGLE_NV
OFFSET_HILO_PROJECTIVE_TEXTURE_2D_NV
OFFSET_HILO_PROJECTIVE_TEXTURE_RECTANGLE_NV
DEPENDENT_HILO_TEXTURE_2D_NV
DEPENDENT_RGB_TEXTURE_3D_NV
DEPENDENT_RGB_TEXTURE_CUBE_MAP_NV
DOT_PRODUCT_TEXTURE_1D_NV
DOT_PRODUCT_PASS_THROUGH_NV
DOT_PRODUCT_AFFINE_DEPTH_REPLACE_NV

Мы не будем описывать каждый новый режим, но следует отметить появившуюся в GeForce4 Ti поддержку скорректированного по z наложения неровностей (z-correct bump mapping), что позволяет устранить артефакты, появляющиеся при соприкосновении bump-текстуры с другой геометрией (например, когда вода в озере или реке соприкасается с землей).

Еще одно важное улучшение касается качества текстур, сжатых по DXT1, как вы сможете убедиться на скриншотах ниже.

nVidia в конце концов смогла улучшить конвейер пиксельных шейдеров, что ощутимо отразилось на скорости рендеринга сцен с 3-4 текстурами на пиксель.

Accuview - улучшенное сглаживание

Во время выпуска GeForce3 в прошлом году nVidia анонсировала сглаживание HRAA - сглаживание на высоком разрешении, базирующееся на многосэмпловом полноэкранном сглаживании.

В GeForce4 реализовано сглаживание Accuview, по сути являющееся улучшенным многосэмпловым сглаживанием, как в отношении качества, так и производительности.

Оригинальное сглаживание Quincunx

Accuview используя все суб-пиксели

nVidia сместила позиции сэмплов, что должно улучшить качество сглаживания по причине накопления меньшего количества ошибок, особенно при использовании сглаживания Quincunx. nVidia выпустила документацию по этой процедуре, но вряд ли имеет смысл ее читать, поскольку она мало что объясняет.

Новая технология фильтрации включается каждый раз, когда сэмплы совмещаются на финальном сглаженном кадре, причем технология позволяет экономить одну полную запись в кадровый буфер, что в свою очередь значительно сказывается на производительности сглаживания.

Новое сглаживание 4xS

Как мы уже говорили, Accuview предназначена для улучшения скорости и качества сглаживания. GeForce4 работает с фирменным nVidia Quincunx так же быстро, как и с обычным 2x сглаживанием. Кроме всего прочего, nVidia добавила еще один режим сглаживания, названный 4xS. Он призван улучшить режим сглаживания 4x с помощью 50% увеличения числа суб-сэмплов на пиксель. К сожалению, этот режим работает только в Direct3D, оставляя OpenGL в стороне.

Accuview поддерживает анизотропную фильтрацию, что улучшает вид текстур, простирающихся с заднего плана на передний.

LMA II - новая архитектура памяти

Как нам кажется, именно благодаря улучшениям в архитектуре памяти GeForce4 Ti показывает столь сильный отрыв от GeForce3.

Вкратце упомянем, что в GeForce3/GeForce4 контроллер памяти разделяется на четыре независимых контроллера, каждый из которых использует выделенную 32-битную DDR шину. Все запросы к памяти разделяются между этими контроллерами.

В LMA II практически каждый компонент подвергся улучшениям. Обратите внимание на четыре кэша. Но не думайте, что кэширование - исключительная черта GeForce, поскольку в Radeon 8500 также присутствуют аналогичные кэши. Вообще кэшированию в графических чипах уделяется намного меньше внимания, чем кэшам в процессорах, поскольку их размер не столь велик. Причина этого понятна: графические чипы работают сейчас медленнее шин памяти, в то время как центральные процессоры работают в 2-16 раз быстрее, поэтому кэш играет там намного более важную роль.

Перекрестный контроллер памяти (crossbar memory controller)
В GeForce3 уже присутствует этот контроллер, позволяющий осуществлять 64-битную, 128-битную и обычную 256-битную передачу, что значительно улучшает пропускную способность. В LMA II nVidia улучшила алгоритмы балансировки нагрузки для различных разделов памяти и модернизировала схему приоритетов.
Визуальная подсистема (visibility subsystem) - отбрасывание перекрытых пикселей
Эта технология уже существовала в GeForce3, но в NV25 она была улучшена для более точной отбраковки пикселей с использованием меньшей пропускной способности памяти. Отбраковка сейчас производится с помощью специального кэша на чипе, что позволяет уменьшить обращение к внешней памяти видеокарты. Как показало исследование Anandtech, GeForce4 на 25% лучше отбраковывает пиксели, чем GeForce3 при равной тактовой частоте.
Компрессия Z-буфера без потерь
И опять же, эта возможность существовала в GeForce3, но благодаря новому алгоритму сжатия в LMA II чаще достигается успешная компрессия 4:1.
Кэш вершин
Сохраняет вершины после того как они были посланы по AGP. Благодаря кэшу улучшается использование AGP, поскольку он позволяет избежать передачи одинаковых вершин (например, если примитивы имеют общие границы).
Кэш примитивов
Накапливает примитивы после их обработки (после вершинного шейдера) в фундаментальные примитивы для передачи на модуль установки треугольников.
Двойной кэш текстур
Уже существовал на GeForce3. Новые алгоритмы лучше работают при использовании мультитекстурирования или высококачественной фильтрации. Благодаря этому в GeForce4 Ti значительно улучшена производительность при наложении 3-4 текстур.
Пиксельный кэш
Кэш используется в конце конвейера рендеринга для накопления, очень похожего на функцию <комбинирования записи/write combining> в процессорах Intel/AMD. Кэш накапливает некоторое количество пикселей и потом в пакетном режиме записывает их в память.
Автоматическая предварительная зарядка (pre-charge)
Перед чтением из банка памяти необходимо сделать его предварительную зарядку, что приводит к задержкам. GeForce4 Ti может упреждающе проводить зарядку, используя специальный алгоритм предсказания.
Быстрая Z-очистка (Z-clear)
Эта возможность уже некоторое время известна и используется в других чипах. Первый раз быстрая Z-очистка была задействована в чипе ATi Radeon. Она попросту устанавливает флаг для определенного участка кадрового буфера, так что сейчас вместо заполнения этого участка нулями, можно всего лишь выставить флаг, что позволяет экономить пропускную способность памяти.

nView

Все карты GeForce4 оснащены двумя 350 МГц RAMDAC, равно как имеют поддержку двух TDMS передатчиков для использования двух ЭЛТ или плоских мониторов. Помимо этого nVidia поставляет соответствующее ПО.

Настройка nView чрезвычайно проста

С точки зрения ПО, nVidia виртуально идентичен Hydravision ATi по возможностям, но nVidia смогла улучшить настройку, добавив очень простую установку в 11 шагов. За 11 щелчков мышью любой пользователь сможет настроить что ему надо.

nView позволяет делать окна прозрачными при их переноске с места на место,
хотя с большими окнами эта функция заметно <подтормаживает>

nVidia интегрирует навигацию между рабочими столами в Explorer

Помимо улучшенного процесса установки и настройки, nVidia добавила к nView несколько приятных черт по сравнению с ATi Hydravision. Например, в nView существует возможность, позволяющая вам открывать ссылку в Internet Explorer в новом окне на втором мониторе. Нам очень понравилась эта функция.

Расширения nView появляются практически во всех меню, вызываемых правой клавишей мыши

Конечно, по возможностям nView и Hydravision уступают Matrox, но после использования nView и Hydravision в течение нескольких недель, мы честно можем сказать, что nVidia провела с nView прекрасную работу.

Следующая страница →

⇣ Содержание

Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.

Материалы по теме

«Это тот самый момент»: Сэм Альтман уверен, что человечество достигло точки сингулярности в гонке ИИ

Клиенты «Билайна» столкнулись с массовой кражей мобильных номеров

Китай наладил массовое производство собственных машин для выпуска 7-нм чипов — первые DUV-литографы выйдут уже в этом году

Тестирование GeForce4 Ti и GeForce4 MX