Следует предупредить сразу – увы, этот материал нельзя назвать полноценным обзором. Пожалуй впервые мы рассказываем о новом графическом процессоре, не имея возможности провести его тестирование и проиллюстрировать теоретические данные результатами испытаний производительности. Впрочем, пока что подобной возможностью могут похвастаться лишь сотрудники компании NVIDIA – видеокарты, построенные на базе нового ГП, недоступны даже для тестовых лабораторий, не говоря уж о покупателях. В то же время, имея на руках подробную информацию об архитектуре нового флагманского ГП NVIDIA, мы, конечно же, не можем не поделиться ею с читателями. Поэтому в этом материале сведем воедино все, что мы знаем о графическом процессоре GF100, получившем уже прозвище «бумажный дракон».
Для массового пользователя первым официальным анонсом видеокарты на базе новой архитектуры Fermi следует считать прошедшую недавно в Лас-Вегасе выставку CES 2010. Именно на ней компания впервые
продемонстрировала широкой общественности работающий экземпляр GF100, на прошедшей именно там пресс-конференции президент и исполнительный директор NVIDIA Дженсон Хуанг (Jen-Hsun Huang)
официально заявил, что начато серийное производство нового ГП, и рассказал о наиболее яркой, пожалуй, этого ГП возможности – технологии 3D Vision Surround. Кроме того, в дни выставки CES 2010 компания NVIDIA провела закрытую техническую конференцию, на которой журналистам была представлена подробная информация о внутренней архитектуре GF100 и возможность собственными глазами увидеть демонстрацию потенциала первых экземпляров видеокарты.
Однако по-прежнему многое о новом поколении видеокарт калифорнийской компании остается неизвестным. Прежде всего, неизвестным остается официальное название будущей видеокарты – пока что приходится оперировать кодовым именем ГП (GF100) и архитектуры, лежащей в его основе (Fermi). Нет никаких официальных данных и о грядущем модельном ряде. Наконец, ничего не известно о рекомендованной изготовителем розничной стоимости, а ведь это решающий для многих покупателей фактор.
Нет данных и о дате официального начала продаж новых видеокарт. Хотя как раз ее угадать совсем несложно – учитывая официальное заявление мистера Дженсона Хуанга о начале серийного производства нового ГП, а так же тот факт, что от старта производства до появления готовых изделий в канале продаж проходит обычно 6-8 недель, стоит предположить, что на полки магазинов GF100 попадет в начале марта. Именно в это время проходит одна из крупнейших ИТ-выставок в мире – германская CeBit, на которой компания NVIDIA уже представляла свои новые продукты. В этом году CeBit стартует 2 марта – скорее всего, именно эта дата станет днем официального анонса и начала продаж GF100.
⇡#Ключевые особенности
На прошедшей в Лас-Вегасе закрытой технической конференции (она называлась GF100 Deep Dive) инженеры NVIDIA, руководившие проектом GF100, рассказали об основных целях, которые были поставлены перед ними при разработке нового ГП. В качестве четырех важнейших особенностей GF100 были названы:
- реалистичность геометрии
- улучшенное качество изображения
- высокая производительность при дополнительных вычислениях
- рекордная мощность ГП
Прежде, чем подробно рассказать, что разработчики понимают под каждым из этих пунктов, остановимся на общих характеристиках нового ГП.
Итак, GF100 – это:
- 512 CUDA-процессоров
- 16 геометрических блоков
- 4 блока растеризации
- 64 текстурных блока
- 48 модулей ROP
- 384-битный интерфейс памяти GDDR5
Стоит отдельно отметить, что GF100 станет первым графическим процессором NVIDIA старшего уровня, изготовленным по 40-нм проектным нормам. В то время как собственные производственные мощности AMD/ATI позволили уже достаточно давно освоить 40-нм техпроцесс, NVIDIA не торопилась с переходом на новую технологию, отрабатывая ее на моделях младшего уровня. Возможно, в этом вопросе калифорнийская компания стала заложником своего главного производственного партнера – компании TSMC и именно из-за проблем с освоением новых проектных норм так задержался выпуск нового флагмана NVIDIA. Так или иначе, но как уже сказано выше, к настоящему моменту все проблемы преодолены, и массовое производство GF100 уже началось.
Хотя среди белых пятен в информации о GF100 есть и некоторые ключевые характеристики – тактовые частоты ядра и памяти нового ГП – все же попробуем сравнить новый ГП с текущими флагманами ATI (Cypress, RADEON HD 5870) и NVIDIA (GT200, GeForce GTX 285).
| NVIDIA GF100 | NVIDIA GT200 | ATI Cypress |
Технология производства, нм | 40 | 55 | 40 |
Кол-во вычислительных блоков | 512 | 240 | 320 (1600) |
Частота ядра, МГц | НД | 648 | 850 |
Частота памяти, МГц | НД | 2484 | 4800 |
Ширина шины памяти, бит | 384 | 512 | 256 |
Тип памяти | GDDR5 | GDDR3 | GDDR5 |
DirectX | 11 | 10 | 11 |
Даже краткое сравнение ключевых характеристик позволяет предположить, что инженеры NVIDIA действительно ориентировались на достижение рекордной мощности и у GF100 есть все шансы стать самым высокопроизводительным графическим решением для настольных компьютеров. По некоторым параметрам современный флагман NVIDIA (GT200) до сих пор был в роли догоняющего (отсутствие поддержки DirectX 11, более «грубый» техпроцесс, на 30% меньшее количество вычислительных блоков). С появлением GF100 компания NVIDIA делает большой шаг вперед – первое DX11-решение компании при аналогичном технологическом процессе имеет на 60% больший вычислительный потенциал (разумеется, в данном случае мы имеем в виду количество ядер CUDA – финальная же мощность определяется как частотами, так и особенностями архитектуры) и, соответственно, большую пропускную способность шины памяти. По сравнению же с GT200 количество вычислительных блоков выросло более чем в два раза! Что касается частотного потенциала GF100, то рискнем предположить, что с переходом на 40-нм проектные нормы, этот ГП быстро сравняется с решениями основного конкурента, ведь и на 55-нм техпроцессе инженерам NVIDIA удалось добиться неплохого потенциала.
⇡#Геометрия
Не лишним будет вспомнить, что именно компания NVIDIA вот уже более 10 лет назад реализовала обработку геометрических данных на аппаратном уровне в видеокарте. До 1999 года и первой модели под маркой GeForce геометрическая информация сцены обрабатывалась центральным процессором. Перенос блока T&L в графическое ядро позволил заметно ускорить обработку трехмерных сцен – в современных играх количество полигонов в сцене исчисляется уже миллионами, в то время как десять лет назад оно составляло в лучшем случае десятки тысяч. Тем не менее, по словам разработчиков NVIDIA, потенциал современных программируемых ГП по обработке геометрических данных используется недостаточно активно. Так, например, GeForce GTX 285 в 150 раз превосходит GeForce FX по скорости закрашивания и вывода пикселей, но лишь в 3 раза по мощности геометрической подсистемы. Это не только вынуждает разработчиков игр использовать более простые объекты, но и делает невозможным реалистичное отображение таких сложных объектов, как вода или, например, волосы. В GF100 внесено множество усовершенствований, направленных на обработку сложной графической информации и на массовое применение такой техники как тесселяция.
В настоящее время все объекты и персонажи игр разрабатываются в программах трехмерного моделирования. Дизайнеры должны вручную создавать несколько моделей с разным уровнем деталей (LOD, Level Of Details), используя ту или иную в зависимости от удаленности объекта от переднего края игровой сцены. Учитывая, что каждый объект передается в ГП заново для каждого кадра, требуются достаточно сложные алгоритмы для использования модели с оптимальным в данный момент уровнем детализации. Причем существенное ограничение накладывает не только предельная производительность ГП при обработке геометрической информации, но и пропускная способность PCI Express.
Метод тесселяции, основанный на картах смещения, позволяет в значительной степени обойти эту проблему. Напомним, что карта смещения – это монохромная текстура, используемая не для закрашивания полигона, а для изменения его геометрических свойств. Яркость каждой точки на этой текстуре определяет отклонение (высоту) это точки над исходной поверхностью. В отличие от традиционных методов, когда объем имитируется обычными плоскими текстурами, тесселяция позволяет получить гораздо более сложные и естественно выглядящие объекты, правильно рассчитывать тени и т.п. Огромное преимущество карт смещения в том, что они позволяют создать универсальную модель, уровень детализации которой определяется лишь используемой картой смещения. Важно также, что по сути карта смещения – это обычная текстура, методы оптимизации и компрессии которой уже давно и успешно отработаны. В графическом процессоре GF100 реализованы средства аппаратной поддержки теселляции, причем инженеры NVIDIA уделили этому аспекту максимум внимания. Но, обо всем по порядку.
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.