Сегодня 20 апреля 2018
18+
MWC 2018
Видеокарты

NVIDIA GF100 – полное описание архитектуры

Следует предупредить сразу – увы, этот материал нельзя назвать полноценным обзором. Пожалуй впервые мы рассказываем о новом графическом процессоре, не имея возможности провести его тестирование и проиллюстрировать теоретические данные результатами испытаний производительности. Впрочем, пока что подобной возможностью могут похвастаться лишь сотрудники компании NVIDIA – видеокарты, построенные на базе нового ГП, недоступны даже для тестовых лабораторий, не говоря уж о покупателях. В то же время, имея на руках подробную информацию об архитектуре нового флагманского ГП NVIDIA, мы, конечно же, не можем не поделиться ею с читателями. Поэтому в этом материале сведем воедино все, что мы знаем о графическом процессоре GF100, получившем уже прозвище «бумажный дракон». Для массового пользователя первым официальным анонсом видеокарты на базе новой архитектуры Fermi следует считать прошедшую недавно в Лас-Вегасе выставку CES 2010. Именно на ней компания впервые продемонстрировала широкой общественности работающий экземпляр GF100, на прошедшей именно там пресс-конференции президент и исполнительный директор NVIDIA Дженсон Хуанг (Jen-Hsun Huang) официально заявил, что начато серийное производство нового ГП, и рассказал о наиболее яркой, пожалуй, этого ГП возможности – технологии 3D Vision Surround. Кроме того, в дни выставки CES 2010 компания NVIDIA провела закрытую техническую конференцию, на которой журналистам была представлена подробная информация о внутренней архитектуре GF100 и возможность собственными глазами увидеть демонстрацию потенциала первых экземпляров видеокарты.
NVIDIA GF100
Однако по-прежнему многое о новом поколении видеокарт калифорнийской компании остается неизвестным. Прежде всего, неизвестным остается официальное название будущей видеокарты – пока что приходится оперировать кодовым именем ГП (GF100) и архитектуры, лежащей в его основе (Fermi). Нет никаких официальных данных и о грядущем модельном ряде. Наконец, ничего не известно о рекомендованной изготовителем розничной стоимости, а ведь это решающий для многих покупателей фактор. Нет данных и о дате официального начала продаж новых видеокарт. Хотя как раз ее угадать совсем несложно – учитывая официальное заявление мистера Дженсона Хуанга о начале серийного производства нового ГП, а так же тот факт, что от старта производства до появления готовых изделий в канале продаж проходит обычно 6-8 недель, стоит предположить, что на полки магазинов GF100 попадет в начале марта. Именно в это время проходит одна из крупнейших ИТ-выставок в мире – германская CeBit, на которой компания NVIDIA уже представляла свои новые продукты. В этом году CeBit стартует 2 марта – скорее всего, именно эта дата станет днем официального анонса и начала продаж GF100.

#Ключевые особенности

На прошедшей в Лас-Вегасе закрытой технической конференции (она называлась GF100 Deep Dive) инженеры NVIDIA, руководившие проектом GF100, рассказали об основных целях, которые были поставлены перед ними при разработке нового ГП. В качестве четырех важнейших особенностей GF100 были названы:
  • реалистичность геометрии
  • улучшенное качество изображения
  • высокая производительность при дополнительных вычислениях
  • рекордная мощность ГП
Прежде, чем подробно рассказать, что разработчики понимают под каждым из этих пунктов, остановимся на общих характеристиках нового ГП.
GF100s.png
Итак, GF100 – это:
  • 512 CUDA-процессоров
  • 16 геометрических блоков
  • 4 блока растеризации
  • 64 текстурных блока
  • 48 модулей ROP
  • 384-битный интерфейс памяти GDDR5
Стоит отдельно отметить, что GF100 станет первым графическим процессором NVIDIA старшего уровня, изготовленным по 40-нм проектным нормам. В то время как собственные производственные мощности AMD/ATI позволили уже достаточно давно освоить 40-нм техпроцесс, NVIDIA не торопилась с переходом на новую технологию, отрабатывая ее на моделях младшего уровня. Возможно, в этом вопросе калифорнийская компания стала заложником своего главного производственного партнера – компании TSMC и именно из-за проблем с освоением новых проектных норм так задержался выпуск нового флагмана NVIDIA. Так или иначе, но как уже сказано выше, к настоящему моменту все проблемы преодолены, и массовое производство GF100 уже началось. Хотя среди белых пятен в информации о GF100 есть и некоторые ключевые характеристики – тактовые частоты ядра и памяти нового ГП – все же попробуем сравнить новый ГП с текущими флагманами ATI (Cypress, RADEON HD 5870) и NVIDIA (GT200, GeForce GTX 285).
NVIDIA GF100NVIDIA GT200ATI Cypress
Технология производства, нм405540
Кол-во вычислительных блоков512240320 (1600)
Частота ядра, МГцНД648850
Частота памяти, МГцНД24844800
Ширина шины памяти, бит384512256
Тип памятиGDDR5GDDR3GDDR5
DirectX111011
Даже краткое сравнение ключевых характеристик позволяет предположить, что инженеры NVIDIA действительно ориентировались на достижение рекордной мощности и у GF100 есть все шансы стать самым высокопроизводительным графическим решением для настольных компьютеров. По некоторым параметрам современный флагман NVIDIA (GT200) до сих пор был в роли догоняющего (отсутствие поддержки DirectX 11, более «грубый» техпроцесс, на 30% меньшее количество вычислительных блоков). С появлением GF100 компания NVIDIA делает большой шаг вперед – первое DX11-решение компании при аналогичном технологическом процессе имеет на 60% больший вычислительный потенциал (разумеется, в данном случае мы имеем в виду количество ядер CUDA – финальная же мощность определяется как частотами, так и особенностями архитектуры) и, соответственно, большую пропускную способность шины памяти. По сравнению же с GT200 количество вычислительных блоков выросло более чем в два раза! Что касается частотного потенциала GF100, то рискнем предположить, что с переходом на 40-нм проектные нормы, этот ГП быстро сравняется с решениями основного конкурента, ведь и на 55-нм техпроцессе инженерам NVIDIA удалось добиться неплохого потенциала.

#Геометрия

Не лишним будет вспомнить, что именно компания NVIDIA вот уже более 10 лет назад реализовала обработку геометрических данных на аппаратном уровне в видеокарте. До 1999 года и первой модели под маркой GeForce геометрическая информация сцены обрабатывалась центральным процессором. Перенос блока T&L в графическое ядро позволил заметно ускорить обработку трехмерных сцен – в современных играх количество полигонов в сцене исчисляется уже миллионами, в то время как десять лет назад оно составляло в лучшем случае десятки тысяч. Тем не менее, по словам разработчиков NVIDIA, потенциал современных программируемых ГП по обработке геометрических данных используется недостаточно активно. Так, например, GeForce GTX 285 в 150 раз превосходит GeForce FX по скорости закрашивания и вывода пикселей, но лишь в 3 раза по мощности геометрической подсистемы. Это не только вынуждает разработчиков игр использовать более простые объекты, но и делает невозможным реалистичное отображение таких сложных объектов, как вода или, например, волосы. В GF100 внесено множество усовершенствований, направленных на обработку сложной графической информации и на массовое применение такой техники как тесселяция. В настоящее время все объекты и персонажи игр разрабатываются в программах трехмерного моделирования. Дизайнеры должны вручную создавать несколько моделей с разным уровнем деталей (LOD, Level Of Details), используя ту или иную в зависимости от удаленности объекта от переднего края игровой сцены. Учитывая, что каждый объект передается в ГП заново для каждого кадра, требуются достаточно сложные алгоритмы для использования модели с оптимальным в данный момент уровнем детализации. Причем существенное ограничение накладывает не только предельная производительность ГП при обработке геометрической информации, но и пропускная способность PCI Express.
figure14_01s.png
Метод тесселяции, основанный на картах смещения, позволяет в значительной степени обойти эту проблему. Напомним, что карта смещения – это монохромная текстура, используемая не для закрашивания полигона, а для изменения его геометрических свойств. Яркость каждой точки на этой текстуре определяет отклонение (высоту) это точки над исходной поверхностью. В отличие от традиционных методов, когда объем имитируется обычными плоскими текстурами, тесселяция позволяет получить гораздо более сложные и естественно выглядящие объекты, правильно рассчитывать тени и т.п. Огромное преимущество карт смещения в том, что они позволяют создать универсальную модель, уровень детализации которой определяется лишь используемой картой смещения. Важно также, что по сути карта смещения – это обычная текстура, методы оптимизации и компрессии которой уже давно и успешно отработаны. В графическом процессоре GF100 реализованы средства аппаратной поддержки теселляции, причем инженеры NVIDIA уделили этому аспекту максимум внимания. Но, обо всем по порядку.
Следующая страница →
 
Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
⇣ Комментарии