Новости Hardware

NVIDIA представила ускорители нового поколения GeForce GTX 980 и GTX 970

Как и ожидалось, NVIDIA представила два новых флагманских ускорителя, основанных на 28-нм чипе GM204 площадью 398 мм2 — GeForce GTX 980 и GTX 970. Компания отмечает, что это первые видеокарты, использующие полноценную реализацию архитектуры NVIDIA 10 поколения с кодовым именем Maxwell, несмотря на присутствующую на рынке GeForce GTX 750 Ti. Основные преимущества — повышенная производительность, очень высокая энергоэффективность, оптимизации для работы со шлемами виртуальной реальности и существенное повышение качества освещения благодаря технологии VXGI.

GM204 спроектирован с прицелом на визуализацию игр в высоких разрешениях 4K — GPU поддерживает разрешения до 5120×3200 @60 Гц и стандарт HDMI 2.0. GeForce GTX 980 может одновременно работать с тремя дисплеями, поддерживающими технологию синхронизации кадров NVIDIA G-SYNC.

Блок-схема чипа GM204

Кроме того, GM204 оснащается улучшенным аппаратным блоком обработки видео NVENC, который получил поддержку кодирования и декодирования H.265 (HEVC) и увеличил производительность кодирования видео H.264 в 2,5 раза по сравнению с Kepler, благодаря чему ускорители способны в потоковом режиме кодировать видео 4K с частотой 60 кадров/с.

При этом чип включает новую технологию полноэкранного сглаживания Dynamic Super Resolution (динамическое сверхразрешение, DSR) для экранов с разрешением ниже 4K. Например, игра думает, что вывод происходит на дисплей 4K, ускоритель честно визуализирует в высоком разрешении c MSAA или FXAA, а затем осуществляет при выводе уменьшение картинки до родного разрешения монитора 1080p с использованием продвинутых фильтров, позволяющих оптимальным образом сохранить информацию о высоком разрешении и минимизировать артефакты алиасинга.

Скриншот Dark Souls 2. Стандартное разрешение 1080p (с полноэкранным сглаживанием) слева и режим DSR справа

Кроме того, инженеры NVIDIA представили ещё один алгоритм полноэкранного сглаживания — Multi-Frame Sampled AA (MFAA), который меняет шаблоны AA при сглаживании граней объектов не только в пространстве, но и во времени для достижения максимально качественного результата. В результате качество приближается к 8xAA при затратах производительности 4xAA (или качество 4xAA при производительности 2xAA). Разработка MFAA ещё не окончена NVIDIA.

Среднее превосходство GeForce GTX 980 над GTX 680 в различных играх в максимальном качестве и полноэкранном сглаживании MSAA при росте разрешения

Среднее превосходство GeForce GTX 980 над GTX 680 в различных играх в максимальном качестве и полноэкранном сглаживании MFAA при росте разрешения

Архитектура Maxwell разработана, чтобы существенно увеличить производительность, принципиально повысив при этом энергоэффективность. Изначально NVIDIA разработала эти оптимизации для графики своей однокристальной системы Tegra K1, затем использовала их в видеокарте GeForce GTX 750 Ti, а теперь дополнительно улучшила в чипе GM204 — в новых ускорителях Maxwell демонстрирует 2-кратный прирост производительности на Ватт по сравнению с продуктами поколения Kepler:

Освещение — самая большая проблема компьютерной графики на пути к реализму. Глобальная модель освещения позволила видеокартам ближе подойти к достижению реализма, но по-настоящему динамическое глобальное освещение в реальном времени до сих пор было непрактичным. NVIDIA утверждает, что её новая технология глобального освещения Voxel Global Illumination (VXGI) является большим шагом вперёд.

VXGI основана на концепции, разработанной исследователем из NVIDIA Кириллом Крассиным (Cyril Crassin) и предусматривающей использование 3D-структур данных (вокселов) для захвата сферы действия и информации об освещении в каждой точке сцены. Эти данные затем на финальной стадии визуализации могут быть обработаны для точного определения влияния отражённых пучков света на различные участки сцены. Это нечто среднее между полноценной трассировкой лучей и растровыми методами.

В изначальной концепции вокселы хранились в октадереве и алгоритм мог успешно работать на GeForce GTX 680 с некоторыми ограничениями. NVIDIA потратила три года на улучшение алгоритма и разработку технологии, которая могла бы ускоряться с помощью GPU. Результатом и стала технология VXGI, которая может работать на любых GPU, но аппаратное ускорение поддерживается только на последних чипах Maxwell. VXGI будет поддерживаться в Unreal Engine 4 и других популярных движках начиная с последнего квартал этого года.

Существенным образом были переработаны блоки тесселяции. NVIDIA обещает, что благодаря увеличению количества вычислительных блоков PolyMorph Engine и архитектурным оптимизациям производительность тесселяции GeForce GTX 980 окажется в три раза выше, чем у GTX 680:

Первыми ускорителями на основе GM204 станут флагманский GeForce GTX 980 и более простой GTX 970. NVIDIA обещает выпустить в перспективе и другие видеокарты на базе этого чипа. Ускоритель GeForce GTX 980, как отмечает компания, является самым быстрым GPU в мире, отличаясь при этом энергопотреблением всего 165 Вт.

GeForce GTX 980 может предложить 2048 потоковых процессоров (ядер CUDA), 128 текстурных блоков и 64 блока растеризации (ROP). Таким образом, число ROP по сравнению с предыдущим поколением было удвоено с целью увеличения производительности в режимах полноэкранного сглаживания и высокого разрешения.

Благодаря целому ряду оптимизаций каждый потоковый процессор Maxwell может обеспечить примерно в 1,4 раза более высокую производительность по сравнению с процессором Kepler. Другими словами, 2048 потоковых процессоров Maxwell равны примерно 2870 таковым у архитектуры Kepler. Насколько заявленные изготовителем данные подтверждаются результатами тестов, вы можете выяснить, прочитав наш подробнейший обзор эталонной видеокарты GeForce GTX 980.  

При этом GPU работает на частоте 1126 МГц (в Boost-режиме — 1216 МГц), а 4 Гбайт видеопамяти GDDR5 — на эффективной частоте 7 ГГц (1750 МГц). Шина памяти осталась, как и GTX 680, 256-битной. Однако подсистема памяти была переработана: объём универсальной кеш-памяти L2 увеличен до 2 Мбайт, благодаря чему снизится число запросов к памяти; также был улучшен алгоритм сжатия памяти, за счёт чего снижены требования к пропускной способности. В результате Maxwell примерно на 25% менее требовательна к пропускной способности памяти по сравнению с Kepler:

Карта потребляет до 165 Вт энергии и требует подключения двух дополнительных 6-контактных разъёмов внешнего питания. Теоретическая производительность в операциях с плавающей запятой — 5 терафлопс, в наличии три выхода DisplayPort 1.2, один HDMI 2.0 и один DL-DVI.

В ускорителе GeForce GTX 970 количество активных вычислительных блоков — 13 из 16. Поэтому меньше и количество потоковых процессоров — «всего» 1664, работающих на частоте 1050 МГц (в Boost-режиме — 1178 МГц). Ускоритель также оснащён 256-битной шиной и 4 Гбайт оперативной памяти, которая работает на той же частоте 7 ГГц (1750 МГц). Теоретическая производительность в операциях с плавающей запятой — 4 терафлопса, в наличии также три выхода DisplayPort 1.2, один HDMI 2.0 и один DL-DVI.

Рекомендуемая розничная стоимость нового флагманского ускорителя GeForce GTX 980 на рынке США составит $550, цена GeForce GTX 970 будет заметно более привлекательной — $330. Кроме того, NVIDIA снизила цену GeForce GTX 760 до $220 и сообщила о прекращении выпуска ускорителей GeForce GTX 780 Ti, GTX 780 и GTX 770.

Более подробный рассказ о новинке  и практическое исследование ее производительности в самых разных классах задач вы найдете в нашем обзоре эталонной видеокарты GeForce GTX 980.  

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥