Видеокарты

Двойной удар. Обзор AMD Radeon HD 6950 и Radeon HD 6970

⇣ Содержание

Конец прошлого года и практически весь текущий год на рынке настольной графики правит бал компания AMD со своими ускорителями семейства Evergreen. Выпущенные в сентябре 2009 продукты на базе GPU Cypress, а также их младшие модификации по праву заняли своё место в компьютерах множества пользователей. Естественно, успех ускорителей AMD случайным назвать никак нельзя. Пока NVIDIA решала свои производственные проблемы, пытаясь вывести на рынок ускорители на базе GF100,  AMD уже вовсю продвигала свои DirectX 11-совместимые решения во всех сегментах рынка настольной графики,  активно отвоёвывая рыночную долю у конкурента. Даже появление на свет GeForce GTX 480 не смогло остановить “красный локомотив”, так как новый флагман NVIDIA оказался не так быстр, как того желала публика, кроме того, он был заметно горячее и дороже Radeon HD 5870. Наконец, совсем недавно NVIDIA начала исправлять ситуацию в лучшую для себя сторону.  Серьёзная работа над ошибками, проведённая инженерами компании, позволила новым ускорителям GTX 5xx занять достойное место среди самых производительных настольных решений для ПК. Тем временем фанаты AMD с ехидством потирали руки, ожидая мощного ответа от AMD, способного вернуть «красной графике» чемпионский титул среди одночиповых решений.

Сегодня состоялся официальный анонс видеокарт Radeon HD 6950 и Radeon HD 6970 - именно они, по слухам, воспринимались в качестве ответного удара на выпуск GeForce GTX 570 и GeForce GTX 580. Постараемся разобраться, насколько эффективно новое оружие AMD, и как на самом деле компания позиционирует свои новые продукты.

Итак, вопреки ожиданиям публики, AMD не считает свои новые графические ускорители Radeon HD 6970 и Radeon HD 6950 прямыми конкурентами GeForce GTX 580 и GeForce GTX 570. В противовес самому быстрому ускорителю NVIDIA AMD по-прежнему ставит Radeon HD 5970, который,  как показало наше тестирование, уже далеко не всегда справляется с возложенной на него миссией. В свою очередь Radeon HD 6970, по мнению AMD, должен оказаться быстрее GeForce GTX 570 и немного медленнее GTX 580, а вот для Radeon HD 6950 уготована особая роль - считается, что новинка должна породить свою собственную нишу в иерархии современных 3D-ускорителей.

При разработке новых GPU перед инженерами AMD ставился целый ряд задач:

  • Создание эффективной архитектуры для графических и неграфических вычислений;
  • Достижение высокой геометрической производительности;
  • Внедрение новых режимов качества картинки;
  • Внедрение эффективных методов управления питанием.

С момента появления графического процессора R600, на базе которого строились ускорители серии HD 2900, тогда ещё компания ATI, а ныне компания AMD использует так называемую VLIW-архитектуру (Very Long Instruction Word - Очень длинное машинное слово).

Блок-схема GPU Cypress

Блок-схема GPU Barts

Блок-схема GPU Cayman

Суть работы этой архитектуры заключается в параллельном исполнении ядром сразу нескольких операций одновременно. До сих пор графические процессоры ATI/AMD использовали так называемую VLIW5-архитектуру. Это означало следующее: в GPU Cypress содержалось 20 SIMD ядер, каждое такое ядро содержало по 16 блоков суперскалярных потоковых процессоров (Stream Core).

Внутренняя структура каждого потокового процессора такова:

  • Четыре исполнительных блока + Блок специальной функциональности (SFU или Special Function Unit);
  • Блок ветвлений;
  • Блок регистров общего назначения.

Выходит, что внутри чипа Cypress находится 20*16=320 потоковых процессоров, а учитывая структуру каждого потокового процессора, можно считать, что GPU Cypress содержит 1600 (320*5) скалярных 32-битных потоковых процессоров. Благодаря такому устройству GPU Cypress обладает пиковой вычислительной мощью до 2,7 Тфлопс при расчётах с одинарной точностью и до 544 Гфлопс в операциях с двойной точностью (FP64). Используемая VLIW-архитектура позволяет отказаться от целого ряда сложных узлов внутри GPU, что делает графические чипы AMD достаточно экономичными, особенно в сравнении с топовыми продуктами конкурента. Однако не всё так гладко, как кажется на первый взгляд. Параллельное исполнение вычислительных операций часто заставляет блоки простаивать в ожидании выполнения той или иной операции, когда результат одного вычисления зависит от результата другого. Ручное программирование для чипов с VLIW-архитектурой требует немало усилий, поскольку программисту требуется учитывать огромное количество внутренних зависимостей нитей кода, вследствие чего эффективность вычислений на таких GPU во многом зависит от оптимизации компиляторов. Графические процессоры Cayman, являющиеся сердцем Radeon HD 6950/6970, получили переработанную VLIW-архитектуру, так называемую VLIW4.

Использование VLIW4 позволяет лучше оптимизировать загрузку потоковых процессоров, улучшить функциональность каждого исполнительного блока (Stream Processing Unit – SPU) и избавиться от блока специальной функциональности (SFU (Special Function Unit)), который отвечал за вычисление так называемых трансцендентных функций. В итоге, по заявлениям AMD, графические чипы Cayman обладают повышенной эффективностью из расчёта на 1 кв.мм. площади кристалла. Благодаря переходу на VLIW4 удалось усовершенствовать дизайн ядра, увеличить количество SIMD-ядер, текстурных блоков, а также переработать ряд других блоков GPU.

Эффективность ROP повышена за счет улучшенного объединения операций записи (более эффективной загрузки шины памяти)

В GPU Cayman впервые реализована технология “Asynchronous dispatch”. Прежде графическое ядро имело одну общую очередь команд, поэтому вычислительные и графические задачи выстраивались в эту очередь по принципу ”первый пришел – первым обслужили”. Это напоминает одноядерный центральный процессор со многими ALU, но всего одним декодером. В ускорителях серии Radeon HD 6900 впервые поддерживается асинхронная обработка многих независимых очередей команд. Каждая очередь имеет свой приоритет и свою виртуальную память. Также доступны два независимых полноскоростных контроллера DMA (Direct Memory Access) для одновременного чтения и записи системной памяти по шине PCI-E. Кроме того, вычисления с двойной точностью достигли ¼ от пиковой скорости вычислений с одинарной точностью.

Не секрет, что AMD долго ругали за невысокую скорость обработки геометрии и медленную работу с тесселляцией. По заявлению разработчика, скорость обработки геометрии выросла вдвое, а при включении тесселляции в некоторых случаях достигается почти трёхкратный рост производительности в сравнении с Radeon HD 5870. Такие результаты стали возможны благодаря наращиванию соответствующих функциональных блоков, отвечающих за работу с примитивами, а также использование более совершенного блока тесселляции.

В день анонса серии Radeon HD 6800 был представлен новый метод полноэкранного сглаживания, так называемый Morphological AA. По сути, это специальный пост-фильтр, который сглаживает готовое изображение сразу перед тем, как вывести его на экран. Более подробно с принципом работы MLAA вы можете ознакомиться по ссылке выше, здесь же мы расскажем о новом методе полноэкранного сглаживания, получившем название Enhanced Quality Antialiasing (EQAA). EQAA - новая опция сглаживания, доступная на видеокартах серии Radeon HD 6900.

Включение этого режима удваивает число выборок на пиксель при сохранении того же самого числа выборок цвета/глубины/шаблона. Этот метод предлагает усовершенствованное сглаживание “зазубренных” краев, не требуя дополнительного объема видеопамяти, и с минимальной потерей производительности.

К сожалению, в рамках данного материала мы не будем исследовать на практике скорость и качество полноэкранного сглаживания, введённого специалистами AMD в новых версиях драйверов для Radeon HD 6950/6970, однако в будущем мы ещё вернёмся к этому вопросу.

Пожалуй, для всех современных GPU, особенно для мощных, актуальна проблема высокого тепловыделения. Есть целый ряд методов, позволяющих удержать TDP в разумных пределах, однако многие из них требуют огромных временных и финансовых затрат на внедрение. Инженеры AMD предложили своё решение данной проблемы. Всем известно, что, помимо обычных игровых приложений, существуют ещё так называемые стресс-тесты, которые созданы для того, чтобы максимально нагрузить ускоритель и проверить его на стабильность при работе в экстремальных условиях. Как правило, в играх и других повседневных приложениях, использующих ресурсы GPU, такая нагрузка на графический чип не достигается. Поэтому, для достижения оптимального баланса между тактовой частотой GPU и уровнем TDP, инженеры AMD разработали технологию под названием PowerTune.

В графическом ядре Cayman располагается большое количество специальных блоков, которые отслеживают степень загрузки GPU. Если загрузка превышает определённый порог, то ускоритель автоматически изменяет частоту/напряжение на GPU. Причём все изменения происходят очень быстро, иногда даже по несколько раз в процессе рендеринга одного кадра. Стоит отметить, что AMD PowerTune – аппаратная технология, и скорость переключения режима работы GPU не зависит от драйверов.

На данный момент в драйверах AMD доступна опция, позволяющая сдвинуть порог активации PowerTune, а в будущем появятся утилиты, способные фиксировать все изменения частоты GPU во времени. Предвосхищая вопросы читателей о функции отключения PowerTune, скажем, что такая возможность теоретически есть, но для её реализации потребуется модификация BIOS видеокарты.

Для отвода тепла от Radeon HD 6950/6970 производитель использовал систему охлаждения с испарительной камерой. Это уже не первый случай, когда AMD прибегает к использованию подобной конструкции, а недавно и NVIDIA взяла на вооружение такой подход.

Как известно, некоторые производители видеокарт используют для своих лучших решений две микросхемы BIOS. Такая возможность позволяет энтузиастам более гибко проводить тюнинг своих ускорителей без лишнего риска “убить” карту при прошивке. Отныне подобная технология реализована на серийных видеокартах AMD. Эталонные версии AMD Radeon HD 6950/6970 снабжены двумя микросхемами BIOS, одна из которых защищена от записи, другая же позволяет осуществлять прошивку. На наш взгляд, это весьма полезное решение, особенно для тех, кто любит экспериментировать с частотами и таймингами памяти.

Как и Radeon HD 6850/6870, новые ускорители AMD Radeon HD 6950/6970 поддерживают подключение до шести мониторов к одной плате благодаря поддержке DisplayPort 1.2. Подробнее об этом можно почитать тут.

Наконец, перед тем, как перейти к внешнему осмотру ускорителей Radeon HD 6950/6970, обратимся к сводной таблице с техническими характеристиками и ценами.

Название видеокарты

AMD Radeon HD 5870 1 Гбайт

AMD Radeon HD 6850 1 Гбайт

AMD Radeon HD 6870 1 Гбайт

AMD Radeon HD 6950 2 Гбайт

AMD Radeon HD 6970 2 Гбайт

Кодовое имя ядра

Cypress XT

Barts

Barts XT

Cayman

Cayman XT

Техпроцесс,нм

40

40

40

40

40

Кол-во транзисторов, млн. шт.

2150

1700

1700

2640

2640

Максимальное энергопотребление, Вт (PowerTune Maximum)

188

127

151

200

250

Типичное энергопотребление, Вт

?

?

?

140

190

Энергопотребление в состоянии покоя, Вт

27

19

19

20

20

Частота ядра GPU, МГц

850

775

900

800

880

Кол-во блоков ROP, шт

32

32

32

32

32

Кол-во TMU, шт

80

48

56

88

96

Кол-во универсальных процессоров

1600

960

1120

1408

1536

Частота шейдерного домена, МГц

 

 

 

 

 

Тип видеопамяти

GDDR-5

GDDR-5

GDDR-5

GDDR-5

GDDR-5

Разрядность шины памяти, бит

256

256

256

256

256

Эффективная частота видеопамяти, МГц

4800

 

4000

4200

5000

5500

ПСП видеопамяти, Гбайт/с

153.6

128

134.4

160

176

Примерная розничная стоимость по данным Market 3Dnews / рекомендованная розничная стоимость у.е.

12500

6500

8500

???/ 299

???/
369

Исходя из технических характеристик новинок и памятуя обо всех архитектурных улучшениях в Cayman, мы полагаем, что ускоритель AMD Radeon HD 6950 в целом должен быть примерно на одном уровне по производительности с Radeon HD 5870. Где-то HD 6950 будет быстрее (в случае с тесселляцией - заметно быстрее), где-то медленнее из-за более низкой тактовой частоты графического ядра. В свою очередь Radeon HD 6970 во всех приложениях должен опережать старичка Radeon HD 5870, особенно это касается последних DirectX 11-приложений с поддержкой тесселляции. Если говорить о ценах, то пока данных о розничной стоимости новых ускорителей нет, однако уже сейчас ясно, что новые ускорители AMD окажутся заметно дешевле, чем GeForce GTX 570/580, правда, как нам кажется, по производительности они вряд ли дотянут до уровня флагманских ускорителей NVIDIA. Насколько? Покажет тестирование. А пока переходим к внешнему осмотру героев нашего обзора.

Ускорители AMD Radeon HD 6950/6970 внешне практически ничем не отличаются друг от друга, даже размер плат идентичен. Отличить ускорители можно лишь по наклейке на кожухе СО, а также по разъёмам питания. Ускоритель Radeon HD 6950 питается при помощи двух 6-pin разъёмов PCI-Ex, в свою очередь Radeon HD 6970 требует подключения одного 6-pin и одного 8-pin коннектора.  С обратной стороны платы практически полностью закрыты металлическими пластинами. Судя по всему, это сделано для равномерного распределения тепла по поверхности ускорителя.

Количество и тип разъёмов на панели выводов у Radeon HD 6950 и HD 6970 одинаковы: два разъёма Mini DisplayPort версии 1.2, HDMI 1.4A, 2x DVI (DL-DVI + SL-DVI). В сравнении с Radeon HD 6850/6870 никаких отличий в компоновке портов здесь нет.

Демонтируем систему охлаждения Radeon HD 6950/6970. Конструктив СО обеих видеокарт полностью совпадает. К пластиковому кожуху СО крепится массивная металлическая пластина, которая контактирует с чипами памяти и элементами системы питания через специальные термопрокладки. За отвод тепла от GPU отвечает алюминиевый радиатор, подошвой которого является медная испарительная камера. Контакт с GPU происходит через тонкий слой термопасты.

Radeon HD 6950 сзади

Radeon HD 6950 спереди

Radeon HD 6970 сзади

Radeon HD 6970 спереди

Лишь после демонтажа системы охлаждения видно, что PCB ускорителей немного отличаются по цвету. Текстолит ускорителя Radeon HD 6970 имеет коричневый оттенок, а текстолит Radeon HD 6950 – чёрный. Система питания обеих карт идентична:

  • Volterra VT1156MF - напряжение на GPU (6 фаз).
  • Память - 1 фаза.
  • Vddci (контроллер памяти) - 2 фазы.

На обеих видеокартах установлена память Hynix H5GQ2H24MFR.  Объём памяти каждой из видеокарт составляет 2 Гбайт, номинальная тактовая частота составляет 6 ГГц (QDR).

Следующая страница →
 
⇣ Содержание
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
⇣ Комментарии
window-new
Soft
Hard
Тренды 🔥