Сегодня 20 сентября 2017
18+
Процессоры и память

AMD Trinity для десктопа. Часть 1. Графическое ядро

Ни у кого не возникает сомнений в том, что наиболее быстродействующие процессоры для персональных компьютеров поставляет на сегодняшний день отнюдь не компания AMD. И такая ситуация сложилась далеко не вчера. С тех пор как Intel перешла от Pentuim 4 к выпуску различных процессоров рода Core, предложения AMD скатились на вторые позиции. Фактически вся сегодняшняя процессорная продукция этой компании представляет собой либо бюджетные, либо какие-то узкоспециализированные решения, малоинтересные для широкого круга пользователей, ставящих высокую производительность во главу угла. Однако невысокие показатели быстродействия выпускаемых процессоров, так же как и сокращение рыночной доли, – это совсем не повод поставить крест на результатах работы процессорного подразделения AMD.

Инженеры этой фирмы славятся тем, что способны время от времени выдавать какие-то оригинальные идеи, позволяющие AMD не просто поддержать своё рыночное положение, но и оказать немалое влияние на всю индустрию в целом. За примерами таких идей далеко ходить не надо: 64-битные расширения микроархитектуры x86, многоядерный дизайн CPU, интеграция в процессор контроллера памяти и северного моста чипсета – все эти решения первой разработала и внедрила именно AMD, а не текущий лидер процессоростроения.

Именно поэтому мы продолжаем пристально следить за тем, какие нововведения вызревают в недрах AMD. И похоже, к настоящему моменту компания вновь нащупала плодотворный вектор развития, который способен придать положительный импульс не только ей самой, но и всему процессорному рынку в целом. Вектор этот – APU (Accelerated Processing Unit, «ускоренное процессорное устройство») – идеология, предусматривающая объединение на одном полупроводниковом кристалле традиционных вычислительных ядер с производительным графическим ядром. Причём не простое соседство, а симбиоз – возможность объединения их ресурсов для решения общих задач.

К классу APU можно отнести несколько разнообразных предложений AMD, выпущенных ещё в 2011 году. Наибольший интерес среди них представляют гибридные процессоры A-серии с кодовым именем Llano, служащие базисом платформ Lynx и Sabine и ориентированные на применение в широком спектре настольных и мобильных систем. Несмотря на то, что эти процессоры и платформы служат лишь «пробным шаром», так как на них происходит только обкатка принципов APU, они были достаточно тепло приняты рынком. Особенно востребованными Llano оказались в мобильном сегменте, что тут же отразилось в увеличении присутствия продукции AMD в современных ноутбуках. И это действительно видно невооружённым глазом. Если ещё пару лет назад мобильные платформы AMD встречались в составе очень немногочисленных предложений, то сегодня купить ноутбук, основанный на процессоре этого производителя, не составляет никакого труда. В любом компьютерном магазине вы с лёгкостью найдёте огромное число предложений, оснащённых APU разработки AMD.

Впрочем, повышенный интерес к процессорам AMD, наблюдаемый на рынке мобильных компьютеров, возник вовсе не из-за их гибридности. Его, скорее, следует понимать как побочный эффект. В реальности же дело в том, что достаточно мощное графическое ядро, скомпонованное с приемлемыми по меркам мобильных решений вычислительными ядрами, – это как раз то, чего не хватает в ассортименте Intel. А если принять во внимание очень демократичные цены, установленные компанией AMD на свои APU, то совершенно неудивительно, что в недорогие ноутбуки они вписались идеально, дав тем самым производителям оных возможность собирать компьютеры современного уровня без установки в них дискретных видеоускорителей и сопряженных с этим дополнительных затрат.

В результате в народ пошла и сама концепция APU. Её проповедники от AMD, общаясь с разработчиками программного обеспечения, получили возможность опираться на актуальность и распространённость, и в конце концов в распоряжении пользователей появились и реальные программы, рассчитанные на полноценное использование ресурсов гибридных процессоров. Майское же обновление A-серии мобильных процессоров AMD дизайном Trinity, в рамках которого была увеличена производительность как вычислительной, так и графической частей APU, стало дополнительным аргументом в пользу жизнеспособности и привлекательности концепции. Так что в дальнейшем доля ноутбуков с логотипом AMD Vision будет только увеличиваться.

С десктопными же процессорами AMD класса APU случилась совсем иная история. Требования пользователей настольных систем существенно отличаются от запросов владельцев ноутбуков, и тема APU их особо не заинтересовала с самого начала. Движущей силой проникновения первых поколений гибридных процессоров в ноутбуки выступала достаточно мощная графика, однако при её использовании в настольных компьютерах от этого эпитета нужно отказаться. Дело в том, что для десктопов характерны гораздо более высокие разрешения экрана, в которых процессоры AMD A-серии приемлемого уровня 3D-производительности не развивают. Иными словами, с точки зрения пользователей десктопов графическое ядро процессоров Llano качественно мало отличается от встроенной графики интеловских предложений: оба варианта для геймерской системы начального уровня подходят почти одинаково плохо. Мощность же вычислительных ядер, которыми располагают гибридные процессоры AMD, существенно ниже, чем у процессоров Intel, и это закрывает Llano путь в целый ряд домашних или офисных систем. Даже в роли сердца медиацентров у APU компании AMD не слишком много шансов перед конкурирующими предложениями. В этом случае их подводит слишком высокое тепловыделение и отсутствие средств, позволяющих ускорять кодирование видеоконтента высокого разрешения.

Однако самым грандиозным препятствием на пути Llano в настольные компьютеры стала специально разработанная для них платформа Socket FM1 с совершенно неясными перспективами. Никакие иные процессоры, кроме Llano, установить в неё невозможно, и это делает её «вещью в себе», с одной стороны, не склонной к последующему апгрейду, а с другой – с очень ограниченным сроком жизни. Вполне закономерно, что заинтересовать решением с таким сочетанием характеристик пользователей настольных систем практически невозможно, ведь рынок наводнён конкурирующими LGA1155-предложениями на любой вкус и кошелёк с куда более продолжительным жизненным циклом.

Но отдавать рынок интегрированных настольных процессоров во власть конкурента, который, видя перспективность концепции APU, в спешном порядке наращивает мощности собственных графических ядер, в планы AMD явно не входит. Поэтому, спустя примерно год с появления Llano, компания готова предложить второе поколение десктопных процессоров A-серии, исправленное и переработанное. Дизайн новых десктопных APU не является специализированным и утилитарным. Это – Trinity, и он уже обкатан на мобильных системах, где успешно применяется с начала лета. Однако для настольных систем серьёзно увеличены частоты вычислительной и графической составляющих, что позволяет производителю уверять общественность в том, что свежие APU, в отличие от их предшественников, должны понравиться многим пользователям десктопов, в том числе и энтузиастам.

В целом мы почти готовы поверить в слова AMD: по крайней мере, по дизайну Trinity однозначно лучше Llano. Как мы уже видели на примере мобильных APU, используемые в Trinity вычислительные ядра, которые основаны на микроархитектуре Piledriver, работают побыстрее ядер Husky из Llano, корни микроархитектуры которых уходят в далёкое прошлое. Существенно поднялась и производительность графического ядра, строение которого коренным образом переработано. И самое главное, для десктопных процессоров Trinity теперь предлагается новая платформа Socket FM2, которая должна быть лишена всех старых недостатков. AMD готова гарантировать её устойчивость в течение нескольких последующих лет, а модельный рад процессоров в совместимом с ней исполнении будет включать широкий диапазон предложений разного уровня.

Иными словами, если сравнивать Trinity и Llano, то новые процессоры очевидно лучше. Однако достаточно ли они хороши для того, чтобы результативно продвинуть концепцию APU в настольные системы, пользователи которых пока что относятся к подобным решениям очень скептически? В нашем материале мы попробуем частично дать ответ на этот вопрос, для чего подробно протестируем графическую составляющую настольных гибридных процессоров нового поколения и попробуем понять, хватает ли её мощности для применения в игровых системах начального уровня.

К сожалению, подробное рассмотрение второй части Trinity – вычислительных ядер – мы вынуждены отложить на некоторое время. Однако в этом нет нашей вины. Дело в том, что компания AMD пока официально не анонсировала свои новые процессоры A-серии для настольных систем. Поэтому наши руки частично связаны обязательствами о неразглашении, так что за этой статьей последует и вторая, включающая тесты другого плана. Впрочем, никто не запрещает нам оперировать имеющейся информацией о микроархитектуре Trinity, поэтому для начала давайте проанализируем, какую работу проделали инженеры AMD для того, чтобы новоиспечённые APU стали реальностью.

#Дизайн Trinity

В соответствии с оригинальной концепцией любой APU состоит из трёх основных частей. В этом плане Trinity не привносит никаких изменений: гибридные процессоры нового поколения включают процессорные ядра, интегрированный графический ускоритель и небольшой, но очень важный компонент – объединённый северный мост. Именно он превращает сумму разнородных ядер в единую систему и, включая контроллер DDR3 SDRAM, отвечает за взаимодействие вычислительных и графических ядер между собой и с системной памятью, обеспечивая возможность их совместной работы с одними и теми же данными.

В целом общая структура Trinity осталась точно такой же, как и у Llano, но вот на более низком уровне все составляющие переработаны. При этом все изменения сделаны таким образом, чтобы не раздувать полупроводниковый кристалл: производственная технология у AMD не обновилась, компания продолжает использовать 32-нм процесс Globalfoundries с SOI, а поднимать себестоимость APU, позиционируемых в качестве достаточно доступных предложений, производитель не собирается. В результате площадь кристалла Trinity по сравнению с Llano возросла лишь на 8 процентов – до 246 мм2. Количество транзисторов изменилось также весьма незначительно и достигло 1,303 млрд штук (было – 1,178 млрд). Более того, не сильно трансформировалось даже деление транзисторного бюджета между вычислительными и графическими ресурсами: они занимают на кристалле примерно одинаковую площадь и в том и в другом случае.

Тем не менее на этом разговоры о похожести Llano и Trinity можно и закончить. Вычислительные ядра, например, с выходом нового поколения APU изменены кардинально. Теперь в основе гибридных процессоров используется (и будет использоваться в дальнейшем) микроархитектура Bulldozer, а конкретнее, её второе поколение – Piledriver. Двухъядерники и четырёхъядерники Trinity включают в себя один или два условно называемых двухъядерными модуля, которые, напомним, содержат по два набора исполнительных устройств и могут обрабатывать по два потока одновременно, но при этом имеют общие на модуль кеш-память, блок выборки инструкций, их декодер и блок операций с плавающей точкой. При этом в Trinity по сравнению с основанными на микроархитектуре Bulldozer процессорами класса FX без встроенной графики не только уменьшено количество ядер, но и отсутствует кеш третьего уровня.

Зато используемое в новых APU второе поколение микроархитектуры Bulldozer, пока что не представленное ни в одном другом семействе процессоров, предлагает целый ряд небольших усовершенствований, направленных на увеличение производительности, уменьшение токов утечки и обеспечение стабильности на высоких тактовых частотах. Фронтальная часть конвейера получила более точный предсказатель ветвлений, а также окно инструкций увеличенного размера. Исполнительные устройства обрели улучшенный планировщик, а сами они научились немного быстрее выполнять отдельные инструкции, например целочисленное и вещественночисленное деление. Кроме того, разработчики говорят об увеличении ёмкости L1 TLB и о совершенствовании алгоритмов арбитража и предварительной выборки данных L2-кеша. Всё это оценено в примерно 25-процентное превосходство (по расчётам AMD) процессоров Trinity над Llano в вычислительной производительности.

Кардинальные изменения затронули и объединённый северный мост. В первую очередь инженеры пересмотрели систему приоритетов доступа к разделяемой памяти, отдав первенство вычислительным ядрам, которые, как показывает практика, генерируют относительно небольшую часть запросов. Помимо этого, AMD позаботилась и о поддержке новых типов памяти, включая DDR3-1866 в штатном режиме или DDR3-2400 при разгоне. Внутренние шины данных были расширены, в частности, графическое ядро получило возможность работать с контроллером памяти по 256-битной специализированной шине Radeon Memory Bus, а вне чипа все соединения теперь используют протокол PCI Express, пришедший на смену Hyper-Transport.

Однако наибольший интерес вызывают изменения, произошедшие с графическим ядром. Дело в том, что без существенного увеличения транзисторного бюджета и без коренной переработки архитектуры у AMD получилось заметно поднять его быстродействие, то есть фактически нарастить плотность полезных блоков в GPU за счёт упразднения каких-то излишков. Эта находка, пожалуй, заслуживает отдельного разговора, тем более что именно интегрированная в Trinity графика сегодня находится в фокусе нашего внимания.

#Графическое ядро Devastator

Самый интригующий факт, касающийся дизайна Devastator, – а именно такое кодовое имя получил GPU, встроенный в процессоры Trinity, – это то, что он основывается на архитектуре VLIW4. Если учесть, что графическое ядро Llano базировалось на архитектуре VLIW5, такой ход AMD кажется несколько странным, и мы бы скорее ожидали увидеть в Trinity архитектуру CGN, характерную для последних версий дискретных ускорителей. Однако на самом деле именно VLIW4 позволяет увеличить удельную эффективность графического ядра, искусственно ограниченного числом транзисторов. Такой трюк AMD уже проворачивала с собственными видеокартами серии Radeon HD 6900, и тогда его результаты были более чем удовлетворительными.

Суть в том, что предусмотренная VLIW5 группировка ALU по пять штук на потоковый VLIW-процессор оказывается не очень эффективной, и один из ALU в большом числе случаев просто простаивает. Поэтому VLIW4-компоновка Devastator, предполагающая наличие четырёх ALU в потоковом VLIW-процессоре, влечёт за собой более рациональное задействование имеющихся ресурсов. Конечно, обратной стороной выступает уменьшение суммарного числа исполнительных устройств и снижение теоретической пиковой производительности ядра, однако практическая удельная производительность в пересчёте на квадратный миллиметр растёт. А для кристалла гибридного процессора, на котором, помимо графического ядра, находятся вычислительные ядра, это – наиболее правильный путь оптимизации.

В общей сложности в графическом ядре Trinity предусмотрено шесть SIMD-движков, каждый из которых состоит из четырёх текстурных блоков и шестнадцати потоковых VLIW-процессоров. В сумме это даёт наличие в ядре 384 ALU, и это – на 16 штук меньше, чем имелось в распоряжении графического ядра Sumo процессоров Llano. Однако простая арифметика здесь не вполне уместна, ALU-блоки Devastator обычно загружены работой сильнее, чем их предшественники, а, кроме того, относительная простота потоковых VLIW-процессоров позволяет выставлять графическому ядру более высокие тактовые частоты. Например, в то время как в старшей версии Llano графика работала на частоте 600 МГц, у Trinity скорость видеоядра может достигать 800 МГц.

Если учесть, что в распоряжении Devastator есть 24 блока текстурирования (по 4 TMU на каждый SIMD-движок) и 8 блоков растровых операций (ROP), то можно заключить, что это графическое ядро фактически представляет собой примерно одну четверть GPU класса Radeon HD 6970. Что даже с учетом поправки на немного более низкую рабочую частоту и на отсутствие выделенной шины памяти с высокой пропускной способностью – очень неплохо. Иными словами, говоря, что процессоры Trinity оснащены интегрированной графикой «дискретного» класса, AMD совсем не лукавит. От гибридных процессоров нового поколения действительно можно ожидать очень неплохой 3D-производительности.

Вряд ли кого-то удивит то, что графическое ядро Trinity совместимо с современными программными интерфейсами DirectX 11, OpenCL 11 и DirectCompute 11. Эти возможности были и у видеокарт Radeon HD 6900, основанных на той же архитектуре, и у предшественников Trinity – процессоров Llano. Но при этом в новой встроенной графике унаследованы и некоторые черты совсем современных решений, в которых нашла своё место архитектура CGN. В частности, в Devastator имеется усовершенствованный блок тесселяции, а также поддержка всех актуальных типов полноэкранного сглаживания: SSAA, EQAA и MLAA.

Отдельное внимание в графике Trinity уделено актуальным для гибридных процессоров медийным возможностям. Графическое ядро располагает позаимствованным из свежих версий GPU специализированным блоком AMD HD Media Accelerator, который включает в себя движки для аппаратного декодирования видео (UVD3) и аппаратного кодирования видеоконтента в формат H.264 (VCE). Последняя возможность очень важна для успешной конкуренции Trinity с интеловскими гибридными процессорами, давно получившими технологию Quick Sync для высокоскоростного транскодирования видео высокого разрешения. Теперь нечто подобное есть и в процессорах AMD, однако на данный момент мы так и не смогли убедиться в работоспособности движка VCE по причине проблем с его поддержкой в драйверах и в существующем программном обеспечении.

Выводя на рынок настольных систем свой новый гибридный процессор, в AMD задумались и над тем, чтобы его пользователи не чувствовали себя обделёнными по сравнению с владельцами дискретных видеокарт в части возможностей подключения мониторов. Выражается это в том, что к интегрированной системе с процессором Trinity можно подключить до четырёх независимых дисплеев одновременно, при этом поддерживаются все типы соединений: аналоговый — VGA — и цифровые — DVI, HDMI и Display Port 1.2, а также четыре независимых аудиопотока. Правда, при этом количество физических выводов ограничено тремя, а для подключения четырёх дисплеев потребуется соединение пары мониторов «цепочкой» через Display Port.

Что впечатляет ещё сильнее, графика Trinity поддерживает и технологию Eyefinity. Конечно, для того чтобы найти какую-нибудь игру, способную работать с приемлемым уровнем FPS на подключенных к Devastator трёх-четырёх мониторах, придётся потрудиться, но само наличие такой возможности говорит о том внимании, с которым разработчики AMD подошли к оснащению APU второго поколения перед его выводом на массовый рынок.

#Модельный ряд Trinity

Говоря о графическом ядре десктопных процессоров Trinity, необходимо коснуться и состава их модельного ряда. Дело в том, что различные представители A-серии с дизайном Trinity могут быть снабжены различающимися вариантами ядра Devastator. Их различия образуются стандартно: пытаясь ввести сегментирование своих продуктов по различным ценовым категориям, производитель в младших модификациях отключает один или несколько SIMD-движков. В результате подробно описанным в предыдущем разделе набором ресурсов, включающим 384 исполнительных устройства, обладают лишь старшие модификации APU.

Номенклатура моделей Trinity при этом выглядит следующим образом. Наиболее скоростные модели с полноценным ядром Devastator, которое имеет маркетинговое название Radeon HD 7660D, относятся исключительно к новой флагманской серии A10. Все же остальные модификации с графическими ядрами с урезанным количеством потоковых процессоров и с пониженными частотами принадлежат к более «простым» сериям A8, A6 и A4, заменяя в них процессоры со старым дизайном Llano.

Полный состав линейки APU, основанной на дизайне Trinity, приводится в таблице:

Спецификации APU Trinity
Модельный номер A10-5800K A10-5700 A8-5600K A8-5500 A6-5400K A4-5300
Встроенная графика HD 7660D HD 7660D HD 7560D HD 7560D HD 7540D HD 7480D
TDP, Вт 100 65 100 65 65 65
Число унифицированных шейдерных процессоров 384 384 256 256 192 128
Частота GPU, МГц 800 800 760 760 760 723
Количество ядер 4 4 4 4 2 2
Частота CPU, ГГц (базовая/турбо) 3,8 / 4,2 3,4 / 4,0 3,6 / 3,9 3,2 / 3,7 3,6 / 3,8 3,4 / 3,6
L2-кеш, Мбайт 4 4 4 4 1 1
Максимальная частота памяти DDR3-1866 DDR3-1866 DDR3-1866 DDR3-1866 DDR3-1866 DDR3-1600

Даже версия графического ядра, устанавливаемая в процессоры класса A8, чисто теоретически медленнее полноценного Devastator более чем на 35 процентов. Что уж говорить о ещё более медлительных A6 и A4. А это значит, что для использования в качестве игрового решения интерес представляют в первую очередь процессоры A10-5800K и A10-5700. Именно их можно пытаться представить себе в геймерских системах начального уровня, лишённых дискретной видеокарты. Процессоры же младших серий, пожалуй, для универсальных игровых компьютеров подходят совсем плохо, поэтому их рекомендуется применять в мультимедийных центрах или в домашних развлекательных системах, не нацеленных на запуск ресурсоёмких игровых 3D-приложений.

Именно поэтому в данном материале мы сосредоточились на тестировании самого старшего гибридного процессора — A10-5800K, со встроенным в него графическим ядром Radeon HD 7660D. Этот процессор имеет в своём распоряжении два модуля Piledriver, благодаря чему распознаётся диагностическими утилитами и операционной системой как четырёхъядерный. Однако отметим и существование альтернативного мнения, согласно которому этот процессор – двухъядерный, но с возможностью выполнения четырёх потоков. Собственно, это мнение, хотя и противоречит заявлениям самой AMD, как раз более точно отражает позиционирование A10-5800K. По своей стоимости этот APU попадает в ту же ценовую категорию, что и интеловские Core i3, которые, как известно, двухъядерники, но с поддержкой технологии Hyper-Threading.

Рабочая частота рассматриваемого процессора, с учетом поддержки им технологии Turbo Core 3.0, должна колебаться в пределах от 3,8 до 4,2 ГГц. Однако на практике мы видели, что под нагрузкой большую часть времени A10-5800K проводит в промежуточном состоянии – при частоте 4,0 ГГц.

Встроенное в A10-5800K графическое ядро Radeon HD 7660D работает на частоте 800 МГц, причём в моменты отсутствия 3D-нагрузки она снижается до 300 МГц. Несмотря на то, что AMD обещала функционирование турборежима и для графического ядра, в реальности выше заложенных в спецификациях 800 МГц его частота не поднимается.

Следующая страница →
 
Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
⇣ Комментарии