⇣ Содержание
Опрос
|
реклама
Самое интересное в новостях
AMD Trinity для десктопа. Часть 1. Графическое ядро
Ни у кого не возникает сомнений в том, что наиболее быстродействующие процессоры для персональных компьютеров поставляет на сегодняшний день отнюдь не компания AMD. И такая ситуация сложилась далеко не вчера. С тех пор как Intel перешла от Pentuim 4 к выпуску различных процессоров рода Core, предложения AMD скатились на вторые позиции. Фактически вся сегодняшняя процессорная продукция этой компании представляет собой либо бюджетные, либо какие-то узкоспециализированные решения, малоинтересные для широкого круга пользователей, ставящих высокую производительность во главу угла. Однако невысокие показатели быстродействия выпускаемых процессоров, так же как и сокращение рыночной доли, – это совсем не повод поставить крест на результатах работы процессорного подразделения AMD. Инженеры этой фирмы славятся тем, что способны время от времени выдавать какие-то оригинальные идеи, позволяющие AMD не просто поддержать своё рыночное положение, но и оказать немалое влияние на всю индустрию в целом. За примерами таких идей далеко ходить не надо: 64-битные расширения микроархитектуры x86, многоядерный дизайн CPU, интеграция в процессор контроллера памяти и северного моста чипсета – все эти решения первой разработала и внедрила именно AMD, а не текущий лидер процессоростроения. Именно поэтому мы продолжаем пристально следить за тем, какие нововведения вызревают в недрах AMD. И похоже, к настоящему моменту компания вновь нащупала плодотворный вектор развития, который способен придать положительный импульс не только ей самой, но и всему процессорному рынку в целом. Вектор этот – APU (Accelerated Processing Unit, «ускоренное процессорное устройство») – идеология, предусматривающая объединение на одном полупроводниковом кристалле традиционных вычислительных ядер с производительным графическим ядром. Причём не простое соседство, а симбиоз – возможность объединения их ресурсов для решения общих задач. К классу APU можно отнести несколько разнообразных предложений AMD, выпущенных ещё в 2011 году. Наибольший интерес среди них представляют гибридные процессоры A-серии с кодовым именем Llano, служащие базисом платформ Lynx и Sabine и ориентированные на применение в широком спектре настольных и мобильных систем. Несмотря на то, что эти процессоры и платформы служат лишь «пробным шаром», так как на них происходит только обкатка принципов APU, они были достаточно тепло приняты рынком. Особенно востребованными Llano оказались в мобильном сегменте, что тут же отразилось в увеличении присутствия продукции AMD в современных ноутбуках. И это действительно видно невооружённым глазом. Если ещё пару лет назад мобильные платформы AMD встречались в составе очень немногочисленных предложений, то сегодня купить ноутбук, основанный на процессоре этого производителя, не составляет никакого труда. В любом компьютерном магазине вы с лёгкостью найдёте огромное число предложений, оснащённых APU разработки AMD. Впрочем, повышенный интерес к процессорам AMD, наблюдаемый на рынке мобильных компьютеров, возник вовсе не из-за их гибридности. Его, скорее, следует понимать как побочный эффект. В реальности же дело в том, что достаточно мощное графическое ядро, скомпонованное с приемлемыми по меркам мобильных решений вычислительными ядрами, – это как раз то, чего не хватает в ассортименте Intel. А если принять во внимание очень демократичные цены, установленные компанией AMD на свои APU, то совершенно неудивительно, что в недорогие ноутбуки они вписались идеально, дав тем самым производителям оных возможность собирать компьютеры современного уровня без установки в них дискретных видеоускорителей и сопряженных с этим дополнительных затрат. В результате в народ пошла и сама концепция APU. Её проповедники от AMD, общаясь с разработчиками программного обеспечения, получили возможность опираться на актуальность и распространённость, и в конце концов в распоряжении пользователей появились и реальные программы, рассчитанные на полноценное использование ресурсов гибридных процессоров. Майское же обновление A-серии мобильных процессоров AMD дизайном Trinity, в рамках которого была увеличена производительность как вычислительной, так и графической частей APU, стало дополнительным аргументом в пользу жизнеспособности и привлекательности концепции. Так что в дальнейшем доля ноутбуков с логотипом AMD Vision будет только увеличиваться. С десктопными же процессорами AMD класса APU случилась совсем иная история. Требования пользователей настольных систем существенно отличаются от запросов владельцев ноутбуков, и тема APU их особо не заинтересовала с самого начала. Движущей силой проникновения первых поколений гибридных процессоров в ноутбуки выступала достаточно мощная графика, однако при её использовании в настольных компьютерах от этого эпитета нужно отказаться. Дело в том, что для десктопов характерны гораздо более высокие разрешения экрана, в которых процессоры AMD A-серии приемлемого уровня 3D-производительности не развивают. Иными словами, с точки зрения пользователей десктопов графическое ядро процессоров Llano качественно мало отличается от встроенной графики интеловских предложений: оба варианта для геймерской системы начального уровня подходят почти одинаково плохо. Мощность же вычислительных ядер, которыми располагают гибридные процессоры AMD, существенно ниже, чем у процессоров Intel, и это закрывает Llano путь в целый ряд домашних или офисных систем. Даже в роли сердца медиацентров у APU компании AMD не слишком много шансов перед конкурирующими предложениями. В этом случае их подводит слишком высокое тепловыделение и отсутствие средств, позволяющих ускорять кодирование видеоконтента высокого разрешения. Однако самым грандиозным препятствием на пути Llano в настольные компьютеры стала специально разработанная для них платформа Socket FM1 с совершенно неясными перспективами. Никакие иные процессоры, кроме Llano, установить в неё невозможно, и это делает её «вещью в себе», с одной стороны, не склонной к последующему апгрейду, а с другой – с очень ограниченным сроком жизни. Вполне закономерно, что заинтересовать решением с таким сочетанием характеристик пользователей настольных систем практически невозможно, ведь рынок наводнён конкурирующими LGA1155-предложениями на любой вкус и кошелёк с куда более продолжительным жизненным циклом. Но отдавать рынок интегрированных настольных процессоров во власть конкурента, который, видя перспективность концепции APU, в спешном порядке наращивает мощности собственных графических ядер, в планы AMD явно не входит. Поэтому, спустя примерно год с появления Llano, компания готова предложить второе поколение десктопных процессоров A-серии, исправленное и переработанное. Дизайн новых десктопных APU не является специализированным и утилитарным. Это – Trinity, и он уже обкатан на мобильных системах, где успешно применяется с начала лета. Однако для настольных систем серьёзно увеличены частоты вычислительной и графической составляющих, что позволяет производителю уверять общественность в том, что свежие APU, в отличие от их предшественников, должны понравиться многим пользователям десктопов, в том числе и энтузиастам. В целом мы почти готовы поверить в слова AMD: по крайней мере, по дизайну Trinity однозначно лучше Llano. Как мы уже видели на примере мобильных APU, используемые в Trinity вычислительные ядра, которые основаны на микроархитектуре Piledriver, работают побыстрее ядер Husky из Llano, корни микроархитектуры которых уходят в далёкое прошлое. Существенно поднялась и производительность графического ядра, строение которого коренным образом переработано. И самое главное, для десктопных процессоров Trinity теперь предлагается новая платформа Socket FM2, которая должна быть лишена всех старых недостатков. AMD готова гарантировать её устойчивость в течение нескольких последующих лет, а модельный рад процессоров в совместимом с ней исполнении будет включать широкий диапазон предложений разного уровня. Иными словами, если сравнивать Trinity и Llano, то новые процессоры очевидно лучше. Однако достаточно ли они хороши для того, чтобы результативно продвинуть концепцию APU в настольные системы, пользователи которых пока что относятся к подобным решениям очень скептически? В нашем материале мы попробуем частично дать ответ на этот вопрос, для чего подробно протестируем графическую составляющую настольных гибридных процессоров нового поколения и попробуем понять, хватает ли её мощности для применения в игровых системах начального уровня. К сожалению, подробное рассмотрение второй части Trinity – вычислительных ядер – мы вынуждены отложить на некоторое время. Однако в этом нет нашей вины. Дело в том, что компания AMD пока официально не анонсировала свои новые процессоры A-серии для настольных систем. Поэтому наши руки частично связаны обязательствами о неразглашении, так что за этой статьей последует и вторая, включающая тесты другого плана. Впрочем, никто не запрещает нам оперировать имеющейся информацией о микроархитектуре Trinity, поэтому для начала давайте проанализируем, какую работу проделали инженеры AMD для того, чтобы новоиспечённые APU стали реальностью. ⇡#Дизайн TrinityВ соответствии с оригинальной концепцией любой APU состоит из трёх основных частей. В этом плане Trinity не привносит никаких изменений: гибридные процессоры нового поколения включают процессорные ядра, интегрированный графический ускоритель и небольшой, но очень важный компонент – объединённый северный мост. Именно он превращает сумму разнородных ядер в единую систему и, включая контроллер DDR3 SDRAM, отвечает за взаимодействие вычислительных и графических ядер между собой и с системной памятью, обеспечивая возможность их совместной работы с одними и теми же данными. В целом общая структура Trinity осталась точно такой же, как и у Llano, но вот на более низком уровне все составляющие переработаны. При этом все изменения сделаны таким образом, чтобы не раздувать полупроводниковый кристалл: производственная технология у AMD не обновилась, компания продолжает использовать 32-нм процесс Globalfoundries с SOI, а поднимать себестоимость APU, позиционируемых в качестве достаточно доступных предложений, производитель не собирается. В результате площадь кристалла Trinity по сравнению с Llano возросла лишь на 8 процентов – до 246 мм2. Количество транзисторов изменилось также весьма незначительно и достигло 1,303 млрд штук (было – 1,178 млрд). Более того, не сильно трансформировалось даже деление транзисторного бюджета между вычислительными и графическими ресурсами: они занимают на кристалле примерно одинаковую площадь и в том и в другом случае. Тем не менее на этом разговоры о похожести Llano и Trinity можно и закончить. Вычислительные ядра, например, с выходом нового поколения APU изменены кардинально. Теперь в основе гибридных процессоров используется (и будет использоваться в дальнейшем) микроархитектура Bulldozer, а конкретнее, её второе поколение – Piledriver. Двухъядерники и четырёхъядерники Trinity включают в себя один или два условно называемых двухъядерными модуля, которые, напомним, содержат по два набора исполнительных устройств и могут обрабатывать по два потока одновременно, но при этом имеют общие на модуль кеш-память, блок выборки инструкций, их декодер и блок операций с плавающей точкой. При этом в Trinity по сравнению с основанными на микроархитектуре Bulldozer процессорами класса FX без встроенной графики не только уменьшено количество ядер, но и отсутствует кеш третьего уровня. Зато используемое в новых APU второе поколение микроархитектуры Bulldozer, пока что не представленное ни в одном другом семействе процессоров, предлагает целый ряд небольших усовершенствований, направленных на увеличение производительности, уменьшение токов утечки и обеспечение стабильности на высоких тактовых частотах. Фронтальная часть конвейера получила более точный предсказатель ветвлений, а также окно инструкций увеличенного размера. Исполнительные устройства обрели улучшенный планировщик, а сами они научились немного быстрее выполнять отдельные инструкции, например целочисленное и вещественночисленное деление. Кроме того, разработчики говорят об увеличении ёмкости L1 TLB и о совершенствовании алгоритмов арбитража и предварительной выборки данных L2-кеша. Всё это оценено в примерно 25-процентное превосходство (по расчётам AMD) процессоров Trinity над Llano в вычислительной производительности. Кардинальные изменения затронули и объединённый северный мост. В первую очередь инженеры пересмотрели систему приоритетов доступа к разделяемой памяти, отдав первенство вычислительным ядрам, которые, как показывает практика, генерируют относительно небольшую часть запросов. Помимо этого, AMD позаботилась и о поддержке новых типов памяти, включая DDR3-1866 в штатном режиме или DDR3-2400 при разгоне. Внутренние шины данных были расширены, в частности, графическое ядро получило возможность работать с контроллером памяти по 256-битной специализированной шине Radeon Memory Bus, а вне чипа все соединения теперь используют протокол PCI Express, пришедший на смену Hyper-Transport. Однако наибольший интерес вызывают изменения, произошедшие с графическим ядром. Дело в том, что без существенного увеличения транзисторного бюджета и без коренной переработки архитектуры у AMD получилось заметно поднять его быстродействие, то есть фактически нарастить плотность полезных блоков в GPU за счёт упразднения каких-то излишков. Эта находка, пожалуй, заслуживает отдельного разговора, тем более что именно интегрированная в Trinity графика сегодня находится в фокусе нашего внимания. ⇡#Графическое ядро DevastatorСамый интригующий факт, касающийся дизайна Devastator, – а именно такое кодовое имя получил GPU, встроенный в процессоры Trinity, – это то, что он основывается на архитектуре VLIW4. Если учесть, что графическое ядро Llano базировалось на архитектуре VLIW5, такой ход AMD кажется несколько странным, и мы бы скорее ожидали увидеть в Trinity архитектуру CGN, характерную для последних версий дискретных ускорителей. Однако на самом деле именно VLIW4 позволяет увеличить удельную эффективность графического ядра, искусственно ограниченного числом транзисторов. Такой трюк AMD уже проворачивала с собственными видеокартами серии Radeon HD 6900, и тогда его результаты были более чем удовлетворительными. Суть в том, что предусмотренная VLIW5 группировка ALU по пять штук на потоковый VLIW-процессор оказывается не очень эффективной, и один из ALU в большом числе случаев просто простаивает. Поэтому VLIW4-компоновка Devastator, предполагающая наличие четырёх ALU в потоковом VLIW-процессоре, влечёт за собой более рациональное задействование имеющихся ресурсов. Конечно, обратной стороной выступает уменьшение суммарного числа исполнительных устройств и снижение теоретической пиковой производительности ядра, однако практическая удельная производительность в пересчёте на квадратный миллиметр растёт. А для кристалла гибридного процессора, на котором, помимо графического ядра, находятся вычислительные ядра, это – наиболее правильный путь оптимизации. В общей сложности в графическом ядре Trinity предусмотрено шесть SIMD-движков, каждый из которых состоит из четырёх текстурных блоков и шестнадцати потоковых VLIW-процессоров. В сумме это даёт наличие в ядре 384 ALU, и это – на 16 штук меньше, чем имелось в распоряжении графического ядра Sumo процессоров Llano. Однако простая арифметика здесь не вполне уместна, ALU-блоки Devastator обычно загружены работой сильнее, чем их предшественники, а, кроме того, относительная простота потоковых VLIW-процессоров позволяет выставлять графическому ядру более высокие тактовые частоты. Например, в то время как в старшей версии Llano графика работала на частоте 600 МГц, у Trinity скорость видеоядра может достигать 800 МГц. Если учесть, что в распоряжении Devastator есть 24 блока текстурирования (по 4 TMU на каждый SIMD-движок) и 8 блоков растровых операций (ROP), то можно заключить, что это графическое ядро фактически представляет собой примерно одну четверть GPU класса Radeon HD 6970. Что даже с учетом поправки на немного более низкую рабочую частоту и на отсутствие выделенной шины памяти с высокой пропускной способностью – очень неплохо. Иными словами, говоря, что процессоры Trinity оснащены интегрированной графикой «дискретного» класса, AMD совсем не лукавит. От гибридных процессоров нового поколения действительно можно ожидать очень неплохой 3D-производительности. Вряд ли кого-то удивит то, что графическое ядро Trinity совместимо с современными программными интерфейсами DirectX 11, OpenCL 11 и DirectCompute 11. Эти возможности были и у видеокарт Radeon HD 6900, основанных на той же архитектуре, и у предшественников Trinity – процессоров Llano. Но при этом в новой встроенной графике унаследованы и некоторые черты совсем современных решений, в которых нашла своё место архитектура CGN. В частности, в Devastator имеется усовершенствованный блок тесселяции, а также поддержка всех актуальных типов полноэкранного сглаживания: SSAA, EQAA и MLAA. Отдельное внимание в графике Trinity уделено актуальным для гибридных процессоров медийным возможностям. Графическое ядро располагает позаимствованным из свежих версий GPU специализированным блоком AMD HD Media Accelerator, который включает в себя движки для аппаратного декодирования видео (UVD3) и аппаратного кодирования видеоконтента в формат H.264 (VCE). Последняя возможность очень важна для успешной конкуренции Trinity с интеловскими гибридными процессорами, давно получившими технологию Quick Sync для высокоскоростного транскодирования видео высокого разрешения. Теперь нечто подобное есть и в процессорах AMD, однако на данный момент мы так и не смогли убедиться в работоспособности движка VCE по причине проблем с его поддержкой в драйверах и в существующем программном обеспечении. Выводя на рынок настольных систем свой новый гибридный процессор, в AMD задумались и над тем, чтобы его пользователи не чувствовали себя обделёнными по сравнению с владельцами дискретных видеокарт в части возможностей подключения мониторов. Выражается это в том, что к интегрированной системе с процессором Trinity можно подключить до четырёх независимых дисплеев одновременно, при этом поддерживаются все типы соединений: аналоговый — VGA — и цифровые — DVI, HDMI и Display Port 1.2, а также четыре независимых аудиопотока. Правда, при этом количество физических выводов ограничено тремя, а для подключения четырёх дисплеев потребуется соединение пары мониторов «цепочкой» через Display Port. Что впечатляет ещё сильнее, графика Trinity поддерживает и технологию Eyefinity. Конечно, для того чтобы найти какую-нибудь игру, способную работать с приемлемым уровнем FPS на подключенных к Devastator трёх-четырёх мониторах, придётся потрудиться, но само наличие такой возможности говорит о том внимании, с которым разработчики AMD подошли к оснащению APU второго поколения перед его выводом на массовый рынок. ⇡#Модельный ряд TrinityГоворя о графическом ядре десктопных процессоров Trinity, необходимо коснуться и состава их модельного ряда. Дело в том, что различные представители A-серии с дизайном Trinity могут быть снабжены различающимися вариантами ядра Devastator. Их различия образуются стандартно: пытаясь ввести сегментирование своих продуктов по различным ценовым категориям, производитель в младших модификациях отключает один или несколько SIMD-движков. В результате подробно описанным в предыдущем разделе набором ресурсов, включающим 384 исполнительных устройства, обладают лишь старшие модификации APU. Номенклатура моделей Trinity при этом выглядит следующим образом. Наиболее скоростные модели с полноценным ядром Devastator, которое имеет маркетинговое название Radeon HD 7660D, относятся исключительно к новой флагманской серии A10. Все же остальные модификации с графическими ядрами с урезанным количеством потоковых процессоров и с пониженными частотами принадлежат к более «простым» сериям A8, A6 и A4, заменяя в них процессоры со старым дизайном Llano. Полный состав линейки APU, основанной на дизайне Trinity, приводится в таблице:
Даже версия графического ядра, устанавливаемая в процессоры класса A8, чисто теоретически медленнее полноценного Devastator более чем на 35 процентов. Что уж говорить о ещё более медлительных A6 и A4. А это значит, что для использования в качестве игрового решения интерес представляют в первую очередь процессоры A10-5800K и A10-5700. Именно их можно пытаться представить себе в геймерских системах начального уровня, лишённых дискретной видеокарты. Процессоры же младших серий, пожалуй, для универсальных игровых компьютеров подходят совсем плохо, поэтому их рекомендуется применять в мультимедийных центрах или в домашних развлекательных системах, не нацеленных на запуск ресурсоёмких игровых 3D-приложений. Именно поэтому в данном материале мы сосредоточились на тестировании самого старшего гибридного процессора — A10-5800K, со встроенным в него графическим ядром Radeon HD 7660D. Этот процессор имеет в своём распоряжении два модуля Piledriver, благодаря чему распознаётся диагностическими утилитами и операционной системой как четырёхъядерный. Однако отметим и существование альтернативного мнения, согласно которому этот процессор – двухъядерный, но с возможностью выполнения четырёх потоков. Собственно, это мнение, хотя и противоречит заявлениям самой AMD, как раз более точно отражает позиционирование A10-5800K. По своей стоимости этот APU попадает в ту же ценовую категорию, что и интеловские Core i3, которые, как известно, двухъядерники, но с поддержкой технологии Hyper-Threading. Рабочая частота рассматриваемого процессора, с учетом поддержки им технологии Turbo Core 3.0, должна колебаться в пределах от 3,8 до 4,2 ГГц. Однако на практике мы видели, что под нагрузкой большую часть времени A10-5800K проводит в промежуточном состоянии – при частоте 4,0 ГГц. Встроенное в A10-5800K графическое ядро Radeon HD 7660D работает на частоте 800 МГц, причём в моменты отсутствия 3D-нагрузки она снижается до 300 МГц. Несмотря на то, что AMD обещала функционирование турборежима и для графического ядра, в реальности выше заложенных в спецификациях 800 МГц его частота не поднимается.
⇣ Содержание
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
|