Оригинал материала: https://3dnews.ru/819407

Обзор APU Beema и Mullins: AMD в планшетах — теперь по-настоящему

Сегодня AMD запускает новое поколение мобильных APU, представленное семействами Beema и Mullins. Они основаны на единой архитектуре, но адресованы, с одной стороны, легким и недорогим ноутбукам (Beema), с другой — еще более компактным устройствам (читай: планшетам), и в этом качестве являются заменой прошлогодних APU линеек Kabini и Temash соответственно.

В связи с тем, что семейство Kaveri пока ограничено десктопными модификациями, Beema и Mullins олицетворяют вершину инженерной мысли AMD в сегменте мобильных процессоров, где им предстоит соперничество с экономичными процессорами Intel Pentium на архитектуре Haswell и системами на чипе Atom (Bay Trail). Битва за более производительные ноутбуки, на которые у Kaveri есть претензии, подкрепленные мощным графическим ядром и спецификацией HSA (равно как и опасения, связанные с посредственной производительностью ядер x86), развернется позднее, вместе с выходом первых мобильных чипов этой линейки.

А пока вместе с AMD сосредоточимся на ультрамобильном применении APU. В преддверии анонса мы получили от производителя достаточно информации о ключевых особенностях архитектуры Beema/Mullins и составе модельных рядов. Кроме того, появилась возможность протестировать прототип планшета на базе чипа Mullins, но в будущем мы надеемся увидеть достойные внимания коммерческие продукты с новыми экономичными APU.

Beema/Mullins относится к младшей ветви гетерогенных процессоров AMD, в основе которой лежит компактное x86-ядро, разработанное с расчетом на низкое энергопотребление, в отличие от Kaveri и процессоров FX, которые базируются на высокопроизводительной архитектуре Steamroller и Piledriver – ее предшествующей итерации.

Чипы Kabini и Temash были довольно удачным проектом по сравнению с Intel Atom в лице платформы Bay Trail благодаря несравненно более мощному интегрированному GPU, да и производительность x86-приложений также была на вполне конкурентоспособном уровне для данной категории. Нельзя сказать, что низковольтные APU AMD снискали оглушительный коммерческий успех, но они все-таки смогли занять определенную долю рынка недорогих компактных ноутбуков. А вот планшеты на базе AMD Temash остались в абсолютном меньшинстве, будучи даже более редким продуктом (многие ли из тех, что были показаны публике, вообще вышли из стадии прототипа?), чем аналоги на платформе Intel Clover Trail.

Сегодня рынок x86-планшетов (а также смежных форм-факторов – ультрамобильных ноутбуков с тачскрином и конвертируемых устройств) воспринимается более серьезно. Дело как в неустанных усилиях Microsoft, так и в том, что архитектуры с набором инструкций x86, с одной стороны, наконец-то удовлетворяют требованиям к энергопотреблению, которые накладывают любые ультрамобильные решения, а с другой – обладают достаточно высокой производительностью, в том числе для того, чтобы в этом сегменте можно было полноценно использовать ОС Windows. Идея Microsoft соблазнить пользователей переносом рабочего окружения MS Office на планшет уже в значительной степени дискредитирована, но ведь у Windows есть и другой конек – DirectX, интерес к которому со стороны мобильных грандов показывает участие Qualcomm в работе над 12-й версией API. По меньшей мере Microsoft достаточно состоятельна и упряма, чтобы с прежними силами стимулировать это направление.

Переломным моментом в тернистой истории x86 на ультрамобильных устройствах можно считать недавнее появление платформы Intel Bay Trail, которая порвала с наследием предшествующих чипов Atom (изначально предназначенных не совсем для этого) и, не в последнюю очередь благодаря прогрессивному техпроцессу 22 нм, довела сочетание производительности и энергопотребления чипа до критически важного уровня.

В результате на момент релиза Beema/Mullins AMD оказалась в следующей ситуации. С одной стороны, перед чипами Beema, как преемниками Kabini, по-прежнему стоит задача откусить часть самого нижнего сектора рынка ноутбуков. С другой — Mullins предстоит более увлекательная борьба на перспективном рынке x86-планшетов с мощным соперником в лице Bay Trail. Справедливости ради нужно сказать, что предыдущие ультрамобильные APU AMD – Temash — были уже достаточно быстры для запуска Windows, но все же чересчур прожорливы для планшетов. Как мы увидим дальше, именно этому аспекту AMD посвятила основную массу оптимизаций в APU нового поколения.

#Модельные линейки Beema/Mullins: частоты, энергопотребление

APU AMD по-прежнему производятся по техпроцессу 28 нм, и все преимущества Beema/Mullins по сравнению с Kabini/Temash проистекают из многочисленных оптимизаций по части энергопотребления. Архитектурных же изменений, как мы скоро увидим, набралось не так уж много.

Intel находится на один шаг впереди, выпуская Bay Trail и Haswell по проектным нормам 22 нм, но, невзирая на это, AMD добилась сравнимого с конкурентами энергопотребления. Три анонсированные модели Mullins укладываются в SDP (Scenario Design Point) 2,8 Вт, что не сильно выше, чем 2,2 Вт, заявленные для Bay Trail. TDP чипов составляет от 3,95 до 4,5 Вт. Для Beema максимальное значение TDP составляет 15 Вт, как и у большинства чипов Kabini прежде.

К слову, необходимо прокомментировать, откуда взялся термин SDP и что он означает. AMD позаимствовала его у Intel, впервые применившей SDP для описания энергопотребления низковольтных чипов Ivy Bridge и Haswell серии Y. Понятие Scenario Design Power скрывает следующий трюк. Intel определяет для своих процессоров (по крайней мере низковольтных) три значения PL1, которые описывают мощность чипа в ситуациях непрерывной нагрузки и могут быть как выше, так и ниже заявленного TDP. Производитель конкретного устройства волен использовать любое из них в зависимости от качества охлаждения и емкости батареи. Для Y-серии CPU в качестве SDP просто указывается наименьшее из них. Такую же методику, по всей видимости, применяет AMD для описания энергопотребления Mullins с тем, чтобы чипы выглядели привлекательно в сравнении с Bay Trail.

Mullins радикально прибавил в тактовых частотах, они достигают 2,2 ГГц. Предельная частота Beema чуть выше — 2,4 ГГц, причем в обеих линейках AMD применяет динамическое управление частотой. Про энергосберегающие технологии в новых APU нам еще предстоит отдельный разговор, ведь именно они заложили основу для такого прогресса в отношении тактовых частот.

#Архитектура Beema/Mullins: ядра x86

Но для начала зафиксируем, что представляет собой архитектура Beema/Mullins. Ядро x86 в составе новых APU под названием Puma+ представляет собой развитие удачной архитектуры Jaguar, которая, помимо экономичных APU для мобильных гаджетов, используется в процессорах консолей PlayStation 4 и Xbox One. Отличия Puma+ сводятся к оптимизации энергопотребления и снижению утечек тока на 19%.

С логической точки зрения все осталось прежним. Ключевые характеристики ядра Puma+ включают декодирование двух инструкций за такт, внеочередное исполнение инструкций и 128-битные ALU для операций с плавающей точкой. Вычислительный модуль включает вплоть до четырех ядер, коммуницирующих посредством общего кеша L2 объемом 2 Мбайт. По описанию Puma+ похожа на не столь давно представленную архитектуру Intel Silvermont, лежащую в основе платформы Bay Trail для планшетных Atom (также две инструкции за такт, внеочередное исполнение и т.д.), только в данном случае Intel является догоняющей командой, поскольку в предыдущих итерациях Atom обладал несравненно более примитивным внутренним устройством без внеочередного исполнения инструкций.

Принимая во внимание сходство Temash и Bay Trail по частотам и количеству ядер, мы можем ожидать довольно острого соперничества между этими APU в сфере традиционных x86-приложений.

#Архитектура Beema/Mullins: GPU

Beema/Mullins комплектуется графическим ядром Graphics Core Next. Поскольку никаких дополнительных заявлений по поводу архитектуры GPU не было сделано, можно заключить, что он принадлежит к первой версии GCN и не содержит нововведений GCN 1.1, например True Audio. Только лишь частоты GPU увеличены до 800 МГц для Beema и 500 МГц для Mullins, с попутными оптимизациями, также сократившими утечки тока на 38%. GPU содержит два Compute Unit’а, которые в совокупности состоят из 128 ALU – потоковых процессоров в терминологии AMD. Состав вычислительных блоков един для всех моделей в линейке, а дифференциация по категориям R2/R3/R4/R6 происходит на основании тактовых частот графического процессора.

В области графики AMD нетрудно было сохранить лидерство по сравнению с Bay Trail, даже если изменилось немногое, ведь в продукте Intel, несмотря на заметный прогресс по сравнению с Clover Trail, используется весьма слабый интегрированный GPU (четыре исполнительных модуля) по сравнению с полноценным HD Graphics версий GT1 и GT2, которые встречаются в процессорах Haswell.

Графика в чипах Beema, благодаря повышенным частотам и поддержке более мощных x86-ядер, чем в Mullins, может составить конкуренцию процессору HD Graphics с шестью исполнительными модулями, который интегрирован в кристалл младших представителей линейки Haswell.

#Контроль частоты, оптимизация энергопотребления

Одно из ключевых нововведений Beema/Mullins состоит в механизме динамического контроля частоты x86-ядер, которого лишены APU Kabini/Temash. В каких пределах меняется частота, AMD не сообщает, зато известно, каким образом действует «авторазгон».

Повысить частоту при таком характере нагрузки, который оставляет незадействованным резерв TDP, – общий принцип работы подобных систем, но AMD ввела дополнительные критерии в алгоритм контроля. Самое интересное то, что микроконтроллер управления частотой отслеживает поведение различных приложений (на уровне аппаратных инструкций) с целью определить, насколько каждое из них зависит от частоты ядер. Задача – избежать лишних расходов энергии на разгон приложений, которые от этого мало выигрывают.

Автоматика использует стратегию race-to-idle, когда более выгодно быстро выполнить задачу APU на повышенной частоте и затем бездействовать, вместо того чтобы растянуть процесс на низкой частоте. При определении мощности берется в расчет не только сам APU, но и другие компоненты устройства, которые также вносят заметный вклад в общее энергопотребление системы при длительной нагрузке.

В Beema/Mullins используется нестандартный подход к температуре APU. Вводится понятие TSP, представляющее собой такую мощность, при потреблении которой неограниченно долго корпус устройства достигает температуры, чувствительной для пользователя. Контроль частоты допускает кратковременный разгон ядер сверх отметки TSP, пока корпус не успеет прогреться. В качестве аналогии вспоминается задаваемый в настройках драйвера лимит скорости вращения вентилятора в дискретных графических адаптерах Radeon R9 290(X). И там и там фактором ограничения мощности чипа выступает характеристика, непосредственно значимая для пользователя. Интересно, что для работы STAPM (Skin Temperature Aware Power Management) не требуется аппаратных сенсоров. Вместо этого AMD будет поставлять OEM-производителям инструменты для того, чтобы построить функцию корпусной температуры от температуры и мощности SoC.

Кроме того, Beema/Mullins содержат оптимизации контроллера RAM, включающие поддержку дополнительной спецификации – низковольтных чипов DDR3L-1333 (сокращение мощности на 500 мВт по сравнению со стандартными DDR3-1333). С другой стороны, появилась поддержка быстрых модулей DDR3-1866, что должно благотворно сказаться на производительности APU в более мощных устройствах. Наконец, переработка экранного интерфейса позволит сэкономить еще до 200 мВт при использовании матриц высокого разрешения.

В сумме оптимизации энергопотребления в новых APU привели к сокращению TDP старших чипов Mullins на 43% по сравнению с Temash. Энергопотребление Beema лежит в пределах 10-15 Вт, как и у большей части модификаций Kabini до этого, но AMD зарегистрировала снижение потребляемой мощности на 20% в реальных приложениях при равной с Kabini производительности.

#Platform Security Processor

Вишенка на пироге Beema/Mullins – встроенный PSP (Platform Security Processor), выделенный для вычислений, которые связаны с безопасностью. Для этой цели AMD лицензировала ядро ARM Cortex A5. Базовые возможности этого блока ­– безопасная загрузка ОС, ускорение криптографических функций за счет встроенного сопроцессора, а также TEE (Trusted Execution Environment), которое предоставляет стандартный интерфейс и API для изоляции защищенного контента в ОС. Кстати, ARM-ядро уже было встроено в кремний Kabini/Temash, но не было активировано в силу временных ограничений на разработку.

#Результаты тестирования планшета на базе Mullins

Пока не существует коммерческих продуктов, использующих SoC Beema/Mullins, AMD предоставила для краткого тестирования собственный образец 11,6-дюймового планшета на базе Mullins — Discovery Tablet. Внешне устройство, как водится у AMD, выглядит довольно грубо и не годится для других целей, помимо демонстрации возможностей начинки.

В планшете была установлена SoC Mullins старшей модификации – A10 Micro‐6700T, которая включает четыре ядра x86 и GPU Radeon R6 с частотой 500 МГц. Оперативная память – низковольтные чипы DDR3L‐RS объемом 2 Гбайт. ПЗУ – SSD с интерфейсом SATA. В общем, неслабая конфигурация для планшета, которая к тому же была дополнена качественной (по-видимому, IPS), матрицей с разрешением 1920х1080.

Образец работал под управлением Windows 8.1, пользоваться которой для казуальных задач вроде веб-серфинга было довольно комфортно, если закрыть глаза на издержки сенсорного ввода в режиме рабочего стола. За время, данное для тестирования, удалось провести несколько более интересных тестов – 3DMark, PCMark 8 и бенчмарк в игре DiRT Showdown. Увы, нам пока не с чем сравнить полученные результаты. Единственный планшет на базе Intel Bay Trail, который до сих пор пришлось тестировать в 3DNews, основан также на четырехъядерном, но далеко не самом мощном SoC из всей линейки, поэтому такое сравнение было бы не вполне справедливым.

Тестовый семпл Mullins имеет режим Turbo Dock, из-за чего производительность при работе от внешнего питания должна резко увеличиться. Вот это уже интересный момент, который отчасти оправдывает предъявление результатов Mullins без конкуренции. В целом Turbo Dock обеспечил улучшение результатов на 12% в комплексном тесте PCMark 8 и на 20-30% в графических бенчмарках. Частота смены кадров в DiRT Showdown все же не достигает отметки даже в 25 FPS, хотя используются минимальные настройки качества.

Впрочем, использование планшета «на привязи» – не вполне типичный сценарий. Более важно, как работает SoC в автономном режиме. У нас есть графики частоты CPU в PCMark 8 и 3DMark. 3DMark в равной степени требователен к производительности CPU и GPU, а PCMark в большей степени представляет нагрузку на x86-ядра APU, хотя последний запускался в режиме Accelerated, что перекладывает часть вычислений на GPU посредством OpenCL. В конце концов, именно гетерогенные вычисления являются излюбленной темой AMD и самим смыслом существования APU.

В PCMark 8 тактовая частота CPU колебалась вокруг отметки 1600 МГц, лишь несколько раз достигая 2 ГГц или даже превышая эту планку (короткие пики на графике). Графические тесты 3DMark, равно как и тест Casual Gaming в составе PCMark 8 сбрасывают частоту до 1-1,3 ГГц. В общем, не стоит возлагать большие надежды на заявленную для топового APU Mullins предельную тактовую частоту 2,2 ГГц, хотя де-факто она действительно достижима на короткие периоды времени.

#Выводы

В целом чипы Beema/Mullins можно расценивать как результат работы над ошибками, это — усовершенствованные версии Kabini/Temash. Причем подобный результат можно было бы ожидать от перехода на более тонкий техпроцесс. Однако APU AMD по-прежнему выпускаются по технологии 28 нм, и крупным сокращением потребляемой мощности новые APU обязаны исключительно массе архитектурных оптимизаций и изощренному механизму контроля частоты x86-ядер, которого так не хватало в предыдущей итерации чипов. Будь у AMD доступ к лучшему техпроцессу, Beema/Mullins могли бы выглядеть еще краше, но и то, что есть сейчас, представляет собой добротный «кремний» для ультрамобильных устройств.

Beema как APU для легких и недорогих ноутбуков не вызывает восторга в силу самой специфики этой рыночной ниши, которая представляет жесткий компромисс между ценой и производительностью, да и чисто пользовательскими качествами устройств. Но с утилитарной точки зрения для них явно найдется место под солнцем. Немного разогнанные ядра x86 и GCN добавляют Beema шансов в сравнении с экономичными процессорами Haswell, но как это соотношение выглядит в действительности — хотелось бы проверить на практике. И мы обязательно сделаем это, как только OEM-партнеры AMD выпустят первые коммерческие продукты на базе Beema.

Mullins в этой паре – гораздо более интересный компонент. Сокращение утечек тока и динамический контроль частоты уменьшили TDP на 43% по сравнению с Temash, тем самым открыв дорогу четырехъядерным SoC AMD в пространство ниже 5 Вт, что вполне соответствует требованиям планшетов с нормальными, человеческими габаритами. Благодаря формальной схожести Mullins с платформой Intel Bay Trail по многим параметрам, относящимся к ядрам x86, и по-прежнему непревзойденной в этом классе графике, APU AMD обладают по меньшей мере не худшими стартовыми условиями, чем чипы Intel Atom, для вторжения на рынок ультрамобильных гаджетов. А ведь именно там сейчас происходит наиболее интересное движение, в отличие от рынка высокопроизводительных CPU с набором команд x86 – давно поделенного и предсказуемого. Но опять-таки умерим энтузиазм, покуда на тестирование не попали реальные коммерческие продукты с чипами Mullins.



Оригинал материала: https://3dnews.ru/819407