Новости Hardware

AMD исправляет минусы Bulldozer в архитектуре Steamroller

На днях во время Hot Chips Symposium, главный технолог AMD Марк Пейпермастер (Mark Papermaster) рассказал о новой архитектуре процессоров AMD с кодовым именем Steamroller, которая будет выпускаться с соблюдением 28-нм техпроцесса. Это будет третье поколение архитектуры Bulldozer, и оно имеет высокое значение для компании. Bulldozer, запущенный лишь чуть более года назад, оказался большим разочарованием для приверженцев продукции компании. Второе поколение архитектуры Bulldozer с кодовым именем Piledriver, включающее ряд существенных изменений, вышло весной в чипах Trinity.

Steamroller же является первой существенной переработкой архитектуры Bulldozer и может, наконец, предоставить тот уровень производительности и эффективности, который позволит эффективнее противостоять процессорам Intel. В приведённых слайдах все сравнения и проценты прироста основаны на архитектуре CPU, используемой в Trinity. В Steamroller компания AMD сделала несколько шагов назад, ближе к традиционной 2-ядерной архитектуре.

Сравнение аппаратных блоков выборки/декодирования/отсылки в Bulldozer по отношению к Steamroller

Одним из ограничений Bulldozer было то, что процессор мог декодировать только 4 инструкции на модуль, то есть 16 инструкций на 4 модуля/8 ядер. Это ставило чип при пиковой многопоточной нагрузке в невыгодное положение по отношению к Phenom II (3 инструкции/ядро, 18 — в 6-ядерной конфигурации) и Sandy Bridge (4 инструкции на ядро, 32 — в 8-ядерном CPU).

Не ясно, сможет ли Steamroller в самом деле обрабатывать больше инструкций за такт, но двойной блок выборки должен оказаться быстрее одного универсального блока в Bulldozer. Недостатком собственного декодера у каждого ядра в модуле является рост энергопотребления и площади кристалла. Универсальный подход в Bulldozer снижал многопоточную производительность на 20% по сравнению с обычным 2-ядерным подходом. Увеличить показатели Steamroller в этой области — хорошая возможность для AMD нарастить производительность. Новую архитектуру модулей компания описывает, как «бескомпромиссную двухпоточную производительность».

Для повышения производительности CPU компания также значительно улучшила принцип работы кеш-памяти L1 (одновременно нарастив объём в 1,5—2 раза) и на 5—10% увеличила эффективность работы планировщика модуля целочисленных операций. Также на 20% была усовершенствована работа предсказателя ветвлений.

Подвергся улучшению и интерфейс связи между L1 и L2, наконец, компания в Steamroller использовала кеш-память L2 динамически изменяемого объёма. В зависимости от нагрузки и частоты успешных обращений к кеш-памяти, модуль Steamroller может отключать диапазоны в 1/4 блоков L2, оптимизируя энергопотребление. AMD отмечает, что благодаря этому можно добиться существенного прироста энергоэффективности, особенно в задачах вроде просмотра видео, когда процессор используется не слишком активно.

Steamroller не приносит существенного улучшения задержек в L2/L3. По словам AMD, она понимает проблемы необычайно высоких задержек L3 в архитектуре Bulldozer, но исправление этого параметра не является первостепенным приоритетом (учитывая тот факт, что L3 в мобильных процессорах не применяется, да и многие серверные нагрузки не критичны для задержек L3).

Модуль расчётов с плавающей запятой и вычислитель описывается компаний в качестве «рационализированного оборудования» — компания заметно сократила занимаемую этими блоками площадь ядра без ущерба функциональности, но и прироста производительности в этой области не обещано. Некоторое ослабление возможностей Steamroller в области операций с плавающей запятой не должно стать особой проблемой для новых чипов, так как большую часть этих расчётов, судя по текущим планам AMD в отношении развития продуктов, постепенно возьмут на себя GPU (хоть на кристалле, хоть в качестве дискретной графики). Для обычных пользователей высокая производительность блоков FPU на процессоре обычно не нужна. Игрокам она необходима, но этот сегмент рынка дополняет графика AMD.

При разработке Steamroller компания применила новые методы автоматизации проектирования и оптимизации площади кристалла, благодаря чему элементы на чипе располагаются более плотно — это не только позволяет сокращать затраты на производство, делая чипы менее габаритными, но и приводит к экономии энергии благодаря уменьшению токов утечек (например, блок FPU 32-нм процессора Bulldozer с помощью этих методик становится на 30% компактнее).

Насколько известно на текущий момент, Steamroller напоминает архитектуру Bulldozer, которой она должна была быть. AMD утверждает, что можно смело ждать прироста ещё на 15% в производительности на ватт по сравнению с Piledriver, и список улучшений говорит, что это вполне реально. Похоже, Steamroller, наконец, позволит превзойти старую архитектуру K10 по эффективности на одной частоте. Это весьма важно — AMD необходимо наращивать однопоточную производительность для эффективной конкуренции с Intel.

Плохо то, что ещё 15% не изменят принципиально положение дел — чистая производительность Steamroller может достичь показателей Sandy Bridge, но вряд ли превзойдёт показатели Ivy Bridge или Haswell. Таким образом, доля AMD на рынке будет по-прежнему минимальной там, где нужна максимальная производительность — компания будет продолжать конкурировать при помощи более низкой цены и отличной графики в своих чипах.

Steamroller ожидается в 2013 году в виде 28-нм системы на чипе Kaveri (точная дата выхода этого гибридного процессора пока не названа). Чем раньше состоится запуск, тем лучше, ведь процессорам придётся соревноваться на рынке уже с 22-нм решениями Intel Core i четвёртого поколения с кодовым именем Haswell, выход которых ожидается во втором квартале 2013 года.

Последние планы AMD, опубликованные в феврале текущего года, говорят о том, что в виде обычного процессора без графики (вроде чипов FX) архитектура Steamroller не выйдет, по крайней мере, не в 2013 году. После Steamroller, по-видимому, уже в 2014 году, ожидается выход чипов с архитектурой Excavator, в которых производительность на ватт должна быть снова поднята на 15%.

Материалы по теме:

Источники: