Новости Hardware

ARM представила архитектуру Cortex A7

 Cortex A15 и Cortex A7

Как обеспечить постоянный рост производительности в рамках ограниченных по энергопотреблению устройств, каковыми являются смартфоны или планшеты? Можно создать более энергоэффективную микроархитектуру, но это возможно только до определённой степени. Можно перейти на более совершенный процесс производства, но и этот шаг сегодня уже не даёт прежних преимуществ. Раньше компании полагались на оба подхода, но сегодня этого уже недостаточно. Индустрия постепенно идёт по пути гетерогенных вычислений: размещения высокопроизводительных ядер рядом с маломощными, но энергоэффективными собратьями, и переключения между ними при необходимости.

NVIDIA недавно представила архитектуру процессора Tegra 3 (Kal-El). Компания рассказала о том, что система на чипе имеет 5 вычислительных ядер Cortex-A9, но лишь 4 из них видимы для ОС. При запуске простых фоновых задач работает только одно энергоэффективное ядро Cortex A9, а высокопроизводительные находятся в отключённом состоянии. Как только системе потребуется производительность, задачи перенаправляются на мощные ядра, а энергоэффективное отключается.

Решение NVIDIA полагается на идентичные ядра, но использующие различные транзисторы (LP и G), однако подход не слишком отличается, если использовать к тому же различные архитектуры ядер. Когда NVIDIA разрабатывала свой чип, ARM не могла предложить подходящего энергоэффективного ядра, которое могло бы использоваться как само по себе, так и в качестве ядра-спутника в системе на чипе с Cortex A15. Теперь такое ядро есть, и оно получило имя Cortex A7.

 Cortex A7

Начиная с Cortex A9, ARM перешла на исполнение команд с изменением последовательности (инструкции могут быть переупорядочены для улучшенного параллелизма) — этот переход архитектура x86 совершила во времена Pentium Pro. Cortex A15 развивает эту тенденцию, расширяя при этом число исполняемых за такт инструкций. Cortex A7, напротив, является шагом назад: это ещё одно ядро, исполняющее команды в заданной последовательности и способное выполнить до двух инструкций одновременно. Описание напоминает Cortex A8, однако A7 отличается во многих областях.

Ядро A8 является очень старой разработкой — работы над дизайном начались ещё в далёком 2003 году. Хотя ARM предлагала легко синтезируемые версии ядра, для достижения более высоких частот со временем производителям пришлось использовать собственную дополнительную логику. Создание отдельного дизайна не только удлиняло время вывода решений на рынок, но и увеличивало затраты на разработку. В Cortex A7 остаётся полностью синтезируемым, но при этом предлагает хороший уровень производительности. ARM при разработке архитектуры учла последние процессы производства, добившись хорошего соотношения тактовых частот и производительности, а также пересмотрела архитектуру, дабы уменьшить время и стоимость вывода решений на рынок.

В ядре Cortex A7 применяется 8-ступенчатый конвейер, обрабатывающий по две инструкции за такт (впрочем, некоторые сложные инструкции A7, в отличие от A8 исполняет в режиме одну за такт). Блок целочисленных операций в A7 аналогичен A8, а вот математический сопроцессор имеет полностью конвейерную организацию и более компактен, хотя и несколько упрощён.

 Эффективность Cortex A7

Некоторое упрощение архитектуры позволило существенно сократить размер ядра. ARM утверждает, что одно ядро Cortex A7 будет занимать всего 0,5 мм2 при использовании 28-нм техпроцесса. При одном и том же процессе производства клиенты ARM смогут разместить ядро A7 на площади всего в 1/3—1/2 ядра Cortex A8. Стандартный дизайн ядер A9 по площади соответствует A8, тогда как площадь A15 больше, чем у обоих.

Несмотря на ограниченные возможности в выполнении сложных инструкций, ARM ожидает, что архитектура Cortex A7 обеспечит более высокую производительность по сравнению с Cortex A8. Это частично достигается благодаря усовершенствованному модулю предсказания ветвлений и уменьшенному конвейеру, сокращающему вероятность неправильного предсказания перехода. Cortex A7 отличается улучшенными алгоритмами выборки команд и более скоростной кеш-памятью L2, что также позволяет увеличить общую эффективность вычислений.

Впрочем, из-за некоторых ограничений в определённых задачах производительность Cortex A7 будет находиться на уровне с Cortex A8 или даже уступать последнему. Рейтинг ожидаемой производительность DMIPS/МГц для различных ядер ARM выглядит так:

  • ARM11 — 1,25 DMIPS/МГц;
  • ARM Cortex A7 — 1,9 DMIPS/МГц;
  • ARM Cortex A8 — 2 DMIPS/МГц;
  • ARM Cortex A9 — 2,5 DMIPS/МГц;
  • Qualcomm Scorpion — 2,1 DMIPS/МГц;
  • Qualcomm Krait — 3,3 DMIPS/МГц.

 Сравнение ядер ARM

Важнее же всего то, что ядра Cortex A7 является на 100% ISA-совместимыми с Cortex A15, то есть поддерживают новые инструкции виртуализации и 40-битную адресацию памяти. В результате любой код, написанный для Cortex A15, может исполняться на Cortex A7, только медленнее. Это очень важная характеристика, которая позволяет производителям проектировать системы на чипе, оснащённые как ядрами Cortex A7, так и Cortex A15, переключаясь между ними в зависимости от задачи. ARM называет это конфигурацией big.LITTLE.

Архитектура Cortex A15 станет значительным шагом вперёд с точки зрения производительности архитектур ARM. Она нацелена на противостояние с чипами x86 начального уровня. Ядра Cortex A15 появятся в будущих смартфонах и планшетах, постепенно вытесняя Cortex A9 в решениях высокого класса. В сложных задачах Cortex A15, как ожидается, будут более энергоэффективными, чем A9.

Однако фоновые и простейшие задачи на смартфонах подчас не нуждаются в такой производительности, и их исполнение на мощном ядре A15 не очень эффективно с точки зрения потребления энергии. Здесь-то и выходит на первый план A7. Хотя Cortex A7 можно применять в качестве самостоятельных вычислительных ядер (и, конечно, они и будут так использоваться в дешёвых аппаратах), партнёры ARM могут интегрировать ядра Cortex A7 наряду с Cortex A15 в конфигурации big.LITTLE.

 Конфигурация big.LITTLE

Так как A7 и A15 могут исполнять одни и те же инструкции, системы на чипе, оснащённые ядрами обеих архитектур, могут переключать задачи с энергоэффективных на высокопроизводительные, в зависимости от необходимости. Непротиворечивость содержания кешей обеспечивается связью CCI-400. ARM сообщает, что чип может переключаться между кластерами с различными ядрами за 20 миллисекунд.

Если всё будет работать так, как описывает ARM, такая архитектура окажется полностью прозрачной для ОС, как и в случае с Tegra 3, и не понадобится никаких программных оптимизаций для увеличения энергоэффективности. Впрочем, производители, как отмечает ARM, смогут ставить ОС в известность о реальном числе вычислительных ядер, если им будет необходим такой подход.

На базе Cortex A7 можно будет создавать процессоры, оснащённые от 1 до 4 таких ядер, как самостоятельных, так и в конфигурации с A15. ARM ожидает, что уже в начале следующего года выйдут первые 40-нм чипы, основанные на A7. Они будут применяться в дешёвых 2-ядерных смартфонах стоимостью до $100 и ещё более дешёвых одноядерных. Также в следующем году должны появиться и 28-нм чипы, объединяющие как ядра Cortex A7, так и A15 на едином кристалле.

 Комбинирование Cortex A15 и Cortex A7

Таким образом, Cortex A7 является отличной архитектурой, способной не только обеспечить гораздо более высокое соотношение производительности и цены по сравнению с A8, но и значительно увеличить время автономной работы смартфонов, как высокого класса, так и начального уровня. Эра неоднородных вычислений, как следующая фаза развития микропроцессоров, быстро приближается.

Материалы по теме:

Источник:

window-new
Soft
Hard
Тренды 🔥
Новая статья: Neon White — неожиданный кандидат на «Игру года». Рецензия 8 ч.
Новая статья: Gamesblender № 577: цена прокачки в Diablo Immortal, Overwatch 2 вместо первой части и поиски виновных в багах Cyberpunk 2077 9 ч.
Meta закроет свой неудавшийся криптопроект Novi в сентябре 15 ч.
У витрины инди-игр itch.io появился клон — W3itch.io: его создатели признались в воровстве чужого кода 16 ч.
Первые подробности кампании Бакалавра в «Мор. Утопия»: без выживания и открытого мира, но с путешествием во времени 17 ч.
Крупнейший эмитент стейблкоинов Tether сократил долю коммерческих бумаг в резерве 18 ч.
Reddit поглотила компанию MeaningCloud, специализирующуюся на работе с естественным языком 19 ч.
В TikTok подтвердили, что китайские сотрудники имеют доступ к данным пользователей из США 20 ч.
Новая статья: Starship Troopers: Terran Command — победоносная высадка. Рецензия 02-07 00:22
С выходом восьмого крупного патча Baldur’s Gate 3 потяжелеет до 104 Гбайт 01-07 21:31
Финансируя строительство исследовательского центра TSMC в Японии, власти не получат прав на интеллектуальную собственность 34 мин.
Tesla построит в Техасе ещё один гигантский производственный корпус 2 ч.
Завершён третий этап изоляционного эксперимента SIRIUS: экипаж «побывал» на Луне 2 ч.
Tesla увеличила квартальные поставки электромобилей лишь в годовом сравнении 3 ч.
PlayStation VR2 будет использовать технологию отслеживания взгляда Tobii 16 ч.
EVGA укомплектовала флагманскую видеокарту RTX 3090 Ti K|NGP|N «бесплатным» блоком питания на 1600 Вт 17 ч.
Ключом к высокоёмким литиевым аккумуляторам может стать лазерная 3D-печать 18 ч.
США готовятся к созданию суперкомпьютеров производительностью от 10–20 Эфлопс, которые будут потреблять 20–60 МВт 18 ч.
Ракета Atlas V запустила на орбиту два американских военных спутника 18 ч.
Virgin Orbit совершила первый в мире ночной запуск спутников с самолёта-носителя 18 ч.