Сегодня 22 ноября 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Процессоры и память

45-нм процессоры Intel Penryn и Nehalem: особенности архитектуры

⇣ Содержание

Вступление

Одна из наиболее интригующих тем новостей и публикаций этого сезона – выпуск компанией Intel процессоров с соблюдением норм 45 нм техпроцесса. На страницах нашего сайта, по мере поступления подробностей о новых чипах, прошёл ряд публикаций соответствующего профиля. Сегодня мы попробуем детально рассказать о нововведениях и технологиях в новых процессорах. Попытаемся подвести некую черту под теоретическими выкладками, после которой, как известно, следуют практические испытания инженерных и розничных образцов процессоров.

Микроархитектуры ближайших лет

Прежде всего, расскажем читателям о последних планах Intel по внедрению процессорных микроархитектур в ближайшие пару лет. Процессоры для настольных ПК нового поколения с рабочим названием Penryn будут построены на базе усовершенствованной микроархитектуры Intel Core. Основным их отличием станет переход на 45-нм техпроцесс и некоторые архитектурные новшества, вследствие чего повысится энергоэффективность, расширится частотный потенциал, увеличится количество выполняемых команд за такт и прочее.
После наладки массового производства чипов Penryn, Intel планирует представить процессоры Nehalem с новой одноименной микроархитектурой - на смену Intel Core. Примерно через два-три года после анонса 45-нм процессоров – ориентировочно, ближе к 2009-2010, Intel надеется представить новый, более прецизионный 32-нм техпроцесс. Пока эти планы довольно туманны: даже переход на 45 нм сопровождался большими трудностями и потребовал задействования совершенно новых материалов (high-k диэлектрики и металлические затворы). В рамках 32 нм техпроцесса будут представлены процессоры с рабочим названием Westmere, ранее известные как Nehalem-C, с той же микроархитектурой Nehalem. Через два года после появления Nehalem на смену придет микроархитектура Gesher. О ней пока очень мало сведений. Известно лишь, что первые процессоры Gesher будут выпускаться по 32-нм техпроцессу. На этом прогнозы относительно развития процессоров заканчиваются. Судя по этим планам, Intel придерживается прежней стратегии смены микроархитектур и перехода на новый техпроцесс каждые два года. Удастся ли лидеру процессорной индустрии удерживать такие высокие темпы развития, сказать сложно. В Intel такую стратегию выпуска продукции называет “tick-tock” (“тик-так”). Каждый “тик” отражает новый этап развития полупроводниковых производственных технологий и усовершенствования в области микроархитектуры (например, Penryn). Каждый “так” соответствует созданию новой микроархитектуры (например, Nehalem).

Подробнее о процессорах Penryn

Процессоры семейства Penryn хронологически появятся раньше Nehalem, с них и начнём. Сегодня на разных стадиях разработки находятся более 15 продуктов семейства Penryn. В числе первых мы увидим чипы, ориентированные на разные секторы рынка.
До недавнего времени было известно о готовящихся к выпуску двухъядерном процессоре для ноутбуков, 2- и 4-х ядерных моделях для настольных ПК, а также 2- и 4-х ядерных процессорах для серверного сегмента. В дни Форума Intel для разработчиков в Пекине мы также узнали о планах компании по выпуску 45-нм чипов и для устройств класса UMPC (Ultra Mobile PC). Новые процессоры станут серьёзной заявкой и могут пошатнуть позиции таких производителей, как AMD, VIA Technologies и других.
Усовершенствования, которые принесет переход на новый техпроцесс, интересно рассмотреть с позиций количественного сравнения. Например, четырехъядерные процессоры Penryn будут включать около 820 млн. транзисторов, которые разместятся на двух кристаллах площадью 107 мм2. Для сравнения, современные четырехъядерные процессоры Intel Kentsfield имеют 582 млн. транзисторов, при этом площади кристаллов четырехъядерных процессоров, выпускающихся по 65-нм нормам, составляют 143 мм2.
Новшества, которые принесет следующее поколение процессоров, можно рассматривать по отношению к пяти современным технологиям Intel: Wide Dynamic Execution, Advanced Smart Cache, Smart Memory Access, Advanced Digital Media Boost, Intelligent Power Capability.
Механизм Wide Dynamic Execution обеспечивает выполнение большего числа команд за один тактовый цикл, что увеличивает производительность и помогает добиться повышения энергоэффективности. В рамках этой технологии компания Intel представит усовершенствованный более быстрый блок деления, основанный на базе методики radix-16, а также улучшенную технологию виртуализации Enhanced Intel Virtualization Technology. Инновационная архитектура на базе radix-16 позволит существенно уменьшить задержки при выполнении целочисленных операций деления, а также операций деления с плавающей запятой. На нижеприведенной диаграмме вы видите красноречивые результаты, которые не требуют комментариев.
Технология Advanced Smart Cache нацелена на обеспечение более высокой производительности и эффективности кэш-памяти. В процессорах семейства Penryn компания Intel решила увеличить объем кэша. Так, двухъядерные процессоры будут оснащаться кэшем L2 емкостью до 6 Мб, а отдельные четырехъядерные модели обзаведутся 12-Мб кэш-памятью. О частотных характеристиках пока говорится в ключе преодоления планки 3 ГГц.
В рамках технологии Smart Memory Access говорится об увеличении пропускной способности шины. Подтверждается информация об освоении шины FSB 1600 МГц. Сообщается, что шина FSB 1600 МГц появится в некоторых моделях процессоров для серверов и рабочих станций; когда будут выпущены модели с высокоскоростной шиной для настольных ПК, пока не уточняется. Технология Advanced Digital Media Boost применяется для ускорения обработки видео, изображения и речевых потоков. Для повышения производительности при обработке медиаданных Intel решила добавить к архитектуре ISA набор расширений SSE4 (Streaming SIMD Extensions 4), который станет доступным для большинства массовых секторов рынка ПК с появлением 45-нм процессоров. Этот новый набор команд включает множество инновационных инструкций (их насчитывается около 50), которые условно можно разделить на две группы:
  • Примитивы векторизации для компиляторов и ускорители мультимедийных приложений;
  • Ускорители обработки строк и текстовой информации.
Пожалуй, на SSE4 остановимся детальнее, поскольку технология является одним из ключевых нововведений. Для начала опишем приложения, которые затронет это усовершенствование. Улучшения коснутся графики, кодирования и обработки видео, создания трехмерных изображений, игр, Web-серверов, серверов приложений. Как утверждает Intel, увеличится производительность приложений с высокой интенсивностью вычислений - анализа хранилищ данных, СУБД, сложных алгоритмов поиска и сопоставления, алгоритмов сжатия звука, видео, изображений и данных, алгоритмов синтаксического анализа и анализа логических состояний, а также многих других.
По словам Intel, SSE4 – самое масштабное и значительное расширение архитектуры Intel ISA со времени появления SSE2. Набор команд SSE4 содержит несколько примитивов векторизации для компиляторов, обеспечивающих дальнейшее увеличение производительности и эффективности мультимедийных приложений. Имеются также и новые инновационные инструкции для обработки строк. Еще одним усовершенствованием является механизм перестановок - Super Shuffle Engine. Новый блок умеет выполнять перестановки значений сразу во всем 128-разрядном регистре за один такт. Это существенно повышает производительность при обработке операций, связанных с перестановкой (упаковка, распаковка, сдвиг упакованных значений, вставка). Сравнение количества тактов, нужных для выполнения базовых операций SSE, приведено на диаграмме. В среднем наблюдается двукратное увеличение производительности.
Интересные новшества касаются уменьшения уровня потребления мощности и увеличения показателя «производительность на ватт». В связи с этим Intel представила две новые технологии: Deep Power Down Technology и Enhanced Dynamic Acceleration Technology. Технология Deep Power Down Technology будет внедрена, в первую очередь, в процессоры для мобильных платформ (Mobile Penryn). Для понижения энергопотребления в режиме бездействия добавлено еще одно особое состояние процессора, именуемое как Deep Power Down Technology State, или C6. В этом режиме предусмотрено отключение ядер, при этом также полностью отключается кэш-память. Это позволяет существенно понизить напряжение ядра и потребляемой мощности, что, в свою очередь, увеличивает время работы батареи.
Интересным нововведением является технология Enhanced Dynamic Acceleration Technology (EDAT). Её идея состоит в следующем. Для простоты возьмем случай с двухъядерным процессором. Поскольку в однопоточных приложениях от многоядерности толку мало, основную роль здесь играет производительность отдельно взятого ядра. Поэтому Intel предусмотрела увеличение частоты работающего ядра (non-idle core), в то время как второе (idle core) находится в одном из состояний бездействия (C3-C6) и его тепловыделение резко сокращается. Эту разницу использует работающее ядро и повышает свою частоту до достижения процессором граничного уровня TDP. Для наглядности приводим следующую иллюстрацию.
Теперь об уровне TDP 45-нм процессоров. К сожалению, пока нет данных о тепловыделении мобильных чипов. Двухъядерные Penryn для настольных ПК попадут в энергетический класс 65 Вт, а для их четырехъядерных родственников предусмотрены тепловые пакеты 95 и 130 Вт. В серверном сегменте для двухъядерных Intel Xeon уровни TDP составят 40, 65 и 80 Вт, а для четырехъядерных – 50, 80 и 120 Вт. Согласно внутренним тестам Intel, в игровых приложениях наблюдается 20-ти процентный прирост производительности новых чипов, а в операциях с декодированием видео (при условии использования SSE4) – более 40% прирост. Если сравнивать серверный процессор Penryn с частотой более 3 ГГц и самый мощный четырехъядерный Xeon (Xeon X5355, 2,66 ГГц, FSB 1333 МГц), прирост в приложениях, интенсивно использующих операции с плавающей запятой и чувствительных к пропускной способности, составит около 45%.

Следующая страница →
 
⇣ Содержание
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.

window-new
Soft
Hard
Тренды 🔥
Центр ФСБ по компьютерным инцидентам разорвал договор с Positive Technologies 49 мин.
Android упростит смену смартфона — авторизовываться в приложениях вручную больше не придётся 54 мин.
OpenAI пытается выйти на рынок интернет-браузеров и поисковых систем 2 ч.
Apple разрабатывает LLM Siri — она будет больше похожа на человека и выйдет с iOS 19 3 ч.
Новая статья: Верные спутники: 20+ полезных Telegram-ботов для путешественников 9 ч.
Итоги Golden Joystick Awards 2024 — Final Fantasy VII Rebirth и Helldivers 2 забрали больше всех наград, а Black Myth: Wukong стала игрой года 10 ч.
В программу сохранения классических игр от GOG вошли S.T.A.L.K.E.R. Shadow of Chernobyl и Call of Pripyat, а Clear Sky — на подходе 11 ч.
Star Wars Outlaws вышла в Steam с крупным обновлением и дополнением про Лэндо Калриссиана 12 ч.
Рекордная скидка и PvP-режим Versus обернулись для Warhammer: Vermintide 2 полумиллионом новых игроков за неделю 14 ч.
Новый трейлер раскрыл дату выхода Mandragora — метроидвании с элементами Dark Souls и нелинейной историей от соавтора Vampire: The Masquerade — Bloodlines 15 ч.
Positive Technologies получила сертификат ФСТЭК на межсетевой экран PT NGFW 52 мин.
Google готова навсегда отменить разработку планшета Pixel Tablet 3 2 ч.
Nvidia предупредила о предстоящем дефиците GeForce в ближайшие месяцы 6 ч.
Представлен внешний SSD SanDisk Extreme на 8 Тбайт за $800 и скоростной SanDisk Extreme PRO с USB4 10 ч.
Представлен безбуферный SSD WD_Black SN7100 со скоростью до 7250 Мбайт/с и внешний SSD WD_Black C50 для Xbox 10 ч.
Новая статья: Обзор ноутбука ASUS Zenbook S 16 (UM5606W): Ryzen AI в естественной среде 10 ч.
Redmi показала флагманский смартфон K80 Pro и объявила дату его премьеры 12 ч.
Астрономы впервые сфотографировали умирающую звезду за пределами нашей галактики — она выглядит не так, как ожидалось 15 ч.
Представлена технология охлаждения чипов светом — секретная и только по предварительной записи 16 ч.
Японская Hokkaido Electric Power намерена перезапустить ядерный реактор для удовлетворения потребности ЦОД в энергии 16 ч.