Сегодня 26 апреля 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Процессоры и память

Intel Xeon 1,7 ГГц - король High-End?

⇣ Содержание

С момента первого выпуска Intel Pentium II Xeon прошло чуть меньше трех лет. Процессор базировался на том же ядре, что и Pentium II и Celeron тех дней, и позиционировался в роли процессора для high-end рабочих станций и серверов, на место Pentium Pro.

Одним из главных преимуществ Xeon было то, что процессор был достаточно мощным для большинства интенсивных серверных задач, и в то же время он сохранял функции ядра P6 для быстрого выполнения домашних/офисных приложений. Таким образом, благодаря Pentium II Xeon исчезла идея использования специализированного компьютера для работы, который не мог бы выполнять домашние/игровые приложения. Также Pentium II Xeon помог дальнейшему продвижению Intel на рынке многопроцессорных рабочих станций, который был захвачен не-x86 архитектурой.

Самый первый Pentium II Xeon был оснащен полноскоростным кэшем L2 до 2 Мб. Однако по причине использования 0,25 мкм технологии в Pentium II, кристалл был уже достаточно большим, и L2 кэш пришлось вынести за ядро и поместить на отдельном чипе, связанном внешней шиной с ядром процессора. Серия Xeon прошла долгую дорогу со своих первых дней в 1998 году. В Pentium III Xeon технология ядра уменьшилась до 0,18 мкм, поэтому кэш L2 (до 2 Мб) уже смог поместиться на кристалле процессора, что значительно улучшило производительность кэша.

Сегодня Intel продолжает свой курс по сегментированию своих флагманских процессоров и анонсирует процессор Xeon следующего поколения, который базируется на ядре Pentium 4 Willamette. Процессор называется по-старому, Intel Xeon, и выпускается в трех вариантах: 1,4 ГГц, 1,5 ГГц и 1,7 ГГц. Ядро процессора почти полностью идентично обычной (desktop) версии Pentium 4 за исключением незначительных деталей.



Архитектура Intel Xeon

Процессор Intel Xeon основан на точно таком же ядре, что и обычная версия Pentium 4. А это означает, что все то, чем гордится Pentium 4, есть и в Xeon. Но точно также это означает, что все недостатки Pentium 4 остались и в Xeon.

Мы не будем подробно останавливаться на архитектуре Pentium 4, а лишь вкратце пробежимся по основным чертам Pentium 4 и Xeon.

Гиперконвейерная технология (Hyper Pipelined Technology). У Xeon конвейер значительно длиннее, чем у Pentium III или Athlon. К сожалению, это означает, что Xeon выполняет меньше операций за такт, однако это обеспечивает путь для достижения значительно более высоких тактовых частот. В теории, работа на больших тактовых частотах позволит Xeon-у продемонстрировать весомое преимущество в производительности перед своими предшественниками, потому что факт выполнения меньших вычислений за такт не сильно заметен при умопомрачительных частотах. По этой же причине Pentium III мог достичь только 1 ГГц при использовании 0,18 мкм техпроцесса, и в то же время Xeon работает на 1,7 ГГц при том же самом техпроцессе. И как вы увидите, между ними ясно видна разница в производительности.

Улучшенное предсказание ветвлений (Improved Branch Prediction). Очевидно, что при таком длинном конвейере необходимо использовать улучшенный модуль предсказания ветвлений (BPU), как и сделано в Xeon. Можно утверждать, что BPU в Xeon является самым лучшим из всех существующих, и именно этот модуль сдерживает производительность Athlon. В любом случае, BPU в Xeon должен быть достойным, иначе недостатки гиперконвейерной архитектуры в P4 испортят всю картину.

Ядро быстрого выполнения (Rapid Execution Engine). Два ALU (арифметико-логический модуль) работают в Xeon с удвоенной скоростью (double pumped), они могут обрабатывать в два раза больше данных за такт чем обычно. Это дает ALU эффективную пропускную способность, аналогичную ALU, работающему с удвоенной тактовой частотой. В случае с 1,7 ГГц Xeon это означает, что ALU функционируют как обычные ALU (не с удвоенной скоростью) на частоте 3,4 ГГц. Такое ускорение необходимо для обеспечения у Xeon достойной производительности при работе с целыми числами. В целочисленном коде чаще всего происходят ошибки предсказания ветвлений, поэтому менее эффективное ALU привело бы к плохой производительности в целых числах, учитывая очень длинный конвейер Xeon.

Кэш с отслеживанием 12 тысяч инструкций (12K micro-op trace cache). Этот специальный кэш заменяет и улучшает традиционный кэш инструкций L1. 8-канальный ассоциативный кэш с отслеживанием выполнения кэширует операции после их декодирования и также кэширует операции по предсказанному пути выполнения. Это позволяет скрыть некоторые недостатки столь длинного конвейера.

256 кб улучшенный кэш передачи (256KB Advanced Transfer Cache). Подсистема кэша L2 в Xeon просто потрясающая, если не сказать больше. Она отличается не только 256-битной шиной от L2 кэша до процессора, но и способностью передавать данные их кэша на каждый такт, что означает превосходство по пиковой пропускной способности кэша в сравнении с другими процессорами в этом классе. У Xeon 1,7 ГГц пиковая пропускная способность при чтении/записи в кэш L2 составляет 54,4 Гбайт/с. Если сравнить с Pentium III 1,0 ГГц, то у него пропускная способность составляет 16 Гбайт/с, а у Athlon 1,33 ГГц - 10 Гбайт/с (Athlon ограничен 64-битной шиной до кэша L2).

Аппаратная упреждающая выборка (Hardware Prefetch). Xeon способен предсказывать, какие данные ему понадобятся перед реальным запросом из основной памяти, и он может заранее перевести эти данные в кэш. Таким образом, на момент запроса данных, они уже будут находиться в кэше. Если же данные так и не будут востребованы, место в кэше будет использовано вхолостую, и точно такая же ситуация произойдет и с частью пропускной способности FSB и шины памяти. В любом случае, аппаратная упреждающая выборка сводится к загрузке пропускной способности FSB/шины памяти, но благодаря следующей особенности архитектуры Xeon она так и не смогла стать серьезной проблемой.

Четырехскоростная (quad pumped) 100 МГц FSB и двухканальная RDRAM. Xeon использует 100 МГц FSB, скорость которой увеличена в четыре раза (quad pumped), таким образом она обеспечивает пропускную способность, эквивалентную 400 МГц FSB, то есть 3,2 Гбайт/с. FSB синхронно работает с двумя каналами RDRAM чипсета i850 на частоте 400 МГц используя две 16-битные шины. Таким образом, пиковая пропускная способность шины памяти составляет 3,2 Гбайт/с. Если для платформы Pentium III RDRAM была не так уж необходима, то для использования совместно с Xeon, такая память очень хорошо подходит.

SSE2. В Xeon добавлены новые 144 SSE2 инструкции к имеющимся в первом SSE 70 инструкциям. Под SPEC CPU2000 улучшение производительности с использованием одной только оптимизации под SSE2 находится в пределах 5%. Учитывая синтетическую природу теста SPEC CPU2000, очень непохоже, что SSE2 покажет нам какой-либо стоящий прирост производительности в современных приложениях. Единственное что мы не учли -SSE2 может использовать две 64-битные SIMD-Int и SIMD-FP операции. Эта возможность не используется в SPEC CPU2000 и она, возможно, еще покажет себя.


Технология Jackson - не в этот раз

Еще во время IDF существовало достаточно много причин поверить в то, что Intel Xeon будет первым процессором с использованием технологии Jackson (это ее внутреннее имя). Технология предназначена для использования одновременной многопоточности (Simultaneous Multithread, SMT) в ядре процессора. Говоря вкратце, процессор имеет аппаратное ограничение выполнения только одного потока в один момент времени. Если сравнить теоретическое число инструкций, которые процессор может выполнить за определенный такт (IPC), то оно будет намного выше действительного IPC при выполнении реальных задач. Связано это с тем, что процессор не всегда максимально загружен, и часть вычислительной мощности теряется.

Эффективность работы процессора многократно повысилась бы, если бы он был способен выполнять на аппаратном уровне несколько потоков одновременно. В этом и заключается основное преимущество технологии одновременной многопоточности.

Было бы очень логично, если бы технология Jackson начала использоваться в двухпроцессорных рабочих станциях на базе Xeon, так как приложения, которые обычно запускаются на таких станциях, должны были бы получить значительное преимущество от использования SMT ядра. К сожалению, процессор Intel Xeon, который вышел на днях, не задействует технологию Jackson.

Однако, как ясно видно по информации с IDF и по сообщениям некоторых источников, близких к Intel, технология Jackson значится в планах Intel. Эта технология должна стать большим шагом вперед для Intel, она открывает весьма любопытные возможности для увеличения производительности. Также не следует забывать, что Intel имеет обыкновение выпускать одно ядро и адаптировать его для самых важных сегментов рынка. Существует вероятность, что технология Jackson будет использоваться и в обычной версии Pentium 4, а не только в версии Xeon для рабочих станций и серверов.

Как вариант, может получиться ситуация, когда текущее ядро Willamette содержит технологию Jackson, но она не задействована ядром. Существует некоторое число проблем, которые Intel должна разрешить перед анонсом/включением поддержки Jackson, например, поддержка технологии программным обеспечением.

Мы с нетерпением ждем выхода технологии Jackson, однако, нам придется еще немного потерпеть. Не будем забывать, что к концу года планируется уменьшение технологии изготовления ядра, а в следующем году будет выпущен Xeon MP (4+ процессора) с L3 кэшем на кристалле ядра. Оба этих события могут послужить хорошей причиной для анонса технологии Jackson.

Следующая страница →
 
⇣ Содержание
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.

window-new
Soft
Hard
Тренды 🔥
AMD выпустила драйвер с поддержкой игры Manor Lords и исправлением множества ошибок 6 ч.
Telegram обновился: рекомендованные каналы, дни рождения, трансляция геопозиции и аватарки при пересылке 10 ч.
В Steam и на консолях вышел боевик Another Crab's Treasure в духе Dark Souls, но про краба-отшельника — игроки в восторге 10 ч.
TikTok не рассматривает продажу американского бизнеса — соцсеть просто закроется в США 11 ч.
Blizzard отменила BlizzCon 2024, но с пустыми руками фанатов не оставит 11 ч.
Состоялся релиз «Кибер Инфраструктуры» версии 5.5 с VDI, DRS и рядом других улучшений 12 ч.
Объявлены обладатели международной премии Workspace Digital Awards-2024 13 ч.
ИИ-стартап Synthesia разработал по-настоящему эмоциональные аватары, которые так и просятся в дипфейки 13 ч.
Intel выпустила драйвер с поддержкой Manor Lords 14 ч.
Один из лучших модов для Doom II скоро получит ремейк на Unreal Engine 5 — страница Total Chaos появилась в Steam 14 ч.
Процессор HiSilicon Kirin 9010 внутри смартфонов Huawei Pura 70 тоже выпускается SMIC по 7-нм технологии 24 мин.
TSMC не потребуется оборудование High-NA EUV для выпуска чипов по технологии A16 2 ч.
Выручка Intel выросла на 9 %, но прогноз на текущий квартал вызвал падение курса акций на 7,75 % 5 ч.
Honor представила смартфон Honor 200 Lite с Dimensity 6080 и 108-Мп камерой 6 ч.
TSMC представила техпроцесс N4C — благодаря ему 4-нм чипы станут дешевле 9 ч.
Wacom представила первый интерактивный OLED-дисплей — 13-дюймовый Movink стоимостью $750 9 ч.
Новая статья: Обзор Ryzen 7 8700G: на что способна интегрированная графика для игр в 1080p 10 ч.
Apple избавилась от директора по маркетингу Vision Pro — с продажами гарнитуры и правда не всё в порядке 13 ч.
Китай отправил на космическую станцию пилотируемый корабль «Шэньчжоу-18» с тремя тайконавтами 13 ч.
В Китае испытали нейроинтерфейс Neucyber, который составит конкуренцию Neuralink 13 ч.