Аналитика

Микроархитектура Intel Sandy Bridge, часть III

⇣ Содержание

Этой публикацией мы заканчиваем цикл статей теоретического плана, посвящённых новому поколению микроархитектуры Intel Core II с рабочим названием Sandy Bridge.

В первой части под названием «Микроархитектура Intel Sandy Bridge, часть I»  мы рассмотрели структурные новшества новой процессорной микроархитектуры, а также изучили в деталях принцип работы кольцевой шины, кеш-памяти L3 и системного агента с входящими в его состав контроллером памяти DDR3, модулем управления питанием, блоком обработки медиаданных, видеовыходом и прочими вспомогательными компонентами.

Во второй статье - «Микроархитектура Intel Sandy Bridge, часть II»  мы познакомили наших читателей с особенностями реализации и функционирования процессорных ядер Sandy Bridge.

В сегодняшней статье мы рассмотрим технологии и нововведения, реализованные в микроархитектуре Sandy Bridge для повышения производительности интегрированного графического процессора и модуля медиа-обработки.  

#Структура графической системы Sandy Bridge

Прежде чем перейти к рассмотрению особенностей реализации архитектурных изменений в интегрированной графической подсистеме Sandy Bridge, обязательно следует сказать несколько слов о рыночном позиционировании этого решения. По словам представителей Intel, работая над улучшением характеристик нового поколения встроенной в процессор графики, они в первую очередь преследовали цель повысить привлекательность своих решений в массовых сегментах рынка настольных и мобильных ПК.

Типичным сценарием использования таких систем является работа с документами, интернет-сёрфинг, просмотр онлайнового и потокового видео, воспроизведение Blu-Ray и DVD (обычных и 3D), казуальные, браузерные и DirectX 10.1 игры. Иными словами, целью Intel изначально не являлось соперничество в секторе высокопроизводительных графических процессоров для видеокарт, где царят DirectX 11-решения и где интегрированной графике пока не место. Но на уже занятом поле интегрированной 3D-графики Intel хотела показать вполне приличный результат.

Справедливости ради стоит отметить, что для большинства потребителей настольных и мобильных систем с интегрированной графикой, не интересующихся ресурсоемкими DX11-приложениями, в большинстве случаев достаточно возможностей чипов с ядром Clarkdale/Arrandale. Однако в Intel пошли дальше и практически удвоили возможности графики в реализации Sandy Bridge.

Прежде всего, хотелось бы обратить внимание на тот факт, что встроенный графический процессор теперь выполнен на едином кристалле вместе с остальными компонентами Sandy Bridge.  В предыдущем поколении ядер Clarkdale/Arrandale встроенная графика с модулем обработки медиа и элементами периферии представляла собой отдельный дополнительный 45-нм кристалл с QPI-подключением к 32-нм кристаллу с процессорными ядрами и кешем L3, то есть 45-нм кристалл играл роль этакого встроенного «северного моста». В реализации архитектуры Sandy Bridge графика и все остальные элементы процессора располагаются на одном 32-нм кристалле.

В отличие от ядер Clarkdale/Arrandale, где управление производительностью и температурным режимом графики осуществлялось с помощью программного драйвера, жёстко привязанного к общим параметрам системы, GPU микроархитектуры Sandy Bridge управляется системным агентом на аппаратном уровне. При этом процессы изменения напряжения питания, тактовой частоты, производительности и энергопотребления встроенной графики теперь осуществляются в более широких пределах, с той же высокой эффективностью, что и изменение параметров процессорных ядер. Более того, турбо-режим графического процессора будет представлен и в настольных, и в мобильных процессорах.

Наконец, необходимо напомнить о самом главном моменте, который мы обсудили в первой части материала: теперь графический процессор подключен в систему общей кольцевой шиной и представляет собой равноценный элемент микроархитектуры Sandy Bridge с полноценным доступом к кешу L3.

Также напомним, что в реализации архитектуры Sandy Bridge модуль медиа-обработки и видеовыхода является отдельным структурным элементом системного агента.

#Графический процессор в микроархитектуре Sandy Bridge

Возможности графического процессора Sandy Bridge в целом сравнимы с таковыми у предыдущего поколения подобных решений Intel, разве что теперь в дополнение к возможностям DirectX 10 добавлена поддержка DirectX 10.1.

Тем не менее нововведений в графике Sandy Bridge достаточно много, и нацелены они главным образом на увеличение производительности при работе с 3D-графикой.

Основной упор при разработке нового графического ядра, по словам представителей Intel, был сделан на максимальном использовании аппаратных возможностей для обсчёта 3D-функций, и то же самое – для обработки медиа-данных. Такой подход радикально отличается от полностью программируемой аппаратной модели, принятой на вооружение, например, в NVIDIA, или в самой Intel для разработки Larrabee (за исключением текстурных блоков).

 

 

Однако в реализации Sandy Bridge отход от программируемой гибкости имеет свои неоспоримые плюсы, за счет него достигаются более важные для интегрированной графики выгоды в виде меньшей латентности при исполнении операций, лучшей производительности на фоне экономии расхода энергии, упрощённой модели программирования драйверов, и что немаловажно, с экономией физических размеров графического модуля.

Для программируемых исполнительных шейдерных модулей графики Sandy Bridge, по традиции называемых в Intel «исполнительными блоками» (EU, Execution Units), характерны увеличенные размеры регистрового файла, что позволяет достичь эффективного исполнения комплексных шейдеров. Также в новых исполнительных блоках применена оптимизация ветвления для достижения лучшего распараллеливания исполняемых команд.

В целом, по заявлению представителей Intel, новые исполнительные блоки обладают удвоенной по сравнению с предыдущим поколением интегрированной графики пропускной способностью, а производительность вычислений с трансцедентальными числами (тригонометрия, натуральные логарифмы и так далее) за счёт акцента на использовании аппаратных вычислительных возможностей модели вырастет в 4-20 раз.

Внутренний набор команд, усиленный в Sandy Bridge рядом новых, позволяет распределять большинство инструкций API набора DirectX 10 в режиме «один к одному», как в случае с архитектурой CISC, что в результате позволяет добиться значительно более высокой производительности при той же тактовой частоте.

Быстрый доступ посредством быстрой кольцевой шины к распределённому кешу L3 с динамически конфигурируемой сегментацией позволяет снизить латентность, поднять производительность и в то же время снизить частоту обращений графического процессора к оперативной памяти.

По предварительным данным, процессоры Intel Core II будут представлены двумя типами интегрированной графики, единственным отличием между которыми будет количество исполнительных блоков (EU). Максимальное количество – 12 EU - получат все процессоры для портативных ПК и часть процессоров для настольных ПК, по 6 EU получат некоторые модели процессоров для настольных ПК.

Разумеется, проводить аналогию между исполнительными шейдерными блоками графических процессоров Sandy Bridge и их эквивалентами в архитектурах графических процессоров NVIDIA или AMD, и уж тем более сравнивать их количество и пытаться построить на этом какие-то сравнительные прогнозы по производительности, нет никакого смысла. Слишком уж они разные. Достоверные цифры для сравнения производительности  мы сможем получить лишь после лабораторных тестов. Представители Intel говорят о двукратном превосходстве 3D-графики процессоров Sandy Bridge над предыдущим поколением.

По предварительным данным, тактовая частота графического ядра процессоров Sandy Bridge составит в разных версиях процессоров от 650 до 850 МГц, а с «раскачкой» при помощи Turbo Boost - до 1350 МГц в чипах для настольных ПК и до 1300 МГц в чипах для ноутбуков.

#Обработка медиа в процессорах микроархитектуры Sandy Bridge

Несмотря на тот факт, что физически модуль обработки медиа в Sandy Bridge расположен далеко за пределами графического процессора, а именно, в составе системного агента, обработка медиа-данных осуществляется с помощью «объединённых сил» медиа-модуля и GPU. В частности, с помощью исполнительных блоков графического процессора, оптимизированного под исполнение медиа-задач одновременно с обработкой 3D-графики.

 

Рендеринг видео значительно ускоряется благодаря распараллеленной обработке заданий и аппаратным медиа-кодекам распространённых форматов. Так, в Sandy Bridge значительно доработаны узлы кодирования и декодирования видео. В частности, специализированный мультиформатный распараллеленный движок декодирования MFX (Multi-Format Codec) теперь обеспечивает 100% аппаратное декодирование форматов MPEG2, VC1 и AVC, а также кодирование в формате AVC. Полностью аппаратная реализация мультиформатного кодека обеспечивает продолжительное время работы от батарей при автономном воспроизведении, а также быстрое декодирование видео.

Особый упор в презентации о Sandy Bridge представители Intel сделали на том, что новые процессоры даже самой бюджетной категории будут способны без каких-либо затруднений воспроизводить стереоскопический контент в формате Blu-ray 3D. Иными словами, в плане работы с медиа-контентом процессоры Sandy Bridge ничем не уступают по возможностям графическим решениям конкурентов.   

Специализированные аппаратные ускорители обработки медиа в чипах Sandy Bridge, наряду с повышением скорости обработки контента, обеспечивают такие современные функциональные возможности, как автоматическое детектирование деинтерлейсинга и кинотеатрального режима, качественное масштабирование видео, фильтрацию шумов и повышение детализации. В модуле обработки медиа-контента также реализованы аппаратные средства для качественной обработки цветовой составляющей и изображения – улучшения передачи телесных тонов, адаптивного повышения контрастности и общего управления цветовыми настройками.  

 

#Энергопотребление при работе с 3D-графикой и медиа-контентом

В первой части материала, в процессе знакомства с модулем системного агента, мы рассмотрели технологию Turbo Boost, принципы аппаратного управления напряжением питания и тактовыми частотами, производительностью и терморежимом компонентов микроархитектуры Sandy Bridge.

В этой части будет уместным ещё раз напомнить, что аппаратное управление питанием и тактовой частотой графического процессора в микроархитектуре Sandy Bridge делегировано системному агенту и организованное по образу и подобию управления процессорными ядрами. Такая организация технологии Turbo Boost позволяет оптимизировать энергопотребление графики и применять взвешенные рациональные сценарии нагрузки графического ядра и процессорных ядер.

 

В презентации Intel, посвящённой графическим компонентам микроархитектуры Sandy Bridge, подчёркивается, что разработчикам удалось значительно снизить энергопотребление новых процессоров и увеличить эффективность работы технологии Turbo Boost в режиме обработки медиа-данных – главным образом за счёт оптимизации целочисленных вычислений, введения распределённых цепей управления и агрессивных режимов отключения питания незадействованных компонентов.

Так, например, в режиме воспроизведения HD-видео энергопотребление процессора Sandy Bridge снижается практически вдвое. Более того, в процессе работы с типичным медиа-контентом при полной загрузке энергопотребление процессора примерно на 30% ниже, чем при работе с типичной 3D-задачей.

Процессоры Intel с микроархитектурой Sandy Bridge: ближайшие перспективы

Судя по информации, имеющейся на сегодняшний день, официальный анонс новых процессоров Intel Core II с микроархитектурой Sandy Bridge состоится в ближайшие несколько недель. Иными словами, всего несколько недель отделяет нас от возможности поговорить о характеристиках чипов Sandy Bridge предметно, с конкретными цифрами производительности различных шин, интерфейсов, с обсуждением результатов первых тестов.

Углубляться в описание ещё не анонсированных продуктов в такой ситуации особого смысла не имеет: незачем пересказывать догадки, когда совсем скоро можно будет представить официальную информацию; к тому же некоторая часть уже доступной информации уже сейчас находится под эмбарго соглашения о неразглашении.

И всё же кое-какие данные о новой платформе Intel на базе процессоров Sandy Bridge мы представим сейчас - тем более что большая часть этой информации доступна публично ещё с сентября, когда состоялся Форум Intel для разработчиков в Сан Франциско. 

Первое поколение процессоров Sandy Bridgeбудет выпускаться с соблюдением норм 32-нм техпроцесса; первыми на рынке будут представлены двуядерные и четырёхядерные процессоры для мобильных и настольных систем. Предварительная информация о некоторых из них представлена в таблице ниже. 

Модели первых процессоров с архитектурой Sandy Bridge (прогноз)
Модель Частота Turbo Boost,
Max
Ядер Кэш L3 TDP

Разлоч.
множ.

HT vPro AES-NI
Core i7 2600K 3,4 ГГц 3,8 ГГц 4 8 Мбайт 95 Вт + + - +
Core i7 2600 3,4 ГГц 3,8 ГГц 4 8 Мбайт 95 Вт - + + +
Core i5 2500K 3,3 ГГц 3,7 ГГц 4 6 Мбайт 95 Вт + - - +
Core i5 2500 3,3 ГГц 3,7 ГГц 4 6 Мбайт 95 Вт - + + +
Core i5 2400 3,1 ГГц 3,4 ГГц 4 6 Мбайт 95 Вт - + + +
Core i3 2120 3,3 ГГц - 2 3 Мбайт 65 Вт - + - -
Core i3 2100 3,1 ГГц - 2 3 Мбайт 65 Вт - + + -
Core i7 2600S 2,8 ГГц 3,8 ГГц 4 8 Мбайт 65 Вт - + + +
Core i5 2500S 2,7 ГГц 3,7 ГГц 4 6 Мбайт 65 Вт - - + +
Core i5 2500T 2,3 ГГц 3,3 ГГц 4 6 Мбайт 45 Вт - - + +
Core i5 2400S 2,5 ГГц 3,5 ГГц 4 6 Мбайт 65 Вт - - + +
Core i5 2400T 2,7 ГГц 3,5 ГГц 2 3 Мбайт 35 Вт - + + +
Core i3 2100T 2,5 ГГц - 2 3 Мбайт 35 Вт - + - -

Судя по маркировке новых процессоров, вопрос с отображением второго поколения архитектуры Core в названии чипа решён очень просто: отныне цифровые индексы будут 4-значными, и первая цифра как раз обозначает порядковый номер поколения архитектуры. Таким образом, никакой путаницы с Core 2 и Core Duo не будет.

Новые процессоры на базе микроархитектуры Sandy Bridge будут сопровождаться новыми наборами логики Intel 6 Series (Cougar Point), предварительная информация о которых сведена в таблице ниже.

  Чипсеты для настольных ПК серии Couger Point (прогноз)     
Модель H67 P67 H61 Q67 Q55 B65
Разъём CPU LGA1155 LGA1155 LGA1155 LGA1155 LGA1155 LGA1155
PCI Express 1x16 1x16/2x8 1x16 1x16 1x16 1x16
vPro - - - + ? -
RAID RAID 0/1/5/10 RAID 0/1/5/10 AHCI RAID 0/1/5/10 AHCI AHCI
USB 2.0 14  14 10 14 14 12
SATA 6Gbps 6(2)  6 (2) 4(0) 6 (2) 6(1) 6 (1) 6 (1)
PCI - - - + +  +

Ожидается, что новые платформы Intel для настольных ПК, помимо традиционных приложений, повысят спрос в наиболее динамично растущем секторе домашних развлекательных компьютерных систем, благо теперь интегрированное видео микроархитектуры Sandy Bridge уверенно поддерживает любой медиа-контент, включая воспроизведение Blu-ray 3D.

Соответственно, ожидается, что вместе с широким спектром системных плат в традиционных форм-факторах ATX/microATX, на рынке будет представлено великое множество более компактных и миниатюрных решений, благо TDP новых процессоров это позволяет. Для таких систем также будут выпускаться специальные низкопрофильные системы охлаждения.  

В дальнейших планах Intel числится переход к производству процессоров с соблюдением норм 22-нм технологического процесса. По предварительным данным, микроархитектура Sandy Bridgeбудет иметь как минимум три переходных дизайна -  ожидаемый Sandy Bridge, затем  Ivy Bridge, и ещё один, пока неизвестный Bridge(а не два, как в случае сегодняшних Nehalem/ Westmere).

Процессоры Ivy Bridgeбудут выпускаться с соблюдением норм 22-нм техпроцесса: первым ожидается появление 4/8-ядерных решений  для настольных систем. Уже на стадии появления микроархитектуры Ivy Bridge  - ближе к концу 2011 года - в интегрированнных GPU процессоров впервые будет реализована поддержка DirectX 11. А дальше... что будет дальше, мы расскажем, когда поступит достоверная информация.

 
 
⇣ Содержание
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
⇣ Комментарии
window-new
Soft
Hard
Тренды 🔥