Сегодня 14 ноября 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Аналитика

Микроархитектура Intel Sandy Bridge, часть III

⇣ Содержание

Этой публикацией мы заканчиваем цикл статей теоретического плана, посвящённых новому поколению микроархитектуры Intel Core II с рабочим названием Sandy Bridge.

В первой части под названием «Микроархитектура Intel Sandy Bridge, часть I» мы рассмотрели структурные новшества новой процессорной микроархитектуры, а также изучили в деталях принцип работы кольцевой шины, кеш-памяти L3 и системного агента с входящими в его состав контроллером памяти DDR3, модулем управления питанием, блоком обработки медиаданных, видеовыходом и прочими вспомогательными компонентами.

Во второй статье - «Микроархитектура Intel Sandy Bridge, часть II» мы познакомили наших читателей с особенностями реализации и функционирования процессорных ядер Sandy Bridge.

В сегодняшней статье мы рассмотрим технологии и нововведения, реализованные в микроархитектуре Sandy Bridge для повышения производительности интегрированного графического процессора и модуля медиа-обработки.

#Структура графической системы Sandy Bridge

Прежде чем перейти к рассмотрению особенностей реализации архитектурных изменений в интегрированной графической подсистеме Sandy Bridge, обязательно следует сказать несколько слов о рыночном позиционировании этого решения. По словам представителей Intel, работая над улучшением характеристик нового поколения встроенной в процессор графики, они в первую очередь преследовали цель повысить привлекательность своих решений в массовых сегментах рынка настольных и мобильных ПК.

Типичным сценарием использования таких систем является работа с документами, интернет-сёрфинг, просмотр онлайнового и потокового видео, воспроизведение Blu-Ray и DVD (обычных и 3D), казуальные, браузерные и DirectX 10.1 игры. Иными словами, целью Intel изначально не являлось соперничество в секторе высокопроизводительных графических процессоров для видеокарт, где царят DirectX 11-решения и где интегрированной графике пока не место. Но на уже занятом поле интегрированной 3D-графики Intel хотела показать вполне приличный результат.

Справедливости ради стоит отметить, что для большинства потребителей настольных и мобильных систем с интегрированной графикой, не интересующихся ресурсоемкими DX11-приложениями, в большинстве случаев достаточно возможностей чипов с ядром Clarkdale/Arrandale. Однако в Intel пошли дальше и практически удвоили возможности графики в реализации Sandy Bridge.

Прежде всего, хотелось бы обратить внимание на тот факт, что встроенный графический процессор теперь выполнен на едином кристалле вместе с остальными компонентами Sandy Bridge. В предыдущем поколении ядер Clarkdale/Arrandale встроенная графика с модулем обработки медиа и элементами периферии представляла собой отдельный дополнительный 45-нм кристалл с QPI-подключением к 32-нм кристаллу с процессорными ядрами и кешем L3, то есть 45-нм кристалл играл роль этакого встроенного «северного моста». В реализации архитектуры Sandy Bridge графика и все остальные элементы процессора располагаются на одном 32-нм кристалле.

В отличие от ядер Clarkdale/Arrandale, где управление производительностью и температурным режимом графики осуществлялось с помощью программного драйвера, жёстко привязанного к общим параметрам системы, GPU микроархитектуры Sandy Bridge управляется системным агентом на аппаратном уровне. При этом процессы изменения напряжения питания, тактовой частоты, производительности и энергопотребления встроенной графики теперь осуществляются в более широких пределах, с той же высокой эффективностью, что и изменение параметров процессорных ядер. Более того, турбо-режим графического процессора будет представлен и в настольных, и в мобильных процессорах.

Наконец, необходимо напомнить о самом главном моменте, который мы обсудили в первой части материала: теперь графический процессор подключен в систему общей кольцевой шиной и представляет собой равноценный элемент микроархитектуры Sandy Bridge с полноценным доступом к кешу L3.

Также напомним, что в реализации архитектуры Sandy Bridge модуль медиа-обработки и видеовыхода является отдельным структурным элементом системного агента.

#Графический процессор в микроархитектуре Sandy Bridge

Возможности графического процессора Sandy Bridge в целом сравнимы с таковыми у предыдущего поколения подобных решений Intel, разве что теперь в дополнение к возможностям DirectX 10 добавлена поддержка DirectX 10.1.

Тем не менее нововведений в графике Sandy Bridge достаточно много, и нацелены они главным образом на увеличение производительности при работе с 3D-графикой.

Основной упор при разработке нового графического ядра, по словам представителей Intel, был сделан на максимальном использовании аппаратных возможностей для обсчёта 3D-функций, и то же самое – для обработки медиа-данных. Такой подход радикально отличается от полностью программируемой аппаратной модели, принятой на вооружение, например, в NVIDIA, или в самой Intel для разработки Larrabee (за исключением текстурных блоков).

Однако в реализации Sandy Bridge отход от программируемой гибкости имеет свои неоспоримые плюсы, за счет него достигаются более важные для интегрированной графики выгоды в виде меньшей латентности при исполнении операций, лучшей производительности на фоне экономии расхода энергии, упрощённой модели программирования драйверов, и что немаловажно, с экономией физических размеров графического модуля.

Для программируемых исполнительных шейдерных модулей графики Sandy Bridge, по традиции называемых в Intel «исполнительными блоками» (EU, Execution Units), характерны увеличенные размеры регистрового файла, что позволяет достичь эффективного исполнения комплексных шейдеров. Также в новых исполнительных блоках применена оптимизация ветвления для достижения лучшего распараллеливания исполняемых команд.

В целом, по заявлению представителей Intel, новые исполнительные блоки обладают удвоенной по сравнению с предыдущим поколением интегрированной графики пропускной способностью, а производительность вычислений с трансцедентальными числами (тригонометрия, натуральные логарифмы и так далее) за счёт акцента на использовании аппаратных вычислительных возможностей модели вырастет в 4-20 раз.

Внутренний набор команд, усиленный в Sandy Bridge рядом новых, позволяет распределять большинство инструкций API набора DirectX 10 в режиме «один к одному», как в случае с архитектурой CISC, что в результате позволяет добиться значительно более высокой производительности при той же тактовой частоте.

Быстрый доступ посредством быстрой кольцевой шины к распределённому кешу L3 с динамически конфигурируемой сегментацией позволяет снизить латентность, поднять производительность и в то же время снизить частоту обращений графического процессора к оперативной памяти.

По предварительным данным, процессоры Intel Core II будут представлены двумя типами интегрированной графики, единственным отличием между которыми будет количество исполнительных блоков (EU). Максимальное количество – 12 EU - получат все процессоры для портативных ПК и часть процессоров для настольных ПК, по 6 EU получат некоторые модели процессоров для настольных ПК.

Разумеется, проводить аналогию между исполнительными шейдерными блоками графических процессоров Sandy Bridge и их эквивалентами в архитектурах графических процессоров NVIDIA или AMD, и уж тем более сравнивать их количество и пытаться построить на этом какие-то сравнительные прогнозы по производительности, нет никакого смысла. Слишком уж они разные. Достоверные цифры для сравнения производительности мы сможем получить лишь после лабораторных тестов. Представители Intel говорят о двукратном превосходстве 3D-графики процессоров Sandy Bridge над предыдущим поколением.

По предварительным данным, тактовая частота графического ядра процессоров Sandy Bridge составит в разных версиях процессоров от 650 до 850 МГц, а с «раскачкой» при помощи Turbo Boost - до 1350 МГц в чипах для настольных ПК и до 1300 МГц в чипах для ноутбуков.

#Обработка медиа в процессорах микроархитектуры Sandy Bridge

Несмотря на тот факт, что физически модуль обработки медиа в Sandy Bridge расположен далеко за пределами графического процессора, а именно, в составе системного агента, обработка медиа-данных осуществляется с помощью «объединённых сил» медиа-модуля и GPU. В частности, с помощью исполнительных блоков графического процессора, оптимизированного под исполнение медиа-задач одновременно с обработкой 3D-графики.

Рендеринг видео значительно ускоряется благодаря распараллеленной обработке заданий и аппаратным медиа-кодекам распространённых форматов. Так, в Sandy Bridge значительно доработаны узлы кодирования и декодирования видео. В частности, специализированный мультиформатный распараллеленный движок декодирования MFX (Multi-Format Codec) теперь обеспечивает 100% аппаратное декодирование форматов MPEG2, VC1 и AVC, а также кодирование в формате AVC. Полностью аппаратная реализация мультиформатного кодека обеспечивает продолжительное время работы от батарей при автономном воспроизведении, а также быстрое декодирование видео.

Особый упор в презентации о Sandy Bridge представители Intel сделали на том, что новые процессоры даже самой бюджетной категории будут способны без каких-либо затруднений воспроизводить стереоскопический контент в формате Blu-ray 3D. Иными словами, в плане работы с медиа-контентом процессоры Sandy Bridge ничем не уступают по возможностям графическим решениям конкурентов.

Специализированные аппаратные ускорители обработки медиа в чипах Sandy Bridge, наряду с повышением скорости обработки контента, обеспечивают такие современные функциональные возможности, как автоматическое детектирование деинтерлейсинга и кинотеатрального режима, качественное масштабирование видео, фильтрацию шумов и повышение детализации. В модуле обработки медиа-контента также реализованы аппаратные средства для качественной обработки цветовой составляющей и изображения – улучшения передачи телесных тонов, адаптивного повышения контрастности и общего управления цветовыми настройками.

#Энергопотребление при работе с 3D-графикой и медиа-контентом

В первой части материала, в процессе знакомства с модулем системного агента, мы рассмотрели технологию Turbo Boost, принципы аппаратного управления напряжением питания и тактовыми частотами, производительностью и терморежимом компонентов микроархитектуры Sandy Bridge.

В этой части будет уместным ещё раз напомнить, что аппаратное управление питанием и тактовой частотой графического процессора в микроархитектуре Sandy Bridge делегировано системному агенту и организованное по образу и подобию управления процессорными ядрами. Такая организация технологии Turbo Boost позволяет оптимизировать энергопотребление графики и применять взвешенные рациональные сценарии нагрузки графического ядра и процессорных ядер.

В презентации Intel, посвящённой графическим компонентам микроархитектуры Sandy Bridge, подчёркивается, что разработчикам удалось значительно снизить энергопотребление новых процессоров и увеличить эффективность работы технологии Turbo Boost в режиме обработки медиа-данных – главным образом за счёт оптимизации целочисленных вычислений, введения распределённых цепей управления и агрессивных режимов отключения питания незадействованных компонентов.

Так, например, в режиме воспроизведения HD-видео энергопотребление процессора Sandy Bridge снижается практически вдвое. Более того, в процессе работы с типичным медиа-контентом при полной загрузке энергопотребление процессора примерно на 30% ниже, чем при работе с типичной 3D-задачей.

Процессоры Intel с микроархитектурой Sandy Bridge: ближайшие перспективы

Судя по информации, имеющейся на сегодняшний день, официальный анонс новых процессоров Intel Core II с микроархитектурой Sandy Bridge состоится в ближайшие несколько недель. Иными словами, всего несколько недель отделяет нас от возможности поговорить о характеристиках чипов Sandy Bridge предметно, с конкретными цифрами производительности различных шин, интерфейсов, с обсуждением результатов первых тестов.

Углубляться в описание ещё не анонсированных продуктов в такой ситуации особого смысла не имеет: незачем пересказывать догадки, когда совсем скоро можно будет представить официальную информацию; к тому же некоторая часть уже доступной информации уже сейчас находится под эмбарго соглашения о неразглашении.

И всё же кое-какие данные о новой платформе Intel на базе процессоров Sandy Bridge мы представим сейчас - тем более что большая часть этой информации доступна публично ещё с сентября, когда состоялся Форум Intel для разработчиков в Сан Франциско.

Первое поколение процессоров Sandy Bridgeбудет выпускаться с соблюдением норм 32-нм техпроцесса; первыми на рынке будут представлены двуядерные и четырёхядерные процессоры для мобильных и настольных систем. Предварительная информация о некоторых из них представлена в таблице ниже.

Модели первых процессоров с архитектурой Sandy Bridge (прогноз)
Модель Частота Turbo Boost,
Max
Ядер Кэш L3 TDP

Разлоч.
множ.

HT vPro AES-NI
Core i7 2600K 3,4 ГГц 3,8 ГГц 4 8 Мбайт 95 Вт + + - +
Core i7 2600 3,4 ГГц 3,8 ГГц 4 8 Мбайт 95 Вт - + + +
Core i5 2500K 3,3 ГГц 3,7 ГГц 4 6 Мбайт 95 Вт + - - +
Core i5 2500 3,3 ГГц 3,7 ГГц 4 6 Мбайт 95 Вт - + + +
Core i5 2400 3,1 ГГц 3,4 ГГц 4 6 Мбайт 95 Вт - + + +
Core i3 2120 3,3 ГГц - 2 3 Мбайт 65 Вт - + - -
Core i3 2100 3,1 ГГц - 2 3 Мбайт 65 Вт - + + -
Core i7 2600S 2,8 ГГц 3,8 ГГц 4 8 Мбайт 65 Вт - + + +
Core i5 2500S 2,7 ГГц 3,7 ГГц 4 6 Мбайт 65 Вт - - + +
Core i5 2500T 2,3 ГГц 3,3 ГГц 4 6 Мбайт 45 Вт - - + +
Core i5 2400S 2,5 ГГц 3,5 ГГц 4 6 Мбайт 65 Вт - - + +
Core i5 2400T 2,7 ГГц 3,5 ГГц 2 3 Мбайт 35 Вт - + + +
Core i3 2100T 2,5 ГГц - 2 3 Мбайт 35 Вт - + - -

Судя по маркировке новых процессоров, вопрос с отображением второго поколения архитектуры Core в названии чипа решён очень просто: отныне цифровые индексы будут 4-значными, и первая цифра как раз обозначает порядковый номер поколения архитектуры. Таким образом, никакой путаницы с Core 2 и Core Duo не будет.

Новые процессоры на базе микроархитектуры Sandy Bridge будут сопровождаться новыми наборами логики Intel 6 Series (Cougar Point), предварительная информация о которых сведена в таблице ниже.

Чипсеты для настольных ПК серии Couger Point (прогноз)
Модель H67 P67 H61 Q67 Q55 B65
Разъём CPU LGA1155 LGA1155 LGA1155 LGA1155 LGA1155 LGA1155
PCI Express 1x16 1x16/2x8 1x16 1x16 1x16 1x16
vPro - - - + ? -
RAID RAID 0/1/5/10 RAID 0/1/5/10 AHCI RAID 0/1/5/10 AHCI AHCI
USB 2.0 14 14 10 14 14 12
SATA 6Gbps 6(2) 6 (2) 4(0) 6 (2) 6(1) 6 (1) 6 (1)
PCI - - - + + +

Ожидается, что новые платформы Intel для настольных ПК, помимо традиционных приложений, повысят спрос в наиболее динамично растущем секторе домашних развлекательных компьютерных систем, благо теперь интегрированное видео микроархитектуры Sandy Bridge уверенно поддерживает любой медиа-контент, включая воспроизведение Blu-ray 3D.

Соответственно, ожидается, что вместе с широким спектром системных плат в традиционных форм-факторах ATX/microATX, на рынке будет представлено великое множество более компактных и миниатюрных решений, благо TDP новых процессоров это позволяет. Для таких систем также будут выпускаться специальные низкопрофильные системы охлаждения.

В дальнейших планах Intel числится переход к производству процессоров с соблюдением норм 22-нм технологического процесса. По предварительным данным, микроархитектура Sandy Bridgeбудет иметь как минимум три переходных дизайна - ожидаемый Sandy Bridge, затем Ivy Bridge, и ещё один, пока неизвестный Bridge(а не два, как в случае сегодняшних Nehalem/ Westmere).

Процессоры Ivy Bridgeбудут выпускаться с соблюдением норм 22-нм техпроцесса: первым ожидается появление 4/8-ядерных решений для настольных систем. Уже на стадии появления микроархитектуры Ivy Bridge - ближе к концу 2011 года - в интегрированнных GPU процессоров впервые будет реализована поддержка DirectX 11. А дальше... что будет дальше, мы расскажем, когда поступит достоверная информация.

 
 
⇣ Содержание
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.

window-new
Soft
Hard
Тренды 🔥
FTC потребовала от Meta продать Instagram и WhatsApp 4 ч.
Поработайте за нас: AWS предоставит учёным кластеры из 40 тыс. ИИ-ускорителей Trainium 7 ч.
Комедийный детектив Loco Motive в духе квестов 90-х выйдет на два года позже обещанного — дата релиза и новый трейлер 7 ч.
Warhammer 40,000, Armored Core и даже Concord: анимационный сериал Secret Level от авторов «Любовь, смерть и роботы» получил насыщенный трейлер 8 ч.
«RuStore на гаджетах Apple быть!» — Госдума приняла в I чтении законопроект об обязательной установке RuStore 9 ч.
«Дарим играм вечную жизнь»: GOG запустил программу по сохранению игровой классики для будущих поколений 9 ч.
Никаких «красных линий»: Microsoft продолжит выпускать эксклюзивы Xbox на PS5 и Switch 10 ч.
Dogecoin подскочил на 153 % после выборов в США — по капитализации он обогнал Ford 10 ч.
Microsoft ещё не оправилась от покупки Activision Blizzard, но уже засматривается на новые игровые студии 11 ч.
Intel облегчила графические драйверы на 500 Мбайт, но они всё равно «тяжелее» пакетов AMD и Nvidia 11 ч.