⇣ Содержание
Опрос
|
реклама
Самое интересное в новостях
Микроархитектура Intel Sandy Bridge, часть III
Этой публикацией мы заканчиваем цикл статей теоретического плана, посвящённых новому поколению микроархитектуры Intel Core II с рабочим названием Sandy Bridge. В первой части под названием «Микроархитектура Intel Sandy Bridge, часть I» мы рассмотрели структурные новшества новой процессорной микроархитектуры, а также изучили в деталях принцип работы кольцевой шины, кеш-памяти L3 и системного агента с входящими в его состав контроллером памяти DDR3, модулем управления питанием, блоком обработки медиаданных, видеовыходом и прочими вспомогательными компонентами. Во второй статье - «Микроархитектура Intel Sandy Bridge, часть II» мы познакомили наших читателей с особенностями реализации и функционирования процессорных ядер Sandy Bridge. В сегодняшней статье мы рассмотрим технологии и нововведения, реализованные в микроархитектуре Sandy Bridge для повышения производительности интегрированного графического процессора и модуля медиа-обработки. ⇡#Структура графической системы Sandy BridgeПрежде чем перейти к рассмотрению особенностей реализации архитектурных изменений в интегрированной графической подсистеме Sandy Bridge, обязательно следует сказать несколько слов о рыночном позиционировании этого решения. По словам представителей Intel, работая над улучшением характеристик нового поколения встроенной в процессор графики, они в первую очередь преследовали цель повысить привлекательность своих решений в массовых сегментах рынка настольных и мобильных ПК. Типичным сценарием использования таких систем является работа с документами, интернет-сёрфинг, просмотр онлайнового и потокового видео, воспроизведение Blu-Ray и DVD (обычных и 3D), казуальные, браузерные и DirectX 10.1 игры. Иными словами, целью Intel изначально не являлось соперничество в секторе высокопроизводительных графических процессоров для видеокарт, где царят DirectX 11-решения и где интегрированной графике пока не место. Но на уже занятом поле интегрированной 3D-графики Intel хотела показать вполне приличный результат. Справедливости ради стоит отметить, что для большинства потребителей настольных и мобильных систем с интегрированной графикой, не интересующихся ресурсоемкими DX11-приложениями, в большинстве случаев достаточно возможностей чипов с ядром Clarkdale/Arrandale. Однако в Intel пошли дальше и практически удвоили возможности графики в реализации Sandy Bridge. Прежде всего, хотелось бы обратить внимание на тот факт, что встроенный графический процессор теперь выполнен на едином кристалле вместе с остальными компонентами Sandy Bridge. В предыдущем поколении ядер Clarkdale/Arrandale встроенная графика с модулем обработки медиа и элементами периферии представляла собой отдельный дополнительный 45-нм кристалл с QPI-подключением к 32-нм кристаллу с процессорными ядрами и кешем L3, то есть 45-нм кристалл играл роль этакого встроенного «северного моста». В реализации архитектуры Sandy Bridge графика и все остальные элементы процессора располагаются на одном 32-нм кристалле. В отличие от ядер Clarkdale/Arrandale, где управление производительностью и температурным режимом графики осуществлялось с помощью программного драйвера, жёстко привязанного к общим параметрам системы, GPU микроархитектуры Sandy Bridge управляется системным агентом на аппаратном уровне. При этом процессы изменения напряжения питания, тактовой частоты, производительности и энергопотребления встроенной графики теперь осуществляются в более широких пределах, с той же высокой эффективностью, что и изменение параметров процессорных ядер. Более того, турбо-режим графического процессора будет представлен и в настольных, и в мобильных процессорах. Наконец, необходимо напомнить о самом главном моменте, который мы обсудили в первой части материала: теперь графический процессор подключен в систему общей кольцевой шиной и представляет собой равноценный элемент микроархитектуры Sandy Bridge с полноценным доступом к кешу L3. Также напомним, что в реализации архитектуры Sandy Bridge модуль медиа-обработки и видеовыхода является отдельным структурным элементом системного агента. ⇡#Графический процессор в микроархитектуре Sandy BridgeВозможности графического процессора Sandy Bridge в целом сравнимы с таковыми у предыдущего поколения подобных решений Intel, разве что теперь в дополнение к возможностям DirectX 10 добавлена поддержка DirectX 10.1. Тем не менее нововведений в графике Sandy Bridge достаточно много, и нацелены они главным образом на увеличение производительности при работе с 3D-графикой. Основной упор при разработке нового графического ядра, по словам представителей Intel, был сделан на максимальном использовании аппаратных возможностей для обсчёта 3D-функций, и то же самое – для обработки медиа-данных. Такой подход радикально отличается от полностью программируемой аппаратной модели, принятой на вооружение, например, в NVIDIA, или в самой Intel для разработки Larrabee (за исключением текстурных блоков).
Однако в реализации Sandy Bridge отход от программируемой гибкости имеет свои неоспоримые плюсы, за счет него достигаются более важные для интегрированной графики выгоды в виде меньшей латентности при исполнении операций, лучшей производительности на фоне экономии расхода энергии, упрощённой модели программирования драйверов, и что немаловажно, с экономией физических размеров графического модуля. Для программируемых исполнительных шейдерных модулей графики Sandy Bridge, по традиции называемых в Intel «исполнительными блоками» (EU, Execution Units), характерны увеличенные размеры регистрового файла, что позволяет достичь эффективного исполнения комплексных шейдеров. Также в новых исполнительных блоках применена оптимизация ветвления для достижения лучшего распараллеливания исполняемых команд. В целом, по заявлению представителей Intel, новые исполнительные блоки обладают удвоенной по сравнению с предыдущим поколением интегрированной графики пропускной способностью, а производительность вычислений с трансцедентальными числами (тригонометрия, натуральные логарифмы и так далее) за счёт акцента на использовании аппаратных вычислительных возможностей модели вырастет в 4-20 раз. Внутренний набор команд, усиленный в Sandy Bridge рядом новых, позволяет распределять большинство инструкций API набора DirectX 10 в режиме «один к одному», как в случае с архитектурой CISC, что в результате позволяет добиться значительно более высокой производительности при той же тактовой частоте. Быстрый доступ посредством быстрой кольцевой шины к распределённому кешу L3 с динамически конфигурируемой сегментацией позволяет снизить латентность, поднять производительность и в то же время снизить частоту обращений графического процессора к оперативной памяти. По предварительным данным, процессоры Intel Core II будут представлены двумя типами интегрированной графики, единственным отличием между которыми будет количество исполнительных блоков (EU). Максимальное количество – 12 EU - получат все процессоры для портативных ПК и часть процессоров для настольных ПК, по 6 EU получат некоторые модели процессоров для настольных ПК. Разумеется, проводить аналогию между исполнительными шейдерными блоками графических процессоров Sandy Bridge и их эквивалентами в архитектурах графических процессоров NVIDIA или AMD, и уж тем более сравнивать их количество и пытаться построить на этом какие-то сравнительные прогнозы по производительности, нет никакого смысла. Слишком уж они разные. Достоверные цифры для сравнения производительности мы сможем получить лишь после лабораторных тестов. Представители Intel говорят о двукратном превосходстве 3D-графики процессоров Sandy Bridge над предыдущим поколением. По предварительным данным, тактовая частота графического ядра процессоров Sandy Bridge составит в разных версиях процессоров от 650 до 850 МГц, а с «раскачкой» при помощи Turbo Boost - до 1350 МГц в чипах для настольных ПК и до 1300 МГц в чипах для ноутбуков. ⇡#Обработка медиа в процессорах микроархитектуры Sandy BridgeНесмотря на тот факт, что физически модуль обработки медиа в Sandy Bridge расположен далеко за пределами графического процессора, а именно, в составе системного агента, обработка медиа-данных осуществляется с помощью «объединённых сил» медиа-модуля и GPU. В частности, с помощью исполнительных блоков графического процессора, оптимизированного под исполнение медиа-задач одновременно с обработкой 3D-графики.
Рендеринг видео значительно ускоряется благодаря распараллеленной обработке заданий и аппаратным медиа-кодекам распространённых форматов. Так, в Sandy Bridge значительно доработаны узлы кодирования и декодирования видео. В частности, специализированный мультиформатный распараллеленный движок декодирования MFX (Multi-Format Codec) теперь обеспечивает 100% аппаратное декодирование форматов MPEG2, VC1 и AVC, а также кодирование в формате AVC. Полностью аппаратная реализация мультиформатного кодека обеспечивает продолжительное время работы от батарей при автономном воспроизведении, а также быстрое декодирование видео. Особый упор в презентации о Sandy Bridge представители Intel сделали на том, что новые процессоры даже самой бюджетной категории будут способны без каких-либо затруднений воспроизводить стереоскопический контент в формате Blu-ray 3D. Иными словами, в плане работы с медиа-контентом процессоры Sandy Bridge ничем не уступают по возможностям графическим решениям конкурентов. Специализированные аппаратные ускорители обработки медиа в чипах Sandy Bridge, наряду с повышением скорости обработки контента, обеспечивают такие современные функциональные возможности, как автоматическое детектирование деинтерлейсинга и кинотеатрального режима, качественное масштабирование видео, фильтрацию шумов и повышение детализации. В модуле обработки медиа-контента также реализованы аппаратные средства для качественной обработки цветовой составляющей и изображения – улучшения передачи телесных тонов, адаптивного повышения контрастности и общего управления цветовыми настройками.
⇡#Энергопотребление при работе с 3D-графикой и медиа-контентомВ первой части материала, в процессе знакомства с модулем системного агента, мы рассмотрели технологию Turbo Boost, принципы аппаратного управления напряжением питания и тактовыми частотами, производительностью и терморежимом компонентов микроархитектуры Sandy Bridge. В этой части будет уместным ещё раз напомнить, что аппаратное управление питанием и тактовой частотой графического процессора в микроархитектуре Sandy Bridge делегировано системному агенту и организованное по образу и подобию управления процессорными ядрами. Такая организация технологии Turbo Boost позволяет оптимизировать энергопотребление графики и применять взвешенные рациональные сценарии нагрузки графического ядра и процессорных ядер.
В презентации Intel, посвящённой графическим компонентам микроархитектуры Sandy Bridge, подчёркивается, что разработчикам удалось значительно снизить энергопотребление новых процессоров и увеличить эффективность работы технологии Turbo Boost в режиме обработки медиа-данных – главным образом за счёт оптимизации целочисленных вычислений, введения распределённых цепей управления и агрессивных режимов отключения питания незадействованных компонентов. Так, например, в режиме воспроизведения HD-видео энергопотребление процессора Sandy Bridge снижается практически вдвое. Более того, в процессе работы с типичным медиа-контентом при полной загрузке энергопотребление процессора примерно на 30% ниже, чем при работе с типичной 3D-задачей. Процессоры Intel с микроархитектурой Sandy Bridge: ближайшие перспективы Судя по информации, имеющейся на сегодняшний день, официальный анонс новых процессоров Intel Core II с микроархитектурой Sandy Bridge состоится в ближайшие несколько недель. Иными словами, всего несколько недель отделяет нас от возможности поговорить о характеристиках чипов Sandy Bridge предметно, с конкретными цифрами производительности различных шин, интерфейсов, с обсуждением результатов первых тестов. Углубляться в описание ещё не анонсированных продуктов в такой ситуации особого смысла не имеет: незачем пересказывать догадки, когда совсем скоро можно будет представить официальную информацию; к тому же некоторая часть уже доступной информации уже сейчас находится под эмбарго соглашения о неразглашении. И всё же кое-какие данные о новой платформе Intel на базе процессоров Sandy Bridge мы представим сейчас - тем более что большая часть этой информации доступна публично ещё с сентября, когда состоялся Форум Intel для разработчиков в Сан Франциско.
Первое поколение процессоров Sandy Bridgeбудет выпускаться с соблюдением норм 32-нм техпроцесса; первыми на рынке будут представлены двуядерные и четырёхядерные процессоры для мобильных и настольных систем. Предварительная информация о некоторых из них представлена в таблице ниже.
Судя по маркировке новых процессоров, вопрос с отображением второго поколения архитектуры Core в названии чипа решён очень просто: отныне цифровые индексы будут 4-значными, и первая цифра как раз обозначает порядковый номер поколения архитектуры. Таким образом, никакой путаницы с Core 2 и Core Duo не будет. Новые процессоры на базе микроархитектуры Sandy Bridge будут сопровождаться новыми наборами логики Intel 6 Series (Cougar Point), предварительная информация о которых сведена в таблице ниже.
Ожидается, что новые платформы Intel для настольных ПК, помимо традиционных приложений, повысят спрос в наиболее динамично растущем секторе домашних развлекательных компьютерных систем, благо теперь интегрированное видео микроархитектуры Sandy Bridge уверенно поддерживает любой медиа-контент, включая воспроизведение Blu-ray 3D. Соответственно, ожидается, что вместе с широким спектром системных плат в традиционных форм-факторах ATX/microATX, на рынке будет представлено великое множество более компактных и миниатюрных решений, благо TDP новых процессоров это позволяет. Для таких систем также будут выпускаться специальные низкопрофильные системы охлаждения. В дальнейших планах Intel числится переход к производству процессоров с соблюдением норм 22-нм технологического процесса. По предварительным данным, микроархитектура Sandy Bridgeбудет иметь как минимум три переходных дизайна - ожидаемый Sandy Bridge, затем Ivy Bridge, и ещё один, пока неизвестный Bridge(а не два, как в случае сегодняшних Nehalem/ Westmere). Процессоры Ivy Bridgeбудут выпускаться с соблюдением норм 22-нм техпроцесса: первым ожидается появление 4/8-ядерных решений для настольных систем. Уже на стадии появления микроархитектуры Ivy Bridge - ближе к концу 2011 года - в интегрированнных GPU процессоров впервые будет реализована поддержка DirectX 11. А дальше... что будет дальше, мы расскажем, когда поступит достоверная информация.
⇣ Содержание
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
|