Сегодня 20 ноября 2017
18+
Процессоры и память

Intel Skylake: подробности о микроархитектуре

Анонс процессоров поколения Skylake протекает на этот раз в несколько своеобразном режиме. В первую очередь Intel представила Core i7-6700K и i5-6600K – старшие десктопные модели для энтузиастов – и даже начала их продавать, но выход массовых процессоров для настольных компьютеров, как и для других рыночных сегментов, оказался отодвинут на несколько более поздний срок. Следуя этому графику, в момент анонса оверклокерских флагманов компания не сочла нужным рассказать об особенностях новой микроархитектуры, поэтому, хотя мы и оценили быстродействие Skylake, разобраться в том, почему оно оказалось именно таким, в полной мере не получилось.

Однако в рамках прошедшей в Сан-Франциско сессии IDF 2015 компания Intel решила заполнить информационный вакуум и поведала о некоторых деталях внутреннего устройства новинок. К сожалению, рассказ оказался не столь полным, как того хотелось бы, – всю информацию разработчики обещают выложить на стол лишь в момент представления серверных процессоров Xeon. Но обнародованных сведений вполне хватит, чтобы получить общее представление о том, в чём Skylake отличается от Haswell и Broadwell с точки зрения микроархитектуры. И в этой статье мы попробуем воспроизвести основные факты, то есть фактически подведём под выполненное нами ранее тестирование представителей семейства Skylake-S недостающую теоретическую базу.

Четырёхъядерный Skylake-S с графикой GT2

Четырёхъядерный Skylake-S с графикой GT2

Издавна повелось, что основным приоритетом разработчиков при проектировании новых микроархитектур оказывается стремление понизить энергопотребление и улучшить удельную производительность на каждый затраченный ватт. И на первый взгляд со Skylake в этом плане поменялось немногое – разрабатывавшая эту микроархитектуру в течение последних пяти лет израильская команда инженеров исходила из этих же вводных. Однако есть важный нюанс: при проектировании данного поколения процессоров разработчики старались не просто добиться снижения потребления, а пытались учесть, что такие процессоры должны найти применение в конечных продуктах с сильно различающимися тепловыми пакетами, начиная c 4,5 Вт и заканчивая 95 Вт. Применённый подход сразу учитывал то, что новая микроархитектура должна хорошо вписываться как в высокоэкономичные, так и высокопроизводительные дизайны. Иными словами, начиная со Skylake компания Intel решила постепенно дистанцироваться от прошлой стратегии, когда при разработке новых микроархитектур во главу угла ставится экономичность, и на базе полученного энергоэффективного дизайна изготавливаются не только мобильные процессоры, но и решения для десктопов и серверов.

Однако вариативность в потреблении и тепловых пакетах процессоров – далеко не единственная цель, стоявшая перед инженерами. Растущий рыночный сегмент ультрапортативных устройств диктует и другие условия, которые должны учитываться в процессорном дизайне. Например, большое значение приобретают размеры чипов и сопутствующих схем. Вполне логично, что экономичные 4,5-ваттные процессоры вместе с набором системной логики и материнской платой, которые предназначаются для планшетных компьютеров, должны занимать как можно меньшее пространство и быть как можно легче. Поэтому ещё одним ориентиром при разработке выступали и массогабаритные характеристики, которым, как и энергопотреблению, нужно было позволить варьироваться в широких пределах – для того чтобы микроархитектура Skylake без проблем вписывалась как в ультрапортативные, так и в настольные компьютеры.

И поставленные задачи были решены. Мобильные варианты Skylake, как и версии в исполнении система-на-чипе, удалось сделать заметно меньшими по размеру по сравнению с Haswell и Broadwell. А оптимизации в части энергопотребления позволили заметно увеличить производительность энергоэффективных чипов при сохранении старых рамок тепловых пакетов. Впрочем, всё это само по себе – вполне обычное проявление технического прогресса. Поражает же другое – масштаб изменений. Потребление процессоров Skylake разных классов теперь может расходиться в 20 раз, а их физические размеры способны варьироваться в четырёхкратных пределах. Также инженеры Intel ставят себе в заслугу и заметное повышение экономичности систем-на-чипе нового поколения, достигающее 40-60 процентов на типовых мультимедийных задачах и в состоянии бездействия.

Вообще, несмотря на то, что Intel говорит о Skylake как об универсальной микроархитектуре, по сложившейся традиции основным бенефициаром её ввода в строй выступают чипы для ультрапортативных устройств. Например, от современных систем-на-чипе требуется поддержка специфичных шин и интерфейсов: смартфоны и планшеты для хранения данных активно используют устройства eMMC и SDXC, интерфейс CSI для подключения камеры и тому подобное. И многие из таких интерфейсов теперь встроены непосредственно в чипсеты для Skylake, которые могут сожительствовать с процессором в одном полупроводниковом кристалле. Но самое интересное, что подобные изменения затронули и базовую часть процессора. Так, непосредственно в микроархитектуре Skylake прописался новый блок с фиксированными функциями – сигнальный процессор для обработки изображений.

Он поддерживает до четырёх камер с разрешением 13 Мп, причём две из них могут быть активными одновременно, и обеспечивает аппаратную обработку сигнала, включающую как простой захват видео (с разрешением 1080p60 или 2Kp30), так и продвинутые функции вроде распознавания лиц, формирования панорам, построения HDR-изображений и так далее.

#Базовая микроархитектура

Впрочем, не стоит думать, что, создавая такой универсальный процессор, Intel забыла про совершенствование базовой микроархитектуры. Всё-таки Skylake относится к фазе разработки «так», поэтому достаточно серьёзные изменения затронули и непосредственно вычислительные ядра. Правда, действующий со времён Haswell принцип проектирования, который даёт ход лишь таким решениям, которые улучшают производительность как минимум вдвое сильнее, чем поднимают энергопотребление, остался в силе. И это хорошо объясняет, почему базовая архитектура теперь меняется гораздо более медленными темпами, чем раньше. Применительно же к Skylake всё это выливается в то, что по сравнению с процессорами прошлых поколений мы видим лишь небольшое число усовершенствований, которые на обычном скалярном x86-коде лишь незначительно увеличивают показатель IPC (число исполняемых за такт инструкций).

Фактически большинство сделанных изменений направлено на расширение входной части исполнительного конвейера, что позволяет улучшить возможности по параллельной обработке команд. Основные принципы работы Skylake по сравнению с предшествующими процессорами не изменились. И новая микроархитектура нацелена на одновременное декодирование до шести x86 CISC-инструкций, которые могут преобразовываться в шесть RISC-микроинструкций. Но, в отличие от его предшественников, число ситуаций, в которых Skylake сможет похвастать одновременным исполнением сразу шести полученных микроинструкций, то есть максимально эффективной загрузкой своего исполнительного конвейера, увеличится.

Для этого вновь улучшены блоки предсказания ветвлений, а также увеличены возможности по внеочередному исполнению инструкций. Впрочем, ни о какой структурной переделке речь не идёт. Все усовершенствования выполнены за счёт простого углубления внутренних буферов. Например, размер окна внеочередного исполнения вырос с 192 инструкций в Haswell до 224 в Skylake. Аналогично подросли и другие буфера, за счёт чего Skylake может работать одномоментно над большим количеством кода. Так, были увеличены буфера для работы с данными, ускорена обработка промахов страниц и промаха кеша L2, а технология Hyper-Threading стала более эффективной за счёт роста объёма станции резервирования (Reservation Stations).

Интересные изменения затронули блок предварительной выборки, агрессивность которого на этот раз была даже уменьшена. Как показал опыт, предварительная выборка избыточного числа инструкций может вредить энергоэффективности. Поэтому инженеры сделали выбор в пользу экономии энергии, которую можно потратить на других этапах исполнительного конвейера или просто повысить тактовую частоту.

К сожалению, Intel не стала углубляться в подробности относительно изменений в самом сердце микроархитектуры – в исполнительных устройствах. Мы даже не получили никакого намёка на то, не изменилось ли по сравнению с Haswell число исполнительных портов. Однако специалисты компании утверждают, что итогом сделанных глубинных переделок стало увеличение темпа исполнения целого ряда FPU-инструкций. Кроме того, Intel обнародовала информацию об ускорении в Skylake выполнения криптографических команд семейства AES. Прирост производительности типовых алгоритмов шифрования должен составить до 33 процентов в CBC-режиме и до 17 процентов в GCM-режиме.

Надо сказать, что в рассказе Intel о Skylake прозвучали достаточно любопытные откровения о том, что построенные на ней серверные и клиентские процессоры могут серьёзно различаться по своей конфигурации даже на уровне микроархитектуры. Один пример такого отличия уже хорошо известен – серверные Skylake получат поддержку команд AVX-512, которая в остальных процессорах реализована не будет. Однако аналогичным образом дело может обстоять и с какими-то другими расширениями. Иными словами, когда на рынке появятся серверные модификации Skylake, эта микроархитектура может открыть какие-то новые свои стороны.

Но нововведения в системе команд не миновали и клиентские процессоры. Так, в них появились новые инструкции семейства Intel SGX (Software Guard Extension). Входящие в этот набор команды позволяют приложению создать для своего исполнения изолированную и защищённую среду в памяти, доступ к которой будет невозможен ни для каких иных процессов и устройств. Таким образом приложение, оперирующее критически важной информацией, сможет защитить свой код и данные от каких-либо программных и аппаратных атак и вторжений, что может поднять безопасность платформы x86 на новый уровень. Intel отдельно подчёркивает, что благодаря SGX можно создавать и полностью защищённый программный код, который невозможно отслеживать с помощью аппаратных отладчиков ITP-класса.

Существенные изменения сосредоточены в микроархитектуре Skylake и на более высоком уровне – во взаимодействии процессорных блоков между собой и работе с данными. В первую очередь упомянуть следует изменение алгоритма работы L2-кеша. Ассоциативность по сравнению с Haswell и Broadwell уменьшилась вдвое, это увеличило его скорость, а обработка промахов теперь вызывает меньшие задержки.

Но более существенные нововведения стоит искать ещё дальше от процессорных ядер. Skylake получил более быструю кольцевую шину, которая связывает между собой все процессорные ядра, L3-кеш, контроллер памяти, графическое ядро и системный агент. По словам разработчиков, максимальная полоса пропускания кольцевой шины удвоена. Однако при этом она способна работать и в старом, менее скоростном режиме, в зависимости от того, какой сценарий использования процессорного дизайна предполагается в каждом конкретном случае. Более медленная шина позволяет снизить энергопотребление и тепловыделение, но в десктопных вариантах Skylake используется скоростной режим. Соответственно, в тех модификациях Skylake, где упор сделан на производительность, а не на энергоэффективность, за счёт увеличения пропускной способности кольцевой шины стала быстрее работать и кеш-память третьего уровня.

Преобразования в системе кеширования затронули и eDRAM-буфер, который, начиная с Haswell, устанавливается в некоторых производительных модификациях процессоров. В Skylake компания Intel планирует расширить сферу применения eDRAM, и с прицелом на это сделан сразу целый комплекс оптимизаций. В процессорах Haswell и Broadwell построенный на eDRAM дополнительный буфер, размещённый в отдельном полупроводниковом кристалле Crystalwell по соседству с процессорным ядром, мог сожительствовать лишь с L3-кешем с объёмом 1,5 Мбайт на ядро. В это время eDRAM выступала 128-мегабайтным кешем четвёртого уровня, в котором хранятся данные, вытесненные из L3-кеша. В Skylake эта структура разрушена: теперь конфигурации процессора с eDRAM смогут располагать кешем третьего уровня с ёмкостью 2 Мбайт на ядро, а eDRAM-память утратила свою роль ещё одного уровня кеширования и может иметь различные варианты ёмкости: от 64 до 128 Мбайт.

 

Было: Broadwell

 

Стало: Skylake

В ознаменование произошедших изменений Intel даже придумала для eDRAM новое название – Memory Side Cache (кеш на стороне памяти). Основная идея состоит в том, что до сих пор eDRAM была напрямую связана с L3-кешем, получая из него данные, которые  не могутв нём больше храниться. В новых же процессорах eDRAM взаимодействует не с процессорным кешем, а с контроллером памяти. Это означает две вещи. Во-первых, теперь eDRAM логически отвязана от процессора и с него снята забота о поддержании её когерентности. Во-вторых, кешироваться в eDRAM теперь могут абсолютно любые данные, поступающие в системную память, в том числе и те, которые помечены операционной системой как некешируемые, и даже те, которыми обменивается с памятью не процессор, а, например, PCI Express-устройства или графическое ядро.

Такие усовершенствования выглядят очень интересно, однако, по всей видимости, вариантов Skylake с eDRAM, ориентированных на использование в традиционных настольных системах, не будет. Так что все преимущества новой схемы смогут ощутить на себе лишь пользователи мобильных систем и компьютеров новых форм-факторов.

#Новые подходы к экономии энергии

Волей-неволей к разговору об энергоэффективности приходится возвращаться снова. Слишком уж повлияло на дизайн процессоров Skylake стремление к экономии электроэнергии. И здесь получили развитие как традиционные подходы, так и некоторые принципиально новые идеи.

В первую очередь следует напомнить о том, что теперь процессорный дизайн не включает в себя интегрированный преобразователь питания. Он был убран именно из соображений экономичности – в наиболее энергоэффективных CPU с тепловым пакетом порядка 4,5 Вт это решение оказалось слишком расточительным, поэтому теперь конвертер питания вновь поселился на материнских платах. К слову, в будущих микроархитектурах Intel собирается вернуть преобразователь обратно в процессор, но не во всех версиях дизайна, а только в тех, которые рассчитаны на достаточно либеральные тепловые пакеты.

Второе достаточно очевидное нововведение состоит в том, что инженеры Intel разбили процессор на большее, чем раньше, число энергетических доменов, способных независимо отключаться от линий питания в случае их бездействия. Теперь дело дошло даже до отдельных исполнительных устройств. Например, в Skylake могут независимо обесточиваться в случае простоя даже 256-битные исполнительные устройства, отвечающие за исполнение AVX2-команд.

Впрочем, всё это – отнюдь не новый подход, подобные техники в том или ином виде используются уже очень давно. Между тем в Skylake есть и действительно революционное нововведение – технология Speed Shift, суть которой заключается в том, что процессору теперь даётся куда большая свобода действий в управлении собственными энергосберегающими состояниями.

Обычно современные процессоры могут самостоятельно, то есть без участия операционной системы, переключать свою частоту между номинальным состоянием и турборежимом. Однако переход в экономичные состояния с пониженными напряжениями и частотами требует непосредственного участия ОС. Команды к снижению частот даёт именно она, предварительно обратившись к микропрограмме и выяснив, какие режимы со сниженным энергопотреблением может предложить конкретный экземпляр CPU. В результате переключение в любое экономичное состояние – это целый комплекс мероприятий, на который требуется немалое время. Ещё хуже дело обстоит с выходом из таких режимов. Процессор должен проинформировать операционную систему, о том, что что-то произошло, затем система должна обработать эту информацию и передать процессору команду на переключение частоты – такая цепочка действий занимает до 30 мс.

Внедрение же Speed Shift даёт процессору большую самостоятельность. Да, он сохраняет свою подчинённость операционной системе, которая может перевести его на более низкую частоту, например для экономии энергии в заканчивающейся батарее мобильного устройства. Но рутинные вопросы переключения энергосберегающих состояний процессор теперь берёт полностью на себя, что существенно улучшает время реакции и позволяет входить в энергосберегающие режимы и выходить из них за единицы миллисекунд. Уменьшение времени реакции на изменение условий должно, с одной стороны, послужить цели экономии энергии, а с другой — способно положительно сказаться и на производительности. Иными словами, процессоры Skylake с технологией Intel Speed Shift смогут самостоятельно подбирать наиболее подходящую частоту работы исходя из возложенной на них нагрузки, причём переключение состояний будет происходить более точно и более быстро.

Следует отметить, что в Speed Shift учитывается и ещё один аспект, который ранее обходился разработчиками стороной. Снижение частоты для уменьшения энергопотребления не всегда даёт ожидаемый эффект. Проблема заключается в том, что при уменьшении частоты ниже некоторого граничного значения потребление начинает падать в гораздо меньшей степени из-за приобретающих большее влияние токов утечки. Поэтому в некоторых энергосберегающих режимах эффективнее оказывается поднять частоту процессора, быстро выполнить необходимый код, а затем перевести процессор в режим сна. Именно такая стратегия и применяется в Skylake, где введены специальные алгоритмы, способные в глубоких энергосберегающих состояниях периодически отправлять процессор в состояние сна и затем пробуждать его для решения текущих низкоприоритетных задач.

Технология Speed Shift выглядит достаточно интересным и актуальным решением, однако, к сожалению, для её работы требуется поддержка со стороны операционной системы. На данный момент её может обеспечить лишь Windows 10. Все же остальные OC, в том числе и всевозможные вариации Linux или Android, поддержку Speed Shift пока не обеспечивают. Однако Intel обещает, что со временем эта проблема так или иначе будет решена.

В дополнение к сказанному нужно добавить, что Intel работает и над развитием процессорных блоков с фиксированными функциями, которые также позволяют экономить энергию. О графическом ядре Skylake мы ещё поговорим немного подробнее, но стоит напомнить, что кодирование и декодирование видео через возможности Quick Sync, а не процессорными ядрами, даёт хорошую возможность для энергосбережения. Кстати, в Skylake этот блок приобрёл новые функции, и теперь использование вычислительных ядер стало необязательным и при декодировании H.265/HEVC-контента. Предлагаемое же Intel открытое API для работы с Quick Sync позволяет разработчикам программного обеспечения активно задействовать эту технологию.

#Графика растёт

Роль графических ядер, встроенных в процессоры, с каждым годом увеличивается. И это связано не столько с ростом их 3D-производительности, столько с тем, что встроенные GPU берут на себя всё новые функции, такие как параллельные вычисления или кодирование и декодирование мультимедийного контента. Исключением не стало и графическое ядро Skylake. Intel относит его к следующему, девятому поколению, и это значит, что в нём таится немало сюрпризов. Однако начать стоит с того, что GPU, реализованный в Skylake, как и его предшественники, сохранил традиционный модульный дизайн. Таким образом, мы вновь имеем дело с целым семейством решений разного класса: на базе имеющихся строительных блоков нового поколения Intel может собирать кардинально различающиеся по уровню производительности GPU. Подобная масштабируемость сама по себе новинкой не является, но в Skylake возросла не только максимальная производительность, но и число доступных вариантов графического ядра.

Итак, графическое ядро Skylake может быть построено на базе одного или нескольких модулей, каждый из которых обычно включает в себя по три секции. Секции объединяют по восемь исполнительных устройств, на которые ложится основная часть обработки графических данных, а также содержат базовые блоки для работы с памятью и текстурные семплеры. Помимо исполнительных устройств, сгруппированных в модули, графическое ядро содержит и внемодульную часть, отвечающую за фиксированные геометрические преобразования и отдельные мультимедийные функции.

На самом верхнем уровне иерархии графическое ядро Skylake очень похоже на ядро, реализованное в Broadwell. Однако если углубиться в подробности, то нетрудно найти и заметные изменения.

Во-первых, внемодульная часть вынесена теперь в отдельный энергетический домен, что позволяет задавать ей частоту и отправлять её в сон отдельно от исполнительных устройств. Это значит, что, например, при работе с технологией Quick Sync, которая реализуется как раз силами внемодульных блоков, основная часть GPU может быть отключена от линий питания в целях снижения энергопотребления. Кроме того, независимое управление частотой внемодульной части позволяет лучше подстраивать её производительность под конкретные нужды модулей графического ядра.

Во-вторых, в то время как графическое ядро Broadwell могло основываться лишь на одном или двух модулях, получая в своё распоряжение 24 или 48 исполнительных устройств (для энергоэффективных и бюджетных процессоров мог использоваться один модуль с отключенными секциями, что давало меньшее, чем 24, число исполнительных устройств), в Skylake может применяться от одного до трёх модулей.

Благодаря этому в дополнение к привычным конфигурациям GT1/GT2/GT3 в семействе процессоров Skylake будет доступно ещё более мощное ядро GT4, которое получит 72 исполнительных устройства.

Однако пиковая производительность самих исполнительных устройств в Skylake не изменилась – каждое такое устройство может выполнять до 16 32-битных операций за такт. При этом оно способно исполнять 7 вычислительных потоков одновременно и имеет 128 32-байтовых регистров общего назначения.

В-третьих, варианты ядра GT3 и GT4 могут быть дополнительно усилены eDRAM-буфером объёмом 64 или 128 Мбайт соответственно, что даёт модификации GT3e и GT4e. Процессоры Broadwell комплектовались лишь одним вариантом eDRAM – объёмом 128 Мбайт. В Skylake же этот дополнительный буфер не только изменил алгоритм работы, став «кешем на стороне памяти», но и приобрёл некоторую гибкость конфигурации. Однако его исполнение останется старым – он будет представлен отдельным 22-нм кристаллом, монтируемым на процессорную плату по соседству с основным чипом.

Появление в составе Skylake урезанного чипа eDRAM с ёмкостью 64 Мбайт должно расширить сферу применения графики GT3e. Процессоры Broadwell и Haswell, оснащённые дополнительным буфером, имели высокую стоимость и предназначались исключительно для производительных ноутбуков и настольных систем. Меньший кристалл eDRAM должен дать жизнь более доступным вариантам Skylake с мощным GPU, которые смогут найти применение, например, в ультрабуках.

Согласно имеющимся на текущий момент данным, графическое ядро Skyklake будет существовать в шести различных модификациях, которые получат числовые индексы из пятисотой серии:

  • HD Graphics 510 – GT1: один модуль, 12 исполнительных устройств;
  • HD Graphics 515 – GT1.5: один модуль, 18 исполнительных устройств;
  • HD Graphics 530 – GT2: один модуль, 24 исполнительных устройства;
  • HD Graphics 535 – GT3: два модуля, 48 исполнительных устройств;
  • Iris Graphics 540 – GT3e: два модуля, 48 исполнительных устройств и 64-Мбайт eDRAM-буфер;
  • Iris Pro Graphics 580 – GT4e: три модуля, 72 исполнительных устройства и 128-Мбайт eDRAM-буфер.

Наращивая мощность графического ядра, Intel проявила большую заботу и о том, чтобы для его нужд хватало пропускной способности памяти даже в конфигурациях, лишённых дополнительной eDRAM-памяти. С одной стороны, в Skylake обновился контроллер памяти, и теперь он способен работать с DDR4 SDRAM, частота и пропускная способность которой заметно выше, чем у DDR3 SDRAM. С другой стороны, в GPU появилось новая технология Lossless Render Target Compression («направленное на рендеринг сжатие без потерь»). Её суть заключается в том, что все данные, пересылаемые между GPU и системной памятью, которая одновременно является и видеопамятью, предварительно сжимаются, разгружая таким образом полосу пропускания. Применённый алгоритм использует компрессию без потерь, при этом степень сжатия данных может достигать двукратного размера. Несмотря на то, что всякая компрессия требует задействования дополнительных вычислительных ресурсов, инженеры Intel утверждают, что внедрение технологии Lossless Render Target Compression увеличивает быстродействие интегрированного GPU в реальных играх на величину от 3 до 11 процентов.

Упоминания заслуживают и некоторые другие усовершенствования в графическом ядре. Например, размеры собственной кеш-памяти в каждом модуле GPU были увеличены с 512 до 768 Кбайт. Благодаря этому, а также путём оптимизации архитектуры модулей разработчики смогли добиться почти двукратного улучшения скорости заполнения, что дало возможность не только поднять быстродействие GPU при включении полноэкранного сглаживания, но и добавить в число поддерживаемых режимов 16x MSAA.

Одним из основных ориентиров для встроенной в интеловский процессор графики давно выступает полноценная поддержка 4K-разрешений. Именно с таким прицелом Intel непрерывно увеличивает производительность GPU. Но в улучшении нуждается и другая часть – интерфейсные выходы. Нет ничего удивительного в том, что, подобно процессорам Broadwell, в графическом ядре Skylake поддерживается вывод 4K-изображения с частотой развёртки 60 Гц через DisplayPort 1.2 или Embedded DisplayPort 1.3, с частотой 24 Гц – через HDMI 1.4 и с частотой 30 Гц – по технологии Intel Wireless Display или по беспроводному протоколу Miracast. Но в Skylake к этому перечню добавилась и частичная поддержка HDMI 2.0, через который доступны 4K-разрешения с частотой развертки 60 Гц. Правда, для реализации этой возможности нужен некий дополнительный адаптер DisplayPort ↔ HDMI 2.0. Но зато передача сигнала HDMI 2.0 возможна в том числе и по интерфейсу Thunderbolt 3 в системах, имеющих соответствующий контроллер.

Так же как и раньше, GPU процессоров Skylake способен обеспечить вывод изображения на три экрана одновременно.

Нет ничего удивительного в том, что с ростом популярности новых форматов видео графическое ядро Skylake расширило возможности по его аппаратному кодированию и декодированию. Теперь средствами движка Quick Sync стало можно кодировать и декодировать контент в формате H.265/HEVC с 8-битной глубиной цвета, а с привлечением исполнительных устройств GPU – декодировать H.265/HEVC-видео и с 10-битным представлением цвета. К этому добавилась и полностью аппаратная поддержка кодирования в форматах JPEG и MJPEG.

Однако графика Skylake относится к новому, девятому поколению не в только силу перечисленных изменений. Главной причиной послужило то, что в ней сделаны существенные изменения в части поддерживаемых графических API. На данный момент в GPU новых процессоров есть совместимость с DirectX 12, OpenGL 4.4 и OpenCL 2.0, а позднее, по мере совершенствования графического драйвера, к этому списку добавятся будущие версии OpenCL 2.x и OpenGL 5.x, а также поддержка низкоуровневого фреймворка Vulkan. Здесь уместно упомянуть и о том, что в новом GPU реализована полноценная когерентность памяти с процессором, что делает Skylake самым настоящим APU – его графическое и вычислительные ядра могут одновременно работать над одной и той же задачей, используя общие данные.

При этом графическое ядро Skylake может предложить действительно неплохую вычислительную производительность. Работая на частоте 1,15 ГГц, один модуль GPU обеспечивает пиковое быстродействие на уровне 442 Гфлопс. Это значит, что GT4-версии графического ядра Skylake будут обладать теоретическим быстродействием порядка 1,15 Тфлорс, а это не только значительно превышает возможности любой существовавшей до сих пор интегрированной графики, но и приближается к показателям таких дискретных видеоускорителей, как GeForce GTX 750 или GeForce GTX 950M.

С 2010 года производительность интеловской графики возросла в 27 раз

С 2010 года производительность интеловской графики возросла в 27 раз

Выводы

Во время тестирования процессоров Core i7-6700K и i5-6600K главными их преимуществами нам показался улучшенный разгон и обновлённая платформа. Никакого же впечатляющего прироста производительности мы тогда не заметили – он уложился во вполне уже привычные 5-10 процентов. Однако теперь становится понятно, что флагманские десктопные CPU для настольных систем были не лучшим полигоном для демонстрации преимуществ микроархитектуры Skylake. Раскрытые компанией Intel подробности дают понять, что на самом деле Skylake – гораздо более прогрессивный проект, чем могло показаться изначально.

Очень большая часть нововведений в микроархитектуре Skylake призвана увеличить энергоэффективность и производительность вариаций этого дизайна, нацеленных на экономичные ультрапортативные и мобильные применения. И нет никаких сомнений в том, что благодаря Skylake ультрабуки и планшеты станут ещё быстрее, ещё легче и ещё автономнее. Осталось лишь дождаться их появления – и мы наверняка сможем убедиться в этом воочию.

Огромное внимание Intel уделила и встроенному GPU, что открывает перед Skylake ещё одну дверь. Кажется, теперь мы сможем увидеть полноценные мобильные игровые системы с интегрированной графикой, которые будут способны соперничать по 3D-производительности с ноутбуками, в которых применяется дискретная видеокарта.

К сожалению, сегодняшнее знакомство с микроархитектурой Skylake всё ещё остаётся неполным. Intel не желает разглашать детальную информацию о строении исполнительных устройств, а также пока не рассказывает о том, какие технологические решения будут реализованы в серверных версиях этих процессоров. Поэтому не исключено, что эта прогрессивная микроархитектура ещё сможет удивить нас своими нераскрытыми возможностями, которые, кстати, могут унаследовать и процессоры для энтузиастов класса Skylake-E.

Оставайтесь с нами, эпоха Skylake только начинается, и мы будем внимательно следить за тем, что она приносит в компьютеры разных предназначений и форм-факторов.

 
 
Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
⇣ Комментарии