Сегодня 26 марта 2017
18+
Процессоры и память

Обзор процессора Intel Core i7-6950X Extreme Edition

О том, что в начале лета компания Intel собирается обновить свою высокопроизводительную платформу для энтузиастов, LGA2011-v3, известно уже очень давно. Вполне естественно, что микроархитектура семейства Broadwell вслед за серверными процессорами должна прийти и в многоядерные Core i7, которые, по сути, являются адаптированными для односокетных систем чипами Xeon. Тем не менее от такого обновления никто ничего особенного не ожидал. Действительно, сама платформа LGA2011-v3 и набор логики Intel X99 остаются теми же самыми, а смена микроархитектуры Haswell на Broadwell и перевод производства процессоров на 14-нм технологию с трёхмерными транзисторами, как мы уже знаем по вышедшему год назад четырёхъядерному Core i7-5775С в LGA1150-исполнении, даёт едва заметный прирост в производительности

В конце концов, Broadwell – это всего лишь «тик», и основные улучшения в этом дизайне сделаны на уровне графического ядра, но оно в «больших» высокопроизводительных процессорах не применяется. Не надеялись мы увидеть в Broadwell-E и сколь-нибудь значительное улучшение частотного потенциала: на это явно указывали частоты их серверных родственников поколения Broadwell-EP и отсутствие какого-либо заметного прогресса в рабочих частотах четырёхъядерных Core i7 на базе 14-нм кристаллов Broadwell-C и Skylake-S.

Однако у Intel получилось нас удивить. Начав добавлять в свои флагманские десктопные процессоры дополнительные вычислительные ядра, число которых в Haswell-E два года назад возросло до восьми штук, компания уже не смогла остановиться. В результате выходящий сегодня Core i7-6950X – самый быстрый процессор класса Extreme Edition для настольных систем, основанный на дизайне Broadwell-E, – получил не восемь, а десять стандартных суперскалярных ядер, став первым в истории десктопным десятиядерником.

Впрочем, логику микропроцессорного гиганта понять несложно. Рост тактовых частот натолкнулся на непреодолимые препятствия, и частоты старших процессоров прочно увязли в промежутке от 3 до 4 ГГц. Кардинально улучшить эффективность базовой микроархитектуры Core также давно не удаётся, и её новые версии приносят лишь незначительный рост показателя IPC (числа исполняемых за такт команд).

Зато наращивание количества ядер – сравнительно простой метод, который если и не позволяет сохранить хороший темп роста производительности, то по крайней мере создаёт его видимость. Тем более что ввод в строй более тонких техпроцессов уменьшает геометрические размеры транзисторов и благодаря этому позволяет упаковывать на полупроводниковом кристалле всё возрастающее количество ядер без каких бы то ни было производственных трудностей. Например, в серверных Xeon при переходе от дизайна Haswell-EP к Broadwell-EP максимальное число ядер на полупроводниковом кристалле выросло на 33 процента – с 18 до 24. Неудивительно, что подобный фокус Intel решила провернуть и с высокопроизводительными Core i7.

Другой вопрос, действительно ли такое количество ядер нужно в настольном компьютере. И ответить на него не так просто. Intel, объясняя необходимость развития процессорного параллелизма, постоянно ссылается на программы для обработки медиаконтента, и в первую очередь — на средства видеомонтажа. Однако приложения подобного рода вряд ли можно назвать массовыми. Большинство же пользователей гораздо больше интересует эффективность многоядерных решений в игровых конфигурациях. Но даже не проводя никакого тестирования, можно сказать, что ничего хорошего мы в таких применениях не увидим. Современные игры оптимизируются в лучшем случае под четырёхъядерные CPU, и десять ядер для них более чем избыточны. Таким образом, платформа LGA2011-v3 всё заметнее дрейфует в сторону рабочих станций, и это вряд ли способно порадовать огромную армию геймеров.

Зато добавление в новые процессоры дополнительных ядер позволяет Intel говорить о том, что её флагманские продукты действительно эволюционируют.

К сожалению, эта иллюстрация отражает лишь одну сторону медали. И рядом было бы уместным привести формулировку закона Амдала, который объясняет, что рост числа ядер в пропорциональный рост производительности на самом деле не конвертируется: «В случае, когда задача разделяется на несколько частей, суммарное время её выполнения на параллельной системе не может быть меньше времени выполнения самого длинного фрагмента». В соответствии с этим законом ускорение выполнения программы за счёт распараллеливания на множестве процессорных ядер ограничено временем, необходимым для выполнения её последовательных связанных частей. И в качестве иллюстрации можно привести следующий график теоретически рассчитанного по закону Амдала прироста скорости выполнения программ с долями параллельного кода от 50 до 95 процентов для равночастотных процессоров с числом ядер от 1 до 10.

С ростом количества вычислительных ядер получаемый прирост производительности постепенно снижается. То есть если, например, четырёхъядерный процессор позволяет получить троекратное улучшение быстродействия по сравнению с одноядерным, то это совершенно не означает, что применение для решения той же задачи восьмиядерного CPU позволит довести прирост в быстродействии до шестикратного уровня. Как видно по графику, двукратное увеличение числа ядер в такой ситуации добавит к производительности лишь дополнительные 30 процентов. Более того, увеличение числа ядер выше восьми имеет практический смысл лишь там, где доля распараллеливаемого кода превышает 80 процентов. В противном случае наращивание мощностей CPU окажется совершенно напрасным.

Но ухудшение масштабируемости производительности с ростом числа ядер у многоядерных процессоров – не единственная и не самая большая неприятность, присущая новому десятиядерному Core i7-6950X Extreme Edition. Несмотря на усложнение этого CPU, Intel всё же удалось добиться, чтобы его частоты были не ниже, чем у восьмиядерного предшественника, а значит, какой-никакой прирост производительности он обеспечит в любом случае.

Гораздо же сильнее бьёт по энтузиастам то, что появление Core i7-6950X перечёркивает привычную картину мира, в которой самый быстрый CPU для настольных систем всегда стоил около $1 000. С сегодняшнего же дня для обладания флагманским продуктом придётся потратить на 70 процентов больше. Скорректировать ценовую политику Intel заставило родство Core i7-6950X с процессорами Xeon E5 достаточно высокого уровня, но энтузиастам от этого не легче: обладание непревзойдённой конфигурацией теперь потребует от них существенно больших капиталовложений.

Иными словами, даже поверхностное знакомство с Core i7-6950X Extreme Edition вызывает отнюдь не восхищение предлагаемой им мощью, а серьёзные сомнения в уместности такого CPU. Однако мы не любим делать поспешные выводы, а потому провели подробные тесты новинки.

#Подробнее о Core i7-6950X Extreme Edition

Итак, Core i7-6950X Extreme Edition – это свежее предложение Intel для бескомпромиссных энтузиастов. Как и в предшествующих процессорах класса Extreme Edition, в новинке не зафиксированы никакие множители, и она может стать великолепным объектом для проведения различных экспериментов по разгону. Причём использовать совместно с Core i7-6950X можно в том числе и старые материнские платы на базе набора логики Intel X99 – после обновления BIOS они полностью совместимы с новым CPU.

Впрочем, несмотря на сохранение преемственности с Haswell-E, Core i7-6950X Extreme Edition – это процессор следующего поколения на базе дизайна Broadwell-E, который производится по 14-нм техпроцессу с трёхмерными FinFET-транзисторами. Это обуславливает его отличия как на уровне микроархитектуры, так и по формальным спецификациям. Но главное, чем выделяется Core i7-6950X на фоне своих предшественников, – это десять вычислительных ядер с поддержкой технологии Hyper-Threading. Раньше таких предложений в ассортименте процессоров для настольных систем не существовало, а наиболее передовые Core i7 получали только восемь ядер. Теперь же операционная система сможет увидеть в компьютере, основанном на Core i7-6950X, сразу два десятка логических ядер.

Приятным сюрпризом стали сравнительно неплохие тактовые частоты. Несмотря на то, что по сравнению с восьмиядерным флагманом прошлого поколения у нового Core i7-6950X стало на два ядра больше, его частота назад не откатилась. Номинальный режим для новинки – 3,0 ГГц, но за счёт технологии Turbo Boost 2.0 при неполной нагрузке на вычислительные ресурсы она может автоматически ускоряться до 3,5 ГГц. При этом десятиядерник смог вписаться в стандартный для платформы LGA2011-v3 140-ваттный тепловой пакет.

Увеличение числа ядер не сказалось на частоте и расчётном тепловыделении, но повлияло на размер кеш-памяти третьего уровня. В дизайне Broadwell-E, как и Haswell-E, заложен объём L3-кеша из расчёта 2,5 Мбайт на каждое ядро. В результате десятиядерный Core i7-6950X получил 25-мегабайтный кеш, который функционирует на собственной частоте, приближенной к частоте самого процессора.

Есть в Broadwell-E и другие изменения. В частности, по сравнению с Haswell-E определённые улучшения коснулись контроллера памяти. Формально он остался четырёхканальным и совместимым с DDR4 SDRAM, но официально поддерживаемые им режимы работы теперь включают и DDR4-2400. Это стало следствием внутренней оптимизации, которая к тому же несколько улучшила его производительность и существенно подняла разгонный потенциал. Иными словами, разгонять память в LGA 2011-v3-системах теперь будет можно заметно результативнее, чем раньше.

А вот контроллер PCI Express 3.0 в процессоре остался таким же, как и прежде. Он поддерживает 40 линий PCI Express, которые можно делить на несколько слотов. Это позволяет системам на базе Core i7-6950X не только полноценно обслуживать мульти-GPU-конфигурации, но и работать с высокопроизводительными PCIe NVMe SSD с минимальными латентностями.

Несмотря на то, что в Core i7-6950X есть немало функций, адресованных скорее энтузиастам, этот процессор, как и все предшествующие высокопроизводительные многоядерные интеловские CPU, имеет близкие родственные связи с младшими Xeon E5 v4 поколения Broadwell-EP. Фактически Core i7-6950X базируется на таком же, как и в серверных процессорах, полупроводниковом кристалле LCC (Low Core Count), в котором как раз имеется десять вычислительных ядер, собранных воедино с помощью одной двунаправленной кольцевой шины. В Core i7-6950X лишь аппаратно отключаются блоки, отвечающие за реализацию шины QPI, что лишает десктопные процессоры возможности использования в двухпроцессорных конфигурациях.

Функциональная схема кристалла LCC Broadwell-EP

Функциональная схема кристалла LCC Broadwell-EP

Стоит заметить, что в семействе Xeon E5 v4 кристалл LCC используется на самом деле лишь в процессорах с числом ядер до восьми штук. Для десятиядерных серверных CPU предназначается более сложный кристалл MCC, в котором реализованы уже две кольцевые шины и два системных агента. Но десктопному процессору высокая эффективность межъядерного взаимодействия ни к чему, поэтому в десятиядерном Core i7-6950X производитель считает вполне уместным использовать вариант конструкции кристалла с самой простой внутренней организацией.

Полупроводниковый кристалл Broadwell-E

Полупроводниковый кристалл Broadwell-E

Десятиядерный полупроводниковый кристалл Broadwell-E насчитывает порядка 3,2 млрд транзисторов. Благодаря 14-нм техпроцессу их удаётся разместить на площади 246 мм2. Если сравнивать эти числа с показателями 22-нм восьмиядерного Haswell-E, то получится, что кристалл стал примерно на 30 процентов меньше, хотя число транзисторов выросло более чем на 20 процентов.

Внешнее исполнение у новых процессоров несколько отличается от того, к чему привыкли пользователи LGA2011-v3-систем. Изменилась конфигурация процессорной крышки – она стала массивнее и закрывает теперь практически всю поверхность текстолита.

Слева – Core i7-6950X, справа – Core i7-5960X

Слева – Core i7-6950X, справа – Core i7-5960X

Обусловлено это тем, что в процессорах Broadwell-E, как и в Skylake, используется тонкая печатная плата. Видоизменённый металлический теплорассеиватель должен защитить её от деформации в процессорном гнезде.

Слева – Core i7-6950X, справа – Core i7-5960X

Слева – Core i7-6950X, справа – Core i7-5960X

Перемена эта чисто техническая. Никаких проблем совместимости с разъемами на материнских платах у новых процессоров, естественно, не возникает. Зато историй с изгибом платы и нарушением контакта при чрезмерном прижиме кулера, в которых были замечены Skylake, с Broadwell-E уже наверняка не случится.

А вот как трактует характеристики Core i7-6950X диагностическая утилита CPU-Z.

   

Под высокой нагрузкой частота Core i7-6950X тяготеет к максимальным 3,5 ГГц, то есть активация турборежима у Broadwell-E может происходить и при работе в многопоточных средах. Частота кеш-памяти в реальных условиях при этом подтягивается к величине 2,8 ГГц.

Но особенно обращает на себя внимание сравнительно невысокое напряжение питания десятиядерного процессора. И это не ошибка: наш экземпляр Core i7-6950X действительно требовал для своей работы около 1,1 В. Надо сказать, что 14-нм процессоры для платформ LGA1150/1151 обычно используют заметно более высокий вольтаж. Однако в Core i7-6950X совсем другая идеология: ядер здесь в два с половиной раза больше, а тактовая частота на четверть меньше.

Ну и под конец – ещё раз о самом грустном. Рекомендованная цена Core i7-6950X Extreme Edition составляет $1 723, что заставляет воспринимать этот процессор не как техническое средство, а скорее как предмет роскоши. До сих пор флагманские десктопные CPU если и выходили своими ценами за тысячедолларовую границу, то лишь чуть-чуть. Даже в тех случаях, когда Intel наращивала в них количество ядер. Дороже продавались лишь решения для серверов. Теперь же микропроцессорный гигант решил, что в мире, где стоимость игровых видеокарт может доходить до $1 500, скромничать нечего и не грех дополнительно заработать и на обычных пользователях, которые хотят иметь в своём распоряжении уникальный продукт высочайшего уровня.

#О линейке Broadwell-E целиком

Хотя этот обзор посвящён лишь старшему процессору Broadwell-E, нельзя не упомянуть и о том, что вместе с Core i7-6950X Extreme Edition компания Intel выводит на рынок ещё трех представителей того же семейства. Core i7-6950X с его десятью вычислительными ядрами – явно имиджевый и чрезмерно дорогой продукт, спрос на который вряд ли окажется высоким. Поэтому для тех, кто хочет получить нечто попроще и подоступнее, предусмотрены свои варианты.

Вместо Core i7-5960X Extreme Edition поколения Haswell-E, который стоил $999, в линейке Broadwell-E предусмотрена почти равноценная замена – Core i7-6900K. Это, правда, уже не десятиядерник, а, как и Core i7-5960X Extreme Edition двухлетней давности, процессор с восемью ядрами. Но зато у новинки более новая микроархитектура и выше таковые частоты – 3,2-3,7 ГГц против 3,0-3,5 ГГц. Поэтому вполне возможно, что именно Core i7-6900K станет наиболее популярным решением из семейства Broadwell-E в среде энтузиастов. Ведь восемь ядер и 20 Мбайт L3-кеша кажутся достаточно разумным вариантом для высокопроизводительного компьютера. К тому же Core i7-6900K предлагает практически тот же список преимуществ, что и флагман: в нём есть полный набор свободных множителей, 40 линий PCI Express и обновлённый контроллер памяти.

Есть в линейке LGA2011-v3-процессоров Broadwell-E и более доступные варианты. Правда, все они лишь шестиядерные. Core i7-6850K с ценой $617 сменяет на своём посту Core i7-5930K, а на место LGA2011-v3-процессора начального уровня, которое раньше занимал Core i7-5820K, приходит 434-долларовый Core i7-6800K. Новинки похожи по базовым характеристикам на предшественников поколения Haswell-E и предлагают то же число ядер, тот же объём кеш-памяти и прежнее число линий PCI Express. Однако частоты у младших Broadwell-E несколько выше. Базовая частота Core i7-6850K установлена на отметке 3,8 ГГц, тогда как Core i7-5930K имел частоту 3,5 ГГц. Core i7-6800K же работает на 3,4 ГГц, то есть он на 100 МГц быстрее Core i7-5820K. Новые Broadwell-E с шестью ядрами, как и их более навороченные собратья, тоже разрешают разгон: заблокированных процессоров для платформы LGA2011-v3 не существует вообще.

Спецификации всех четырёх представителей линейки Broadwell-E приведены в таблице ниже.

Core i7-6950X Core i7-6900K Core i7-6850K Core i7-6800K
Ядра/потоки 10/20 8/16 6/12 6/12
Тактовая частота 3,0 ГГц 3,2 ГГц 3,6 ГГц 3,4 ГГц
Макс. частота в турборежиме 3,5 ГГц 3,7 ГГц 3,8 ГГц 3,6 ГГц
Поддержка Turbo Boost Max 3.0 Есть Есть Есть Есть
Разблокированные множители Есть Есть Есть Есть
L3-кеш 25 Мбайт 20 Мбайт 15 Мбайт 15 Мбайт
Число линий PCI Express 3.0 40 40 40 28
Память 4 канала
DDR4-2400
4 канала
DDR4-2400
4 канала
DDR4-2400
4 канала
DDR4-2400
TDP 140 Вт 140 Вт 140 Вт 140 Вт
Процессорное гнездо LGA2011-v3 LGA2011-v3 LGA2011-v3 LGA2011-v3
Цена $1 723 $1 089 $617 $434

Стоит отметить, что с появлением процессоров Broadwell-E «цена входа» в экосистему LGA2011-v3 в очередной раз немного повышается. Теперь младший процессор Core i7-6800K оценён в $434, в то время как официальная цена Core i7-5820K составляла $389. Причём это увеличение стоимости не сопровождается никакими принципиальными изменениями в характеристиках. Как и раньше, младший процессор для LGA2011-v3 получил урезанный контроллер PCI Express, который располагает лишь 28 линиями.

#Broadwell-E: микроархитектурные улучшения

Казалось бы, что может быть принципиально нового в процессорах класса Broadwell? Ведь это – далеко не самая последняя микроархитектура Intel, к тому же ещё и «тик», то есть она представляет собой редизайн Haswell, сделанный в связи с внедрением 14-нм техпроцесса. Однако это вовсе не значит, что Broadwell-E не смогут предложить по сравнению с Haswell-E никакого заметного прогресса в производительности, даже если говорить о CPU с одинаковым количеством вычислительных ядер.

Современный 14-нм техпроцесс, пришедший в высокопроизводительные многоядерные процессоры спустя почти два года после своего внедрения в чипы с меньшим количеством ядер, сегодня позволяет получать достаточно сложные высокочастотные полупроводниковые кристаллы с небольшим уровнем брака. В результате Intel в новых многоядерных Core i7 смогла немного нарастить тактовые частоты. Кроме того, сама микроархитектура Broadwell содержит некоторое количество небольших улучшений, которые в сумме способны дать ещё примерно 5-процентное улучшение удельного быстродействия. Плюс есть и ещё один момент: дизайн Broadwell-E содержит пару уникальных возможностей, которые тоже способны повысить привлекательность и производительность основанных на нём продуктов.

Подробно о тех оптимизациях, которые были сделаны в микроархитектуре Broadwell, мы говорили в нашем специальном материале, где рассказывали о LGA1150-процессорах Broadwell-C. Если же коротко, то по сравнению c Haswell в них ускорен блок выполнения делений чисел с плавающей точкой, уменьшены задержки при выполнении AVX-умножений, в полтора раза увеличен буфер ассоциативной трансляции, в очередной раз слегка оптимизирована схема предсказания ветвлений, а также расширено окно планировщика.

Но в дополнение к этому процессоры Broadwell-E получили усовершенствованный блок управления питанием, который научился новому трюку: изменять частоту вычислительных ядер в рамках турборежима независимо друг от друга. И инженеры Intel нашли для этой возможности сразу три практических применения.

Во-первых, в Broadwell-E было оптимизировано исполнение вычислительных потоков, которые задействуют AVX-команды. Векторные инструкции, входящие в различные AVX-подмножества, отличаются существенной энергоёмкостью. Это хорошо известно оверклокерам, которые обычно проверяют стабильность процессоров при помощи утилит, реализующих различные счётные алгоритмы с применением AVX-команд.

Известно это было и конструкторам процессоров, поэтому любое включение в процесс вычислений векторных блоков принудительно отключало турборежим и снижало частоту процессора на несколько шагов по меньшей мере на 1 мс. В новых процессорах с дизайном Broadwell-E процедура снижения частоты осталась, но работает она теперь не глобально, а избирательно – для каждого ядра в отдельности. То есть при выполнении AVX-инструкций частота снижается только у тех ядер, которые непосредственно заняты AVX-вычислениями. Остальные же ядра, работающие с традиционными скалярными командами, могут продолжать пользоваться преимуществами турборежима и функционировать на повышенной частоте.

Во-вторых, в Broadwell появилась весьма любопытная функция поядерного разгона. Теперь для каждого ядра процессора можно настроить собственный, независимый множитель. И это открывает достаточно широкий оперативный простор перед оверклокерами-экспериментаторами, поскольку ядра, соседствующие на одном полупроводниковом кристалле в многоядерных процессорах, действительно могут разгоняться по-разному из-за различного расположения, неравномерного прилегания теплорассеивателя, непостоянства характеристик техпроцесса и тому подобного.

Третье применение новой возможности ещё более любопытно. Это новая технология Intel Turbo Boost Max Technology 3.0. Суть данной технологии состоит в выделении отдельных процессорных ядер с форсированным турборежимом и направлении критических нагрузок в первую очередь на такие ядра. Конкретная реализация Intel Turbo Boost Max Technology 3.0 в процессорах семейства Broadwell-E представляет собой целый комплекс, который работает не только на аппаратном уровне — он также добавляет в операционную систему собственный дополнительный драйвер. Иными словами, Turbo Boost Max Technology 3.0 явно заслуживает отдельного рассказа.

#Технология Intel Turbo Boost Max Technology 3.0

Анонс нового флагманского процессора, подобного Core i7-6950X, не оставляет никаких сомнений в том, что Intel взяла курс на рост параллелизма, то есть на наращивание производительности за счёт добавления вычислительных ядер. Однако такой экстенсивный путь развития даёт явные результаты не всегда. Да, программное обеспечение, которое основано на многопоточных алгоритмах, безусловно, получит ускорение, однако существует огромное число задач, которые распараллеливаются с большим трудом. Среди программ, которые используются в массовых настольных системах, таких немало, и самый распространённый пример – это игры. В этом случае рост производительности мог бы быть достигнут за счёт увеличения тактовой частоты процессоров, но на данном этапе он невозможен. Более того, частоты даже приходится откатывать назад, чтобы новые многоядерные процессоры не выходили за рамки допустимых тепловых пакетов.

Проблема производительности при работе с плохо распараллеливаемыми алгоритмами волнует Intel уже давно. И современные процессоры имеют механизмы, которые позволяют смягчить негативный эффект, вызванный невысокими частотами многоядерных процессоров. Например, именно для этой цели в современных CPU Intel была введена технология Turbo Boost 2.0. Её суть заключается в увеличении тактовой частоты на несколько шагов в те моменты, когда процессорные ядра загружены работой лишь частично и температурный режим полупроводникового кристалла находится в допустимых рамках.

Однако для процессоров с высоким числом ядер, вроде десятиядерного Core i7-6950X или восьмиядерного Core i7-6900K, эффективность Turbo Boost 2.0 оказывается недостаточной. Например, максимальная частота Core i7-6950X в турборежиме в лучшем случае доходит лишь до 3,5 ГГц, в то время как у старших процессоров в LGA1151-исполнении, которые относятся к более низкому классу, 4,0 ГГц – это номинальная частота.

Поэтому в новых процессорах инженеры Intel решили реализовать более хитрый турборежим – технологию Intel Turbo Boost Max Technology 3.0. И в этом им помог улучшенный менеджер управления питанием, который в Broadwell-E получил возможность независимого управления частотой отдельных ядер. Идея Turbo Boost Max 3.0 заключается в том, что частоту единичных ядер при невысокой нагрузке на вычислительные ресурсы допустимо поднимать выше общей тактовой частоты даже в том случае, если процессор уже работает в режиме Turbo Boost 2.0. И в новых LGA2011-v3-процессорах семейства Broadwell-E одному из вычислительных ядер разрешили разгоняться сильнее, чем всем остальным.

Например, процессор Core i7-6950X имеет номинальную тактовую частоту 3,0 ГГц, и при тяжёлой многопоточной нагрузке он функционирует именно на ней. Старая технология Turbo Boost 2.0 позволяет ему поднимать частоту до 3,4-3,5 ГГц. И если нагрузка на процессор не слишком велика, то процессор переходит в турборежим с такой частотой. Однако одно из ядер у этого процессора в турборежиме за счёт новой технологии Turbo Boost Max 3.0 увеличивает свою частоту не до 3,5 ГГц, а до 4,0 ГГц. Если такое ускоренное ядро всегда использовать для выполнения малопоточных задач, то производительность платформ LGA2011-v3 и LGA1151 в приложениях, не создающих большого числа параллельных вычислительных потоков, естественным образом сблизится.

Правда, есть одна проблема: диспетчер задач Windows (да и других операционных систем) понятия не имеет о существовании процессоров, ядра которых работают на разной тактовой частоте. Поэтому в общем случае нет никакой гарантии, что нагрузка в первую очередь будет направляться на то ядро, которое работает с самой высокой тактовой частотой, а уже потом на остальные процессорные ресурсы.

Но Intel предусмотрела и это. Для решения данной проблемы разработчики компании создали специальный драйвер – Turbo Boost Max Driver, который работает как надстройка над диспетчером задач и перераспределяет нагрузку по ядрам процессора, отправляя её в первую очередь на те из них, которые работают быстрее.

Таким образом, для полноценной работы технологии Turbo Boost Max 3.0 необходимы три составляющие. Во-первых, эта технология работает исключительно с процессорами Broadwell-E, и никакими другими CPU она не поддерживается. Во-вторых, она требует поддержки со стороны BIOS материнской платы. В частности, плата должна позволять включать независимое управление частотой отдельных ядер. Например, вот как это выглядит на нашей тестовой плате ASUS X99-Deluxe.

Обратите внимание: ядро, которому разрешено поднимать частоту выше, чем остальным, в оболочке UEFI BIOS даже помечено звёздочкой.

В-третьих, в системе должен быть установлен и настроен драйвер Intel Turbo Boost Max Driver.

Стоит отметить, что разработанное Intel программное обеспечение предлагает достаточно гибкие настройки. В правой части окна управляющей панели отображается список ядер, отсортированных в соответствии с приоритетом направления на них нагрузки (список формируется автоматически, на первое место ставится «быстрое» ядро). В левой части пользователь может сформировать свой список приложений, которые должны быть перенесены на более быстрые ядра в первую очередь. В противном случае приоритетными считаются те приложения, которые работают на переднем плане.

Кроме того, в панели управления драйвером есть и расширенные настройки. В соответствующем окне можно изменить частоту, с которой драйвер проверяет ситуацию с нагрузкой, задать границу, по которой отсекается невысокая нагрузка, а также внести изменения в стандартный алгоритм перераспределения нагрузки.

Intel обещает, что включение программно-аппаратного комплекса Turbo Boost Max Technology 3.0 способно увеличить производительность системы более чем на 15 процентов. И для Core i7-6950X это действительно так. Причём наличие одного ускоренного до 4,0 ГГц ядра, на которое направляется критическая нагрузка, сильно помогает не только в однопоточных, но и в многопоточных задачах. Ведь даже в тех приложениях, которые могут эффективно распараллеливать свою работу, один из потоков обычно несёт на себе дополнительные управляющие и координирующие функции. Поэтому перемещение его на более быстрое ядро увеличивает скорость выполнения всей задачи в целом.

Для того чтобы собственноручно оценить эффективность работы Turbo Boost Max Technology 3.0, мы воспользовались комплексным тестом SYSmark 2014, который оценивает средневзвешенную производительность в типичных пользовательских сценариях, исполняемых в реальных приложениях.

Как видно по приведённым данным, в среднем в реальных пользовательских сценариях технология Turbo Boost Max Technology 3.0 даёт увеличение производительности порядка 8 процентов. И это, на самом деле, только подтверждает ценность данной технологии. Фактически за счет динамического увеличения частоты одного ядра Intel смогла добиться такого же прироста в быстродействии, как от увеличения общей тактовой частоты на 200-300 МГц.

И кстати, в отдельных приложениях технология Turbo Boost Max 3.0 может обеспечивать и гораздо более заметное улучшение производительности.

Как видите, увеличение скорости работы может превышать и 10-процентный уровень. Причём прирост можно наблюдать не только в приложениях, работающих на ограниченном числе ядер, но и в задачах, которые мы привыкли относить к числу многопоточных и способных эффективно распределять свою нагрузку по большому массиву вычислительных ядер.

Следующая страница →
 
Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
⇣ Комментарии