Теги → архитектура
Быстрый переход

Бывший инженер Intel указал на крупнейшую бизнес-ошибку компании

Во второй половине 2015 года полупроводниковый гигант Intel начал поставки процессоров на основе новой архитектуры Skylake. Она была существенно лучше предыдущего поколения Broadwell, обеспечивала более высокие показатели производительности, функциональности и энергоэффективности. Чипы Skylake производились с соблюдением 14-нм технологических норм Intel.

Семейство Skylake было рассчитано на типичный годовой цикл жизни, после чего в 2016 году ему на смену должны были прийти чипы Cannon Lake. Но из-за трудностей с освоением 10-нм норм производства, которые должны были применяться для печати Cannon Lake и его преемников, а также плохого планирования основные линейки продуктов Intel по-прежнему основаны, по сути, на архитектуре Skylake, хотя и с оптимизацией техпроцесса, и наращиваем ядер для повышения производительности.

Согласно твиту известного инженера Франсуа Пиноэля (Francois Piednoel), покинувшего Intel в июле 2017 года, у компании была возможность внедрить совершенно новые технологии ещё на этапе текущих 14-нм норм, но руководство решило отложить их на будущее: «Я на самом деле считаю, что потеря рыночного импульса куда хуже, чем появление Ryzen — это очень плохо. Два года назад я говорил, что ICL [архитектуру Ice Lake] следует внедрять ещё на этапе техпроцесса 14++, и тогда все смотрели на меня, словно я самый сумасшедший... что ж... теперь они наверняка думают иначе».

Как архитектура процессора, так и лежащая в основе технология производства влияют на конкурентоспособность продукта. Например, если компания сохраняет старую архитектуру, просто перенося прежний дизайн на более тонкие нормы, чип, как правило, получает улучшенную энергоэффективность и производительность. Можно, напротив, внедрить архитектурные новации на отработанном техпроцессе, добившись улучшения производительности, энергоэффективности и функциональности за счёт дизайна чипа.

Исторически сложилось, что процессоры Intel развивались в рамках так называемого цикла «Тик-Так». «Тик» предполагал использование проверенной архитектуры чипа с небольшими оптимизациями для нового техпроцесса. С другой стороны, «Так» предусматривал применение совершенно новой архитектуры при использовании немного усовершенствованных отлаженных производственных норм.

Этот подход к разработке продуктов хорошо зарекомендовал себя, поскольку позволял Intel минимизировать риски и обеспечивать надёжное поступление новых продуктов на рынок. Но в последние годы возникла проблема с освоением следующей 10-нм технологии производства полупроводниковых кристаллов. К моменту, когда проблема стала во весь рост, было уже слишком поздно перерабатывать рассчитанную на 10 нм новую архитектуру под старые 14-нм нормы.

В итоге Intel принялась за оптимизации своих 14-нм норм, чтобы добиться повышенной производительности (результатом стали 14-нм+ и 14-нм++ нормы), но при этом компания не изменила существенно архитектуру самих процессоров (самое крупное новшество — рост количества вычислительных ядер). В результате за последние три года Intel снизила темпы новаций, что вместе с запуском Ryzen привело к ослаблению рыночных позиций.

Франсуа Пиноэль говорит о том, что этого можно было избежать, если бы руководство Intel прислушалось тогда и приняло решение переходить на новую архитектуру Ice Lake ещё на этапе 14-нм++ норм. Видимо, руководство тогда считало, что к текущему моменту 10-нм технология Intel будет готова к массовому производству.

Исполнительный директор Intel Брайан Кржанич (Brian Krzanich) поясняет, что трудности при переходе на 10-нм нормы массового производства были вызваны тем, что компания пыталась добиться более агрессивного, чем обычно, уплотнения транзисторов по сравнению с предыдущим поколением. Он выразил уверенность, что эта ошибка не повторится в ходе освоения 7-нм техпроцесса.

Будем надеяться, что Intel извлечёт и другой урок: трудности с производством не должны сдерживать архитектурные новации. Руководству следовало бы выделить дополнительные ресурсы на приспособление архитектуры Ice Lake к 14-нм технологическим нормам в качестве запасного плана, ведь два года назад должно было быть уже ясно, что со своевременным освоением 10-нм норм могут возникнуть большие трудности.

История архитектуры AMD GCN завершится в 2019–2020 годах вместе с GPU Navi

В мае прошлого года AMD поделилась своими планами по развитию видеоускорителей на ближайшие годы. GPU следующего за Vega поколения носит кодовое имя Navi, поступит в производство в этом году и будет выпускаться по 7-нм техпроцессу DUV на заводах GlobalFoundries с использованием многослойной памяти HBM следующего поколения, предложит существенно возросшую производительность и улучшенную масштабируемость. О следующих за Navi ускорителях известны были лишь сроки: начало 2020 года, да применение второго поколения 7-нм техпроцесса EUV.

Теперь же ресурс TweakTown.com сообщил информацию о запуске первых ускорителей Navi во время мероприятия SIGGRAPH 2018, 12–16 августа. Это будут видеокарты профессионального класса — потребительские же Radeon RX появятся уже в следующем 2019 году. В свою очередь, сайт WCCFTech.com отметил, что Navi станут последним, шестым поколением ускорителей AMD с архитектурой GCN, на смену которой в 2020–2021 годах придёт полностью новая и пока безымянная микроархитектура.

Неизвестно, насколько сильное влияние на post-GCN-дизайн оказал бывший руководитель подразделения AMD Radeon Technologies Group Раджа Кодури (Raja Koduri), с ноября прошлого года возглавивший в Intel команду по разработке дискретных ускорителей. Тем не менее, покидая свой пост в AMD, он сказал: «Я искренне верю в наши проекты — Vega, Navi и последующие, и невероятно горжусь тем, как далеко мы зашли и куда направляемся…».

Созданные под его началом видеокарты Vega значительно уступают по эффективности ускорителям NVIDIA с архитектурой Pascal и стали менее привлекательными для игроков. И надежды на то, что положение улучшат продукты Navi, вполне могут не оправдаться. По крайней мере, источники TweakTown.com утверждают, что Vega стала катастрофой для AMD, а команда Radeon якобы не уверена в будущем и считает, что Navi повторит судьбу Vega. Ведь NVIDIA достаточно перейти на новый техпроцесс, чтобы дать достойный ответ, не говоря уже об архитектурных улучшениях и использовании памяти GDDR6 или HBM2. По результатам прошлого года доля NVIDIA на рынке графических карт превысила 70 %.

В своё время GCN, пришедшая на смену TeraScale в 2011 году в лице видеокарт Southern Islands, оказалась весьма передовой и перспективной. Достаточно вспомнить Radeon R9 290X и сверхмощную двухпроцессорную видеокарту Radeon R9 295X2, а также популярность продуктов AMD. Теперь в графическом секторе «красным» стало сложно соперничать с «зелёными»: продажи Vega держатся во многом на добыче криптовалют, и оптимизированные ускорители Navi вряд ли изменят что-то в этом отношении.

Остаётся надеяться, что AMD, как и всегда прежде, сможет переломить ситуацию и её новая, следующая за Navi (и шире — GCN), архитектура вернёт баланс на рынок графических карт.

Western Digital инвестировала в разработчика «процессора в памяти»

Огромная инерция классических микропроцессорных архитектур не позволяет быстро вывести на рынок что-то по-настоящему новое, хотя это новое давно назрело. Объёмы обрабатываемых данных увеличились настолько, что раздельное расположение подсистем памяти превратилось в так называемую проблему «стены памяти». Пересылка данных из процессора в память и обратно стала съедать достаточно ресурсов, чтобы проектировщики начали задумываться о новых архитектурных решениях для микропроцессоров и памяти. Лидеры отрасли начали создавать собственные проекты: Micron предложила Automata Processor (процессор автоматов), HP работает над проектом Machine, Toshiba создаёт CPU с кеш-памятью STT MRAM, есть свои проекты у Intel и IBM. И, конечно же, свой путь ищут разнообразные стартапы. Некоторые оказываются небезнадёжными.

В составе модулей памяти может появиться свой процессор для обработки данных (Upmem SAS)

В составе модулей памяти может появиться свой процессор для обработки данных (Upmem SAS)

Так, созданная в 2015 году компания Upmem SAS (Гренобль, Франция) предложила собственную архитектуру процессора в памяти (processor-in-memory, PIM). Это RISC-процессор, получивший также название DPU (DRAM processing units). Конструктивно процессор DPU «размазан» по массиву памяти или, говоря иначе, он интегрирован в массив памяти. Это позволяет работать над данными не пересылая их через контроллер наружу. Данные обрабатываются в том же самом месте, где хранятся. Утверждается, что без увеличения потребления архитектура компании Upmem увеличит производительность вычислений от 10 до 25 раз.

На днях компания Upmem SAS провела первый раунд размещения крупного пакета акций (серия A). В ходе раунда компания собрала 3 млн евро. Инвесторами выступили венчурные компании C4 Ventures, Partech Ventures, Supernova Invest и... финансовое подразделение Western Digital Capital. Других подробностей нет и пока они не нужны. Интерес Western Digital к разработке понятен без лишних размышлений. С покупкой SanDisk она стала производителем флеш-памяти, а энергонезависимая память как раз рассматривается в качестве предпочтительной для архитектур типа Upmem PIM. Актуальная флеш-память типа NAND не очень хорошо подходит для данных архитектур, но это тоже не проблема. В активе Western Digital имеются наработки и продолжается работа над памятью типа ReRAM и другими перспективными типами энергонезависимой памяти.

Слайд из презентации Western Digital на FMS

Слайд из презентации Western Digital на FMS

По признанию Upmem, один из партнёров компании крайне высоко оценил архитектуру processor-in-memory. К сожалению, в компании не уточнили, о чём идёт речь: об эмуляции или о FPGA. Собранные в серии A инвестиции помогут разработчикам воплотить архитектуру в настоящем кремнии и создать необходимые программные инструменты для продвижения решения в массы.

Фасад здания в аэропорту Сан-Диего украсил 500-метровый «дисплей» E Ink

Тайваньская компания E Ink Holdings выпустила пресс-релиз, в котором сообщила о самой большой в её истории публичной демонстрации одноимённой технологии. Фасад здания для аренды автомобилей в Международном аэропорту города Сан-Диего украсила 500-метровая инсталляция из панелей E Ink. Для оформления фасада задействованы 2000 монохромных панелей E Ink Prism. Все они с использованием беспроводной связи подключены к управляющему компьютеру, а питание каждой из них осуществляется от солнечных панелей.

На панели здания размещены 2000 панелей E Ink (E Ink Holdings)

На панели здания размещены 2000 панелей E Ink (E Ink Holdings)

В зависимости от выбранного режима панели динамически меняют цвет, воссоздавая привлекательную анимацию. Это может быть имитация ряби на воде, калейдоскоп из пятен, движение геометрических фигур или что-то другое, что придёт в голову дизайнеру-оформителю. Следует отметить, что панели E Ink Prism двухцветные, но могут поставляться в вариантах из 7 различных базовых цветов. Данные панели компания представила в 2015 году как решение для оформления архитектурных сооружений внутри и снаружи.

Дизайн инсталляции под кодовым именем «DAZZLE» предложила компания Ueberall International. Впрочем, дизайн позаимствован из истории США. В ходе Первой мировой войны для военных кораблей в водах Сан-Диего был предложен камуфляж «razzle dazzle» в виде мозаики из контрастных параллелепипедов. Секции E Ink для оформления фасада здания в аэропорту также выполнены в виде параллелепипедов. Как это выглядит в динамике, можно увидеть из видео выше.

Intel Gemini Lake: детали архитектуры готовящихся SoC

В последние годы компания Intel старается подтянуть свои экономичные SoC до уровня обычных процессоров, чтобы производители систем в сборе могли выпускать на их основе не только бюджетные ноутбуки и неттопы, но и оригинальные устройства с возможностями, выходящими за рамки модели использования «пишущих машинок». После того как SoC Apollo Lake вывели экосистему самых скромных чипов Intel на новый уровень, в Intel планируют выпустить ещё более «шустрые» процессоры Gemini Lake. Последние будут изготавливаться по хорошо «обкатанной» 14-нм технологии и будут сочетать в себе вычислительные ядра Goldmont Plus, графический блок Intel 9-го поколения (Gen9LP) и разнообразную системную логику.

«2-в-1» Acer Switch 3 на базе актуальных SoC Intel Apollo Lake

«2-в-1» Acer Switch 3 на базе актуальных SoC Intel Apollo Lake

Ключевые детали строения SoC Gemini Lake мы приводили в одной из недавних публикаций, где на уровне слухов сообщалось о поддержке новыми чипами форматов видео HEVC и VP9 (оба — 10-бит), наличии у готовящихся процессоров двойного объёма кеш-памяти второго уровня, а также контроллера DDR4, интерфейса HDMI 2.0, адаптера беспроводных сетей и других узлов. Дополнительные сведения об Intel Gemini Lake привёл ресурс CNX Software, сопроводив соответствующий материал схемой строения четырёхъядерного процессора.

С архитектурой Goldmont Plus связан переход от конвейера с тремя параллельно выбираемыми и декодируемыми инструкциями (3-wide) к конвейеру с четырьмя инструкциями (4-wide), что теоретически должно обеспечить 10–15 % прироста производительности на одинаковых частотах по сравнению с Apollo Lake/Goldmont. Увеличение объёма кеша второго уровня с 2 до 4 Мбайт подкреплено обновлённым протоколом событий в кеше (cache event list). Встроенное в тело SoC графическое ядро включает 18 исполнительных блоков (EU). Помимо вышеупомянутых 10-битных форматов видео, оно поддерживает на аппаратном уровне H.264, MPEG-2, VC-1, JPEG, VP8, а также обычные 8-битные форматы HEVC и VP9. Интеграция интерфейса HDMI 2.0 вместо HDMI 1.4 гарантирует работу 4K-мониторов при 60 Гц вместо 24–30 Гц. Наряду с HDMI 2.0 присутствуют DisplayPort 1.2a и eDP 1.4.

Контроллер памяти у Gemini Lake гибридный (DDR3/DDR4) двухканальный. Поддерживаемая частота памяти LPDDR3 — 1866 МГц, а LPDDR4 — 2400 МГц. Контроллер Wi-Fi/Bluetooth «спрятался» в блоке CNVi, название которого происходит от Connectivity Integration Architecture. Его включение в состав SoC наверняка сократит общие затраты на платформу. В числе прочей системной логики — линии PCI Express 2.0, контроллер eMMC 5.1, каналы SATA 6 Гбит/с, USB 3.0 и USB 2.0.

Снимок кристалла SoC Apollo Lake

Снимок кристалла SoC Apollo Lake

В целом нет сомнений, что чипы Gemini Lake усилят позиции Intel на рынке дешёвых экономичных SoC архитектуры x86. Другое дело, что в этом году среднеценовые и HEDT-процессоры сильно прибавили, поэтому эволюционное развитие Goldmont — самое меньшее, что можно было ожидать от Intel в бюджетном сегменте рынка CPU/SoC. Ориентировочным сроком релиза чипов Gemini Lake считается четвёртый квартал текущего года.

Intel в поиске опытного проектировщика CPU

Одна из вакансий на сайте компании Intel привлекла внимание публики и в, частности, журналистов интернет-издания Overclock3D, которые увидели в ней подготовку чипмейкера к релизу процессоров с принципиально новой архитектурой. Согласно сохранённой в кеше Google копии страницы с jobs.intel.com, коллектив разработчиков CPU Intel в г. Хилсборо (штат Орегон, США) нуждается (или нуждался) в пополнении в лице «Senior CPU Micro-architect and Design Expert» или, проще говоря, старшего проектировщика процессорных ядер.

«...Наша цель — создать революционное микропроцессорное ядро, которое "зарядит" собой следующее десятилетие вычислений и станет благодатной почвой для создания вещей, о которых нам ещё только предстоит мечтать. Мы ищем талантливого специалиста в областях проектирования процессоров, CPU-логики и высокопроизводительных интегральных схем — человека, который поможет создать ядро с нуля. Начните путешествие [в будущее] с нами!»

В обязанности старшего проектировщика ядер входит разработка элементов высокопроизводительной архитектуры CPU с учётом различных факторов (мощность, производительность, площадь кристалла, себестоимость) и, кроме того, планирование и руководство процессом воплощения ядра в кремнии и управление младшими техническими сотрудниками.

Необходимость разработки компанией Intel новой процессорной архитектуры назрела довольно давно, поскольку со времён Sandy Bridge (32 нм) она принципиально не менялась. Проекты Ivy Bridge, Haswell/Haswell Refresh/Devil’s Canyon, Broadwell, Skylake и Kaby Lake, а также Coffee Lake и Cannon Lake постепенно повышали быстродействие чипов в x86-приложениях и работе с графикой (iGPU), и снижали их энергопотребление. Тем не менее дискретная графика с 2005 года (старт проекта Sandy Bridge) шагнула далеко вперёд, как и сегмент HPC, поэтому качественный рывок, подобный «телепортации» AMD с Bulldozer-Excavator в Zen, крайне необходим. Вероятно, Intel попробует взять реванш у ARM за поражение на рынке SoC для смартфонов, но здесь важно не допустить перекоса в сторону мобильного сегмента, который ограничит максимальную производительность архитектуры.

Пока не ясно, когда Intel будет готова отправить на пенсию последнюю «инкарнацию» Sandy Bridge. В роли таковой может выступить семейство 10-нм процессоров Cannon Lake или следующее за ним Ice Lake. В любом случае, всё решится до или одновременно с переходом на 7-нм технологическую норму.

Epic Games продемонстрирует архитекторам возможности Unreal Engine

Unreal Engine 4 изначально создавался для разработки игр, но Epic Games хочет показать, что он подходит и для других задач. С этой целью компания проведёт серию вебинаров, в которых покажет возможности движка как инструмента визуализации для архитекторов.

Дизайнерскую идею зачастую непросто продемонстрировать. Раньше архитекторы использовали рисунки и уменьшенные модели, но программное обеспечение вроде Unreal Engine может позволить перемещаться по фотореалистичным зданиям с естественным освещением. А благодаря виртуальной реальности люди могут в буквальном смысле оказываться в местах, которых пока ещё не существует.

Epic Games планирует провести четыре бесплатных вебинара, первый из которых намечен на 27 апреля. Специальным гостем станет архитектор Фабрис Боррелли (Fabrice Bourrelly), который расскажет о причинах, по которым Unreal Engine стоит использовать в данной сфере. Зарегистрироваться на вебинар можно здесь.

«Используя модели Дома из стекла Филиппа Джонсона (Philip Johnson) и Церкви света Тадао Андо (Tadao Ando), Фабрис покажет, как Unreal Engine привносит эмоции, настроение и атмосферу рендеринга в автономном режиме в глубокую и интерактивную виртуальную и дополненную реальность в режиме реального времени, — сказал представитель сообщества движка Крис Руффо (Chris Ruffo). — Фабрис является архитектором, художником и 3D-визуализатором, который за последний год стал лидирующим пользователем и учителем по Unreal Engine. В список клиентов Фабриса входят Google, IDEO, Томас Хизервик (Thomas Heatherwick), Аниш Капур (Anish Kapoor), Bentley Motors и Филипп Старк (Philippe Starck)».

Боррелли начал работать с Unreal Engine не так давно. В прошлом году он провёл лекцию по визуализации и обнаружил, что огромное число людей, работающих в сфере, хотели бы узнать больше о движке и исследовании моделей виртуальной реальности. Так он решил скачать программное обеспечение и опробовать его.

«Я начал с простого коридора, освещённого снаружи, и одного материала, — заявил Боррелли. — Это позволило мне почувствовать, как один материал будет вести себя с отражениями и освещением. Я научился создавать мягкое освещение с помощью Lightmass, что является критичным для построения реалистичной архитектурной визуализации».

Архитектор загружает свои работы на канал в YouTube.

Analemma Tower: проект небоскрёба, свисающего с астероида

Нью-йоркская фирма Clouds Architecture Office представила футуристический проект весьма необычного здания под названием Analemma Tower.

Идея заключается в том, чтобы в буквальном смысле подвесить небоскрёб к астероиду. Для этого предлагается доставить космическое тело нужной массы на околоземную орбиту. Для монтажа всей конструкции должны использоваться многочисленные тросы, обладающие колоссальной прочностью.

Компания Clouds Architecture Office отмечает, что теоретически создание Analemma Tower может осуществляться в любой точке мира. После завершения строительства вся конструкция может быть доставлена на место базирования.

Космический небоскрёб, по задумке дизайнеров, будет состоять из нескольких секций. Они получат разное предназначение и разную структуру из-за того, что им предстоит находиться на различной высоте, где будут варьироваться давление, температура и другие характеристики атмосферы.

Необходимую электроэнергию подвесная башня Analemma Tower должна получать от массива солнечных панелей космического базирования. Небоскрёб предлагается оборудовать комплексной системой фильтрации и рециркуляции воды, запасы которой будут пополняться за счёт конденсации и естественных осадков.

Разумеется, пока Analemma Tower — это не более чем любопытная концепция. Доступные сегодня технологии попросту не позволят реализовать проект на практике. Некоторые дополнительные детали о космическом небоскрёбе можно найти здесь

Ошибка в процессорах AMD Ryzen связана с набором инструкций FMA3

Выпуск нового процессора, особенно, если речь идёт о новой архитектуре, а не об усовершенствовании старой, проверенной, обычно влечёт за собой и наличие ошибок. Чаще всего эти ошибки не фатальны, хотя их список может исчисляться десятками страниц, но история знает и яркие примеры серьёзных провалов: «двойная сигма», не позволявшая дефектным процессорам Intel 80386 работать в 32-битном режиме, ошибка F00F в ранних Pentium, приводившая к зависанию системы, а также некорректная отработка операции деления в первых Pentium 60/66. Увы, как выяснилось на днях, не минула сия судьба и AMD Ryzen на базе новейшей архитектуры Zen.

Краткое описание сущности набора инструкций FMA. Источник: Wikipedia

Краткое описание набора инструкций FMA. Источник: Wikipedia

Как сообщают зарубежные источники, разработчику Александру Еэ (Alexander Yee) удалось выловить серьёзную ошибку в текущей ревизии кремния Ryzen с помощью специальной тестовой программы собственной разработки. Называется программа просто flops и целью её является измерение производительности процессора в операциях с плавающей запятой. Она использует максимально оптимизированный код с поддержкой всех современных наборов инструкций, включая SSE и FMA3 (Fused Multiply-Add 3). В Ryzen AMD отказалась от поддержки FMA4, но в реализацию FMA3 вкралась ошибка: использование 128-битных команд FMA3 может приводить к краху системы, и Александру Еэ удалось добиться воспроизводимости этого результата.

Он опубликовал свою находку на форумах HWBot под ником Mystical, после чего другие пользователи сообщили о том, что проблема действительно существует и регулярно воспроизводится вне зависимости от конфигурации системы: достаточно, чтобы её сердцем был один из новых процессоров Ryzen. Коллеги с ресурса Heise Online проверили поведение Ryzen 7 1700X на плате MSI X370 XPower Gaming Titanium и Ryzen 7 1700 на одной из самых популярных плат с разъёмом AM4 —  ASUS Crosshair VI Hero. Оба раза им удалось добиться «успеха»: система уходила в чёрный экран и намертво зависала, что лечилось только холодной перезагрузкой. Как сообщает глава ресурса HWBot, ошибка всегда проявляется при определённых условиях использования FMA3 и лежит в области микрокода (AGESA, AMD Generic Encapsulated Software Architecture). Следовательно, она не является неисправимой и проблему можно решить обновлением микрокода процессора (в том числе с помощью обновления BIOS системной платы), но AMD пока никак не прокомментировала ситуацию.

Мы надеемся, что в ближайшем времени последует волна обновлений от производителей системных плат, избавляющая системы на базе Ryzen от серьёзного риска зависания при использовании функций FMA3. Но хотелось бы также дождаться и официальных комментариев Advanced Micro Devices.

Ядра Ryzen на 10 % меньше ядер Skylake и технологически эффективнее

Сравнивать процессоры Intel Skylake и Kaby Lake с AMD Ryzen лоб-в-лоб не так-то просто, ведь у первых существенную часть площади кристалла занимает интегрированная графика. Но на конференции International Solid State Circuits (ISSCC) AMD опубликовала официальные спецификации, в которых сравниваются именно процессорные ядра x86, реализованные Intel в версии Skylake и аналогичные ядра AMD — в версии Ryzen.

44 против 49 кв. мм, на 1 слой металлизации меньше

44 против 49 кв. мм, на 1 слой металлизации меньше, компактнее кеши

Из продемонстрированных данных следует, что ядро Ryzen занимает примерно на 10 % меньшую площадь на кристалле, нежели ядро Skylake. Аналитики и инженеры Intel при этом подтвердили, что архитектура Zen, несомненно, является конкурентоспособной. Увы, слишком много неизвестных существует, закрытых от обычного глаза и уха, и нам сложно судить, принесут ли эти 10 % весомую выгоду в себестоимости производства кристаллов Ryzen, хотя AMD сейчас не помешает любая экономия. Пока трудно сказать, за счёт чего достигнуто преимущество в площади — только ли за счёт оптимизации расположения транзисторов на кристалле или же что-то интересное кроется и в архитектуре, если сравнивать Zen и Skylake.

Один из первых снимков восьмиядерного модуля Ryzen

Один из первых снимков восьмиядерного модуля Ryzen

Не исключено, что AMD пришлось уступить в сложности блоков исполнения таких инструкций, как AVX, о чём свидетельствует ранее опубликованная таблица, в которой Zen примерно в два раза уступает Kaby Lake при работе с AVX2. Процессор умеет объединять 128-битные модули AVX, но расплата за поддержку AVX2 — скоростной пенальти в количестве тактов на инструкцию. Но если отступить от темы, Intel признает, что технологически AMD со своей новой процессорной архитектурой ей ничем не уступает. В частности, в Zen удалось добиться 15 % снижения ёмкости при переключении транзисторов, а дизайн конденсаторов переведён на основу MiM (metal-insulator-metal, металл-изолятор-металл). Технология MiM применяется AMD впервые.

Снимок кристалла Intel Skylake с пояснениями

Снимок кристалла Intel Skylake с пояснениями. Больше трети кристалла занимает интегрированная графика

В числе прочего технология MiM позволяет снизить напряжение питания и обеспечить более тонкий контроль за электрическими и частотными параметрами каждого ядра на общем кристалле. Это аппаратная сторона программной технологии SenseMI, о которой мы уже рассказывали читателям. Что же касается структурной организации архитектуры Zen, то новое ядро действительно имеет два 128-битных модуля FMAC (объединённый блок умножения-накопления,  fused multiply-accumulate).

И для исполнения инструкций AVX2 ему приходится объединять эти блоки. К счастью, до ситуации, когда эффективность процессора на рынке определяется его способностью быстро работать с набором инструкций AVX2, ещё очень далеко. Сам набор архитектурой поддерживается полностью, а планы AMD включают в себя как минимум четырёхлетнее развитие архитектуры Zen. Вполне возможно, что в итерации Zen+, помимо планируемого роста IPC, мы увидим и расширение модулей FMAC до 256 бит. Эти инструкции всё более активно используются программными комплексами по обработке мультимедийных данных, да и время будет подходящее, ведь в архитектуре Cannonlake Intel собирается внедрить поддержку AVX-512. Мы не думаем, что AMD захочет уступить Intel в этом вопросе, но пока это дело довольно отдалённого будущего. А на сегодня ясно, что у AMD получилось создать не просто конкурентоспособную процессорную архитектуру, но кое в чём опередить Intel и технологически, а это многого стоит, учитывая размеры и возможности процессорного гиганта.

Первые подробности о новой процессорной микроархитектуре Intel

Компания Intel давно принципиальным образом не обновляла архитектуру своих процессоров, ограничиваясь небольшими нововведениями, работая над энергоэффективностью и встроенной графикой. Последним качественным рывком одни считают дебют 32-нм чипов Sandy Bridge в 2011 году, другие — премьеру Nehalem в 2008-м, третьи — и вовсе анонс первых моделей Core в 2006-м. При этом и те, и другие, и третьи наперебой обвиняют Intel в нежелании вкладывать такой объём средств в разработку CPU, который бы поспособствовал новому рывку в «процессоростроении».

Иногда кажется, что высшее руководство Intel интересует что угодно, кроме процессоров (фото ainonline.com)

Иногда кажется, что высшее руководство Intel интересует что угодно, кроме процессоров (фото ainonline.com)

По данным ресурса Bits and Chips, через несколько лет Intel представит новую микроархитектуру x86-64 процессоров, работа над которой ведётся уже сегодня. Она будет универсальной для серверных, настольных и, скорее всего, ряда мобильных платформ. Проект нацелен на получение «идеального баланса между энергопотреблением, производительностью и стоимостью» процессоров (как отмечает источник — подобно AMD Zen). Главная же новость заключается в том, что для уменьшения размеров кристаллов, а также оптимизации соотношения быстродействия и потребления энергии, будущие чипы лишатся поддержки старых наборов SIMD-инструкций и, соответственно, преемственности по отношению к старому «железу».

CPU Intel

Отсутствие у разрабатываемых CPU обратной аппаратно-программной совместимости с «древними» процессорами вряд ли станет проблемой для большинства пользователей, поскольку часть поддерживаемых инструкций на практике давно широко не используется. Программы-эмуляторы и облачные сервисы помогут справиться с проблемами тем, для кого связь поколений CPU всё ещё будет важна.

Pentium MMX

Журналисты Bits and Chips склоняются к мысли, что сокращение перечня SIMD-расширений и SIMD-инструкций является шагом Intel навстречу разработчикам ПО, которым сегодня приходится оптимизировать свои продукты для x86-64 платформ с перенасыщенными (кавычки по вкусу) инструкциями процессорами Intel и AMD, и SoC архитектуры ARM с минимумом полезных расширений. Надо полагать, что реверанс Intel в сторону софтверных компаний отчасти вынужден, ведь последние нередко ориентируются в первую очередь на создание продуктов в рамках экосистемы ARM.

Процессоры на базе новой микроархитектуры увидят свет в 2019–20 гг., а до тех пор Intel продолжит «порционно» наращивать производительность CPU: 2017 год — Coffee Lake (14 нм), 2018 год — Icelake (10 нм), 2019 год — Tigerlake (10 нм). В зависимости от потенциала процессоров AMD Ryzen, чипмейкер из Санта-Клары может в любой момент поднять ставки, предложив, к примеру, шестиядерные CPU Coffee Lake по цене четырёхъядерных Kaby Lake.

Samsung работает над принципиально новой процессорной архитектурой

Мы не сделаем открытия, если скажем, что производительность традиционных вычислительных архитектур перестала расти теми темпами, которые наблюдались ещё десять лет назад. Застой возник по многим объективным причинам. Это и перманентный кризис в мировой экономике, и близость рубежа, после которого кремниевая электроника прекратит бурное развитие, и ворох накопившегося архаичного программного и аппаратного наследия, и многое другое. К счастью, разработчики осознают встающие перед отраслью проблемы и предпринимают попытки найти иной путь для развития вычислительных систем. Одним из таких путей может стать появление принципиально новой микропроцессорной архитектуры.

Макет принципиально нвой компьютерной платформы HP Machine (HP)

Макет принципиально новой компьютерной платформы HP Machine (HP)

Над новой микроархитектурой работают почти все гиганты индустрии и масса молодых компаний. Подобный подход не стоит расценивать как раздутую до планетарных масштабов версию известной басни о лебеде, раке и щуке. Окончательный выбор всё равно будут делать корпорации, так что приживётся далеко не всё, но, возможно, оптимальное. Современная ситуация с акцентом на распараллеливание вычислений и развитие гетерогенных платформ позволяет компаниям отклониться от «генеральной линии партии» и отказаться от массовых x86-совместимых платформ или от теряющих популярность, но остающихся в авторитете RISC/UNIX-платформ.

Процессорный модуль Micron Automata Processor с массивным распараллеливанием вычислений

Процессорный модуль Micron Automata Processor с массивным распараллеливанием вычислений

Собственные микропроцессорные архитектуры несколько лет назад начали создавать компании HP (Machine), Micron (Automata Processor, AP), Toshiba и другие. Особенный интерес представляет проект компании Toshiba, которая предлагает заменить традиционную иерархию памяти в составе вычислительной платформы и процессора. Японские разработчики делают ставку на встраиваемую магниторезистивную память MRAM. Скоростные характеристики eMRAM и высокая устойчивость к перезаписи — в 1000 раз больше, чем у NAND — позволяет заменить оперативную память SRAM в процессоре на энергонезависимую память. Подобные качества позволят говорить о мгновенно включающихся и выключающихся системах любой сложности, что наиболее важно для бесперебойной работы серверов с огромными массивами памяти.

Ведущий разработчик «когнитивного» процессора IBM, Дхармендра Модха (Dharmendra S. Modha)

Ведущий разработчик «когнитивного» процессора IBM, Дхармендра Модха (Dharmendra S. Modha)

Как стало известно на днях, компания Samsung также работает над микропроцессорной архитектурой, ориентированной на память. По словам главного стратега компании — Йона Сона (Young Sohn), если память так важна, то зачем ограничивать её шину, что мы видим в случае архитектуры x86? По замыслу Samsung, вычисления необходимо производить как можно ближе к месту хранения данных. В идеале — локально, как это происходит в мозге человека. Нечто подобное мы видим в случае процессора IBM TrueNorth — это первый нейроморфный процессор, который стал доступен в виде коммерческой вычислительной системы. К сожалению, представитель компании Samsung отказался озвучить детали разработки, а послушать было бы интересно.

AMD рассказала об архитектуре Zen на конференции Hot Chips

В ходе мероприятия Hot Chips 28, традиционно проводимого в Стэнфордском университете, компания AMD обнародовала новую порцию сведений о готовящихся 14-нм процессорах с микроархитектурой Zen. Напомним, что чипмейкер планирует выпустить CPU Summit Ridge и APU Raven Ridge в следующем году, а пока ограничивается демонстрацией их инженерных семплов.

В состав одного ядра Zen включены четыре блока целочисленных операций (ALU) и два 128-битных FMAC (блок умножения — сложения). Объём 4-канального кеша инструкций равен 64 Кбайт, 8-канального кеша данных — 32 Кбайт. Кеш-память второго уровня с 8-канальным доступом имеет объём 512 Кбайт, а разделяемый кеш третьего уровня выполнен в виде блоков по 1 Мбайт.

AMD постоянно напоминает, что процессоры Zen могут выполнять на 40 % больше инструкций («работы») за один такт по сравнению с чипами Excavator. На нижеприведённом графике также изображена нисходящая кривая «энергопотребление/такт».

Zen поддерживает многопоточную обработку данных (Simultaneous Multi-Threading), содержит улучшенный предсказатель переходов, более «вместительные» блоки кеша операций и очередей. Кеш-память первого уровня имеет функцию обратной записи; пропускная способность различных уровней кеша выросла на величину от двух до пяти раз.

14-нм процессоры AMD получили восемь новых инструкций, включая эксклюзивные (не применяющиеся Intel) инструкции CLZERO и PTE Coalescing. Первая очищает содержимое кеш-памяти, а вторая объединяет 4-Кбайт таблицы страниц в 32-Кбайт страницы.

Одна из наиболее интересных особенностей Zen — «нарезанный» блоками по 2 Мбайт (2× 1 Мбайт) разделяемый кеш третьего уровня. Обращение любого из четырёх ядер модуля Zen к любому блоку кеша L3 занимает примерно одно и то же время. На один четырёхъядерный модуль (CPU Complex, CCX) приходится 8 Мбайт кеш-памяти третьего уровня. Вероятно, недорогие 4–8-ядерные процессоры Summit Ridge будут обладать неполным объёмом кеша L3 — 8 Мбайт и/или 12 Мбайт из максимально возможных 16 Мбайт.

Большинство операционных блоков ядер Zen эффективно используются как в однопоточном, так и в двухпоточном (SMT) режиме. Исключение составляют очереди микроопераций (micro-op), ухода (retire) и хранения (store).

В 2017 году мы станем свидетелями анонсов самых разных процессоров Zen — от встраиваемых до серверных, от 2- до 32-ядерных, от 4-ваттных до, как минимум, 95-ваттных.

Архитектура AMD Zen

AMD поведала подробности о процессорах семейства Summit Ridge

На мероприятии в г. Сан-Франциско, посвящённом старшим 14-нм процессорам на базе микроархитектуры Zen, компания AMD продемонстрировала потенциал 8-ядерного CPU Summit Ridge, а также показала двухсокетную плату с двумя 32-ядерными процессорами Naples. Модели Summit Ridge для новой платформы AM4 придут на смену чипам Piledriver AM3+, старшим из которых является FX-9590 с boost-частотой 5 ГГц. Кроме поддержки оперативной памяти DDR4, настольные платы Socket AM4 будут оборудоваться разъёмами PCI Express 3.0, USB 3.1 (10 Гбит/с), SATA Express и поддерживать накопители с протоколом NVMe.

AMD Zen

Рост производительности Zen относительно процессоров поколения 32-нм/28-нм обеспечит оптимизация предсказателя переходов, кеш микроопераций и почти двукратное расширение окна планировщика инструкций.

По сравнению с моделями Bulldozer и их производными у Summit Ridge вдвое вырос объём кеша данных первого уровня (с 16 до 32 Кбайт), но уменьшился объём кеш-памяти второго уровня (с 2 Мбайт на модуль из двух ядер до 512 Кбайт на ядро).

AMD Zen

Предварительно, объём разделяемого кеша третьего уровня остался прежним (8 Мбайт), хотя, в частности, AnandTech утверждает, что у 8-ядерных Summit Ridge он равен 16 Мбайт — по 8 Мбайт на каждый из двух 4-ядерных модулей Zen.

Снимок кристалла Summit Ridge и попытка его толкования

Снимок кристалла Summit Ridge и попытка его толкования

Переход с 32-нм/28-нм на 14-нм FinFET-техпроцесс теоретически сулит большой прирост частоты экономичных процессоров и не столь значительное повышение частоты топовых CPU. Тем не менее изменения архитектуры столь значительные, что обозначить частотный предел настольных 8-ядерных Zen пока не представляется возможным.

AMD Zen

Ядра Zen могут обрабатывать данные в два потока благодаря технологии Simultaneous Multi-Threading (SMT), которая является аналогом Intel Hyper-Threading (впервые распределение операций с данными между виртуальными потоками было описано в 1950-х).

AMD Zen

Дабы впечатлить публику, представители AMD запустили рендеринг сцены в программе Blender 3D одновременно на инженерном семпле CPU Summit Ridge с частотой 3 ГГц и на Intel Core i7-6900K (Broadwell-E). Победителем очного противостояния с перевесом около 0,5 с стал чип семейства AMD Zen.

AMD Zen

Серийное производство процессоров Summit Ridge начнётся в 2017 году.

В качестве десерта приведём фото серверной материнской платы с 32-ядерными CPU Naples. Новые процессоры будут доступны для заказа начиная со второго квартала следующего года.

AMD Zen

Второе издание учебника по микроэлектронике снова «положило» сайт Imagination

На сайте Imagination Technologies стало доступно второе дополненное и исправленное издание популярного учебника Дэвида Харриса и Сары Харрис «Цифровая схемотехника и архитектура компьютера» на русском языке.

Ещё первый выпуск вызвал ажиотажный интерес и огромный трафик из России, что навело тогда администраторов сайта на мысль о хакерской атаке. Несмотря на принятые предварительные меры, и теперь не обошлось без остановки работы сайта на несколько часов.

Учебник был переведён на русский язык группой энтузиастов из России, Украины и русских специалистов из калифорнийских компаний Imagination Technologies, AMD, Apple, NVIDIA, Synopsys и других. Он был высоко оценён преподавателями МФТИ, МВТУ им. Баумана, харьковского ХНУРЭ и других университетов.

Изложенная в доступной и понятной форме книга открывает перед несведущим, но любознательным читателем сложный мир микроэлектроники и даёт минимальный набор знаний, позволяющий написать и реализовать работающий конвейерный процессор на базе FPGA.

Скачать книгу не так легко: вначале нужно вступить в сообщество Imagination, а затем принять участие в университетской программе — впрочем, обе регистрации теперь проходят на общей странице.