Теги → гетерогенные вычисления
Быстрый переход

Замечен инженерный образец AMD Raven Ridge

С успешным запуском в массовую продажу новых процессоров AMD Ryzen, они же Summit Ridge, все как-то позабыли о другом проекте AMD на базе той же архитектуры Zen — гетерогенных процессорах (APU) Raven Ridge. Маркетингового имени они пока не имеют, но это не значит, что проект заброшен. Компания активно работает над этими чипами, и недавно в базе данных SiSoftware был замечен вполне функциональный прототип APU AMD нового поколения. Платформа для него, как мы уже знаем, готова — все новые процессоры AMD, за исключением серверных, используют разъём AM4, а на соответствующих системных платах разведены видеовыходы и установлены нужные компоненты. Прототип имеет неплохие характеристики: четыре ядра Zen с поддержкой SMT работают на частоте 3,0 ГГц с возможностью ускорения до 3,3 ГГц в турборежиме.

Скорее всего, продажная версия будет иметь более высокие частоты, но и 3 ГГц на данный момент выглядят неплохо, учитывая, что времени до анонса Raven Ridge ещё остаётся порядочно. Вторым компонентом APU, не менее главным, чем процессорная часть, является графическое ядро. Оно у прототипа базируется на архитектуре Vega — AMD всё-таки решила перешагнуть через поколение при разработке гетерогенных процессоров. Неизвестно, финальные ли это характеристики, но та модель, которая была замечена энтузиастами, имеет 704 потоковых процессора (11 модулей) — с учётом преимуществ архитектуры Vega вполне неплохо. Речь не идёт о простой адаптации архитектуры Vega 10 — для APU у AMD разработано специальное графическое ядро под кодовым названием 15DD.  Судя по всему, промежуточной памяти HBM2 на борту чипа нет, хотя в случае с APU, которые довольствуются общей для процессорной и графической частей памятью, её наличие было бы отнюдь не лишним. Тем более, мы знаем, что у Zen в своей первой инкарнации не очень быстрый контроллер DDR4, имеющий всего два канала.

Новая схема наименования процессоров AMD

Новая схема наименования процессоров AMD

Тактовая частота графического ядра достаточно высока и составляет 800 МГц. Судя по предварительным результатам, оно достаточно быстрое; во всяком случае, тесты SiSoft выдают оптимистичные 572 Мп/с. Объём кешей у новинки составляет 2 Мбайт для L2 и 4 Мбайт для L3. Чип уже имеет собственное кодовое имя — Mandolin River, полный код его выглядит следующим образом: 2M3001C3T4MF2_33/30_N. Согласно схеме, применяемой AMD для маркировки своих чипов, 2 означает статус прототипа ES1 (что близко к статусу квалификационного образца), M, скорее всего, свидетельствует о мобильном предназначении, 1 означает ревизию, а C3 — энергетические характеристики. Скорее всего, теплопакет у обсуждаемого чипа лежит ниже отметки 65 ватт. Символ Т означает объём кеша L3, цифра 4 — количество процессорных ядер, а символ М — упаковку типа AM4. За сочетанием F2, которое указывает на степпинг, следует частотная формула. Характеристики образца Raven Ridge вполне укладываются в рамки ранее опубликованных планов AMD. Напомним, что поставки новых APU ожидаются лишь в следующем году.

Новая серия APU AMD получит имена хищных птиц

Компания AMD в последнее время активно меняет названия серий графических и центральных процессоров. В секторе дискретной графики вместо географических имён теперь используются астрономические, а недавно стало известно, что все грядущие гетерогенные процессоры (APU), запланированные на период между 2017 и 2019 годами, получат имена различных хищных птиц. Любопытно также, что начинаются планы с 14-нм чипов и кончаются 7-нм процессорами; как видите, места для 10-нм техпроцесса действительно не оставлено. Выглядят планы на 2017‒2019 годы следующим образом:

Как видите, все новые APU базируются на архитектуре Zen, лишь самый отдалённый от текущего момента 7-нм чип Gray Hawk (сизый канюк, buteo plagiatus) будет использовать усовершенствованную версию под названием Zen+. Производством Gray Hawk займется Global Foundries или TSMC; пятилетний контракт с первой компанией уже подписан и вступил в действие. В этой же графе таблицы упомянут разъём AM4+, чем он будет отличаться от обычного 1331-контактного AM4 — пока не известно. Gray Hawk (воробьиный сыч) станет наследником Horned Owl, 14-нм APU на базе Zen, который появится во второй половине следующего года и будет выпускаться как в конструктиве AM4 (PGA 1331), так и в конструктиве FP5 BGA, предусматривающим припаивание чипа к системной плате.

Вероятная блок-схема AMD Snowy Owl

Вероятная блок-схема AMD Snowy Owl

Его ближайший родственник, Banded Kestrel (мадагаскарская полосатая пустельга), явно будет предназначаться для установки в ноутбуки и компактные системные платы для мини-ПК, поскольку предусматривает лишь один форм-фактор, FP5 BGA. Наконец, самой ранней пташкой станет чип Snowy Owl (полярная сова): этот гетерогенный процессор запланирован уже на первое полугодие 2017 года, но предназначен он будет для серверных систем. Вероятнее всего, это будет APU с наибольшим количеством вычислительных и графических ядер и, скорее всего, именно об этом проекте AMD мы писали, когда упоминали 16-ядерный Zen с графикой нового поколения.

Новые AMD APU будут сочетать архитектуры Zen и Polaris

О том, что новая процессорная архитектура Zen будет применяться AMD во всех новых продуктах — от процессоров для ноутбуков и APU до многоядерных серверных решений  уже — известно всем. Постепенно раскрываются некоторые технические подробности, на этот раз о гетерогенных процессорах, так называемых APU. Как сообщают зарубежные источники, новое поколение гетрогенных процессоров AMD увидит свет в 2017 году и будет сочетать в себе архитектуры Zen и Polaris 11.

До этого технические характеристики новых APU были известны далеко не столь подробно. Теперь же мы знаем, что новые чипы получат поддержку памяти DDR4 с частотами до 3200 МГц и будут содержать в своём составе 11 графико-вычислительных кластеров, что в соответствии с особенностями Polaris 11 даёт нам 704 потоковых процессора GCN 4.0. Это действительно серьёзный шаг вперёд, ведь до этого APU AMD располагали не более чем 512 потоковыми процессорами с более старой архитектурой.

Использование Polaris 11 в сочетании с быстрой памятью (а возможно, и с некоторым интегрированным на подложку объёмом HBM) должно дать новому поколению гетерогенных процессоров AMD буквально новое дыхание там, где идёт речь о производительности в 3D-приложениях и играх. В сочетании с четырьмя процессорными ядрами, поддерживающими SMT и умеющими выполнять 8 потоков, это должно дать отличное недорогое решение для компактных систем с графической производительностью выше, чем у того же Xbox One. Теплопакет новых APU не превысит 65 ватт.

Доступен новый бюджетный APU AMD A4 Pro-3350B

Компания Advanced Micro Devices выпустила новый бюджетный гетерогенный чип A4-3350B ещё в мае этого года, но доступен он стал только сейчас. Чип базируется на дизайне Carrizo-L годичной давности и производится с использованием 28-нанометрового техпроцесса. Как и прочие Carrizo-L, A4-3350B имеет два модуля (четыре ядра x86), 2 Мбайт кеша второго уровня и интегрированную графику класса Radeon.

Carrizo-L

Carrizo-L

В этой модели она называется Radeon R4 и имеет 128 потоковых процессоров. Чип обладает более высокой производительностью, нежели его предшественник в лице A4-7210, за счёт повышенных тактовых частот. Так, процессорные ядра данного APU функционируют на частоте 2 ГГц и за счет технологии Turbo Core могут разгоняться до 2,4 ГГц. Оба значения на 200 МГц выше показателей A4-7210. Частота интегрированной графики меняется динамически, в максимуме достигая 800 МГц.

Dell Vostro 15 3000

Dell Vostro 15 3000

Процессор поддерживает инструкции AVX, SSE4a, SSE4.2, AES, а также все остальные современные наборы инструкций. Имеется поддержка внешнего интерфейса PCIe 2.0 (x4). А вот встроенный контроллер памяти имеет всего один канал и поддерживает память DDR3-1600, что может сдерживать производительность процессора. Несмотря на повышенные частоты, теплопакет у A4 Pro-3350B остался прежним и составляет 15 ватт. Чип производится в упаковке BGA и пока замечен лишь в серии ноутбуков Dell Vostro 15 3000.

Новая информация о гетерогенной платформе AMD Bristol Ridge

Компания Advanced Micro Devices наводит последние штрихи на новую унифицированную платформу, использующую разъём AM4. В новом форм-факторе будут выпускаться не только мощные процессоры без интегрированной графики Summit Ridge, но и гетерогенные чипы класса APU под кодовым названием Bristol Ridge. Официальный дебют новой платформы должен состояться на Computex Taipei 2016. Пока информации о новых гетерогенных процессорах AMD не так много, но кое-что потихоньку просачивается во всемирную сеть.

Так, ресурс Geekbench опубликовал некоторые данные о производительности и характеристиках Bristol Ridge. Кое-что известно даже о платформе Gardenia, в нижеприведённой таблице она идёт первым столбцом. Она используется компанией для тестирования встраиваемых систем на совместимость с экосистемой Android. Новая же эталонная системная плата с разъёмом AM4 носит название Myrtle. На этот раз компания решила брать имена из ботаники, но некоторые поклонники творчества Джоан Роулинг также могут порадоваться, ведь Плакса Миртл — один из важных персонажей саги о Гарри Поттере.

Существует вероятность того, что платы для Bristol Ridge хотя и будут использовать унифицированный разъём AM4, но получат поддержку стремительно устаревающей памяти DDR3 вместо нового стандарта DDR4, хотя возможность перехода на DDR4 и не исключается полностью. Идентификационные коды новых процессоров выглядят как «AuthenticAMD Family 21 Model 101 Stepping 1», а значит все они используют ядра Carrizo, а не Zen, поскольку идентификатор Carrizo также выдает «Family 21 Model 96 Stepping 1». Или это обновление существующей серии APU, или же новые модели Carrizo с поддержкой DDR4. Объёмы кешей те же, так что изменений в новых чипах явно не слишком много.

Самое любопытное в новинках — низкие частоты, что нехарактерно для решений AMD. C момента анонса архитектуры Bulldozer тактовые частоты чипов AMD рвались вверх и достигли 5 ГГц, а здесь мы видим 2 ГГц в лучшем случае, да и то у двухъядерной модели. Существует и пятый процессор, также замеченный Geekbench, который наделён чем-то похожим на аналог технологии Intel Hyper-Threading. По всей видимости, это всё-таки не Zen, поскольку Windows теперь видит модули Bulldozer как два физических ядра, а не как одно, что ранее вызвало волну протестов среди владельцев процессоров AMD. Сомнений нет, поскольку Zen предполагает использование 512 Кбайт кеша на ядро, что в четырёхъядерной конфигурации выглядит как 4 × 512 Кбайт, а не 1 Мбайт на каждые два модуля; к тому же новая архитектура подразумевает использование кеша третьего уровня.

Что касается производительности, то «неизвестные процессоры AMD» на плате Myrtle показывают очень неплохой в своём классе результат, в однопоточном тесте уступая Intel Core i5-6200U, но в многопоточном существенно его опережая. Таблица производительности, опубликованная зарубежными коллегами, даёт неплохое представление о том, каких платформ следует избегать, если вы желаете получить максимальную производительность при минимальной стоимости. Среди мобильных решений, доступных сегодня, лучшим выбором на базе AMD по-прежнему является FX-9800P. Первого июня 2016 года мы узнаем о новинках AMD больше — на Computex AMD представит не только новую дискретную графику Polaris, но и подробно расскажет о решениях Summit Ridge и Bristol Ridge.

Новые сведения о мобильных процессорах AMD Bristol Ridge

Как известно, Advanced Micro Devices намерена в этом году запустить два семейства центральных процессоров — для настольных и мобильных систем соответственно. Именно в настольном сегменте впервые дебютирует архитектура Zen, на которую AMD возлагает так много надежд. Эти процессоры для игроков и энтузиастов наделены кодовым именем Summit Ridge. Но компания также намеревается представить полный спектр процессоров Bristol Ridge, причём не только для ноутбуков. Но пока речь пойдёт исключительно о мобильной платформе.

Похоже, произошла существенная утечка информации: ресурс Citavia Blog привёл полный список моделей Bristol Ridge для платформы FP4, как гетерогенных APU, так и вариантов FX, лишенных интегрированной графики. Пока удалось насчитать 13 моделей в двух классах —  общем (mainstream) и бизнес-классе; в последнем случае название чипа традиционно начинается с «AMD Pro». Итак, в массовом сегменте будут выпущены следующие модели Bristol Ridge:

  • AMD FX-9830P;
  • AMD FX-9800P;
  • AMD A12-9730P;
  • AMD A12-9700P;
  • AMD A10-9630P;
  • AMD A10-9600P.

Всего шесть моделей, две из них относятся к обычным процессорам без интегрированного графического ядра. Бизнес-сектор получит на одну модель больше, причём все процессоры класса Pro будут иметь активную графику GCN:

  • AMD Pro A12-9800B;
  • AMD Pro A12-9830B;
  • AMD Pro A10-9730B;
  • AMD Pro A10-9700B;
  • AMD Pro A8-9630B;
  • AMD Pro A8-9600B;
  • AMD Pro A6-9500B.

Неприятным фактом является то, что даже пристальный взгляд на Carrizo и Bristol Ridge не выявляет существенных отличий между этими семействами APU. В обоих случаях используется третье поколение графики GCN (1.2 в привычных нам цифрах), которое также реализовано в Fiji и Tonga, так что о новых, «звёздных» версиях GCN речи, увы, нет. Оба семейства поддерживают DirectX 12, имеют встроенный аудиопроцессор, видеоблок UVD последнего поколения и могут выводить изображение одновременно на три монитора. Максимальное количество процессорных ядер Excavator не превысит четырёх, они получат 2 Мбайт кеша L2, поддержку гетерогенных вычислений HSA 1.0 и стандарта памяти DDR4. Обещается увеличение количества исполняемых за такт инструкций в сравнении с предыдущими поколениями чипов AMD.

Платформа FP4 предназначена исключительно для мобильных решений, и ожидается, что тактовые частоты новых APU будут варьироваться в пределах 3,0‒3,7 ГГц, а теплопакет составит от 15 до 35 ватт. Для ещё более экономичных устройств будут выпущены процессоры Stoney Ridge. Как обычно, в зависимости от модели, APU получат 8, 6 или 4 активных графических модуля GCN, работающих на частотах от 600 до 900 МГц. Спецификации новых чипов Bristol Ridge уже известны:

Как видно из сводной таблицы, ничего особенного нам не припасли, за исключением двух моментов: существенно возрос частотный потенциал в сравнении с APU предыдущего поколения, но при этом теплопакеты новых чипов остались в тех же рамках, несмотря на аналогичный, 28-нанометровый техпроцесс. Вероятно, на Bristol Ridge AMD отрабатывает новые механизмы повышения энергоэффективности, которые затем будут применены в процессорах на базе архитектуры Zen. 15 % прироста по сравнению с Carrizo на том же техпроцессе можно считать весьма неплохим достижением, считают зарубежные обозреватели.

AMD выпустила обновлённые ЦП Godavari и Carrizo, снизила цены на семейство FX

До выхода платформы AMD AM4 остаётся ещё достаточно много времени, поэтому пока компании приходится работать с тем, что есть, а именно с платформами FM2+ и AM3+. Последние анонсы включают в себя целый ряд новых процессоров с разъёмом FM2+ и снижение цен на чипы FX с разъёмом AM3+. Стоит упомянуть и появление ряда новых системных плат, обновлённых согласно требованиям сегодняшнего дня и получивших поддержку современных интерфейсов USB 3.1 и M.2. Обновление платформы FM2+ включает в себя три процессора: A10-7860K, A6-7470K и Athlon X4 845.

Как нетрудно догадаться, первые два чипа представляют собой гетерогенные процессоры или, в терминологии AMD — APU, а Athlon X4 845 отличается от них деактивированным графическим ядром Radeon. Гетерогенные процессоры базируются на 28-нм техпроцессе и микроархитектуре Steamroller, в то время, как в основе Athlon — архитектура Excavator. Вскоре должен быть выпущен также флагманский APU AMD A10-7890K. Это будет последний процессор перед тем, как на смену текущей серии APU придёт серия Bristol Ridge.

Этот ЦП получит четыре ядра с частотами 4,1/4,3 ГГц и графическое ядро Radeon R7 с архитектурой Sea Islands и 512 ядрами GCN, работающими на частоте 900 МГц. Объём кеша второго уровня составит 4 Мбайт, теплопакет не превысит 95 ватт, а контроллер памяти будет поддерживать DDR3 с частотой до 2133 МГц. Стоимость новинки составит всего $140 — столько же стоит текущий флагман семейства, чип AMD A10-7870K. A10-7680K также является четырёхъядерным процессором с частотами 3,6/4,0 ГГц и 384 ядрами GCN Radeon R7. Их частота в данном случае составит 757 МГц, но теплопакет останется прежним, на уровне 95 ватт.

A6-7470K получит лишь два ядра x86 с частотами 3,7/4,0 ГГц, объём кеша будет снижен до 2 Мбайт, графическое ядро Radeon R5 получит лишь 256 ядер GCN с частотой 800 МГц. Но TDP этой модели ощутимо ниже, всего 65 ватт. В комплект поставки войдёт новый тихий кулер AMD. Стоимость новых APU составит $106 и $86, соответственно. Цены в остальном семействе будут скорректированы: так, цена A10-7860K составит $118, а A8-7650K — $96. 

Отдельный интерес представляет Athlon X4 845 с архитектурой Excavator. Его ядра работают на частоте 3,5/3,8 ГГц, объём кеша L2 составляет 2 Мбайт, а теплопакет укладывается в значение 65 ватт. Но предназначен он для разгона, поэтому в комплект поставки войдёт кулер повышенной мощности, рассчитанный на 95 ватт. Встроенной графики чип не имеет, но позволяет использовать внешнюю графическую карту с интерфейсом PCI Express 3.0 x8. Стоимость данного решения составляет $70.

Отметим ещё раз, что с новыми APU и Athlon будут поставляться и новые кулеры, рассчитанные на отвод 95 и 65 ватт тепла, соответственно. Компания заявляет, что их акустические характеристики сопоставимы с теми, что демонстрирует новейший Wraith, которым комплектуются самые мощные и горячие процессоры AMD. Старшая модель заметно сложнее младшей и использует медное основание с тепловыми трубками, в то время, как младшая довольствуется обычным алюминиевым радиатором с алюминиевым же основанием. Что касается снижение цен на модели FX, то в настоящее время семейство процессоров AMD выглядит следующим образом:

  • AMD FX-8370 Wraith:     $200
  • AMD FX-8370:                  $190
  • AMD A10-7860K:              $118
  • AMD A8-7670K:                $106
  • AMD A8-7650K:                $96
  • AMD Athlon X4 870K:      $90
  • AMD Athlon X4 860K:      $80
  • AMD Athlon X4 845:        $70

Что касается системных плат, то партнёры AMD уже предлагают ряд решений с разъёмами AM3+ и FM2+, оснащёнными самыми современными технологиям, включая USB 3.1 и M.2 с интерфейсом PCIe x4. Сделано это с помощью контроллеров сторонних производителей, но так поступают и при создании плат для платформы Intel. Является ли хорошей стратегией выбор платформы AMD сейчас, когда в ближайшем будущем она выведет в свет новый процессорный разъём AM4 и соответствующую инфраструктуру, сказать трудно. Для тех, у кого уже есть один из процессоров AM3+ или FM2+ приобрести плату с поддержкой новых интерфейсов, включая NVMe, вероятно, может быть осмысленным шагом. Равно как и для тех, кто ищет недорогую, но достаточно производительную платформу для повседневной работы и игр.

Зато теперь ясно, чем объясняется замеченный нами «ренессанс» платформ AMD — уже целый ряд новостных заметок был посвящён платам с разъёмами AM3+ или FM2+. Словно мудрый полководец, Advanced Micro Devices пытается эффективно использовать все имеющиеся в её распоряжении ресурсы до подхода основной боевой силы. Мы надеемся, что эта сила, в лице архитектуры Zen не только не запоздает, но и окажется достаточно мощной в «военном» отношении, чтобы сражаться на равных с «синими» не только в сегменте бюджетных решений и вернуть AMD былую славу производителя мощных настольных процессоров. Станут ли таковыми Bristol Ridge и Summit Ridge, покажет лишь время.

Известны детали о новом APU AMD A10-8780P Extreme

Ресурс CPU World опубликовал любопытную информацию о новом гетерогенном процессоре AMD под названием A10-8780P Extreme. Он займет нишу между моделями A10-8700P и FX-8800P, появившимися на рынке ещё в июне. Новый APU имеет 2 модуля Excavator (4 ядра x86), которые могут работать на частоте до 3,3 ГГц, что на 100 МГц выше аналогичного показателя A10-8700P.

wccftech.com

wccftech.com

Базовую частоту удалось найти в спецификациях нового ноутбука HP Pavilion 15-ab103nt, согласно им, этот показатель равен 2 ГГц. Объём кеша L2 не изменился и по-прежнему составляет по мегабайту на модуль, в сумме 2 Мбайт. Графическое ядро содержит 8 модулей GCN, что эквивалентно 512 шейдерным процессорам. Как и все Carrizo, чип производится с использованием 28-нм техпроцесса GlobalFoundries.

Графическое ядро занимает более трети кристалла Carrizo

Графическое ядро занимает более трети кристалла Carrizo

Любопытно, что графическая часть носит название Radeon R8 — у A10-8700P она указана под именем Radeon R6, а у FX-8800P называется Radeon R7, хотя у последнего количество модулей GCN такое же, как и у обсуждаемой новинки. Это косвенно указывает, что производительность графической части A10-8780P Extreme может быть выше, скорее всего, из-за более высоких тактовых частот. Теплопакет нового APU лежит в рамках 15 ватт и не имеет возможности конфигурации.

AMD работает над совместимостью с NVIDIA CUDA

Закрытые стандарты в перспективе проигрывают открытым. Ситуация может быть иной только в том случае, если создатель стандарта является фактическим монополистом на рынке. К числу закрытых стандартов относится и технология вычислений на GPU NVIDIA CUDA, появившаяся на рынке в 2007 году с анонсом первого в мире унифицированного графического процессора G80. Открытый стандарт OpenCL появился позже, лишь в 2009 году, поэтому CUDA успела завоевать определённую популярность в нише GPGPU и суперкомпьютеров. Но, похоже, что эксклюзивности CUDA приходит конец, как и монополии NVIDIA на эту технологию.

Как известно, Advanced Micro Devices является рьяным приверженцем OpenCL и тратит немало сил на продвижение этого стандарта, в том числе, и в рамках инициативы гетерогенных вычислений — технология HSA применяется в процессорах AMD класса APU. Недавно компания представила новый компилятор HCC (Heterogeneous Compute Compiler), а затем реализовала для него слой совместимости (compatibility layer) с NVIDIA CUDA. Соответствующий анонс был опубликован 16 ноября. Как сообщают разработчики AMD, новая функция HIP (Heterogeneous Compute Interface for Portability) в ряде случаев позволяет автоматически конвертировать до 90 % кода, написанного в рамках CUDA в стандартную модель C++.

Это не означает немедленной и прямой конверсии кода CUDA в OpenCL, либо прямого запуска CUDA-программ на графических чипах AMD, поскольку компания все еще не имеет необходимых лицензий NVIDIA, хотя последняя и открыла лицензирование в 2013 году. Но технология HIP позволяет программисту GPGPU работать в рамках удобной ему парадигмы, а последующая конверсия в стандарт C++ позволит другим программистам оптимизировать код с учётом нужд заказчика, к примеру, планирующего запуск суперкомпьютера на основе ускорителей AMD FirePro с поддержкой OpenCL. Новая инициатива AMD позволит укрепить позиции компании на рынке супервычислений (HPC), который сам по себе довольно консервативен и склонен к использованию CUDA, стандарта, появившегося первым и хорошо освоенного за прошедшее время.

Замечены процессоры AMD Bristol Ridge FX-9830P и Stoney Ridge

Как известно, схема наименования процессоров AMD предполагает использование префикса FX, главным образом, для настольных моделей без графического ядра, построенных на базе архитектур Bulldozer, Piledriver или Vishera. Есть исключение для Carrizo, где применяется схема наименований вида FX-8000P. На официальном веб-сайте группы разработчиков стандарта USB был замечен новый гибридный чип AMD FX-9830P. При этом указано, что относится он к семейству Bristol Ridge, имеет конструктив FP4 и являет собой полноценную «систему на чипе» (system-on-chip, SOC). Как известно, процессоры Bristol Ridge должны будут заменить собой аналогичные чипы Carrizo в 2016 году.

Из этого можно сделать вывод, что решения серии Bristol Ridge будут использовать схему наименований FX-9000P. Вышеупомянутый чип относится к категории «разработка USB 3.1 Gen 1» и имеет ревизию A1. Помимо этого, данных о нём нет. Но нам они, к счастью, известны — семейство Bristol Ridge должно получить два двухъядерных модуля Excavator, каждый из которых располагает своим кешем второго уровня объёмом 1 Мбайт (четыре ядра x86 и 2 Мбайт L2 суммарно).

Новые APU AMD будут высокоинтегрированными решениями

Новые APU AMD будут высокоинтегрированными решениями

Графическая часть будет представлена ядром Radeon с 512 процессорами GCN и поддержкой стандарта гетерогенных вычислений HSA 1.0. Двухканальный контроллер памяти будет обладать поддержкой DDR4. Также известно, что внутренние подсистемы питания Bristol Ridge будут оптимизированы для достижения ещё большей эффективности в плане энергопотребления. Ранее предполагалась совместимость с разъёмом FM2+, но в рамках унификации все новые решения AMD будут переведены на новый разъём AM4. Чипы в упаковке BGA получат форм-фактор FP4.

Ещё один любопытный чип заметили сотрудники популярного ресурса WCCFTech. Речь идёт о процессоре AMD Stoney Ridge — младшем собрате Bristol Ridge. О его характеристиках мы также сообщали в одной из предыдущих новостных заметок. На этот раз он был обнаружен в базе данных SiSoft Sandra. Этот APU имеет лишь один вычислительный модуль с 1 Мбайт кеша L2, эквивалентный двум ядрам x86 и, если верить источнику, работает на частоте 2,7 ГГц, демонстрируя при этом уровень энергопотребления в районе 35 ватт. Похоже, предположение о том, что AMD будет обкатывать 14-нанометровый техпроцесс на сравнительно простом дизайне Stoney Ridge, не подтвердилось. Тем не менее, судя по всем признакам, проблем у AMD с наследниками Carrizo и Carrizo-L нет и, по сути, новые гетерогенные решения готовы к началу массового производства.

Анонсирована первая платформа AMD с поддержкой DDR4

О том, что Advanced Micro Devices собирается провести унификацию своих вычислительных платформ, было известно уже давно. Ещё летом 2015 года были опубликованы планы компании по внедрению нового, единого форм-фактора AM4 (FP4 для исполнения BGA), главной особенностью которого должна была стать поддержка памяти DDR4. Можно сказать, что процесс начался — AMD анонсировала линейку высокоинтегрированных чипов под общим кодовым названием Merlin Falcon. Это первые процессоры AMD, поддерживающие DDR4. Они предназначены для рынка встраиваемых приложений, где на первое место традиционно ставятся такие параметры, как экономичность, компактность и низкий уровень тепловыделения.

Необходимо отметить, что речь пока идёт исключительно о решениях в корпусах типа BGA, то есть не предусматривающих возможность замены процессора. По сути, Merlin Falcon представляет собой адаптацию Carrizo к требованиям рынка встраиваемых решений. Пять новых чипов, RX-421BD, RX-418GD, RX-216GD, RX-421ND и RX-216TD, образуют новую линейку AMD APU — R-Series. В зависимости от модели, в их состав может входить один или два модуля Excavator, приблизительно соответствующие двум или четырём классическим ядрам х86, а также интегрированная графика Radeon R5 или R7, причём реализована последняя версия архитектуры GCN 1.2, та же, что в графических процессорах Tonga и Fiji. Объём процессорного кеша L2 составляет 1 Мбайт на двухъядерный модуль.

Отдельно следует отметить интеграцию южного моста в основной кристалл. В результате, кристалл, разумеется, стал больше — 29 × 37 миллиметров, против 29 × 32 миллиметра у AMD Bald Eagle, но теперь ему не нужен дополнительный чип Bolton (24,5 × 24,5 миллиметра). Блок южного моста (PCH) включает в себя поддержку SATA 3.0, SD Card, SPI, от 4 до 8 портов USB 2.0, 4 порта USB 3.0. Основной блок Merlin Falcon имеет до трёх дисплейных выходов и располагает контроллером PCI Express 3.0 x8 или x4, в зависимости от конфигурации. Дисплейные интерфейсы могут быть реализованы в виде DisplayPort 1.2, HDMI 2.0 или eDP 1.4.

Как уже было сказано, изначально AMD анонсировала пять моделей Merlin Falcon. Линейка автоматически разделилась на две категории: APU и чипы без интегрированной графики. Количество исполнительных блоков GCN варьируется от 8 (512 ядер) у RX-421BD до 4 (256 ядер) у RX-216GD, тактовая частота графической части у всех чипов одинакова — 800 МГц. Что касается контроллера памяти, то он ориентирован на использование DDR4 с частотой 1600 или 2400 МГц (зависит от модели), но сохранена и поддержка DDR3 с частотой до 2133 МГц. По данным AMD, новые высокоинтегрированные APU могут опережать предыдущее поколение на 25 %.

Теплопакеты у AMD Merlin Falcon конфигурируемые, минимальное значение составляет 12 ватт, а максимальное составляет 15 ватт для двухъядерных моделей и 35 ватт для четырёхъядерных. Новые чипы имеют диапазон допустимых температур от 0 до 90 градусов Цельсия, в 2016 году будет выпущена версия iTemp Range, которая сможет работать при температурах от -40 до 105 градусов. Анонс AMD Merlin Falcon знаменует собой начало перехода компании к использованию более прогрессивного в сравнении с DDR3 типа памяти DDR4. В будущем этот процесс затронет и «бытовую» платформу AM4.

Новые процессоры AMD Opteron получат ядра Zeppelin и шину GMI

Стало известно новое имя серверных процессоров AMD Opteron следующего поколения, а точнее, их x86-совместимой части — Zeppelin. Сами процессоры будут представлять собой многочиповые модули (MCM). Другими кристаллами на модуле станут дискретная графика Greenland и многослойная память HBM2. По всей видимости, они будут соединяться посредством специальной подложки (interposer), похожей на ту, что используется в графическом процессоре Fiji.

Всё это, за исключением имени, было уже известно ранее, но есть и новые данные, выраженные в цифрах. Так, пропускная способность интерфейса, ведущего к памяти HBM, составит около 500 Гбайт/с, а аналогичный показатель одного из четырёх соединений GMI (Global Memory Interconnect) — 100 Гбайт/с при латентности существенно меньшей, нежели 500 наносекунд, свойственных традиционной шине PCI Express. Под термином GMI, вероятно, скрывается шина Coherent Data Fabric, о которой мы сообщали ранее, но не исключено, что речь идёт о чём-то новом. Эта шина свяжет Zeppelin с Greenland, так что узких мест в сборке не останется, тем более, что совокупная пропускная способность внешнего интерфейса памяти DDR4 также составит 100 Гбайт/с.

Производительность ядра Greenland, по традиции называемого графическим, составит более 4 терафлопс, но, к сожалению, неизвестно, идёт ли речь о вычислениях с одинарной или двойной точностью. В последнем случае производительность Greenland не будет иметь аналогов. Напомним также, что каждое из x86-совместимых ядер Zen получит 512 Кбайт кеша второго уровня, а на каждые четыре таких ядра придётся 8 Мбайт разделяемого кеша третьего уровня. В случае 32-ядерного варианта EHP (Exascale Heterogeneous Processor) x86-совместимая часть процессора сможет выполнять 64 потока благодаря поддержке SMT.

AMD подтверждает намерение выпустить 32-ядерный APU на базе Zen

Слухи о том, что Advanced Micro Devices работает над созданием многоядерного гетерогенного процессора, сочетающего в себе архитектуры Zen и Greenland, а также память HBM, ходят давно. А теперь компания официально признала, что такой чип в планах есть и называется он EHP (Exascale Heterogeneous Processor). Данное решение получит 32 процессорных ядра Zen и до 32 гигабайт многослойной памяти HBM. Как и в случае с графическим процессором Fiji, EHP будет использовать специальную соединительную подложку (2.5D interposer).

К сожалению, опубликованная AMD диаграмма не раскрывает многих подробностей будущего 32-ядерного монстра. Она позволяет лишь оценить количество процессорных ядер и сборок HBM, но не количество поточных процессоров Greenland. Ранее предполагалось, что ядер x86 будет всего 16. Количество кристаллов HBM на сборку, если верить диаграмме, равно четырём. С учётом того, что это будет явно HBM2, ёмкость кристалла составляет 8 Гбит, а в сборке 4-Hi общая ёмкость составит 4 Гбайт. Таким образом, 8 сборок 4-Hi HBM2 действительно дают объём 32 Гбайт, что весьма впечатляет. Многие пользователи довольствуются меньшим объёмом DDR, а ведь AMD EHP получит поддержку ещё и внешней памяти DDR4, поскольку будет наделён восьмиканальным контроллером. Максимальная ёмкость — 256 Гбайт на канал. Что касается графической части, то, к примеру, ресурс WCCFTech полагает, что количество поточных процессоров в ней может превысить 3072.

На основе этого предположения выводится следующее: ввиду чудовищной сложности, графическая и процессорная части EHP будут производиться отдельно, а затем объединяться посредством соединительной подложки, на которую также будут устанавливаться и сборки HBM. Скорее всего, финальная сборка будет осуществляться на мощностях UMC, у которой уже есть соответствующий опыт — сборка графических процессоров Fiji. При этом процессорная часть EHP будет представлена двумя кристаллами, по 16 ядер Zen в каждом — так проще будет выпустить 16-ядерный вариант. Каждое процессорное ядро получит по 512 Кбайт кеша L2, а на каждые четыре ядра придётся 8 Мбайт кеша L3, что в сумме даёт 16 и 64 Мбайт соответственно. С учётом того, что каждое ядро Zen обладает возможностью исполнять два потока, общее число одновременно исполняемых потоков составит 64. Если проект увенчается успехом, то в распоряжении AMD появится монстр, способный успешно конкурировать с решениями GPGPU и новейшими моделями Intel Xeon Phi.

AMD полагает, что гетерогенные вычисления унифицируют рынок рабочих станций

Компания Advanced Micro Devices продолжает продвигать свою концепцию гетерогенных вычислений (HSA), суть которой заключается в совместном использовании всех вычислительных ресурсов системы: как центральных, так и графических процессоров. Последние, как мы знаем, уже давно опережают CPU в чистой скорости вычислений, так что резон в этом подходе есть, и очень серьезный, хотя, разумеется, всё зависит от поддержки со стороны разработчиков программного обеспечения.

На конференции Future of Computе, проведённой недавно AMD, компания однозначно выразила своё отношение: гомогенные системы могут остаться в прошлом, а гетерогенные — способны объединить разные типы рабочих станций в один. Смелое заявление, но основы для него у AMD есть уже сейчас, поскольку при грамотном использовании вычислительных ресурсов APU, эти скромные и недорогие процессоры способны на равных состязаться с лучшими классическими CPU, а то и оставлять их далеко позади. И уже существуют результаты тестов, подтверждающие данный тезис.

К примеру, обычный чип AMD Kaveri A10-7850K потребительского класса стоимостью $173 при грамотном использовании HSA в большинстве тестов оставляет позади Intel Core i5-4670K, стоимость которого заметно выше и составляет $242. И ведь ничто не мешает созданию специализированных APU с ещё более серьёзными возможностями по части гетерогенных вычислений. Сама по себе архитектура AMD Steamroller не слишком эффективна по нынешним меркам, и с Intel Haswell ей не тягаться, но ведь в распоряжении Kaveri имеется целых 512 поточных процессоров GCN, которые при должном использовании легко компенсируют все недостатки обычных процессорных ядер.

А теперь давайте представим себе новую процессорную архитектуру AMD, обещанную к 2016 году, совмещённую с новым поколением графики и дополненную быстрой многослойной памятью. Будучи воплощённым в профессиональный APU, этот комплект может не оставить классическим Xeon ни единого шанса. Хотя, разумеется, Intel тоже не собирается сидеть сложа руки и упускать лакомый кусок. Главный соперник AMD непременно будет вести работы в этом направлении, достаточно вспомнить его планы по поводу развития линейки сопроцессоров Xeon Phi.

Но вернёмся к рабочим станциям. По мнению Advanced Micro Devices, этот тип персональных компьютеров делится на три подкласса: «сборщик» (Acquire), «симулятор» (Simulations) и «рендерер» (Rendering). Первый тип предназначен для сбора и хранения больших массивов данных, включая несжатое видео в форматах 4К и даже 8К. Разумеется, отсюда проистекает главное требование к этому классу рабочих станций: как можно более быстрая подсистема хранения данных. Станции симуляции различных процессов обычно используют ускорители типа Tesla, и, наконец, назначение станций рендеринга понятно из самого их названия. Обычно в них устанавливаются ускорители Quadro или FirePro, если только финальный рендеринг не передаётся специализированной «ферме» (render farm).

AMD полагает, что широкое использование HSA позволит объединить эти три типа рабочих станций в один. Тут-то и кроется главный повод для критики: если второй и третий подклассы действительно можно объединить с помощью гетерогенных процессоров, то что делать с классом «сборщиков», которые всё равно придется комплектовать ёмкими и быстрыми (а также очень дорогими) системами хранения данных? А если сделать эту подсистему во всех классах одинаково производительной, то стоимость станций симуляции и рендеринга неоправданно вырастет. Таким образом, за гетерогенными вычислительными системами определённо есть будущее и очень большое, но было бы наивным полагать, что они окажутся волшебной панацеей от всех бед. Для того чтобы это сработало, необходима не только чистая вычислительная мощность, но и доступные высокопроизводительные накопители большой ёмкости. В роли второго революционера здесь обещает выступить Intel.

window-new
Soft
Hard
Тренды 🔥