Теги → xeon phi
Быстрый переход

Intel создаёт группу по разработке дискретных GPU и нанимает Раджу Кодури

В четверг вечером корпорация Intel объявила о создании Core and Visual Computing Group, подразделения по разработке дискретных графических процессоров для игровых ПК, а также ускорителей вычислений для суперкомпьютеров и различных перспективных приложений. Новую группу возглавит известный специалист Раджа Кодури (Raja Koduri), успевший поработать в ATI, Apple и AMD Radeon Technologies Group. Сам факт того, что в Intel решили вернуться к созданию дискретных графических процессоров в третий раз, говорит о том, что компания существенно меняет стратегию на нескольких рынках.

«Раджа является одним из самых опытных, новаторских и уважаемых визионеров в области графических и системных архитектур в индустрии и ещё одним примером того, как лучшие таланты присоединяются к Intel — сказал Мурти Рендучинтала (Murthy Renduchintala), президент группы Client and Internet of Things Business & Systems Architecture Group (CISA). «У нас есть захватывающие планы по активному расширению наших вычислительных и графических возможностей с использованием нашего всеобъемлющего портфеля интеллектуальной собственности. С Раджей во главе Core and Visual Computing Group мы добавим в наш портфель непревзойдённые возможности, продвинем нашу стратегию в области вычислений и графики и, впоследствии, станем движущей силой революции обработки данных».

Раджа Кодури

Раджа Кодури

Intel возвращается на рынок дискретных GPU

Принимая во внимание характер анонса, трудно ожидать, что Intel раскроет перспективный план по разработке графических и вычислительных технологий, который будет реализовываться под руководством господина Кодури. Тем не менее, пресс-релиз Intel раскрывает ряд деталей о характере будущих решений компании.

Ключевой задачей Раджи Кодури в Intel станет создание семейства высокопроизводительных дискретных графических решений для различных приложений. Данные решения будут базироваться на унификации различных архитектур и интеллектуальной собственности Intel, а конечные продукты будут использоваться для обработки графики, суперкомпьютерных вычислений, искусственного интеллекта и ряда других перспективных направлений.

Хотя задача господина Кодури кажется однозначной, её исполнение означает существенный сдвиг в стратегии Intel по целому ряду направлений, а потому есть смысл вспомнить подходы Intel к разработке GPU и суперкомпьютерным ускорителям.

Intel 740 и графические адаптеры стоимостью похода в кафе

Глядя на взрывной рост популярности графических ускорителей для игровых ПК в 1990-х годах прошлого века, в Intel осознали, что подобные микросхемы могут стать новым рынком сбыта, а потому корпорация должна выпустить собственный графический процессор. Поскольку у Intel не было собственной команды разработчиков графических адаптеров, то для работы над проектом Auburn компания решила объединить усилия с другими игроками рынка — Real3D (изначально подразделение General Electric, затем — Lockheed Martin) и Chips and Technologies.

Графическая карта на базе Intel 740. Фото Wikipedia.org

Графическая карта на базе Intel 740. Фото Wikipedia.org

Auburn появился на свет в начале 1998 года под именем Intel 740, а его главной особенностью стало использование инновационной по тем временам шины AGP. В теории AGP позволяла хранить текстуры в системной памяти, тем самым снижая требования к объёму оперативной памяти на графическом адаптере и его себестоимость. На практике хранить текстуры в системной памяти было невыгодно с точки зрения производительности, драйверы Intel 740 оказались очень несовершенны, а конкуренция со стороны традиционных разработчиков графических адаптеров столь серьёзной, что в Intel приняли решение прекратить продажи i740 осенью 1999 года. Чуть позже Intel попыталась выпустить ещё один дискретный графический процессор (Intel 752), но не смогла сделать его сколько-то массовым.

Неудачи i740 и i752 показали Intel, что компания не может выдержать конкуренции с ATI и NVIDIA на рынке видеокарт. Однако имеющиеся на тот момент возможности полупроводникового гиганта в области интеграции, производства и продаж подсказали Intel, что она в состоянии создавать дешевые интегрированные графические решения для недорогих ПК. Таким образом, в недрах Intel родилось подразделение под руководством Тома Пиаццы (Tom Piazza), которое занималось разработкой графических процессоров Graphics & Media Accelerator (GMA), чья стоимость для конечных пользователей была равна цене похода в кафе. Поскольку Intel жёстко ограничивала развитие своих встроенных GPU транзисторным бюджетом, размерами на кристалле и устаревшими технологическими процессами производства, GMA имели довольно скромные возможности и посредственную репутацию.  

Микросхема Intel 740 на материнской плате

Микросхема Intel 740 на материнской плате

Через несколько лет в Intel пожалели о таком подходе, но до того времени недорогая графика Intel стала весьма популярной среди желающих снизить себестоимость производителей ПК.

Intel Larrabee: x86 от игрового ПК до суперкомпьютера

Шло время, в начале 2000-х годов в отрасли заговорили о том, что GPU можно использовать для определённых вычислений общего назначения в суперкомпьютерах, получив преимущество от их «параллельности». Помимо GPU, на рынке появлялись гетерогенные (Niagara/Sun UltraSPARC T1) и гомогенные (Cell BE) многоядерные процессоры, также направленные в т. ч. на суперкомпьютеры. Разумеется, как GPU, так и многоядерные CPU представляли прямую угрозу для Intel. Помимо этого, несмотря на то, что интегрированные GPU Intel использовались в огромном количестве недорогих ПК, рынок дорогих дискретных GPU рос, равно как средняя стоимость графических карт. Таким образом, в 2005 году руководство Intel приняло решение возобновить работу над дискретными графическими процессорами, но при этом не пытаться улучшить архитектуру GMA до уровня дискретных GPU ATI и NVIDIA, а создать нечто иное. Впоследствии это стало проектом Larrabee.

Intel Xeon Phi

Intel Xeon Phi

Основные требования к разрабатываемой GPU-архитектуре были просты: большое количество вычислительных ядер общего назначения на базе архитектуры x86, высокая тактовая частота, максимальное количество операций с плавающей запятой в секунду (TFLOPS), минимальное количество специфических для GPU блоков. Учитывая требования и многоцелевой характер будущего продукта, изначально проект получил название SMAC (Simple, Massive Array of Cores — простой огромный массив ядер). В руководстве Intel считали, что «гибкие» высокочастотные x86-ядра смогут выполнять те же задачи, что и специализированное аппаратное обеспечение в GPU с приемлемой скоростью, их количество даст возможность максимизировать вычислительную мощность для суперкомпьютеров, а совместимость с x86 облегчит работу HPC-программистов, привыкших к Intel Xeon.

Карты Xeon Phi

Карты Intel Xeon Phi

По словам разработчиков, для эмуляции аппаратных возможностей GPU на 62-ядерном графическом процессоре Larrabee запускали операционную систему FreeBSD и программу DirectXGfx. Последняя не только позволяла играть в DirectX 11-игры (разумеется, на обычной Windows-системе), но и добавлять Larrabee новые возможности. К сожалению, такой подход не позволил Larrabee показывать конкурентоспособную производительность в сравнении с AMD Radeon и NVIDIA GeForce, что и послужило причиной отказа Intel от выпуска Larrabee в качестве GPU. Тем не менее, архитектура Larrabee была использована для сопроцессоров, а потом и процессоров Xeon Phi, призванных конкурировать с ускорителями NVIDIA Tesla. Глядя на пиковую производительность топовых Xeon Phi 7290 (3,5 FP64 TFLOPS) и NVIDIA Tesla P100 (4 – 4,6 FP64 TFLOPS для PCIe карты, 4,7 – 5,3 FP64 TFLOPS для NVLink ускорителя), довольно очевидно, что сегодняшний Xeon Phi на базе x86 не может противостоять GPU на основе ядер с современной проприетарной архитектурой. Можно констатировать, что на сегодняшний день Larrabee не преуспел ни в одной из своих изначальных задач: он не стал быстрым GPU и едва ли может конкурировать с NVIDIA на рынке суперкомпьютеров.

HD и Iris Graphics: гадкий утёнок превращается в лебедя

Larrabee был не единственным графическим проектом Intel, стартовавшим в середине 2000-х годов. Как несложно вспомнить, операционные системы и графические интерфейсы становились всё более требовательными к ресурсам GPU с появлением Apple Mac OS X (2000), Microsoft Windows Vista (2006), Apple iPhone OS (2007) и других. В какой-то момент Intel не смогла убедить Apple использовать её микросхемы в своих мобильных устройствах вследствие того, что у компании не было сколько-то мощных встроенных GPU. Кроме того, Стив Джобс (Steve Jobs) настоятельно требовал от Пола Отеллини (Paul Otellini, исполнительный директор Intel c 2005 по 2013 год) увеличить производительность интегрированных графических процессоров (iGPU), поскольку использование дискретных GPU становилось всё более проблематичным в мобильных ПК.

Проигрыш многомиллионного контракта, а также настойчивые требования важного партнёра сделали своё дело: в 2007 году господин Отеллини объявил о планах увеличить производительность встроенных GPU в 10 раз к 2010 году. Именно в этот момент настал золотой час группы Тома Пиаццы, некогда разработавшей Intel 740.

Прогресс в развитии iGPU Intel в последние годы

Прогресс в развитии iGPU Intel в последние годы

Получив финансирование, транзисторный бюджет, достаточное место на кристалле, а затем и передовые технологии производства (вследствие перемещения iGPU в процессор), команда смогла разработать графическое решение, которое превосходило производительность iGPU образца 2007 года в 25 раз. В последующие годы производительность интегрированных графических процессоров Intel росла не только благодаря улучшениям в области архитектуры, но и появлению более мощных версий этих iGPU c большим количеством исполнительных устройств (EU, execution units). Так, если наиболее мощное графическое ядро класса GT3 в процессоре поколения Haswell обладало 40 EU, то CPU поколения Skylake уже могут похвастаться iGPU класса GT4 с 72 EU. Как показала практика партнёрства Intel c AMD в области интеграции дискретного Radeon в один корпус с процессором Kaby Lake, Intel готова идти ещё дальше, чтобы представить своим пользователям более высокую производительность.

Intel Core с графикой AMD Radeon

Intel Core с графикой AMD Radeon

Раджа Кодури в Intel: чего ожидать?

Принятие на работу ключевого сотрудника конкурента, с которым только что был заключен контракт на поставку важного компонента, говорит о том, насколько специалист уровня господина Кодури необходим Intel.

Как видно, в отличие от начала 2000-х годов, в Intel более не считают графические ускорители уделом любителей игр и развлечений. Быстрая эволюция iGPU компании последних лет подтверждает это. Судя по всему, Intel готова инвестировать в графические процессоры, а потому Раджа Кодури получит все необходимые ему ресурсы. Сам факт принятия на работу специалиста такого уровня говорит об очень серьёзных намерениях.

Примечательно, что в Intel говорят об унификации архитектур и интеллектуальной собственности на фоне того, что Xeon Phi на базе x86 не может конкурировать с NVIDIA Tesla в том, что касается производительности. Неизвестно, означает ли фраза Intel об унификации, что компания планирует отказаться от x86-ядер в решениях для суперкомпьютеров, однако едва ли это стало бы удивительным развитием событий.

AMD Radeon Vega Frontier Edition

AMD Radeon Vega Frontier Edition

Пожалуй, самый главный вопрос, на который пока нет ответа, это то, когда именно Intel планирует выпустить свой новый дискретный GPU. В случае, если у компании нет уже готовой архитектуры, способной масштабироваться от небольшого iGPU для ноутбука до дискретного графического процессора размером 550 мм2 и более, то работа над дискретным GPU Intel потребует нескольких лет. Таким образом, едва ли мы увидим плоды деятельности Раджи Кодури ранее 2022 года. Если же текущая (Gen 9.5) или будущая (Gen 10, Gen 11) графическая архитектура Intel (чья разработка уже завершена) способна масштабироваться и показывать производительность сравнимую с будущими решениями AMD и NVIDIA, мы вполне можем рассчитывать увидеть дискретный GPU компании уже в 2019–2020 году (но не раньше, иначе в партнёрстве Intel c AMD не было бы смысла).

Стоит помнить, что поскольку в описании рабочих задач господина Кодури значится не только проектирование нового GPU, но и унификация различных архитектур и интеллектуальной собственности Intel, очень вероятно, что мы увидим несколько поколений продукции для разных приложений, прежде чем поставленная Intel задача будет выполнена.

Новая статья: Репортаж с Intel AI Day: новый мозг для искусственного разума

Данные берутся из публикации Репортаж с Intel AI Day: новый мозг для искусственного разума

Новая статья: Intel на SC16: клич войны с GPU?

Данные берутся из публикации Intel на SC16: клич войны с GPU?

Новая статья: Репортаж с IDF 2016: новый Intel Core, накопители Optane, виртуальная реальность и многое другое

Данные берутся из публикации Репортаж с IDF 2016: новый Intel Core, накопители Optane, виртуальная реальность и многое другое

Компании Intel исполнилось 48 лет

Сегодня корпорация Intel отмечает 48 лет со дня основания. 18 июля 1968 года бывшие инженеры компании Fairchild Semiconductor Гордон Мур (Gordon Moore) и Роберт Нойс (Robert Noyce) основали собственную компанию, получившую название-акроним от словосочетания Integrated Electronics. Первым проектом Intel было создание микросхемы оперативной памяти 1101, однако серьёзного успеха инженерам-новаторам пришлось ждать до 15 ноября 1971-го, когда свет увидел 4-разрядный процессор Intel 4004, включавший всего 2,3 тыс. 10-мкм транзисторов.

Слева направо: Энди Гроув, Роберт Нойс и Гордон Мур, фото 1978 г.

Слева направо: Энди Гроув, Роберт Нойс и Гордон Мур, фото 1978 г.

Ныне счёт выпущенных чипмейкером моделей CPU идёт на тысячи, а сама Intel занимает 60-е место в рейтинге крупнейших компаний Forbes Global 2000 с капитализацией 149,3 млрд долларов США. Финансовые результаты Intel будут опубликованы на днях. В соответствии с прогнозом аналитиков из Санта-Клары, доход компании уменьшится с $13,7 до $13,5 млрд, что связано прежде всего с меньшим количеством дней в финансовом квартале. На разработку и дизайн продуктов, а также операции, связанные с покупкой других компаний, Intel потратит 5,1 млрд долларов, ещё порядка $1,2 млрд расходов связаны с проводимой в течение года реструктуризацией — сокращением штата на 11% и закрытием ряда проектов.

Нынешний генеральный директор Intel Брайан Кржанич (Brian Krzanich) на 8 лет старше самой компании — сейчас ему 56. С момента вступления в должность в январе 2012 года он продолжил курс предыдущего главы Intel Пола Отеллини (Paul Otellini) на уменьшение зависимости Intel от колебаний спроса на CPU и сокращения рынка персональных компьютеров. Благодаря поглощению Altera чипмейкер значительно усилил позиции в корпоративном сегменте рынка, а амбициозный проект «Интернет вещей» (Internet of Things, IoT) обеспечит инженеров компании работой на долгие годы. За время нахождения Брайна Кржанича на посту №1 стоимость акций Intel Corporation выросла с 25 до 34 долларов.

Генеральный директор Intel Брайан Кржанич (Brian Krzanich)

Осенью Intel представит третье, после Broadwell и Skylake, семейство 14-нм процессоров для массового рынка — Kaby Lake. Его откроют чипы для мобильных устройств со скромным уровнем TDP — 15-ваттный Core i7-7500U, 4,5-ваттный Core i7-7Y75 и другие. Стоит также выделить относительно недавний дебют 10-ядерного процессора Core i7-6950X и других чипов Broadwell-E для платформы LGA2011-3. Кроме того, во второй половине июня дебютировали модели Xeon Phi 7200 на базе архитектуры Knights Landing, выполненные в виде полноценного процессора (а не сопроцессора, как ранее).

Xeon Phi

48-й день рождения компании, судя по «молчанию» официальных аккаунтов Intel в социальных сетях Facebook и Twitter, будет отмечен довольно скромно. Но через два года, в честь полувекового юбилея чипмейкера, нас определённо ждут сюрпризы в виде нерядовых анонсов и акций.

Intel подтверждает поддержку AVX-512 процессорами Cannon Lake

На днях компания Intel обновила руководство для программистов по работе с расширенным набором инструкций AVX-512. Ожидалось, что блоки для обработки целочисленных значений и значений с плавающей запятой с поддержкой 512-бит команд появятся в составе процессоров Intel 14-нм поколения Skylake. Потом стало известно, что в поколении Skylake поддержка AVX-512 будет только в составе серверных процессоров Intel Xeon и ускорителей расчётов Xeon Phi (в 14-нм поколении ускорителей Knights Landing). В составе ускорителей Knights Landing обещана поддержка большего набора расширений AVX-512, чем в случае процессоров Xeon общего назначения. Это объясняется тем, что расширенный набор инструкций AVX-512 нацелен на развитие параллелизма в расчётах, что на данном этапе проще реализовать (и с лучшей отдачей) в ускорителях вычислений.

Планы Intel по развитию серверных архитектур (Intel)

Планы Intel по развитию серверных архитектур (Intel)

К слову, ускорители Intel Knights Landing опираются на значительно переделанную архитектуру Atom Silvermont. В конфигурации с 72 ядрами процессоры Knights Landing одновременно могут обрабатывать до 288 потоков и выдавать до 3 терафлопс на операциях с двойной точностью и до 6 терафлопс на операциях с одинарной точностью. Для таких решений поддержка AVX-512 — это то, что доктор прописал. Параллелизм — это их сущность. Поскольку поставки Knights Landing начнутся в текущем квартале, программное обеспечение с реализацией SIMD-инструкций AVX-512 — это вопрос сегодняшнего дня. Поскольку процессоры Skylake-EP за небольшим исключением будут использовать те же наборы AVX-512, что и Knights Landing, к моменту появления на рынке моделей Skylake-EP для новых расширений будет создана серьёзная программная поддержка. Выход Skylake-EP, напомним, ожидается во второй половине 2017 года.

Глубина поддержки инструкций AVX настольными и серверными платформами Intel (Intel)

Глубина поддержки инструкций AVX настольными и серверными платформами Intel (Intel, ComputerBase.de)

Также во второй половине 2017 года появятся первые 10-нм процессоры компании Intel, с которыми мы сегодня знакомы по кодовому имени Cannon Lake. В свежем документе Intel для программистов авторы сайта ComputerBase.de обнаружили, что клиентские процессоры Cannon Lake также будут поддерживать AVX-512. Как минимум речь идёт о расширениях AVX512IFMA, AVX512VBMI, SHA и UMPI. Всё вместе указывает на то, что в конце 2017 года можно ожидать широкую поддержку AVX-512 со стороны программистов. Для клиентского применения использование AVX-512 будет означать, что обработка массивных мультимедийных данных будет проходить с меньшей нагрузкой на процессор. Точнее, работа с использованием аппаратных ресурсов, совместимых с AVX-512, будет максимально эффективна. На этих задачах потребление снизится, а производительность вырастет.

Выигрыш ои внедрения AVX-512 по сравненнию с AVX-256/128 и предыдущими «мультимедийными» инструкциями

Выигрыш от внедрения AVX-512 по сравнению с AVX-256/128 и предыдущими «мультимедийными» инструкциями

Добавим, архитектура процессоров AMD Zen, которая в продуктах компании начнёт свою жизнь в конце 2016 года или в начале 2017 года, будет оперировать двумя 256-битными инструкциями AVX за такт. Для этого каждое ядро Zen получит по два 256-битных FMAC (fused multiply — add capability). На практике подобная архитектура позволит за один такт выполнять одну 512-битную инструкцию. Как это реализовано у процессоров Intel Cannon Lake, мы пока сказать не можем.

Более ста суперкомпьютеров из Top 500 используют ускорители вычислений

Не секрет, что всё больше суперкомпьютеров используют вычислительные ускорители на базе графических процессоров, или же специальные сопроцессоры, чтобы достигнуть невиданной мощности при относительно небольшом энергопотреблении. Согласно данным из нового списка пятисот самых мощных суперкомпьютеров в мире, более сотни уже использует GPU-ускорители. Карты NVIDIA Tesla продолжают оставаться самыми популярными ускорителями для высокопроизводительных вычислений (high-performance computing, HPC).

Рост производительности суперкомпьютеров замедляется

Согласно обновлённому списку Top 500, опубликованному на этой неделе, общая вычислительная мощность всех самых мощных суперкомпьютеров в мире выросла до 420 квадриллионов операций с плавающей запятой в секунду (420 петафлопс – PetaFLOPS [floating point operations per second]) с 361 петафлопс год назад. 80 HPC-систем имеют производительность в один петафлопс, по сравнению с 67 машинами в июле этого года года. Наименее мощный суперкомпьютер из Top 500 может выполнять 204,3 триллионов операций в секунду (терафлопс), тогда как ранее мощность самой медленной Top 500 системы в мире была 164 терафлопс.

Суперкопьютер Cray XK7

Суперкопьютер Cray XK7

Авторы рейтинга Top 500 отмечают, что рост производительности самых быстрых суперкомпьютеров замедляется. Во многом это происходит вследствие замедления роста производительности центральных процессоров, а также некоторых задержек с выходом в свет новейших ускорителей и сопроцессоров для супервычислений.

Количество GPU в суперкомпьютерах растёт

В общей сложности 104 системы в списке пятисот самых мощных суперкомпьютеров в мире используют вычислительные ускорители AMD FirePro S, NVIDIA Tesla или сопроцессоры Intel Xeon Phi. А еще в июле этого года лишь 90 систем использовали подобные устройства. 66 систем из 104 использует NVIDIA Tesla, 27 используют Intel Xeon Phi и три используют AMD FirePro. Четыре системы используют комбинацию из NVIDIA Tesla и Intel Xeon Phi. NVIDIA продолжает доминировать на рынке суперкомпьютерных ускорителей, однако успех Intel Xeon Phi налицо. Примечательно, что, по данным NVIDIA, 23 из 24 новых GPU-ускоренных систем в списке построенным на базе Tesla.

NVIDIA Tesla K80

NVIDIA Tesla K80

«Я верю, что в один прекрасный день GPU-ускорение будет доступно у всех суперкомпьютеров мира», — сказал Дженсен Хуанг (Jen-Hsun Huang), соучредитель и генеральный директор NVIDIA. «К GPU-ускоряемым вычислениям уже обратились ведущие суперкомпьютерные центры мира, что нашло отражение в актуальной версии списка TOP500. Учитывая, что темп научных открытий растет и ученые все чаще обращаются к вычислениям, машинному обучению и визуализации, в будущем эта тенденция только усилится». 

Intel Xeon Phi в составе Tianhe 2

Intel Xeon Phi в составе Tianhe 2

Согласно данным последнего исследования компании Intersect360 Research, почти 70 % из 50 самых популярных HPC-приложений — и 90% из 10 ведущих — поддерживают GPU-ускоренные вычисления. Таким образом, всё указывает на то, что доля графических процессоров в суперкомпьютерах продолжит расти в ближайшие годы.

«Ландшафт индустрии HPC сегодня серьезно изменился, и произошло это благодаря графическим процессорам NVIDIA Tesla», — отметил Эддисон Снелл (Addison Snell), один из авторов исследования, генеральный директор Intersect360 Research. «Применение ускорителей и число GPU-ускоренных версий ведущих HPC кодов неуклонно растет».

Tianhe 2 остаётся самым мощным суперкомпьютером

В верхней части нового списка из пятисот самых мощных суперкомпьютеров в мире, который был выпущен на этой неделе, не произошло существенных изменений.

Самым мощным суперкомпьютером на планете по-прежнему является китайский Tianhe 2, спроектированный оборонным научно-техническим университетом народно-освободительной армии Китайской Народной Республики и компанией Inspur. Он способен выполнять 33,86 квадриллионов операций с плавающей запятой в секунду (33,86 петафлопс). Данная система базируется на процессорах Intel Xeon E5-2692v2 (двенадцать ядер, тактовая частота 2,2 ГГц), а также использует 48 тысяч сопроцессоров Xeon Phi Intel 31S1P. В общей сложности, Tianhe 2 располагает 3,12 миллионами x86-ядер.

Tianhe 2

Суперкомпьютер Tianhe 2

На втором месте находится суперкомпьютер Titan, который установлен в национальной лаборатории Ок-Ридж (Oak Ridge) министерства энергетики США, и обладает мощностью 17,59 петафлопс. Данная система представляет собой кластер Cray XK7 c шестнадцатиядерными AMD Opteron и ускорителями NVIDIA Tesla K20X.

Третья по мощности HPC-система в мире — Sequoia — может выполнять 17,173 квадриллионов операций с плавающей запятой в секунду и принадлежит Ливерморской национальной лаборатории министерства энергетики США имени Э. Лоуренса (Lawrence Livermore National Laboratory, LLNL). Система использует 98 304 процессора IBM Power BQC (шестнадцать ядер, частота 1,60 ГГц) и была построена IBM.

Суперкомпьютер Ломоносов 2

Суперкомпьютер Ломоносов 2

Самым мощным суперкомпьютером в России остался Ломоносов 2, который имеет мощность 1,849 петафлопс (36 место в рейтинге). Данная система была построена компанией T-Platforms для МГУ имени М.В. Ломоносова на базе процессоров Intel Xeon E5-2697v3 (14 ядер, 2,60 ГГц) и ускорителей NVIDIA Tesla K40m.

Рабочие станции на базе Xeon Phi появятся в 2016 году

Руководитель Intel HPC Platform Group Чарльз Вичпард (Wuischpard) сообщил о намерении компании привнести революционные изменения на рынок мощных настольных рабочих станций. Уже в первой половине следующего года производитель планирует отгрузить первую рабочую станцию с 72-ядерным чипом Xeon Phi. Это самый мощный на сегодняшний день процессор в ассортименте Intel.

Intel Xeon Phi x200

Intel Xeon Phi x200

Первоначально на рынок выпустят лишь ограниченное число компьютеров с новыми «суперчипами». Далее объёмы поставок расширятся с помощью партнёров Intel — таких как Cray, Dell, Fujitsu, Hitachi, Huawei, Lenovo, SGI, Supermicro и многих других. Системы на базе Xeon Phi предназначены для исследователей, которые не имеют доступа к более мощным суперкомпьютерам. Вычислительной мощности нового чипа достаточно для многих сложных научных расчетов, а также для написания и тестирования кода перед его переносом на суперкомпьютер. Xeon Phi обеспечит пиковую производительность свыше трёх терафлопс в операциях двойной точности и до восьми терафлопс в операциях одинарной точности. Чип включает традиционные x86 ядра и специализированные вычислительные блоки для специфичных тяжелых нагрузок. Среди особенностей новинки можно отметить также наличие 16 Гбайт памяти MCDRAM, которая предлагает в пять раз более высокую пропускную способность по сравнению с DDR4. Также по плотности хранения информации она в три раза опережает GDDR5.

Intel Xeon Phi x200

Intel Xeon Phi x200

Возможно, демонстрационный образец мы увидим в ходе выставки CES 2016?

 

Intel рассказала о 10-нм Knights Hill и 100-Гбит/с архитектуре Omni-Path

В рамках ежегодной конференции Supercomputing Conference (SC’14), которая традиционно проходит в Новом Орлеане во второй половине ноября, компания Intel официально рассказала о своём процессоре Intel Xeon Phi следующего поколения. Кроме того, компания предоставила информацию о производительности архитектуры Omni-Path, которая представляет собой высокоскоростную технологию межсоединений, нацеленную на HPC-приложения.

Intel

Intel

Новый Xeon Phi, известный под кодовым именем Knights Hill, принадлежит к третьему поколению продуктов этой линейки. Устройство будет выпущено с использованием передового 10-нм техпроцесса и интегрирует в себя Intel Omni-Path Fabric. Предшественником Knights Hill станет решение Knights Landing, которое, как ожидается, будет отгружаться на рынок в следующем году.

Intel

Intel

Intel отметила рост инвестиций своих отраслевых партнёров в чипы Xeon Phi. Более пятидесяти компаний представят свои решения на базе Knights Landing, но ещё больше систем будут использовать версию в виде PCI Express в качестве сопроцессора. Knights Landing будет использоваться в суперкомпьютерах Trinity, Cori.

Intel

Intel

Также производитель отметил, что архитектура Omni-Path обеспечит линейную скорость передачи данных 100 Гбит/с и на 56 % снижение задержки коммутации в кластерах среднего и крупного масштаба по сравнению с альтернативными InfiniBand-решениями. Intel Omni-Path будет включать 48-портовый коммутационный чип (в современных InfiniBand-решениях используются 36-портовые чипы). Это позволит уменьшить сложность системы и инфраструктурные затраты (плотность портов увеличится в 1,3 раза, уменьшение количества коммутаторов на 50 %, увеличение масштабирования в 2,3 раза в двухуровневых конфигурациях).

Также Intel не забыла упомянуть о своём вкладе в суперкомпьютерную отрасль. В новой редакции списка TOP500 86 % систем используют решения Intel. В совокупной производительности 17-процентный вклад обеспечивают именно машины с сопроцессорами Xeon Phi.

Intel представила сопроцессоры нового поколения Xeon Phi Knights Landing

Корпорация Intel анонсировала сопроцессоры Xeon Phi нового поколения (кодовое имя Knights Landing), предназначенные для использования в высокопроизводительных вычислительных системах.

Напомним, что первые изделия Xeon Phi вышли в конце 2012 года. Такие решения базируются на платформе Intel MIC (Many Integrated Core) — специализированной архитектуре, в которой используются тот же язык, те же инструменты, компиляторы и библиотеки, что и в процессорах Xeon. При этом в MIC достигается высокая степень параллелизма за счёт использования процессорных ядер меньшего размера, потребляющих меньше энергии. Результатом является высокая производительность в системах с интенсивной параллельной обработкой данных.

Нынешние сопроцессоры Xeon Phi могут иметь до 61 ядра, 244 потоков и обеспечивать производительность до 1,2 терафлопса (триллиона операций с плавающей запятой в секунду). Они представлены во множестве конфигураций для удовлетворения различных требований к аппаратным и программным средствам, рабочим нагрузкам, производительности и эффективности.

Чипы Xeon Phi нового поколения — Knights Landing — имеют более 60 ядер (точное количество не называется) на архитектуре Silvermont. Изделия рассчитаны на работу с инновационной памятью Hybrid Memory Cube (HMC) объёмом до 16 Гбайт, которая обеспечивает в пять раз более высокую пропускную способность по сравнению с DDR4 при меньшем энергопотреблении.

Другой особенностью сопроцессоров Xeon Phi Knights Landing является технология внутренних связей Intel Omni Scale Fabric, которая призвана обеспечить высокие показатели производительности, надёжности, масштабируемости и плотности размещения компонентов.

Продукты поколения Knights Landing могут использоваться как в качестве сопроцессора на базе карт расширения PCIe, так и в качестве центрального процессора (CPU), устанавливающегося непосредственно в сокет материнских плат. В виде центрального процессора изделия сочетают в себе всю функциональность классического основного процессора и возможности специализированных сопроцессоров.

Быстродействие Knights Landing, по заявлениям Intel, превышает 3 терафлопса в вычислениях с двойной точностью. Высокопроизводительные вычислительные системы, оснащённые сопроцессорами Xeon Phi Knights Landing, появятся во второй половине нынешнего года.

Intel готовит сопроцессор Xeon Phi 7120D

Корпорация Intel, по сообщениям сетевых источников, вскоре выпустит новый сопроцессор серии Xeon Phi — модель с обозначением 7120D.

Изделия Xeon Phi могут иметь до 61 ядра, обрабатывать 244 потока и обеспечивать производительность до 1,2 терафлопса. Intel предлагает сопроцессоры Xeon Phi трёх линеек: 3100, 5100 и 7100. Устройства серии 3100 обеспечивает высокую производительность при выполнении параллельных вычислений. Сопроцессоры Xeon Phi 5100 оптимизированы для вычислительных сред с высокой плотностью. Наконец, изделия Xeon Phi 7100 имеют наибольшее количество функциональных возможностей, самую высокую производительность и максимальный объём памяти.

Сообщается, что новый сопроцессор Xeon Phi 7120D получит 61 ядро и 16 Гбайт памяти, Рабочая частота составит 1,238 ГГц с возможностью увеличения с помощью технологии Turbo. Максимальное значение рассеиваемой тепловой энергии равно 270 Вт, что на 10% меньше по сравнению с другими представителями серии Xeon Phi 7100.

Информации о цене новинки на данный момент нет. Но вероятнее всего она будет аналогична стоимости других сопроцессоров серии, то есть превысит 4000 долларов США. 

Будущие процессоры Intel Xeon Phi: петафлопс в одной стойке к 2015 году

Вычислительные сопроцессоры Xeon Phi, выросшие из проекта Larrabee, неожиданно стали весьма успешным продуктом Intel. После того, как NVIDIA, а затем и AMD, попробовали вывести на рынок суперкомпьютеров свои ускорители вычислений, построенные на базе собственных графических процессоров с многопоточной архитектурой, Intel предложила для этого рынка нечто иное. Разработанный компанией вычислительный сопроцессор Xeon Phi, базирующийся на архитектуре Many Integrated Core, предоставил многоядерное решение с хорошо знакомой разработчикам x86-архитектрой. И это оказалось отличной идеей: отсутствие необходимости перерабатывать уже реализованные алгоритмы при переносе на компьютеры с сопроцессорами Xeon Phi сделала их очень популярным решением для многопоточных высокопроизводительных вычислений. Своими успехами Intel вполне может гордиться. Например, 48 тысяч плат Xeon Phi применяется в быстрейшем на планете компьютере Tianhe-2 (Млечный путь), как и двенадцати других системах из списка суперкомпьютеров Top500.

Новое же поколение Xeon Phi предложит целый ряд кардинальных усовершенствований, которые могут позволить им занять доминирующее положение на суперкомпьютерном рынке. Несколько дней назад Intel объявила, что будущие Xeon Phi поколения Knights Landing станут полноценными устанавливаемыми в сокеты процессорами с интегрированной памятью, а теперь сайт VR-Zone добавил в эту картину несколько новых интригующих штрихов.

Будущие Xeon Phi, относящиеся к поколению Knights Landing, смогут использоваться в системах в качестве центральных процессоров. Они не будут требовать никаких дополнительных процессоров-хостов: загрузка операционной системы, работа с оперативной памятью, взаимодействие с устройствами ввода-вывода и соединение с другими вычислительными узлами будет реализована в самих Knights Landing.

При этом Knights Landing получат собственный шестиканальный контроллер памяти с поддержкой до 384 Гбайт DDR4-2400, что представляется большим прогрессом по сравнению с 16 Гбайт памяти, которыми располагают платы Xeon Phi сегодня. Взаимодействие с памятью в Knights Landing будет происходить через интегрированный непосредственно на процессор высокоскоростной eDRAM-буфер объёмом до 16 Гбайт, имеющий пропускную способность более 500 Гбайт/с. Этот буфер получит два режима: либо его можно будет использовать как кэш, либо он сможет выступать участком адресуемой памяти. Предпочтительный вариант смогут выбрать разработчики, исходя из специфики решаемых задач.

Каждый процессор Knights Landing получит поддержку 36 линий PCI Express 3.0, которые смогут использоваться как для соединений с другими вычислительными узлами, так и для связи с прочими платами (например, графическими) и периферийными устройствами.

В максимальной конфигурации процессоры Knights Landing получат 72 ядра, построенных на модифицированной микроархитектуре Silvermont (в настоящее время используется в процессорах Atom поколения Valleyview) и обладающих поддержкой векторного набора 512-битных инструкций AVX-512.

Процессоры Knights Landing обещают, по меньшей мере, тройное превосходство в быстродействии над сегодняшними вариантами Xeon Phi. Теоретическая пиковая производительность будущих высокопроизводительных процессоров достигнет 6 Тфлопс на операциях с одинарной точностью и 3 Тфлопс на операциях двойной точности. Учитывая же, что Intel обещает выпуск четырёхсокетных плат под Knights Landing, которые смогут устанавливаться в одноюнитовые корпуса, суммарная производительность построенной на перспективных Xeon Phi стойки может достигать уровня в 1 петафлопс. Правда, при этом придётся как-то решить вопрос с охлаждением, так как тепловыделение будущих процессоров Knights Landing может достигать 200 Вт.

Кроме того сразу вслед за Knights Landing на рынке появятся и совместимые с ними модификации Knights Landing-F, в которых будет добавлен приобретённый Intel в прошлом году контроллер межсоединений с низкими задержками Cray HPC interconnect. Благодаря ему Intel обещает обеспечить взаимодействие между узлами системы с пропускной способностью 100 Гбит/с по волоконнооптическому кабелю.

Помимо процессоров Knights Landing, компания Intel продолжит и поставку PCIe-плат, построенных на этой же архитектуре. Однако такие решения получат лишь два из шести каналов памяти и смогут комплектоваться только 64 Гбайт памяти.

Таким образом, компания Intel серьёзно задумывается о расширении своего присутствия на рынке суперкомпьютерных решений и продвижении x86-архитектуры во все сегменты, начиная от мобильных устройств и заканчивая высокопроизводительными многопоточными вычислениями. Выход процессоров Knights Landing запланирован на 2015 год, а для их производства будет использоваться технологический процесс с 14-нм нормами.

Intel раскрывает детали о будущих Xeon Phi: не сопроцессоры, а CPU

Высокопроизводительные вычисления становятся мощной точкой роста компьютерного рынка, и многие полупроводниковые компании активно включаются в гонку гигафлоп. Сегодня на конференции Supercomputing’13 компания Intel сделала важное объявление: она собирается полностью переосмыслить свою многоядерную архитектуру Many Integrated Core и перейти от вычислительных сопроцессоров Xeon Phi к созданию основанных на этой архитектуре полноценных многоядерных центральных процессоров.

Высокопроизводительные суперкомпьютерные системы, бывшие когда-то нишевыми решениями, использовавшимися исключительно в военных или научных целях, сегодня становятся всё более и более востребованными. Рынок суперкомпьютеров, фактически, переживает второе рождение. Все больше игроков включается в «гонку за экзафлопом», причём самое активное участие в ней принимают не только проектировщики и пользователи таких систем, но и разработчики микроэлектронного оборудования, для которых суперкомпьютеры открывают весьма ёмкий и высокодоходный рынок сбыта. Свои амбициозные планы в этой отрасли сегодня обнародовала компания Intel.

В конце 2012 года Intel представила свой первый ускоритель вычислений Xeon Phi и с тех пор она планомерно развивает эту линейку.  Известные под кодовым именем Knights Corner и доступные в настоящее время ускорители вычислений производятся по 22-нм технологии и предназначены для установки в виде дочерних плат в вычислительные системы, построенные на процессорах с x86-архитектурой (в первую очередь на Xeon). Линейка сопроцессоров Knights Corner состоит из моделей с 57-61 простыми ядрами с x86-архитектурой, которые снабжаются выделенной GDDR5-памятью объёмом от 6 до 16 Гбайт. Для взаимодействия между центральным процессором и платами Xeon Phi задействуется шина PCI Express подобно тому, как это происходит с профессиональными видеокартами для вычислений Nvidia Tesla или AMD FirePro.

Ускорители Xeon Phi достаточно популярны в суперкомпьютерных системах. Например, быстрейший на планете компьютер Tianhe-2 (Млечный путь), как и двенадцать других систем из списка суперкомпьютеров Top500, использует именно такие ускорители вычислений. В то же время Intel ожидает дальнейшего роста популярности своей концепции Many Integrated Core, которая, несмотря на сравнительно малый возраст, начинает приобретать всё более широкую поддержку со стороны разработчиков, так как предлагает хорошо знакомую многим программную модель x86.

Учитывая тот факт, что Xeon Phi имеет все шансы прижиться на рынке, Intel решила провести коренную оптимизацию данного решения. В результате, следующее поколение сопроцессоров с кодовым названием Knights Landing будет не только производиться с применением более современного техпроцесса с 14-нм нормами, но и получит многочисленные изменения в ядрах и других частях чипа, направленные на улучшение его производительности и эффективности.

Главное: Knights Landing станет из нуждающегося во внешнем управлении сопроцессора полноценным многоядерным процессором, который можно будет использовать в основе специальных конфигураций, работающих под управлением собственной операционной системы. Иными словами, Knights Landing позволят создавать однородную многоядерную вычислительную среду в широком спектре разнообразных компьютеров: от рабочих станций до суперкомпьютерных кластеров без необходимости добавления в них дополнительных процессоров-хостов другого класса. Это позволит избавиться от ненужной гетерогенности и упростить дизайн таких систем. Выиграют и разработчики программного обеспечения: они получат в своё распоряжение производительные многоядерные ускорители вычислений, с которыми можно работать ровно так же, как и с обычными центральными процессорами. Как обещает Intel, новая версия архитектуры Xeon Phi существенно поднимет производительность суперкомпьютерных систем, так как для обработки данных на вычислительных сопроцессорах программам больше не потребуется выполнять постоянное копирование информации из системной памяти в память ускорителей.

Надо сказать, что Intel не стала углубляться в детали архитектуры процессоров Knights Landing, однако заверила общественность, что они могут работать не только над многопоточными задачами, но и будут вполне совместимы с однопоточными программами.

Помимо этого, перспективные многоядерные процессоры Knights Landing продолжат выпускаться и в виде привычных PCI Express плат, которые можно будет применять для модернизации уже имеющихся систем с сопроцессорами Xeon Phi.

Второе принципиальное нововведение касается архитектуры памяти. Knights Landing получат в своё распоряжение достаточно большой пул набортной памяти, которая будет располагаться внутри упаковки чипа и работать как кэш-буфер при взаимодействии со стандартной DDR-памятью, установленной на материнской плате.

Добавление быстродействующей буферной памяти должно увеличить скорость решения задач, активно работающих с большими массивами данных. Встроенная в чипы память будет выступать частью плоского адресного пространства и не потребует внесения каких-либо изменений в программную модель. Однако Intel обещает предложить разработчикам дополнительные инструменты для оптимизации приложений под новую архитектуру памяти. На данный момент компания не разглашает сведений об объёме планируемого к реализации в будущих Xeon Phi буфера, но обещает, что его будет хватать и при высокой нагрузке.

Первые продукты поколения Knights Landing ожидаются на рынке в 2015 году.

Платы Intel Xeon Phi станут микросхемами-сопроцессорами

Компания Intel собирается изменить формат, в котором будут предлагаться перспективные ускорители вычислений Xeon Phi. Из плат в PCI Express-исполнении в недалёком будущем они превратятся в чипы-сопроцессоры, для установки которых на специализированных материнских платах для серверов и рабочих станций появится отдельный разъём, соседствующий с привычными LGA-гнёздами для процессоров Xeon. Таким образом компания Intel намерена улучшить гибкость конфигурирования систем, оснащённых Xeon Phi, а также поднять рентабельность их выпуска.

Предлагаемые в настоящее время ускорители вычислений Xeon Phi (ранее известные как Larrabee) представляют собой похожие на видеокарты с двухслотовой системой охлаждения карты, устанавливаемые в слоты PCI Express. Они базируются на 22-нм чипах Knights Corner, предлагающих от 57 до 61 ядер с x86-архитектурой, и снабжаются выделенной GDDR5-памятью объёмом от 6 до 16 Гбайт.

Как сообщает сайт Bright Side Of News, несмотря на то, что стоимость акселераторов Xeon Phi составляет от $1695 и выше, для Intel они нерентабельны, так как спрос на них очень ограничен, а для производства ей приходится закупать на стороне многие компоненты: память, систему охлаждения, электронные детали и проч. В связи с этим Intel решила пересмотреть базовое строение Xeon Phi и превратить эти ускорители из плат расширения в LGA-чипы, похожие на обычные процессоры.

Для их установки Intel придётся разработать новый разъём, однако это решение позволит решить сразу несколько проблем. Так, системные интеграторы получат возможность самостоятельно определять необходимые конфигурации систем с Xeon Phi, оснащая их тем или иным объёмом памяти исходя из нужд заказчиков. Кроме того, в настоящее время производительность Xeon Phi серьезно зависит от пропускной способности шины, и в системах, где PCI Express 3.0 поддерживается не в полной мере, она оказывается существенно ниже теоретических показателей. Замкнув же на себя экосистему Xeon Phi, компания Intel хочет упростить для конечных пользователей настройку и эксплуатацию платформ с этими ускорителями вычислений.

К сожалению, перенос сопроцессоров Xeon Phi с PCIe-плат в сокеты лишит их возможности комплектации быстрой GDDR5-памятью, пропускная способность которой на предлагаемых в настоящее время модификациях составляет от 240 до 352 Гбайт/с. Даже если в системах с перспективными моделями Xeon Phi будет использоваться четырёхканальная DDR4 SDRAM, это даст лишь пиковую пропускную способность не более 153 Гбайт/с. Однако по мнению Intel высокая скорость памяти не является критичным фактором, а возможность самостоятельного увеличения её объёма конечными пользователями гораздо важнее.

Как предполагается, первые серверные материнские платы, которые будут оборудованы дополнительным гнездом для чипов-сопроцессоров Xeon Phi, могут появиться с выходом Haswell-EP/EX, то есть в первой половине 2015 года. Источник утверждает, что образцы Xeon Phi в новой форме уже тестируются в секретных лабораториях Intel.