Теги → cavium

Тесты указывают на отличные перспективы ARM-чипов на рынке HPC

Британский альянс Great Western 4 (GW4), в который входят четыре университета на юго-западе Англии и Уэльса (города Бат, Бристоль, Кардифф, Эксетер), скоро установит Isambard — суперкомпьютер с 10 тысячами ядер CPU, который считается первым в мире выпущенным суперкомпьютером на базе ARM. Когда Isambard заработает, то станет самой мощной подобной системой в Великобритании и уступит только Astra, который планируется развернуть в Sandia National Laboratories позже этим летом.

GW4 тестирует предварительные версии чипов Cavium ThunderX2 минимум год, но теперь, с поступлением кристаллов в массовое производство, можно сделать более практическое сравнение с процессорами Intel Xeon. В данном случае 32-ядерная версия ThunderX2 сравнивалась с 22-ядерным Broadwell и 28-ядерным Skylake. Саймон Макинтош-Смит (Simon Mcintosh-Smith) из Университета Бристоля обобщил результаты в блоге, в котором основное внимание уделил производительности вычислений с плавающей запятой, а также пропускной способности памяти и кеша. Показанные в таблице баллы были получены в наиболее распространённых нагрузках HPC, которые запускаются на ARCHER, национальном суперкомпьютере Великобритании.

Для всех, кто следит за прогрессом ARM на серверном рынке в целом и за ThunderX2 в частности, результаты в значительной степени окажутся ожидаемыми. Процессоры Xeon значительно лучше, чем ThunderX2 справляются с вычислениями с плавающей запятой с точки зрения показателя FLOPS. Это в особенности справедливо для Skylake Xeon, который включает в себя 512-битные продвинутые векторные расширения (AVX). Ширина векторных инструкций ThunderX2, в свою очередь, составляет 128 бит.

С другой стороны, благодаря 8-канальной архитектуре памяти Cavium ThunderX2 предлагает на 23 % бо́льшую пропускную способность, чем Skylake, и на 95 % бо́льшую, чем Broadwell. Результаты производительности кеша оказались не столь очевидными, хотя Skylake Xeon вышел в лидеры на всех трёх уровнях кеш-памяти.

Очевидный вывод состоит в том, что чипы Xeon предпочтительнее для исполнения кода, интенсивно использующего вычисления с плавающей запятой, а ThunderX2 — наилучший выбор для задач, упирающихся в пропускную способность памяти и меньше зависящих от показателей FLOPS. Для инструкций, которые могут выполнять большую часть своей работы с помощью кеша, Xeon также станет наилучшим выбором.

Но есть ещё одно важное преимущество процессоров Cavium — более низкая цена. Господин Макинтош-Смит говорит, что процессоры на базе архитектуры ARM значительно дешевле, чем те, которые поставляются от существующих поставщиков. Разница порой оказывается в 2–3 раза, в зависимости от того, какие модели сравнивать. Как следствие, с учётом стоимости, ThunderX2 могут выглядеть намного привлекательнее.

Исследователь также подчёркивает, что наличие в распоряжении учёных разных наборов архитектур CPU на выбор — хорошая практика, позволяющая не зависеть от тех или иных слабых сторон или преимуществ конкретных чипов. «С точки зрения конечных пользователей суперкомпьютеров это означает, что у нас появился новый набор поставщиков процессоров, что даёт нам гораздо более широкие возможности выбора, чем в любой момент за последний десяток лет», — отметил он.

Конечно, несмотря на все дискуссии, в наши дни главный спрос на вычисления в области суперкомпьютеров формирует аналитика, ИИ и другие приложения с интенсивным использованием данных, так что главным показателем по-прежнему остаётся производительность вычислений с плавающей запятой. Поэтому разработчикам серверных чипов ARM необходимо выстроить связи с поставщиками ускорителей вроде NVIDIA, AMD и Xilinx или найти способы распространения своей технологии вроде ARMv8-A SVE (масштабируемые векторные расширения). SVE проходит обкатку в Японии, где Fujitsu разрабатывает свои чипы для суперкомпьютера RIKEN Post-K, который дебютирует в 2021 году.

Саймон Макинтош-Смит также отмечает, что большим преимуществом ARM является возможность создания недорогих специализированных процессоров благодаря простому лицензированию архитектуры. Другими словами, предприимчивые компании могут создавать специализированные процессоры ARM для рынка HPC, оптимизированные под векторную обработку, ИИ-вычисления или другие типы расчётов.

«Такие процессоры будут сильно отличаться от массовых чипов для ЦОД и смогут стать большим шагом вперёд в области производительности для учёных во всём мире, которые в последние годы недовольны относительно медленным наращиванием производительности, особенно в переложении на 1 доллар, — написал Макинтош-Смит. — Таким образом, выход ARM на рынок HPC и внедрение новых идей, новаций и, соответственно, появление конкуренции, могут привести к перевороту в научных вычислениях такого масштаба, который мы в последний раз видели разве что в области потребительских CPU в конце 1990-х годов. Нас ждут увлекательные времена».

Впрочем, пока прекрасное будущее постоянно откладывается. Например, в 2014 году Calxeda свернула разработки серверных чипов ARM, а не так давно стало известно, что и Qualcomm призадумалась об уходе из этого зарождающегося бизнеса.

Cavium покупает QLogic: сделка на миллиард

Одной из быстрорастущих компаний полупроводникового сектора на фоне страдающего, в общем-то, рынка, является молодая компания Cavium. Это поставщик перспективных серверных процессоров на архитектуре ARM. При выполнении отдельных задач решения Cavium оказываются не хуже моделей Intel Xeon E5, но при этом стоят они существенно дешевле и потребляют намного меньше процессоров Intel. Также компания Cavium поставляет решения для аппаратной реализации защиты данных и отдельные решения для сетевого оборудования. Перспективы Cavium на зарождающемся рынке серверного оборудования на архитектуре ARM настолько хороши, что аналитики приписывали компании Qualcomm намерение поглотить Cavium. Однако вышло совсем не так, как предсказывали наблюдатели.

Сообщается, что компания Cavium сама договорилась купить компанию QLogic. Стоимость сделки составляет один миллиард долларов США. Для её проведения Cavium вынуждена будет взять в кредит $750 млн. За каждую акцию QLogic предложено $15,5. Из них деньгами будет выплачено по $11 за акцию, а остальное выдадут акциями Cavium. Компания QLogic представляет собой одного из крупных игроков на рынке серверных интерфейсов, включая сетевые — это крупнейший специалист по контроллерам, платам и коммутаторам для Fibre Channel и Ethernet. В 2012 году QLogic продала компании Intel бизнес и разработки по интерфейсу InfiniBand, но даже оставшаяся часть позволит компании Cavium дополнить свои процессорные платформы на ARM передовыми сетевыми интерфейсами. Иными словами, платформы Cavium станут более полными. Фактически решениями «под ключ», а это дорого стоит.

По словам Cavium, её бизнес и бизнес QLogic пересекается с точки зрения сферы клиентов на 60 %. Обе платформы — процессорная и сетевая — дополнят друг друга и существенно облегчат жизнь клиентам компании. Крупнейшими клиентами QLogic, кстати, являются компании HP, Dell и IBM. Для компании Cavium, которой необходимо продвигать серверные ARM-платформы, это хорошие связи с большой перспективой.

54-ядерные ARM-чипы Cavium ThunderX2 будут быстрее Intel Xeon E5

В прошлом году разработчики серверных версий процессоров на архитектуре ARM успешно освоили 28-нм техпроцесс. Лидеры данного направления — компании Cavium и Applied Micro — начали поставлять однокристальные сборки второго поколения, способные составить конкуренцию процессорам Intel Xeon младшего и среднего уровней производительности. Так, компания Applied Micro запустила в серию 32-ядерные процессоры X-Gene 2, а компания Cavium приступила к поставкам 48-ядерных SoC ThunderX. Отсутствие полномасштабной программной поддержки серверных сборок на архитектуре ARM всё ещё играет против новых конкурентов компании Intel, но дело, так или иначе, сдвинулось с мёртвой точки и интерес к новому направлению понемногу растёт.

Системная плата на базе микросхем Cavium ThunderX (Cavium)

Системная плата на базе микросхем Cavium ThunderX (Cavium)

Следующим шагом противников Intel станет переход на выпуск однокристальных сборок с использованием техпроцесса меньшего масштаба. Так, компания Applied Micro уже поделилась планами начать до конца текущего года выпуск 16-нм FinFET SoC X-Gene 3. На днях же стало известно об ответе компании Cavium на вызовы времени. Новым поколением серверных сборок Cavium станут 54-ядерные 14-нм FinFET решения ThunderX2. Выход новинок планируется с середины до конца следующего года, так что почва для серверных ARM продуктов «прогреется» ещё больше для получения лучших всходов.

Блок-схема 54-ядерного процессора Cavium ThunderX2 (Cavium)

Блок-схема 54-ядерного процессора Cavium ThunderX2 (Cavium)

Однокристальные сборки Cavium ThunderX2 будут нести до 54-х 64-разрядных ядер самостоятельной разработки с поддержкой инструкций ARM. Вычислительные ядра ThunderX2 поддерживают внеочередное исполнение команд и работают на частотах до 2,6 ГГц. Сетевой контроллер сборки поддерживает современный стандарт Ethernet 25 Гбит/с и набор актуальных аппаратных ускорителей. Объём разделяемой кеш-памяти может достигать 32 Мбайт. Встроенный контроллер памяти поддерживает до шести модулей стандарта DDR4.

Сравненние производительности Intel Xeon и новых решений Cavium (Cavium)

Сравнение производительности Intel Xeon и новых решений Cavium (Cavium)

Внутренние тесты сборок Cavium ThunderX2 позволяют понять, что в случае двухпроцессорных конфигураций данные решения с поддержкой инструкций ARM оказываются быстрее процессоров Intel Xeon E5 v4 (Broadwell) и на равных и даже лучше процессоров Intel Xeon E5 v5 (Skylake). Следует сказать, что, несмотря на декларируемое преимущество «телефонных» процессоров по сравнению с Intel Xeon, поставки серверных SOC на ARM всё ещё исчисляются тысячами штук, тогда как Intel поставляет на рынок миллионы процессоров Xeon. Но, как говорится, вода камень точит. Сегодня у Cavium примерно 40 клиентов на SoC ThunderX, а интерес к ThunderX2 проявили уже 54 разработчика серверных платформ.

Аналитик: Qualcomm может приобрести Cavium или Xilinx в попытке диверсифицировать бизнес

Руководство корпорации Qualcomm приняло решение не разделять бизнес компании, поскольку текущая структура позволяет как монетизировать патенты, так и расширять бизнес, имея для этого достаточное количество финансовых средств. Поскольку одним из очевидных направлений развития Qualcomm являются серверы на базе собственных процессоров, некоторые аналитики уверены в том, что компания может купить одного из участников данного рынка.

«Мы ожидаем, что внимание Qualcomm переходит к диверсификации, которая, по нашему мнению, делает крупную сделку слияния или поглощения более вероятной», — написал Срини Пажжури (Srini Pajjuri), аналитик из финансовой компании CLSA, в аналитической записке для клиентов компании. «Руководство компании обозначило сетевые решения, центр обработки данных, а также устройства Internet-of-Things как ключевые возможности [для развития]».

Сервер на базе экспериментального процессора Qualcomm

Сервер на базе экспериментального процессора Qualcomm. Фото Forbes

Аналитик считает, что основными целями для Qualcomm могут стать компании Cavium и Xilinx. Обе компании известны своими решениями для рынков телекоммуникаций, а также центров обработки данных (ЦОД). Принимая во внимание немалые амбиции Qualcomm в области серверов, покупка Cavium или Xilinx является логичной, поскольку сделка помогла бы компании получить неплохие стартовые позиции на данном рынке.

«Мы считаем, что покупка Xilinx наиболее логична, учитывая сильные позиции на рынке сетевых устройств, партнёрские отношения с Qualcomm и высокую валовую прибыль», — написал господин Пажжури. «Мы оцениваем, что потенциальная сделка с Xilinx [имеет смысл] даже при премии в 30 процентов. Мы также рассматриваем Cavium как стратегически подходящую возможность, учитывая их концентрацию на ARM-серверах и IoT. Покупка Marvell и NVIDIA маловероятна».

Суперкомпьютеры на базе решений Xilinx

Системная плата на базе микросхем Cavium ThunderX

В настоящее время Cavium демонстрирует уже разработанные серверные платформы на базе процессоров ThunderX с 48 ARMv8-совместимыми ядрами и готовится начать коммерческие поставки таких платформ. Процессоры Cavium ThunderX уже опробованы индустрией, совместимы с серверными приложениями и будут использованы рядом производителей серверов.

Qualcomm недавно показала первые серверные процессоры с 24 ядрами для центров обработки данных, ориентированные на разработчиков программного обеспечения. Данные микросхемы едва ли когда-то будут использованы в коммерческих машинах, их задача — помочь создателям ПО оптимизировать свои приложения под чипы Qualcomm. Впоследствии Qualcomm выпустит гораздо более мощные процессоры для ЦОД с большим количеством ядер и специализированной микроархитектурой. Тем не менее, до выпуска подобных CPU еще несколько лет, а до этого нужно разработать конкурентоспособные серверные платформы, которые уже сейчас есть у Cavium. Другой вопрос, что размеры Cavium чрезмерно скромны по меркам Qualcomm, а потому руководство и совет директоров могут усомниться в ценности сделки, считают аналитики. Впрочем, если размеры Cavium не станут препятствием, то, возможно, Qualcomm присмотрится и к другому перспективному поставщику процессоров для серверов на базе архитектуры ARMv8-A — Applied Micro. Данная компания также готова начать поставки соответствующих чипов на рынок уже в ближайшем будущем.

Суперкомпьютеры на базе решений Xilinx

Суперкомпьютеры на базе решений Xilinx

Xilinx, один из ведущих производителей программируемых матриц (field programmable gate arrays, FPGAs) и ряда других решений для специализированных устройств, является серьёзным игроком на рынке сетевого оборудования и суперкомпьютеров, что важно для Qualcomm. Интеллектуальная собственность, а также FPGA, CPLD и другие микросхемы Xilinx, могли бы стать солидным конкурентным преимуществом для будущих серверных платформ Qualcomm. Кроме того, компания очень рентабельна: её валовая прибыль составила 70 % в последнем квартале её финансового года. Хотя Qualcomm и Xilinx могли бы дополнить друг друга — а впоследствии стали бы серьёзной силой на рынке решений для центров обработки данных — на сегодняшний день это слишком разные компании, а потому их интеграция будет непростой.

На момент написания заметки рыночная капитализация Cavium составляла около $3,49 млрд, тогда как капитализация Xilinx была примерно $12,21 млрд. На сегодняшний день на счетах Qualcomm находится примерно 17,32 млрд, а значит, компания могла бы приобрести как Cavium, так и Xilinx, даже не обращаясь за помощью к банкам и не прибегая к обмену акциями.

Интересно отметить, что финансовые аналитики упоминают о возможности покупки Xilinx компанией Qualcomm не в первый раз за последние недели. Возможно, нет дыма без огня и компании ведут переговоры, а возможно, что все слухи — лишь вероятный сценарий развития событий.

Пополнение в семействе процессоров OCTEON от Cavium

Компания Cavium Networks, объявила о пополнении в семействе сетевых многоядерных MIPS64 процессоров OCTEON Plus. Новые OCTEON Plus CN58XX работают на частоте 1 ГГц, содержат от 4 до 16 cnMIPS64 ядер и оснащены 2 Мб разделяемого кэша второго уровня. Новые модели удваивают производительность своих предшественников CN30XX и CN31XX за счет увеличения частоты и архитектурных улучшений, но при этом сохраняют обратную совместимость с предыдущим поколением процессоров компании.
Блок-диаграмма Octeon 58XX
OCTEON Plus обеспечивает многоуровневое аппаратное ускорение сетевых приложений, ускорение обработки пакетов, QoS, TCP, ускорение алгоритмов сжатия и шифрования. Новые микропроцессоры несут на борту восемь портов Gigabit Ethernet, два порта SPI-4.2 (10 Гбит/с), PCI-X 64 бит/133 МГц, 72/144-бит контроллер памяти стандарта DDR2-800 (максимум 4 модуля по 4 Гб каждый) и, факультативно, два контроллера памяти стандарта RLDRAM II. Процессоры OCTEON поддерживаются операционными системами MontaVista Linux и Wind River VxWorks/Linux. Стоимость новых процессоров составят от $255 за четырехъядерный вариант, работающий на частоте 600МГц до $987 за 16-яденый вариант с частотой 1ГГц, в оптовых партиях от 10 тыс. штук. Продукт поступит в продажу в первом квартале 2007 года. Тематические материалы в статьях: - 16-ядерная серверная платформа Movidis x16 NAP;
- Fall Microprocessor Forum 2006: подробности.