Теги → cortex
Быстрый переход

ARM представила новые ядра Cortex-A78 и Cortex-X, а также графику Mali-G78

Британский технологический гигант ARM каждый год примерно в одно и то же время представляет новое поколение ядер центральных и графических процессоров. И этот год не стал исключением. Сегодня компания представила процессорные ядра Cortex-A78, графический процессор Mali-G78 и чип Cortex-X, отличающийся возможностью тонкой настройки производителями готовых решений на его базе.

neowin.net

neowin.net

Как заявляет компания, ядро Cortex-A78 получило самый заметный прирост производительности за всю историю ARM. Оно показывает 20 % прирост производительности по сравнению с актуальным Cortex-A77, которое лежит в основе большинства флагманских чипсетов текущего поколения. А вот Cortex-X1, первый процессор семейства Cortex-X, будет производительнее текущего флагмана на целых 30 %. Кроме того, вендоры смогут самостоятельно настраивать параметры Cortex-X1, благодаря чему смогут добиться ещё более высоких показателей производительности.

neowin.net

neowin.net

Что касается графического ускорителя Mali-G78, он представляет собой второе поколение графических процессоров на архитектуре Vallhall. ARM утверждает, что новый GPU на целых 25 % производительнее предшественника, что впечатляет ещё больше, если брать во внимание, что предыдущий чип обеспечил прирост производительности 40 % по сравнению с позапрошлогодним. Новый GPU поддерживает до 24 ядер и, по словам ARM гораздо более энергоэффективен, чем его предшественник.

Кроме того, ARM представила субпремиальный графический чип Mali-G68, который поддерживает до восьми ядер, но при том получил все возможности флагманского Mali-G78. Также был показан нейронный процессор Ethos-N78, который на 25 % эффективнее обрабатывает задачи, связанные с искусственным интеллектом. Новые продукты ARM вероятнее всего лягут в основу флагманских мобильных устройств 2021 модельного года.

MediaTek разрабатывает более дешёвый 7-нм чип с ядрами A76 и 5G

MediaTek пока не анонсировала официально свою первую однокристальную систему 5G с кодовым именем MT6885, которая должна появиться в ряде смартфонов 5G среднего класса в первом квартале 2020 года (прежде всего, в китайских марках вроде Oppo и Vivo). Известно, что чип получит встроенный модем Helio M70, ядра ЦП ARM Cortex-A77 и графику ARM Mali-G77. Теперь появилась информация о другом чипе со встроенным модемом 5G от MediaTek, но менее мощном и, конечно, более дешёвом.

Информация поступила от информатора @Digital Chat Station в Weibo, который несколько дней назад также сообщил, что Redmi разрабатывает телефон с чипом MediaTek 5G (что неудивительно, учитывая агрессивные планы Xiaomi на 2020 год в отношении 5G). По его словам, у MediaTek будет ещё одна однокристальная система 5G, которая также получит встроенный модем Helio M70, но при этом будет построена на менее мощных ядрах Cortex-A76.

Он добавил, что это будет 7-нм чип, поддерживающий сети SA и NSA и рассчитанный на применение в устройствах стоимостью около 2000 йен (~$284). Аппараты 5G по цене менее $300 с относительно неплохим процессором вполне могут найти себе аудиторию на тех рынках, где развёртываются сотовые сети следующего поколения. Поскольку чип оснащён тем же модемом, что и более мощный собрат, показатели скорости передачи данных должны остаться на прежнем уровне.

На данный момент ничего не сообщается о том, когда будет представлена новая однокристальная система Mediatek и какие производители будут использовать её в своих телефонах.

Samsung Exynos 9830 для Galaxy S11 получит ядра Cortex A77 вместо фирменных Mongoose

Для своего будущего флагманского смартфона Galaxy S11 компания Samsung готовит новую однокристальную платформу Exynos 9830, и сегодня стали известны первые подробности о характеристиках данного чипа. Сообщается, что новинка будет в значительной степени отличаться от своих предшественников.

Согласно свежим данным, компания Samsung не станет использовать в новинке нынешние или какие-либо новые версии своих собственных ядер Mongoose. Вместо этого платформа Exynos 9830 будет включать только процессорные ядра ARM Cortex.

Актуальная флагманская платформа Exynos 9825 обладает восемью ядрами, которые разделены на три кластера. Здесь есть два ядра Mongoose M4 от самой Samsung для выполнения самых тяжёлых задач, два ядра ARM Cortex A75 для более простой работы и четыре ядра ARM Cortex A55 для рядовых задач.

В свою очередь Exynos 9830 будет состоять из двух кластеров: четыре ядра ARM Cortex A55 для базовых задач и ещё четыре ядра Cortex A77 для приложений, требующих максимально высокой производительности. По сравнению с Cortex A76 новая архитектура обладают вдвое большей пропускной способностью при предсказании ветвлений, добавляет новый кеш микроопераций и заменяет nanoBTB и macroBTB на единый BTB L1 с 64 записями и задержкой в один цикл.

Точные причины, почему Samsung решила отказаться от использования своих собственных ядер в Exynos 9830, пока что неизвестны. Возможно, решение ARM просто обладает более высокой производительностью и/или лучше оптимизировано. Заметим, что недавно появились слухи, что Samsung вовсе сворачивает разработку собственных ядер.

ARM представила второе в своём роде исключительно 64-битное ядро Cortex-A34

В 2015 году ARM презентовала энергоэффективное 64/32-битное ядро Cortex-A35 для гетерогенной архитектуры big.LITTLE, а в 2016-м выпустила 32-битное ядро Cortex-A32 для носимой электроники.

А теперь, не привлекая особого внимания, компания представила 64-битное ядро Cortex‑A34. Этот продукт предлагается в рамках программы Flexible Access, открывающей разработчикам интегральных схем доступ широкому набору интеллектуальной собственности с возможностью оплачивать только те блоки, которые будут использованы в конечном продукте.

Это единственный процессор Cortex, наряду с Cortex-A65, который поддерживает только 64‑битные инструкции и несовместим с 32-битным кодом. Cortex-A34 построен на архитектуре ARMv8-A, имеет 8-ступенчатый конвейер, поддерживает симметричную многопроцессорность (SMP) в связке до 4 ядер в одном кластере и несколько последовательных кластеров SMP-процессоров, объединённых через шину AMBA 4. Объём распределённой кеш-памяти второго уровня может достигать 1 Мбайт, в том числе с коррекцией ошибок ECC.

Имеется поддержка технологии безопасности TrustZone, аппаратной виртуализации, расширений DSP, SIMD (NEON) и низкозатратных вычислений с плавающей запятой VFPv4, а также комплексной библиотеки компонентов для функций отладки и трассировки в системе CoreSight SoC-400.

ARM указывает, что Cortex-A34 будет использоваться в различных приложениях, включая промышленные устройства, электронику для «умного дома», здравоохранение и облачные вычисления. Наверняка отказ от 32-битных инструкций позволит удешевить конечный чип.

ARM представила новое мощное ядро ЦП — Cortex-A77

ARM представила свой новейший дизайн процессора — Cortex-A77. Как и прошлогодний Cortex-A76, это ядро предназначено для высококлассных задач в смартфонах и самых разных устройствах. В нём разработчик нацелен на увеличение количества исполняемых за такт команд (IPC). Тактовые частоты и энергопотребление остались примерно на уровне Cortex-A76.

В настоящее время ARM нацелена быстро наращивать производительность своих ядер. Согласно её планам, начиная с Cortex-A73 2016 года и вплоть до дизайна Hercules 2020 года компания намерена в 2,5 раза увеличить мощность ЦП. Уже переходы с 16 нм на 10 нм и затем на 7 нм позволили поднять тактовую частоту, а в совокупности с архитектурой Cortex-A75 и затем Cortex-A76, по оценкам ARM, на сегодняшний день достигнут 1,8-кратный прирост производительности. Теперь ядро Cortex-A77 позволит за счёт роста IPC нарастить производительность ещё на 20 % при прежней тактовой частоте. То есть 2,5-кратный прирост в 2020 году становится вполне реален.

Несмотря на рост IPC на 20 %, по оценкам ARM, энергопотребление A77 не возросло. Компромисс в данном случае состоит в том, что площадь кристалла A77 примерно на 17 % больше A76 при одинаковых технологических нормах. В результате стоимость отдельного ядра немного возрастёт. Если сравнивать достижение ARM с лидерами отрасли, то стоит сказать, что AMD в Zen 2 добилась роста IPC на 15 % по сравнению с Zen+, а значение IPC у ядер Intel много лет остаётся примерно на одном уровне.

Окно исполнения с изменением последовательности команд (out-of-order window size) увеличено на 25 %, до 160 единиц, что позволяет ядру нарастить параллелизм расчётов. Даже в Cortex-A76 был большой буфер адресов перехода (Branch Target Buffer), а в Cortex-A77 он был увеличен ещё на 33 %, до 8 Кбайт, что позволяет блоку предсказания ветвлений эффективно справляться с ростом количества параллельных инструкций.

Ещё более интересным новшеством стал полностью новый 1,5-Кбайт кеш, в котором хранятся макрооперации (MOP), возвращаемые из модуля декодирования. Архитектура процессора ARM декодирует инструкции из пользовательского приложения в более мелкие макрооперации, а затем разбивает их на микрооперации, передаваемые уже ядру исполнения. Кеш MOP используется для уменьшения влияния пропущенных ветвлений и сбросов, поскольку теперь макрооперации хранятся в отдельном блоке и не требуют повторного декодирования — тем самым увеличивается общая пропускная способность ядра. В некоторых нагрузках новый блок является крайне полезным дополнением к стандартному кешу инструкций.

В ядре исполнения добавлен четвёртый блок ALU и второй блок ветвлений. Четвёртый ALU увеличивает общую пропускную способность процессора в 1,5 раза за счёт возможности выполнения однотактных инструкций (таких как ADD и SUB) и двухтактных целочисленных операций вроде умножения. Два других ALU могут обрабатывать только базовые однотактные инструкции, в то время как последний блок загружается более сложными математическими операциями, такими как деление, умножение с накоплением и т. д. Второй блок ветвления внутри ядра исполнения удваивает количество одновременных переходов ветвлений, с которыми ядро может работать, что полезно в случаях, когда две из шести отправленных команд относятся к переходам ветвлений. Внутреннее тестирование в ARM показало выигрыш в производительности от использования этого второго блока переходов.

Среди других изменений ядра — добавление второго конвейера шифрования AES, увеличение пропускной способности памяти, усовершенствованный механизм предварительной выборки данных следующего поколения, позволяющий повысить эффективность энергопотребления и одновременно увеличить пропускную способность системы DRAM, оптимизации работы кеша и так далее.

Наибольший прирост наблюдается в Cortex-A77 в целочисленных операциях и вычислениях с плавающей запятой. Это подтверждается внутренними тестами ARM в SPEC, которые показали повышение производительности на 20 % и 35 % в целочисленных операциях и вычислениях с плавающей запятой соответственно. Улучшения пропускной способности памяти находятся где-то в диапазоне 15–20 %. В целом, оптимизации и изменения в A77 в среднем дают 20-процентный рост производительности по сравнению с предыдущим поколением. За счёт более новых технологических норм вроде 7 нм ULV мы можем получить дополнительные преимущества в конечных чипах.

ARM разработала Cortex-A77 для работы в связке 4+4 big.LITTLE (4 мощных ядра и 4 простых энергоэффективных). Но, учитывая увеличенную площадь новой архитектуры, многие производители в целях экономии могут представить связки 1+3+4 или 2+2+4, которые уже активно практикуются, где только одно или два ядра будут полноценными неурезанными A77.

Cortex-A65AE: первое ядро ARM с поддержкой многопоточности

Компания ARM анонсировала новое процессорное ядро, которое называется Cortex-A65AE. Оно ориентировано на использование в автомобилях, в частности, в системах автопилотирования. Новинка интересна в первую очередь тем, что оно является первым ядром с архитектурой ARM, которое поддерживает технологию многопоточности (Simultaneous Multithreading, SMT). Каждое ядро  Cortex-A65AE может обрабатывать два потока.

Новинка относится к семейству ядер Automotive Enhanced, в котором ранее присутствовали лишь ядра Cortex-A76AE, представленные в сентябре текущего года. К сожалению, компания ARM не стала раскрывать все подробности о новом ядре и не указала, чем именно оно отличается от Cortex-A76AE, кроме поддержки многопоточности. По названию Cortex-A65AE можно лишь заключить, что новинка стоит на ступень ниже представленного ранее ядра. Скорее всего разница будет выражена в производительности и стоимости.

Как сообщает ресурс AnandTech, если ядра Cortex-A76AE ориентированы в первую очередь на использование в задачах, требующих высокой пиковой производительности, то новые ядра Cortex-A65AE лучше подойдут для задач, требующих высокой скорости обработки множественных данных. По сути новые ядра должны обеспечить лучшие показатели в многопоточных нагрузках, на что указывает и поддержка SMT, тогда как Cortex-A76AE смогут показать более высокие результаты в однопоточных задачах.

Из многопоточных нагрузок, в которых с лучшей стороны сможет зарекомендовать себя ядро Cortex-A65AE, стоит выделить обработку данных с различных датчиков при автономном вождении. Для лучшей работы автопилотов число различных сенсоров постоянно увеличивается, и здесь как раз и потребуется способность процессора обрабатывать много потоков данных одновременно.

Сама ARM отметила, что новое ядро обладает в 3,5 раза более высоким темпом исполнения инструкций по сравнению с ядрами прошлого поколения. В данном случае прошлым поколением считается ядро Cortex-A53. Такой прирост у новинки будет обеспечен использованием 7-нм техпроцесса для производства, поддержкой многопоточности, а также повышением частот и IPC самой микроархитектуры.

Заметим, что так же, как и Cortex-A76AE, новое ядро Cortex-A65AE поддерживает технологии DynamIQ и Split-Lock. Первая позволяет создавать кластеры из различных по архитектуре ядер, и включать в процессор такие разномастные кластеры. Вторая же позволяет ядрам процессора либо выполнять различные задачи, либо перейти в режим блокировки и объединиться для выполнения и проверки одной задачи. В последнем случае должна обеспечиваться дополнительная безопасность.

По оценкам ARM, первые реальные массовые продукты с новыми процессорными ядрами Cortex-A65AE появятся на рынке только к 2020 году.

Ядро Samsung CPU Mongoose M4 обходит по мощи и энергоэффективности ARM Cortex-A76

Samsung работает над однокристальной системой Exynos 9820, которая, как ожидается, будет производиться с соблюдением её 7-нм FinFET-норм и появится в следующей серии смартфонов высокого класса — прежде всего, в Galaxy S10. Производительные ядра CPU чипов Samsung носят название Mongoose, а в Exynos 9820, по ожиданиям, будет использованы Mongoose M4. По производительности эти решения, как ожидается, вполне могут затмить новейшие флагманские CPU-ядра ARM Cortex-A76.

По крайней мере, Twitter-канал Ice Universe, ранее уже сообщавший верные новости о будущих продуктах, заявил, что по производительности M4 Mongoose будет мощнее Cortex-A76. Это вполне может означать более высокую тактовую частоту. Сама ARM прежде говорила, что частота Cortex-A76 может достигать 3,3 ГГц, что теоретически означает ещё более высокие показатели у Mongoose M4. Однако реалистичнее предположить, что в смартфонах частоты ARM Cortex-A76 будут находиться в пределах до 2,5–2,6 ГГц в целях энергоэффективности.

Но на производительности Mongoose M4 данные источника не ограничиваются: по словам Ice Universe, энергоэффективность ядра будет тоже заметно выше Cortex-A76. В целом же производительность Exynos 9820 в многоядерном режиме в тестовом пакете Geekbench ожидается на уровне более 13 000 очков. Если это так, то по теоретическому быстродействию будущий процессор Samsung будет на уроне с ожидаемым чипом Apple A12, который ляжет в основу iPhone 2018 года.

ARM Cortex-A76: высокопроизводительное ядро для мобильных устройств и ноутбуков

Разработчик энергоэффективных процессоров ARM представил своё новейшее решение — высокопроизводительное вычислительное ядро Cortex-A76, которое пропишется в чипах для различных устройств.

Cortex-A76 — это новое флагманское решение ARM. Данное 64-битное изделие полагается на архитектуру Armv8-A (Harvard). При производстве чипов будет применяться 7-нанометровая технология. Тактовая частота может достигать 3 ГГц и более.

В новинке реализована улучшенная концепция DynamIQ big.LITTLE. Производители могут создавать чипы с одним вычислительным кластером, включающим в себя любое количество тех или иных ядер: скажем, можно сформировать конфигурацию из двух мощных ядер Cortex-A76 и шести энергоэффективных ядер Cortex-A55.

ARM утверждает, что новинка по всем ключевым параметрам существенно превосходит предшественника в лице Cortex-A75. К примеру, при сравнении 3-ГГц 7-нанометрового изделия Cortex-A76 и 2,8-ГГц 10-нанометрового решения Cortex-A75 приводятся следующие показатели:

  • Производительность увеличена на 35 процентов;
  • Энергетическая эффективность повышена на 40 процентов;
  • Быстродействие на операциях машинного обучения увеличено до четырёх раз.

ARM выделяет несколько ключевых областей применения Cortex-A76. Это портативные компьютеры с продолжительным временем автономной работы (в том числе на базе Windows 10), смартфоны и фаблеты следующего поколения, «умные» устройства для современного цифрового дома, производительные одноплатные компьютеры, а также автомобильные системы.

Ожидается, что процессоры с вычислительными ядрами Cortex-A76 выйдут на коммерческий рынок в 2019 году. Более подробную информацию о новом изделии можно найти здесь

Глава ARM прокомментировал ситуацию с Meltdown и Spectre

В этом году выставка CES 2018 прошла в тени обсуждения уязвимостей Spectre и Meltdown, и практически каждая беседа на мероприятии обращалась к этой теме. Журналисты TechCrunch тоже воспользовались возможностью обсудить проблему с исполнительным директором ARM Саймоном Сегарсом (Simon Segars), который рассказал о безопасности, вскрытых проблемах спекулятивных вычислений современных процессоров и борьбе с ними.

Прежде всего господин Сегарс отметил, что вскрытые уязвимости показали, как много в настоящее время существует микропроцессоров. Затем он подчеркнул, что Spectre и Meltdown используют архитектурные особенности высокопроизводительных процессоров, а ARM продаёт лицензии преимущественно на чипы иного плана, так что лишь 5 % решений, использующих её архитектуры, подвержены атакам. Чтобы лучше понять масштабы этих 5 %, нужно отметить, что в настоящее время выпущено, по словам руководителя, более 120 миллиардов чипов, использующих тот или иной дизайн ARM.

Поэтому если говорить только о CPU для смартфонов или планшетов, то процент уязвимых устройств окажется гораздо больше: в той или иной степени атакам подвержены такие популярные ядра, как Cortex-A57, A72 или A9 (наряду с менее распространёнными A8, A15, A17, A73 и A75, а также R7 и R8). Более распространённые CPU-ядра ARM вроде Cortex-A7 или Cortex-A53 не подвержены уязвимостям вообще. Впрочем, речь идёт об эталонном дизайне: лицензиаты подчас вносят весьма серьёзные изменения и, например, все процессоры Apple A подвержены как Spectre, так и Meltdown. NVIDIA тоже выпускает заплатки для своих устройств на базе однокристальных систем Tegra. Подробнее о проблеме ARM рассказывает на своём сайте (19 января компания выпустила ряд дополнительных разъяснений). Там же она обещает, что все будущие её процессоры серии Cortex будут либо полностью неуязвимы к такому типу атак, либо позволят избежать их с помощью уже выпущенных заплаток для ядра ОС.

Саймон Сегарс отметил, что уже вышли обновления для операционных систем (включая, конечно, Android) против обсуждаемых уязвимостей. Тогда журналист спросил у него, как скажутся подобные заплатки на производительности устройств с чипами ARM. Руководитель ответил уклончиво: «Честно говоря, пока рано об этом говорить. Это в высокой степени будет зависеть от типа задач, от конкретного приложения». Впрочем, он сказал, что в некоторых задачах, требующих высокой производительности, скорость снизится, а также добавил: «В большинстве случаев, с которыми имеют дело пользователи — сёрфинг в Интернете, электронная почта и многие другие варианты работы мобильных устройств, — разница не будет заметной».

Журналист задал руководителю ARM вопрос и о том, что компания собирается делать, дабы избежать подобных проблем в будущем, ведь, как показала практика, аппаратные уязвимости могут быть обнаружены спустя годы. Господин Сегарс подчеркнул, что в случае с Meltdown и Spectre возможны программные заплатки, устраняющие проблему. Поэтому индустрии, по его мнению, нужно развиваться в сторону мира, в котором все подключённые к Сети устройства вроде «Интернета вещей» (IoT), телевизоров или иных составляющих «Умного дома» могли бы получать программные обновления безопасности во всё время своего жизненного цикла. Ведь сегодня подобная современная электроника подчас поставляется уже с довольно продвинутыми чипами и собственными ОС, но без механизма обновления ПО. ARM активно трудится в этом направлении, потому что рассматривает IoT в качестве огромной возможности для себя и надеется на будущее, где будут триллионы подключаемых устройств, оснащённых чипами с её архитектурами.

В целом же ситуация с Meltdown и Spectre не вызывает особого оптимизма. Microsoft после длительной паузы, наконец, возобновила выпуск обновлений для всех процессоров AMD (раньше некоторые системы с чипами вроде Opteron, Athlon и Turion X2 Ultra переставали загружаться). С обновлениями для Intel и Apple тоже не всё гладко: поступают массовые жалобы на случайные перезагрузки Windows-компьютеров и iOS-устройств после установки обновлений. Разгневанные потребители оформляют коллективные иски против производителей. Судя по происходящему, Spectre и Meltdown, как и предполагалось, будут ещё долго терзать IT-индустрию.

Новая статья: Qualcomm Snapdragon 636 и ближайшее будущее мобильных сетей

Данные берутся из публикации Qualcomm Snapdragon 636 и ближайшее будущее мобильных сетей

Qualcomm разрабатывает SoC Snapdragon 635/635 Plus и Snapdragon 670

Компания Qualcomm намерена осуществить плановое обновление своих SoC и выпустить три свежих мобильных процессора среднего уровня. Речь идёт о чипе Snapdragon 635 и его «разогнанной» версии Snapdragon 635 Plus, а также модели Snapdragon 670. Появление указанных SoC от Qualcomm стоит ожидать в I–II квартале 2018 года. 

Чип Snapdragon 635 призван устранить существующий разрыв в показателях быстродействия между SoC Snapdragon 660 и Snapdragon 630, став золотой серединой между ними. Snapdragon 635, если верить инсайдерским сводкам, выполнят по 14-нм технологическому процессу FinFET LPP.

droidholic.com

Qualcomm Snapdragon 635 будет содержать 4 высокопроизводительных ядра Cortex A73 и 4 энергоэффективных Cortex A55. Новый графический процессор обеспечит прирост мощности в сравнении с видеоускорителем Adreno 506 своего предшественника на 20 %. Не слишком впечатляющие результаты с учётом 30-процентного «GPU-буста» при переходе со Snapdragon 625 на 630. 

Что до версии Snapdragon 635 Plus, то она будет отличаться от базовой модели без плюса в названии лишь повышенными тактовыми частотами.

Близкие к делам американского производителя источники утверждают, что Qualcomm намерена презентовать в начале 2018 года и SoC Snapdragon 670 — первый 10-нм чип среди процессоров шестой серии. Базироваться он предположительно будет на ядрах Kryo 360. 

Анонс смартфонов среднего уровня с чипами Snapdragon 635/Snapdragon 635 Plus и Snapdragon 670 не задержится: мобильные устройства с перечисленным SoC дебютируют в первой половине 2018 года. 

Новые процессоры ARM созданы для самообучающихся систем

Накануне старта крупной выставки Computex в Тайбэе, на которой производители ПК покажут новые системы с процессорами Intel и AMD, мобильный конкурент ARM решил официально представить CPU и GPU нового поколения. ARM Cortex-A75 стал новым флагманским решением и обещает на 22 % более высокую производительность по сравнению с A73. Он дополняется процессором Cortex-A55, который позиционируется как наиболее энергоэффективный CPU среднего звена, когда-либо спроектированный ARM. И, наконец, третьим продуктом является графический ускоритель Mali-G72, который тоже обещает на 25 % более высокую энергоэффективность по сравнению с предшественником G71.

Улучшения в области производительности и энергоэффективности были вполне ожидаемы и предсказуемы, а вот принципиальным новшеством серии стали интегрированные вычислительные блоки, созданные специально для ускорения работы алгоритмов искусственного интеллекта и машинного обучения прямо на мобильных устройствах. Очень своевременное новшество — сегодня всё больше ИИ-алгоритмов исполняется прямо на смартфонах, без использования облачных ресурсов. Google даже представила особый API для этих целей — TensorFlowLite.

Руководитель отдела маркетинга ARM Джон Ронко (John Ronco) отмечает, что в ближайшие 3–5 лет производительность ИИ возрастёт в 50 раз за счёт оптимизаций в области архитектур, микроархитектур и ПО. Интересно, что ARM не только встраивает блоки машинного обучения в новые ядра, но и использует ИИ непосредственно в CPU. В частности, новые CPU получили улучшенный алгоритм предсказания ветвлений на основе нейронной сети, благодаря чему предварительная выборка данных становится эффективнее, повышается общая производительность.

Вдобавок британский разработчик чипов, принадлежащий сейчас японской SoftBank, существенно переработал и расширил прошлогодние оптимизации, призванные улучшить производительность в таких ресурсоёмких задачах, как виртуальная и дополненная реальность. Таким образом, ARM готовит почву для массового распространения нового поколения мобильных устройств, которые смогут эффективно обрабатывать задачи в области ИИ и VR без привлечения облачных ресурсов.

Cortex-A75 и A55 — первые CPU от ARM, созданные по принципу Dynamiq. Это означает, что конечные производители чипов вроде Qualcomm, Samsung или MediaTek получат более гибкие возможности дизайна кристаллов. Например, ранее ARM предусматривала возможность создания энергоэффективных чипов по принципу big.LITTLE, в которых кластер высокопроизводительных CPU (например, серии A7x) работает в связке с кластером энергоэффективных CPU (серия A5x). Теперь же производители могут создавать чипы с одним кластером, включающим в себя любое количество тех или иных ядер. То есть производители, без лишнего проектирования со своей стороны, могут выпускать, например, однокристальную систему с семью ядрами A55 и одним A75, чтобы достичь нужной стоимости, энергоэффективности и, когда это требуется, высокой однопоточной производительности.

Также изменения ARM Dynamiq касаются подсистемы памяти и работы кеша CPU, благодаря чему, например, поточная производительность памяти удвоилась в A55 по сравнению с A53. Именно A55 призван оказать на рынок наибольшее влияние, ведь предыдущее ядро A53 за последние 3 года было использовано в 1,7 млрд устройств. Как отмечает ARM, в большинстве задач A55 обходит ядро прошлого поколения на 10–30 %, предлагая при этом на 15 % более высокую энергоэффективность и на 18 % лучшую однопоточную производительность. Но ещё более важно, что новый дизайн делает ядро в 10 раз более конфигурируемым: производителям предложено 3000 различных вариантов конфигурации, благодаря чему они могут оптимизировать чип под конкретные собственные нужды.

Cortex-A75 тоже приносит заметные улучшения: ARM обещает, что ядро в среднем на 22 % мощнее A73, пропускная способность памяти выше на 16 %, а улучшения в тестовом пакете Geekbench, по которому любят оценивать производительность мобильных решений, достигает 34 %. Однопоточная производительность A75 увеличена на 20 % за счёт улучшения показателя числа исполняемых за такт инструкций. Площадь ядра A75 примерно в 2,5 раза больше, чем у A55, и оно создано для применения в инфраструктурных продуктах, автомобилях и ресурсоёмких мобильных приложениях вроде игр, VR и AR.

Любопытное архитектурное новшество A75 — расчёт на использование в более энергоёмких однокристальных системах с возможностью потребления до 2 Вт. За счёт этого производительность A75 может быть повышена ещё на 30 % в устройствах с большими экранами (другими словами, в планшетах и ноутбуках). Это явно сделано с прицелом на выходящую в этом году ARM-платформу Windows 10 с эмуляцией x86.

Что же касается Mali G72, то этот графический ускоритель включает 32 потоковых процессора, может предложить на 25 % возросшую энергоэффективность и на 20 % повышенную производительность на квадратный миллиметр площади кристалла. Этот GPU является важной частью инициативы ARM по ускорению расчётов искусственного интеллекта, демонстрируя на 17 % более высокую производительность в этом направлении по сравнению с G71. Но оптимизации ARM призваны прежде всего ускорять расчёты готовых алгоритмов ИИ на мобильных системах, а не задачи обучения. Задачи обучения ИИ будут пока по-прежнему производиться преимущественно на высокопроизводительных суперкомпьютерах, оснащённых графическими ускорителями AMD, NVIDIA или специализированными Google TPU.

Партнёры ARM имели доступ к дизайнам Cortex-A75 и A55 уже в конце 2016 года, так что наверняка уже работают над новыми однокристальными системами с этими ядрами. ARM считает, что реальные коммерческие продукты на базе таких SoC начнут появляться в первой четверти 2018 года. Впрочем, компания также упоминает феномен «китайской скорости», когда производители из Китая выводят на рынок продукты на базе последних наработок ARM гораздо быстрее остальных. Например, смартфон Huawei Mate 9 появился спустя всего 9 месяцев после начала лицензирования ускорителя Mali-G71. Описанный феномен может привести к тому, что первые смартфоны с ядрами A75 и A55 и ускорителем Mali-G72 появятся уже в этом году.

TP-Link анонсировала маршрутизатор Archer C5400X на базе четырёхъядерного процессора

То время, когда домашнему маршрутизатору хватало простейшего одноядерного процессора с частотой в сотни МГц, безвозвратно ушло. Растут скорости, само наполнение всемирной сети становится сложнее, и сейчас почти любой приличный маршрутизатор потребительского класса уже использует двухъядерные системы на чипе (SoC). На этом фоне новая модель TP-Link, Archer C5400X выглядит настоящим монстром.

Этот маршрутизатор, напоминающий перевёрнутого красно-чёрного паука-птицееда, имеет целых восемь антенн, работающих в режиме 4 × 4 сразу в трёх частотных диапазонах. Объединённая пиковая пропускная способность беспроводных каналов в этой модели достигает 5433 Мбит/с, и даже в диапазоне 2,4 ГГц она может составлять 1000 Мбит/с. Здесь требуются серьёзные мощности, и они у новинки есть — её сердцем является чип Broadcom BCM4908. Эта SoC выполнена с использованием 28-нм техпроцесса и имеет четыре ядра ARM Cortex-A53 с частотой 1,8 ГГц.

Режим 2,5 Гбит/с укладывается в спецификации CAT5e

Режим 2,5 Гбит/с укладывается в спецификации CAT5e

Помимо четырёх ядер, в нём есть аппаратный ускоритель алгоритмов шифрования, что полезно при использовании VPN. Он также поддерживает технологию 2.5Gb Base-X, позволяющую использовать скорость 2,5 Гбит/с с обычными кабелями CAT5e. Проводных портов у новинки восемь, но реализован ли в них режим 2,5 Гбит/с, пока неизвестно. С такими мощностями Archer C5400X претендует на роль домашнего сервера, и на то у него есть основания: новинка оснащена встроенным флеш-накопителем ёмкостью 16 Гбайт и поддерживает подключение дополнительных дисков или SSD. Цена Archer C5400X не оглашается, но в данном случае явно не стоит рассчитывать на дешевизну.

Новые ядра ARM Cortex-M23/M33 имеют встроенные функции безопасности

Компания ARM анонсировала новый дизайн процессорного ядра, предназначенный для использования в среде «Интернета вещей» (IoT). Точнее, речь идёт о двух процессорных ядрах — Cortex-M23 и Cortex-M33. Это первые разработки компании, в которых воплощена архитектура ARMv8-M с расширенными возможностями в области информационной безопасности, что очень важно для сферы IoT.

Серия Cortex-M отличается экономичностью при достаточно высокой производительности и широко используется в различных системах, требующих низкого потребления энергии и работающих с различными беспроводными (а значит, и потенциально уязвимыми для атак извне) интерфейсами. В Cortex-M23/M33 реализована технология доверенного выполнения (TrustZone), которая существенно повышает уровень информационной безопасности таких систем.

Парк устройств класса IoT растёт быстрыми темпами, к 2035 году ожидается, что их количество достигнет одного триллиона. Большинство устройств будут общаться друг с другом посредством облаков, поэтому наличие технологий безопасности в чипах стоимостью менее $1 придётся как нельзя более к месту. Здесь-то и придут на помощь ядра Cortex-M23/Cortex-M33, которые заменят собой более ранние устаревшие модели Cortex-M0/0+ и Cortex M3/4 соответственно.

Новый дизайн рассчитан на использование техпроцесса TSMC 40-нм LP, но возможно использование новых ядер и в виде реализации с помощью FPGA. По предварительным прикидкам, старшая модель, Cortex-M33, будет быстрее на 9‒20 %, нежели Cortex-M4. Другое ядро, Cortex-M23, спроектировано с целью миниатюризации. Задача превосходства над M0 не ставилась, но всё же новинка будет несколько быстрее. Она найдёт своё место в наиболее компактных устройствах класса IoT, таких как различные миниатюрные датчики, камеры и тому подобные решения.

Системная плата AMD LeMaker Cello испытывает проблемы с шиной PCIe

Сегодня на рынке полно различных вариантов миниатюрных системных плат на базе архитектуры ARM — от скромной по характеристикам, но очень популярной Raspberry Pi, до мощных наборов разработчика, оснащенных новейшими чипами NVIDIA Tegra. Подобное решение есть и у Advanced Micro Devices, оно базируется на процессоре Opteron A1120 и называется LeMaker Cello. Она разработана партнёром AMD, компанией LeMaker. Сам процессор достаточно мощен: он содержит в своём составе четыре ядра ARM Cortex-A57, имеет 2 Мбайт кеша L2 и 8 Мбайт кеша L3. В отличие от большинства подобных продуктов, оснащённых фиксированным объёмом оперативной памяти, Cello поддерживает обычные модули DDR3-SODIMM, причём работают они в двухканальном режиме.

Частота процессорных ядер достаточно высока — 1,7 ГГц. Вкупе с объёмным кешем и теплопакетом всего 25 ватт это должно было сделать LeMaker Cello весьма удачной платформой, тем более что в составе процессора имеются вспомогательные ядра Cortex-A5. Данная платформа должна была стать доступной уже начиная со второго квартала 2016 года, благо и цена на неё установлена не запредельная — всего $299, однако платы LeMaker Cello в продаже до сих пор нет и вот почему: Opteron A1120 не имеет интегрированного графического ядра и полагается на внешний слот PCI Express x16 (электрически 8 линий PCIe 3.0). Теоретически это позволяет использовать любую видеокарту, имеющую соответствующие драйверы для Red Hat, CentOS или Debian Linux.

Но именно со слотом расширения и имеются проблемы, что признаёт сам разработчик. На данный момент выяснено, что причина проблем не кроется в аппаратном обеспечении. Проведя тщательную проверку, разработчики LeMaker Cello выяснили, что на аппаратном уровне дефектов нет, тем более что все остальные интерфейсы, включая SATA и Ethernet, работают нормально. Похоже, все проблемы, связанные с PCI Express, имеют программную природу и могут быть разрешены путём выпуска соответствующего обновления прошивки, над чем создатели платы совместно с AMD сейчас и работают. В настоящее время покупатели могут заказать LeMaker Cello с нерабочим слотом PCIe, в качестве компенсации производитель предлагает бесплатный кулер (изначально платформа им не комплектуется).

window-new
Soft
Hard
Тренды 🔥