Теги → mali
Быстрый переход

ARM представила нейропроцессоры Ethos-N57 и N37, графику Mali-G57 Valhall и Mali-D37

ARM представила сразу четыре новых продукта. Это процессоры для машинного обучения Ethos, дополняющие существующую модель N77 более простыми N57 и N37; первый графический ускоритель среднего класса на совершенно новой архитектуре Valhall в лице нового Mali-G57; дисплейный процессор среднего уровня в лице Mali-D37.

Нейропроцессоры Ethos

Впервые ARM рассказала о своих новых нейропроцессорах (NPU) в начале прошлого года под именем Project Trillium. В этом году на конференции TechCon компания официально представила эти продукты уже под рыночной маркой Ethos, а N77 стал первым представителем семейства.

Теперь компания сообщила, что Ethos N77 может оснащаться объёмом памяти SRAM от 1 до 4 Мбайт, хотя в прошлом году сообщалось, что максимальный объём составит лишь 1 Мбайт. ARM пояснила, что производителям на практике для эффективной работы алгоритмов машинного обучения потребовалась дополнительная память. Флагманский NPU обеспечивает максимальную теоретическую производительность порядка 4 TOPS при тактовой частоте в 1 ГГц, а эффективность при этом составляет 5 TOPS/Вт.

Все представители семейства Ethos по сути собираются из одних и тех же строительных блоков. Все NPU используют один и тот же вычислительный движок MAC (MCE, MAC computation engine) и движки программируемого уровня (PLE, programmable layer engine). MCE состоит из 128 блоков MAC и работает в связке с PLE. Блоки MCE, PLE и память SRAM формируют блок (CE, computation engine) — количество таких блоков и есть главное отличие между NPU. N77, N57 и N37 включают соответственно 16, 8 и 4 блока CE.

Варианты Ethos среднего и начального уровня достигнут рынка гораздо быстрее, чем другие новые разработки ARM: компания объясняет это тем, что спрос на технологии машинного обучения в недорогих чипах со строгими ограничениями площади кристалла необычайно высок. Появление таких блоков NPU в однокристальных системах начального уровня позволяет реализовать в недорогих аппаратах функции вроде продвинутого распознавания лиц.

Новые NPU уже лицензированы и используются клиентами ARM в своих разработках.

Mali-G57 — первый ГП среднего уровня на базе Valhall

Ранее в этом году ARM представила новую графическую архитектуру Valhall в лице флагманского ускорителя Mali-G77, которую мы должны увидеть в однокристальных системах 2020 года. Новая архитектура ГП — это значительный уход от предыдущих ускорителей семейства Bifrost: был полностью переработан графический конвейер и вычислительная микроархитектура.

Теперь ARM представила ускоритель Mali-G57 — версию Valhall для чипов среднего класса. В настоящее время компания не делится особыми подробностями о том, что упрощено в G57, но решение будет очень похоже на урезанный и уменьшенный в размерах ГП Mali-G77, по аналогии с изменениями в G52 по сравнению с G72.

Компания обещает, что Mali-G57 с тремя исполнительными движками на ядро (3EE) по сравнению с G52 в той же конфигурации сможет показать на 30 % более высокую энергоэффективность и на 30 % более эффективное использование площади кристалла (благодаря росту производительности).

Ну и, наконец, ARM выпустила на рынок новый дисплейный процессор среднего класса в форме Mali-D37. Это решение основано на архитектуре Komeda, которая впервые была представлена ​​в Mali-D71 и его следующей версии — объявленном в этом году DPU Mali-D77. Новый дисплейный процессор D37 нацелен на разрешения экранов 2K и Full HD и обещает занять менее 1 мм² площади кристалла при производстве с соблюдением старых 16-нм норм.

Дисплейный процессор ARM Mali-D77 решает некоторые проблемы VR

В последние пару лет продвижение виртуальной реальности несколько забуксовало из-за сочетания дорогого оборудования, невысокой производительности, отсутствия достаточного количества контента и прочих сложностей. В настоящее время отрасль застряла в сценарии «яйцо или курица», когда нехватка пользователей сдерживает инвестиции в разработку высококачественных игр и других цифровых материалов. Для выхода из тупика нужны более мощные и доступные аппаратные платформы VR.

ARM нацелилась решить некоторые существующие технические проблемы VR, представив свой первый дисплейный процессор, разработанный специально для VR: Mali-D77. Этот блок призван взять на себя некоторые задачи обработки VR, которые сейчас лежат на графическом процессоре, высвободив ресурсы последнего для повышения частоты кадров, а также должен снизить эффект морской болезни, наблюдаемый у некоторых пользователей VR-гарнитур.

В значительной степени Mali-D77 развивает блок Mali-D71 2017 года. Он имеет тот же декодер сжатия, поддержку HDR и блоки управления цветом. Тем не менее, новый дизайн был оптимизирован для разрешений 3K с частотой до 120 кадров/с и разрешений 4K с частотой до 90 кадров/с.

Основные изменения касаются интеграции двух совершенно новых аппаратных ускорителей для VR-задач. Mali-D77 позволяет проводить аппаратную коррекцию искажений объектива и поддерживает технологию Asynchronous Timewarp, вместо того чтобы запускать эти алгоритмы на графическом процессоре. Это позволяет высвободить около 15 % ресурсов ГП. Вдобавок снижаются требования к полосе пропускания на 40 % и уменьшается потребляемая мощность на 180 мВт.

Алгоритм коррекции линз требуется в VR-гарнитурах, чтобы компенсировать кривизну объективов шлемов. Бочкообразные искажения применяются к каждому визуализированному кадру. Традиционно это делается средствами GPU. Кроме того, Mali-D77 выполняет коррекцию хроматических аберраций с использованием аналогичного метода обратного искажения. Благодаря этому на углах кадра не будет наблюдаться расхождение цветов.

Технология Asynchronous Timewarp немного более сложна. ARM использует процессор дисплея, чтобы вращать, наклонять и деформировать изображение с целью компенсировать движения пользователя и сделать VR-окружение более естественным, плавным и качественным. Разрыв реакции между движениями тела и визуальным обновлением картинки в шлеме является основной причиной возникновения у пользователей эффекта тошноты и укачивания, и Mali-D77 может очень помочь в этом отношении.

Данные о смещении по осям X, Y, Z поступают непосредственно в Mali-D77 от ЦП, полностью минуя стадию ГП. Это совершенно другой принцип работы Asynchronous Timewarp, который требует от разработчиков использования нового набора инструментов и методов разработки. К счастью, инженеры ARM тесно сотрудничают с такими организациями, как OpenXR, поэтому наверняка появятся API и инструменты упрощённой разработки.

В целом, ARM Mali-D77 — разумное и логичное развитие идеи гетерогенных вычислений, помогающее решить некоторые из самых серьёзных проблем виртуальной реальности (особенно актуальные для мобильных шлемов). Есть ещё масса препятствий вроде точности отслеживания движений, беспроводной связи и так далее, но Mali-D77 — важный шаг в правильном направлении.

Графический процессор ARM Mali-G77 стал на 40 % быстрее

Наряду с новым процессорным ядром Cortex-A77 компания ARM представила графический процессор, предназначенный для мобильных однокристальных систем следующего поколения. Mali-G77, который не следует путать с новым процессором дисплея Mali-D77, знаменует собой переход с архитектуры ARM Bifrost и на Valhall.

ARM декларирует существенный прирост графической производительности Mali-G77 — на 40 % по сравнению с современным поколением Mali-G76. Это достигнуто как за счёт техпроцесса, так и архитектурных улучшений. Mali-G77 может иметь от 7 до 16 ядер (в перспективе возможно масштабирование от 1 до 32), причём каждое из них почти такого же размера, как у ​​G76. Следовательно, высокопроизводительные смартфоны, вероятно, будут оснащаться тем же количеством ядер ГП.

В играх можно ожидать повышения быстродействия ​​на уровне от 20 до 40 %, в зависимости от типа графических нагрузок. Судя по результатам популярного теста Manhattan GFXBench, существенное превосходство нового графического процессора над текущим поколением заставит озаботиться и конкурирующую компанию Qualcomm о значительном улучшении производительности графики Adreno.

По словам ARM, сама по себе новая архитектура Mali-G77 обеспечивает в среднем 30-процентное улучшение энергоэффективности или производительности. Второе поколение скалярной архитектуры ARM Valhall позволяет графическому процессору параллельно исполнять 16 команд за цикл на CU по сравнению с восемью в Bifrost (Mali-G76). Среди других новшеств: полностью аппаратно управляемое динамическое планирование команд и совершенно новый набор команд с сохранением обратной совместимости с Bifrost. Добавлена также поддержка формата сжатия ARM AFBC1.3 и другие новшества (FP16 render targets, layered rendering и vertex shader outputs).

В Bifrost CU содержали 3 движка исполнения команд, каждый из которых включал кеш инструкций, регистр и блок управления Warp. Распределение по этим трём движкам позволяло выполнять 24 инструкции FMA с 32-битной точностью расчётов с плавающей запятой (FP32). В Valhall каждый CU обладает лишь одним движком исполнения команд, разделённым между двумя вычислительными модулями, способными обрабатывать по 16 команд Warp за такт, то есть обеспечивается общая пропускная способность в 32 инструкции FMA FP32 на CU. Благодаря этим архитектурным изменениям, при параллельных расчётах Mali-G77 может выполнять на треть больше математических расчётов по сравнению с Mali-G76.

Кроме того, каждый из этих вычислительных модулей CU содержит два новых математических функциональных блока. Новый модуль преобразования (CVT) обрабатывает основные целочисленные, логические, ветвящиеся и инструкции преобразования. Блок специальных функций (SFU) ускоряет операции умножения целых чисел, деления, квадратного корня, логарифмов и других сложных целочисленных функций.

В стандартном блоке FMA есть несколько настроек, поддерживающих выполнение 16 инструкций FP32 за цикл, 32 — FP16 или 64 — INT8 Dot Product. Эти оптимизации могут обеспечить повышение производительности в приложениях машинного обучения на значение до 60 %.

Другое ключевое изменение в Mali-G77 — это удвоение производительности текстурного модуля, который теперь обрабатывает 4 билинейных текселя за такт по сравнению с двумя ранее, 2 трилинейных текселя за такт, обеспечивая более быструю фильтрацию FP16 и FP32.

ARM внесла и ряд других изменений, в результате чего Mali-G77 и Valhall обещают значительное повышение производительности для игровых нагрузок и задач машинного обучения. Важно отметить, что энергопотребление и площадь чипа сохранены на уровне Bifrost, что обещает выпуск мобильных устройств с более высокой пиковой производительностью без повышения требований к электропотреблению, теплоотводу и размеру.

ARM выведет графические возможности смартфонов на новый уровень

Компания ARM анонсировала графический процессор следующего поколения Mali-G76, а также высокопроизводительный видеопроцессор Mali-V76.

Изделие Mali-G76 может насчитывать до 20 потоковых процессоров. По сравнению с предшественником — Mali G72 — новое решение способно обеспечивать на 30 % более высокую энергетическую эффективность и на 30 % более высокую производительность в расчёте на единицу площади кристалла.

При создании Mali-G76 большое внимание было уделено средствам машинного обучения: быстродействие на соответствующих операциях по сравнению с Mali G72 увеличилось в 2,7 раза.

Для новинки заявлена поддержка программных интерфейсов OpenGL ES 1.1, 2.0, 3.1, 3.2, Vulkan 1.1 и OpenCL 1.1, 1.2, 2.0.

Графический процессор Mali-G76 будет применяться в смартфонах топового уровнях, устройствах виртуальной и дополненной реальности, автомобильных комплексах и пр.

Что касается видеопроцессора Mali-V76, то главной особенностью этого решения является поддержка стандарта 8К — видео ультравысокого разрешения (7680 × 4320 пикселей).

Утверждается, что чип Mali-V76 позволит декодировать видеопоток в формате 8К со скоростью до 60 кадров в секунду. Кроме того, возможно формирование видеостен по схеме 4 × 4 в формате 1080р (60 кадров в секунду) или 2 × 2 в формате 2160р (60 кадров в секунду).

Видеопроцессор будет применяться в мобильных устройствах премиум-класса, шлемах виртуальной реальности высокого разрешения, системах видеонаблюдения и в других продуктах. 

ARM представила новые ускорители Mali G52 и G31

ARM объявила о выпуске нового семейства мультимедийных продуктов Mali, состоящего из графических процессоров G52 и G31, блока вывода изображения D51 и видеопроцессора V52, ориентированных на средний и начальный сегменты рынка. Сегодня самый сильный рост мобильного рынка происходит в Китае. Поэтому акцент на менее дорогие решения неслучаен.

Прежде всего, следует сказать о новом графическом ускорителе Mali-G52, который выступает наследником представленного в октябре 2016 года G51. Последний был весьма странным решением: производители предпочитали использовать вместо него G71 и G72 в конфигурациях с небольшим количеством ядер, так что потребительских однокристальных систем с G51 мы так и не увидели. ARM заявляет, что сектор ТВ-решений тоже активно формирует спрос на графику среднего уровня, но эти специализированные чипы публику обычно не особенно волнуют.

Так или иначе, но G52 обещает существенный прирост в 30 % по соотношению производительности на единицу площади конечного кристалла. Эффективность повышена не так сильно — всего на 15 % по сравнению с G51.

Одно из основных изменений, которые позволило добиться такого улучшения, является удвоение линий ALU в конвейере исполнения (EU), потому что оно увеличивает общую площадь ядра лишь примерно в 1,22 раза. На сегодняшний день ALU для архитектуры Bifrost (G71, G72, G51) включает в себя FMA и блок ADD/SF. Конвейер исполнения состоял из четырёх таких линий, а в G52 компания впервые удвоила их количество. В будущем такие же изменения можно ожидать и в GPU более высокого класса.

Чтобы предоставить клиентам больше выбора в создании конфигураций, ориентированных на вычисления или скорость заполнения, ARM позволяет использовать G52 с базовыми настройками, содержащими два или три EU. ARM также обещает прирост скорости машинного обучение в 3,6 раза за счёт того, что новые ALU могут обрабатывать 8-бит операции скалярного произведения (8-bit Dot Product).

Теперь стоит перейти к G31. До последнего времени нужды чипов начального уровня покрывал ускоритель Mali-400, который является самым успешным GPU компании ARM, и, вероятно, самым успешным графическим ускорителем вообще, так как ему скоро стукнет 10 лет, а он по-прежнему появляется в новых продуктах. Но сегодня операционные системы и новые вычислительные задачи делают поддержку OpenGL ES 3.0 и Vulkan обязательным требованием, чего старый-добрый Mali-400 не умеет.

Mali-G31 и призван, наконец, заменить Mali-400 в самых дешёвых чипах для смартфонов. G31 основан на G51, но использует только два блока исполнения шейдеров и поддерживает конфигурации лишь с одним или двумя ядрами против 1—4 у G51. В одноядерной конфигурации G31 обещает 20-процентную экономию площади кристалла по сравнению с G51MP2 и на 12 % более высокую производительность в задачах отрисовки пользовательского интерфейса (вероятно, речь идёт об эффективности скорости заполнения). ARM отмечает, что Mali-G31 — самый компактный GPU с поддержкой OpenGL ES 3.2 и Vulkan.

Блок обработки видео Mali-V52 является наследником V61, представленного также в конце 2016 года вместе с G51. V52 старается перенести возможности V61 на решения среднего класса. Он позволяет кодировать и декодировать аппаратно видеоролики 4K с частотой 60 кадров/с (против 120 кадров/с у V61). При этом ARM внесла ряд улучшений, так что в результате при площади на 38 % меньше, одноядерный вариант Mali-V52 поддерживает декодирование видео HEVC, H.264 и VP9 в разрешении 4K при 30 кадрах/с или 1080p при 120 кадрах/с (для сравнения: одноядерный вариант Mali-V61 обеспечивает воспроизведение лишь 1080p при 60 кадрах/с).

ARM также говорит, что для кодирования в формате HEVC новая архитектура за счёт улучшенных эвристических алгоритмов при управлении размерами блоков кодека позволяет достигать на 20 % более высокого качества при прежнем битрейте. Среди других упомянутых особенностей Mali-V52 есть возможность одновременного декодирования 16 видеороликов в HD-разрешении и передаче их блоку вывода изображений одним кадром. В целом за счёт появления такого мощного, и относительно нетребовательного к площади, видеорешения можно вполне ожидать появления улучшенной поддержки 10-бит HDR 4K-видео в большем количестве смартфонов среднего и начального уровня.

Наконец, последний представленный продукт — блок вывода изображений Mali-D51 является наследником DP650 и упрощением Mali-D71. Решение вдвое эффективнее с точки зрения площади кристалла и поддерживает до 8 слоёв композиции, как и D71.

Уникальность блоков вывода изображений ARM в том, что они позволяют осуществлять ряд задач визуализации пользовательского интерфейса (компоновки, линейного вращения, высококачественного масштабирования, повышения или уменьшения контрастности и прочее), снижая нагрузку с графического процессора и увеличивая энергоэффективность.

ARM анонсировала Mali-D71 и другие IP-блоки для дисплеев

ARM представила новый процессор дисплея (часть видеоадаптера, читающая данные из буфера кадра и преобразовывающая их в соответствующие значения пикселей для вывода на экран монитора) — Mali-D71, а также два тесно связанных с ним IP-блока CoreLink MMU-600 и Assertive Display 5, отвечающих соответственно за реализацию 4K VR и HDR на экранах мобильных устройств.

Предварительно D71 был представлен в мае под кодовым именем Mali-Cetus. Он использует новую архитектуру дисплея Komeda и вместе с новым блоком управления памятью MMU-600 позволяет в реальном времени выводить до 120 кадров в разрешении 4K. Тем временем Assertive Display 5 приносит поддержу HDR и улучшенное управление цветом и гаммой вдобавок к компенсации солнечного освещения и набору энергосберегающих функций из прошлых версий технологии.

Все три блока были разработаны параллельно и в случае совместного применения обеспечивают взаимные оптимизации для VR- и HDR-возможностей. D71 и MMU-600 позволяют добиться высоких разрешений и частоты кадров, тогда как Assertive Display 5 включает HDR-возможности и адаптацию к различным типам экранов. Прежде всего, новые решения нацелены на применение в смартфонах и планшетах, но соответствующие блоки предыдущего поколения ранее также использовались в VR-шлемах, телевизорах и ТВ-приставках.

D71 предлагает действительно существенные архитектурные преимущества по сравнению с Mali-DP650 и более старыми процессорами дисплеев, которые создавались прежде всего для эффективной работы с экранами разрешением менее 4K. ARM утверждает, что площадь связки D71 и MMU-600 на 55 % меньше DP650 и MMU-500, а допустимые задержки снижены вчетверо (что особенно важно для виртуальной реальности). Новые аппаратные блоки снижают нагрузку GPU для экономии энергии. Кроме того, они оптимизированы для Hardware Composer HAL (HWC) и для многоэкранного режима Android. Наконец, в целях безопасности MMU-600 также включает TrustZone Media Protection (TZMP).

Прежний блок Assertive Display предлагал ряд аппаратных решений для тонального отображения, обработки пикселей и автоматической регулировки яркости для экономии энергии или компенсации прямого солнечного света. Assertive Display 5 вдобавок приносит поддержку HDR10 и Hybrid Log-Gamma (HLG), а также возможность преобразования HDR в SDR и HDR в HDR. В основе лежит движок тонального отображения iridix8-HDR, благодаря чему блок может формировать картинку, оптимизированную под характеристики конкретного дисплея. Наконец, Assertive Display 5 включает фильтрацию ультрафиолета. Благодаря всем этим новым функциям ARM собирается обеспечить качественное отображение цветов в различных условиях освещения как на новых HDR-, так и на старых SDR-панелях. То есть некоторый эффект от воспроизведения HDR-контента будет ощущаться и на обычных SDR-панелях.

Assertive Display 5 является первой полноценной разработкой ARM после поглощения Apical — разработчика предыдущих решений. D71, MMU-600 и Assertive Display 5 уже доступны аппаратным партнёрам ARM, а в реальных устройствах технология появится примерно в начале 2019 года.

Новые процессоры ARM созданы для самообучающихся систем

Накануне старта крупной выставки Computex в Тайбэе, на которой производители ПК покажут новые системы с процессорами Intel и AMD, мобильный конкурент ARM решил официально представить CPU и GPU нового поколения. ARM Cortex-A75 стал новым флагманским решением и обещает на 22 % более высокую производительность по сравнению с A73. Он дополняется процессором Cortex-A55, который позиционируется как наиболее энергоэффективный CPU среднего звена, когда-либо спроектированный ARM. И, наконец, третьим продуктом является графический ускоритель Mali-G72, который тоже обещает на 25 % более высокую энергоэффективность по сравнению с предшественником G71.

Улучшения в области производительности и энергоэффективности были вполне ожидаемы и предсказуемы, а вот принципиальным новшеством серии стали интегрированные вычислительные блоки, созданные специально для ускорения работы алгоритмов искусственного интеллекта и машинного обучения прямо на мобильных устройствах. Очень своевременное новшество — сегодня всё больше ИИ-алгоритмов исполняется прямо на смартфонах, без использования облачных ресурсов. Google даже представила особый API для этих целей — TensorFlowLite.

Руководитель отдела маркетинга ARM Джон Ронко (John Ronco) отмечает, что в ближайшие 3–5 лет производительность ИИ возрастёт в 50 раз за счёт оптимизаций в области архитектур, микроархитектур и ПО. Интересно, что ARM не только встраивает блоки машинного обучения в новые ядра, но и использует ИИ непосредственно в CPU. В частности, новые CPU получили улучшенный алгоритм предсказания ветвлений на основе нейронной сети, благодаря чему предварительная выборка данных становится эффективнее, повышается общая производительность.

Вдобавок британский разработчик чипов, принадлежащий сейчас японской SoftBank, существенно переработал и расширил прошлогодние оптимизации, призванные улучшить производительность в таких ресурсоёмких задачах, как виртуальная и дополненная реальность. Таким образом, ARM готовит почву для массового распространения нового поколения мобильных устройств, которые смогут эффективно обрабатывать задачи в области ИИ и VR без привлечения облачных ресурсов.

Cortex-A75 и A55 — первые CPU от ARM, созданные по принципу Dynamiq. Это означает, что конечные производители чипов вроде Qualcomm, Samsung или MediaTek получат более гибкие возможности дизайна кристаллов. Например, ранее ARM предусматривала возможность создания энергоэффективных чипов по принципу big.LITTLE, в которых кластер высокопроизводительных CPU (например, серии A7x) работает в связке с кластером энергоэффективных CPU (серия A5x). Теперь же производители могут создавать чипы с одним кластером, включающим в себя любое количество тех или иных ядер. То есть производители, без лишнего проектирования со своей стороны, могут выпускать, например, однокристальную систему с семью ядрами A55 и одним A75, чтобы достичь нужной стоимости, энергоэффективности и, когда это требуется, высокой однопоточной производительности.

Также изменения ARM Dynamiq касаются подсистемы памяти и работы кеша CPU, благодаря чему, например, поточная производительность памяти удвоилась в A55 по сравнению с A53. Именно A55 призван оказать на рынок наибольшее влияние, ведь предыдущее ядро A53 за последние 3 года было использовано в 1,7 млрд устройств. Как отмечает ARM, в большинстве задач A55 обходит ядро прошлого поколения на 10–30 %, предлагая при этом на 15 % более высокую энергоэффективность и на 18 % лучшую однопоточную производительность. Но ещё более важно, что новый дизайн делает ядро в 10 раз более конфигурируемым: производителям предложено 3000 различных вариантов конфигурации, благодаря чему они могут оптимизировать чип под конкретные собственные нужды.

Cortex-A75 тоже приносит заметные улучшения: ARM обещает, что ядро в среднем на 22 % мощнее A73, пропускная способность памяти выше на 16 %, а улучшения в тестовом пакете Geekbench, по которому любят оценивать производительность мобильных решений, достигает 34 %. Однопоточная производительность A75 увеличена на 20 % за счёт улучшения показателя числа исполняемых за такт инструкций. Площадь ядра A75 примерно в 2,5 раза больше, чем у A55, и оно создано для применения в инфраструктурных продуктах, автомобилях и ресурсоёмких мобильных приложениях вроде игр, VR и AR.

Любопытное архитектурное новшество A75 — расчёт на использование в более энергоёмких однокристальных системах с возможностью потребления до 2 Вт. За счёт этого производительность A75 может быть повышена ещё на 30 % в устройствах с большими экранами (другими словами, в планшетах и ноутбуках). Это явно сделано с прицелом на выходящую в этом году ARM-платформу Windows 10 с эмуляцией x86.

Что же касается Mali G72, то этот графический ускоритель включает 32 потоковых процессора, может предложить на 25 % возросшую энергоэффективность и на 20 % повышенную производительность на квадратный миллиметр площади кристалла. Этот GPU является важной частью инициативы ARM по ускорению расчётов искусственного интеллекта, демонстрируя на 17 % более высокую производительность в этом направлении по сравнению с G71. Но оптимизации ARM призваны прежде всего ускорять расчёты готовых алгоритмов ИИ на мобильных системах, а не задачи обучения. Задачи обучения ИИ будут пока по-прежнему производиться преимущественно на высокопроизводительных суперкомпьютерах, оснащённых графическими ускорителями AMD, NVIDIA или специализированными Google TPU.

Партнёры ARM имели доступ к дизайнам Cortex-A75 и A55 уже в конце 2016 года, так что наверняка уже работают над новыми однокристальными системами с этими ядрами. ARM считает, что реальные коммерческие продукты на базе таких SoC начнут появляться в первой четверти 2018 года. Впрочем, компания также упоминает феномен «китайской скорости», когда производители из Китая выводят на рынок продукты на базе последних наработок ARM гораздо быстрее остальных. Например, смартфон Huawei Mate 9 появился спустя всего 9 месяцев после начала лицензирования ускорителя Mali-G71. Описанный феномен может привести к тому, что первые смартфоны с ядрами A75 и A55 и ускорителем Mali-G72 появятся уже в этом году.

Ускоритель ARM Mali-G51 выведет графику смартфонов среднего класса на новый уровень

Компания ARM, купленная японским гигантом SoftBank за $31,4 млрд, представила графический процессор Mali-G51 и видеопроцессор Mali-V61.

Ускоритель ARM Mali-G51, как утверждается, наделит мобильные устройства среднего класса графическими возможностями премиального уровня. В частности, говорится о поддержке передовых игр, приложений виртуальной реальности (VR) и о возможности использования функций дополненной реальности.

ARM Mali-G51 использует архитектуру Bifrost. По заявления разработчиков, новое изделие — это самый маленький и наиболее эффективный графический процессор ARM с поддержкой программного интерфейса Vulkan и разрешений вплоть до 4К.

По сравнению с изделием ARM Mali-T830 чип ARM Mali-G51 обеспечивает прирост производительности до 60 % в расчёте на 1 мм2 площади. Одновременно достигается повышение энергетической эффективности до 60 %. По сравнению с предшественником новый процессор на 30 % компактнее.

Видеопроцессор Mali-V61, в свою очередь, обеспечивает эффективную потоковую трансляцию видео в режиме реального времени. Возможно использование форматов от 1080p@60 (одно ядро) до 4K@120 (несколько ядер). Заявлена поддержка кодеков HEVC и VP9.

Новые изделия уже доступны для лицензирования. Ожидается, что первые устройства с графическим чипом ARM Mali-G51 появятся в 2018 году. 

Анонсирован мобильный процессор Huawei Kirin 960

Компания Huawei анонсировала новейший мобильный процессор Kirin 960, который должен будет заменить выпущенный в прошлом году чип Kirin 950. Как и предполагалось ранее, в состав новинки вошли четыре высокопроизводительных ядра ARM Cortex-A73 с частотой, способной достигать 2,4 ГГц, и четыре экономичных ядра ARM Cortex-A53 с максимальной частотой 1,8 ГГц. Новый процессор Huawei выпускается на мощностях TSMC с использованием 16-нм техпроцесса FinFET.

Ожидается, что данная «система на чипе» станет основой нового смартфона Huawei Mate 9. В предыдущей версии Kirin за графические возможности отвечала подсистема на базе архитектуры ARM Mali-T880 MP4, сейчас же ей на смену пришла новейшая графика Mali-G71 в восьмиядерной конфигурации (MP8). В сравнении с T880 MP4 новая графика потребляет на 20 % меньше энергии и в пересчёте на 1 квадратный миллиметр быстрее на 40 %. В абсолютном выражении новый графический процессор быстрее на 180 %.

Для выполнения вспомогательных задач в составе чипа имеется экономичный сопроцессор i6. Huawei Kirin 960 поддерживает интерфейс UFS 2.1 для подключения флеш-хранилища и способен работать с памятью LPDDR4. Кроме того, модернизации подверглась модемная часть: новый чип получил поддержку LTE Cat. 12/13, а значит, теперь теоретическая скорость скачивания данных может достигать внушительных 600 Мбит/с, а скорость обратного потока — 150 Мбит/с. Есть нововведения и в области надёжности хранения данных: Kirin 960 получил встроенный сопроцессор безопасности и поддержку технологии Qualcomm Secure Execution Environment.

Computex 2016: ARM представила производительное ядро Cortex-A73 и ускоритель Mali-G71

Британская компания ARM представила Cortex-A73 — своё самое миниатюрное и наиболее эффективное вычислительное ядро для мобильных процессоров следующего поколения.

Изделие будет производиться по 10-нанометровой технологии FinFET. Ядро использует архитектуру ARMv8-A; тактовая частота может достигать 2,8 ГГц. Утверждается, что по сравнению с Cortex-A72 достигается увеличение быстродействия до 30 %.

Ядра Cortex-A73 могут использоваться как отдельно, так и в конфигурации big.LITTLE в качестве кластера big. Пару им могут составить такие ядра, как Cortex-A53 и Cortex-A35.

Процессоры на основе Cortex-A73 появятся в 2017 году. Такие чипы будут применяться в смартфонах топового и среднего уровней, фаблетах, «умных» телевизорах, телевизионных приставках и пр.

Кроме того, ARM анонсировала высокопроизводительный графический ускоритель Mali-G71. Это решение по сравнению с Mali-T880 обеспечивает на 20 % более высокую энергетическую эффективность и на 40 % более высокое быстродействие в расчёте на 1 мм2 площади чипа.

Для Mali-G71 заявлена поддержка OpenGL ES 1.1/1.2/2.0/3.0/3.1/3.2, Vulkan 1.0, OpenCL 1.1/1.2/2.0 и DirectX 11 FL11_2. Максимальное количество шейдерных ядер составляет 32. Изделие может применяться в устройствах виртуальной и дополненной реальности, а также в гаджетах, рассчитанных на работу с видеоматериалами ультравысокого разрешения (4К). 

NVIDIA и Samsung урегулировали конфликты и лицензировали ряд патентов

Корпорации NVIDIA и Samsung Electronics договорились уладить все легальные диспуты, касающиеся интеллектуальной собственности двух компаний, а также подписали ограниченное лицензионное соглашение на ряд патентов. Компании не будут выплачивать друг другу отчисления или компенсации, но и не станут подписывать широкое кросс-лицензионное соглашение. Фактически, можно констатировать, что попытка NVIDIA заставить Samsung платить ей лицензионные отчисления провалилась.

В поисках нового источника доходов в середине 2013 года корпорация NVIDIA объявила о желании лицензировать графические ядра Kepler сторонним разработчикам для встраивания в различные системы на кристалле (system-on-chip, SoC). Хотя компания формально предложила потенциальным лицензиатам готовые графические ядра, она едва ли предложила оптимальный способ их интеграции. Дело в том, что сами вычислительные ядра внутри процессоров NVIDIA используют проприетарную шину для соединения с диспетчером задач, кешем второго уровня, различными контроллерами (памяти, PCI Express, выходов на дисплеи и т. д.) и другими устройствами. При этом о лицензировании этой шины не говорилось ничего. Если же лицензировать у NVIDIA некий упрощённый вариант графического процессора (т. е. оплачивать ещё как минимум диспетчер и контроллер памяти), то его пришлось бы подключать к остальной части SoC при помощи шины PCI Express, что едва ли оптимально как с точки зрения площади ядра, так и с точки зрения энергопотребления. Учитывая не очень внятный подход NVIDIA к лицензированию графических ядер, желающих воспользоваться предложением компании до сегодняшнего дня не нашлось. Тем не менее, монетизация интеллектуальной собственности может заключаться не только в лицензировании готовых устройств, но и патентов.

Штаб-квартира NVIDIA

Штаб-квартира NVIDIA

В попытке монетизировать свои патенты в области компьютерной графики, корпорация NVIDIA подала в суд на компании Qualcomm и Samsung Electronics сентябре 2014 года, обвиняя их в нарушении патентов и требуя компенсации. Как Qualcomm, так и Samsung используют в своих системах на кристалле Snapdragon и Exynos либо графические процессоры (graphics processing units, GPUs) собственной разработки (Qualcomm приобрела подразделение по созданию мобильных GPU у AMD вместе с лицензией на фундаментальные технологии), либо лицензированные у третьих сторон. В ответ корпорация Samsung обвинила NVIDIA в неправомерном использовании своей интеллектуальной собственности, положив начало весьма долгому юридическому процессу.

Речь в исковых заявлениях как NVIDIA, так и Samsung шла о фундаментальных технологиях в области устройства графических процессоров, работы с памятью типа SRAM, различных подсистем памяти, а также затрагивала разнообразные аспекты функционирования микросхем вообще.

В ходе разбирательств в международной торговой комиссии США (U.S. International Trade Commission, ITC) судья по административным делам Томас Б. Пендер (Thomas B. Pender) постановил в октябре прошлого года, что Samsung и Qualcomm не использовали интеллектуальную собственность NVIDIA. В декабре Дэвид П. Шо (David P. Shaw), судья по административным делам из Вашингтона, постановил, что NVIDIA нарушила патенты Samsung. Кроме того, в ходе процесса NVIDIA сняла часть своих претензий. Тем не менее, точку в разбирательстве между двумя компаниями должна была поставить специальная комиссия ITC из нескольких судей. Оглашение решения было назначено на второе мая, однако за несколько часов до этого обе компании подписали мировое соглашений, закончив все легальные диспуты на территории США (включая ITC, окружные суды и ведомство по патентам и товарным знакам США).

Samsung Exynos: Микросхема для всех видов устройств

Samsung Exynos: Микросхема для всех видов устройств

Урегулирование конфликтов включает в себя лицензирование небольшого числа патентов каждой из компаний друг другу, но не широкое кросс-лицензирование патентов или иные виды компенсаций. Другие детали соглашения не разглашаются.

Отказ от претензий к Samsung со стороны NVIDIA во многом ставит точку в возможностях компании требовать лицензионные отчисления со стороны создателей процессоров, которые используют графические ядра разработки ARM или Imagination Technologies в своих SoC. Samsung и Qualcomm являются наиболее крупными создателями и эксплуатантами подобных систем на кристалле, а значит легальная победа над ними открывала бы перед NVIDIA широкие перспективы в области монетизации патентов.

Дальнейшие действия NVIDIA по лицензированию интеллектуальной собственности неизвестны. Если лицензирование патентов более не имеет смысла, возможно, компания попытается более эффективно привлекать сторону к лицензированию уже готовых GPU-технологий?

Процессор MediaTek Helio X30 уже в производстве

Компания MediaTek прошла долгий и тернистый путь от производителя дешёвых чипов с архитектурой ARM, часто ничем не отличавшихся от эталонного дизайна, до серьёзного разработчика мощных ARM-решений, с которым приходится считаться таким монстрам, как Qualcomm, Samsung и другие. Её последняя разработка, процессор Helio X20 сам по себе получился очень интересным: впервые в чипах с архитектурой ARM была применена любопытная архитектура Tri-Cluster, включающая в себя ядра на любой вкус и задачу: пару мощных Cortex-A72 с частотой 2,8 ГГц, и по четыре Cortex-A53 с частотами 2,0 и 1,4 ГГц.

Но MediaTek не собирается на этом останавливаться и в производстве уже находится наследник X20 — чип Helio X30. Разработчики уверены, что он справится с лучшим из решений Qualcomm, процессором Snapdragon 820 на базе фирменной архитектуры Kryo, которому, к тому же, помогает выделенный DSP Hexagon 680. Не такая уж простая задача, но MediaTek смотрит на будущую битву процессоров ARM класса High-End с оптимизмом. Согласно ряду источников, Helio X30 появится на рынке уже в 2017 году и вместо заявленного ранее 14-нанометрового техпроцесса FinFET будет использовать сразу 10-нанометровую технологию TSMC или Samsung. Пока не ясно, кто именно займётся производством этих чипов, но с учётом массивных заказов Apple на производство 10-нм процессоров A10 на мощностях TSMC, это действительно может быть Samsung.

В сравнении с X20 количество ядер в X30 не изменится. Рынок смартфонов ещё не готов к пришествию 16-ядерных процессоров. Хотя, разумеется, на самом деле, причина иная —  изменение конфигурации Tri-Cluster. Последняя пара ядер заменена на Cortex-A35 с частотой 2,0 ГГц. И это не шаг назад: Cortex-A35 является самым энергоэффективным дизайном в линейке ARM, превосходящим в экономичности даже A53. А разница в производительности легко нивелируется большей частотой. В дополнение к этому Helio X30 получит два канала LPDDR4 RAM ePOP (скорее всего, это означает упаковку в общий корпус SoC), до 4 Гбайт eMMC 5.1, графическое ядро Mali-T880 (количество модулей пока неизвестно) и поддержку фотосенсоров с разрешением до 26 мегапикселей. Появление процессора с такими возможностями и умеренной с точки зрения покупателя ценой пойдёт рынку смартфонов и планшетов только на пользу.

ARM проектирует процессорные ядра под 10-нм технологию производства

Британская компания ARM раскрыла некоторую информацию о планах по разработке вычислительных ядер следующего поколения для мобильных процессоров.

Напомним, что в феврале нынешнего года ARM представила 64-битное ядро Cortex-A72 и графический блок Mali-T880. Решение Cortex-A72 является представителем семейства ARMv8 и характеризуется поддержкой 64-разрядных вычислений, а также максимальной частотой в 2,5 ГГц. Ядро превосходит по вычислительным способностям своего предшественника — Cortex-А57 — почти в два раза. Что касается ускорителя Mali-T880, то он на 80 % опережает по быстродействию Mali-T760.

На смену Cortex-A72, как ожидается, придёт ядро с кодовым именем Artemis. Как сообщается, это решение проектируется с прицелом на 10-нанометровую технологию производства. Таким образом, можно ожидать дальнейшее снижение энергопотребления.

Ускоритель Mali-T880, в свою очередь, уступит место графическому контроллеру с кодовым именем Mimir. О характеристиках этого решения информации пока, к сожалению, нет.

По всей видимости, в коммерческих продуктах процессоры, объединяющие вычислительные ядра Artemis и ускоритель Mimir, появятся только в 2017 году. 

Аналитики: NVIDIA не сумеет найти лицензиатов на свои технологии в ближайшее время

Недавнее решение судьи по административным делам международной торговой комиссии США (U.S. International Trade Commission, U.S. ITC), который не нашёл нарушений интеллектуальной собственности NVIDIA со стороны компаний Samsung Electronics и Qualcomm, говорит о том, что NVIDIA не сможет заработать на своих патентах в ближайшее время, предполагают финансовые аналитики.

Корпорация NVIDIA впервые озвучила планы лицензировать свои графические архитектуры сторонним компаниям в середине 2013 года. Подобный бизнес, как ожидалось, сделал бы NVIDIA конкурентом таким компаниям, как ARM Holdings, Imagination Technologies и Vivante, а также позволил бы существенно расширить применением графических процессоров GeForce в самых разных устройствах. За почти два с половиной года NVIDIA не подписала ни одного лицензионного соглашения ни с одной из компаний-разработчиков систем на кристаллах (system-on-chips, SoCs).

Штаб-квартира NVIDIA

Штаб-квартира NVIDIA

Со временем компания пересмотрела тактику и в дополнение к графическим ядрам Kepler и Maxwell решила лицензировать патенты на изобретения в области компьютерной графики и графических процессоров. В настоящее время NVIDIA уже лицензирует ряд изобретений корпорации Intel, однако договор с последней истекает в начале 2017 года. В NVIDIA рассчитывали, что судебная тяжба с Samsung и Qualcomm заставит последних лицензировать интеллектуальную собственность компании, тем самым принеся новый источник доходов. Однако решение судьи во многом ставит крест на таких планах, согласно предположениям аналитиков Needham & Co.

«Мы считаем маловероятным, что NVIDIA удастся заменить доходы от лицензирования технологий Intel», — написали аналитики Раджвиндра Джилл (Rajvindra Gill) и Джошуа Бачалтер (Joshua Buchalter) в записке для клиентов. «Основной стратегией NVIDIA в замене лицензионных платежей Intel в структуре доходов был иск против Samsung, обвинявший компанию в ненадлежащем использование графических технологий NVIDIA. В начале октября U.S. ITC отклонил две из трёх патентных претензии напрямую и признал третий патент недействительным. Учитывая это решение, мы предполагаем, что выплаты лицензионных платежей не будут замещены [новыми]».

Графический процессор NVIDIA

Графический процессор NVIDIA

Лицензирование патентов является крайне выгодным бизнесом. Например, подразделение корпорации Qualcomm, ответственное за лицензирование интеллектуальной собственности, — Qualcomm Technology Licensing — за первые три квартала текущего финансового года получило $6,162 млрд дохода, а её прибыль до налогообложения составила $5,395 млрд (то есть валовая прибыль QCT — 87,5 %). Корпорация NVIDIA каждый квартал получает от Intel $66 млн, большая часть этих отчислений — чистая прибыль.

Лицензирование архитектур и готовых графических ядер может быть менее прибыльным бизнесом, поскольку компании потребуется разработать ряд дополнительных технологий, программного и аппаратного обеспечения, а также содействовать интеграции требуемой интеллектуальной собственности в системы на кристалле. Тем не менее, данный бизнес может быть интересен для NVIDIA на фоне падения спроса на персональные компьютеры и недорогие графические адаптеры. Однако пока компании не удалось убедить ни одного разработчика SoC использовать Kepler, Maxwell или Pascal.

«Хотя NVIDIA выражала заинтересованность в монетизации своих патентных активов, мы видели мало свидетельств прогресса на сегодняшний день», — указали аналитики Needham & Co.

Логотип NVIDIA

Логотип NVIDIA

Поскольку план монетизировать патенты является во многом стратегическим, корпорация NVIDIA продолжит предлагать разработчикам SoC лицензировать свои графические ядра, а также патенты. Хотя NVIDIA является успешным поставщиком ряда решений для центров обработки данных, падение спроса на дискретные графические адаптеры тормозит развитие компании, а значит ей придётся искать новые источники доходов, одним из которых могло бы стать лицензирование интеллектуальной собственности. Сможет ли компания стать столь же успешным владельцем патентов, как Qualcomm Technology Licensing, покажет только время.

Поскольку NVIDIA находится в «периоде тишины» перед анонсом квартальных результатов, она не может комментировать информацию, относящуюся к её финансам.

ARM Mali-470: видеочип для смарт-часов и IoT

Специально для повышения производительности графической подсистемы носимых устройств и IoT компания ARM разработала новый видеопроцессор Mali-470. Новый чип нацелен на продукты с малым потреблением электроэнергии, такие как смарт-часы, домашние шлюзы и промышленные панели управления, устройства для контроля здоровья. Также GPU Mali-470 может найти применение и в смартфонах начального уровня.

ARM

ARM

ARM

ARM

ARM надеется, что с новым чипом позиции на рынке продуктов серии Mali только усилятся. Производитель с гордостью отмечает, что более 1 миллиарда мобильных устройств используют чипы Mali-400. Mali-470 может развить этот успех, ведь он предлагает сравнимые характеристики при уменьшении потребляемой мощности вдвое. Также отмечаются меньшая себестоимость чипа и уменьшение площади полупроводникового кристалла примерно на 10 % по сравнению с Mali-400. ARM предполагает, что оптимальные по энергоэффективности устройства можно будет создавать, связывая Mali-470 с процессорами Cortex-A7 и Cortex-A53. Новинка поддерживает OpenGL ES 2.0, как и Mali-400, поэтому проблем совместимости с уже существующими приложениями возникнуть не должно.

ARM

ARM

ARM

ARM

Лицензирование новой архитектуры партнёрам уже началось, а первые устройства с чипами Mali-470 появятся в продаже ближе к концу 2016 года.

window-new
Soft
Hard
Тренды 🔥