Новости Hardware

Hot Chips 31: подробности об Intel Nervana NNP-I или «мозг» в формфакторе M.2

Продолжаем знакомиться с фактическими новинками Intel в области машинного обучения и ИИ. Ранее мы рассказали об ускорителе Intel Nervana NNP-T для машинного обучения с функцией тренировки. Для функции принятия решений (Inference) на основе тренированной модели компания подготовила другой чип ― ускоритель Nervana NNP-I (кодовое имя Spring Hill). Мы уже знаем, что Nervana NNP-I разрабатывается Intel совместно с Facebook*, и последняя уже достаточно широко использует эти ускорители. В основе Nervana NNP-I, о чём мы тоже говорили, лежит модифицированный 10-нм процессор Intel поколения Ice Lake. О глубине модификации Ice Lake компания поведала только сейчас на конференции Hot Chips 31. Так что же такое Nervana NNP-I?

Начнём с того, что Nervana NNP-I компания Intel позиционирует как решение для центров обработки данных. Глядя на формфактор решения, в этом можно было усомниться. Чип помещён на компактную плату в формфакторе M.2. Такую плату можно установить куда угодно в слот в массе периферийных устройств. Тем не менее, пока Intel говорит лишь об использовании Nervana NNP-I в формфакторе M.2 только в составе ЦОД. Собственно, формфактор M.2 имеет ограничения по потребляемой мощности и, очевидно, по мере повышения потребления Nervana NNP-I придётся использовать другой формфактор. Так, уже на начальном этапе решения Nervana NNP-I в зависимости от конфигурации могут потреблять от 10 до 50 Вт, тогда как максимально разрешённое потребление для устройства в формфакторе M.2 равно 15 Вт.

Итак, всё-таки ЦОД. В версии Nervana NNP-I оригинальный четырёхъядерный процессор Ice Lake лишился двух вычислительных ядер и встроенного графического ядра. Два оставшихся вычислительных ядра сохранили 10-нм архитектуру Sunny Cove. Это, по мнению Intel, делает чип Nervana NNP-I уникальным в плане программной поддержки решением. Популярная и знакомая программистам система команд x86 обеспечит простоту создания продуктов с использованием языков высокого уровня.

Оставшееся от выброшенных блоков место Intel, в частности, выделила под ИИ-блоки ICE. Но это не Ice Lake. Это ядра Inference Compute Engine, которых может быть от 10 до 12 штук в зависимости от конфигурации. Именно ядра ICE отвечают за функцию принятия решений. По словам Intel, эти ядра оптимизированы для работы с популярными фреймворками для машинного обучения. Ядра Sunny Cove тоже участвуют в процессе работы ИИ-стека, поскольку аппаратно поддерживают 512-битные векторные инструкции и приспособлены для работы с моделями машинного обучения. За счёт оптимальной работы с моделями производительность Nervana NNP-I по отношению к потреблению составляет 4,8 TOPs/Вт, что является хорошим показателем.

Высокая производительность и эффективность Nervana NNP-I также достигается за счёт наличия бортовой памяти как на плате M.2, так и в составе чипа. На плате расположен чип памяти LPDDR4X объёмом 16 Гбайт, который подключается к ускорителю с помощью встроенного в него двухканального контроллера памяти с пропускной способностью 68 Гбайт/с. Следующей в иерархии памяти Nervana NNP-I идёт интегрированная в кристалл кеш-память L3 объёмом 24 Мбайт. Кроме этого каждый блок ICE содержит по 4 Мбайт SRAM и индивидуальные блоки памяти для инструкций и данных. Полный объём SRAM на кристалле достигает 75 Мбайт.

Пределы масштабирования Nervana NNP-I ограничиваются только наличием свободных портов M.2. Решение поддерживает вычисления FP16 и INT8/4/2/1, но не поддерживает BF16 (грубо ― урезанные после запятой FP32). Чип можно заставить работать как в режиме двух ядер, так и 12, что позволяет менять масштабы производительности (и потребления) в 5,85 раза.


* Внесена в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности».

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Чумной ролевой экшен Thymesia появится на Nintendo Switch, но лишь в облачном формате 32 мин.
Минпромторг России представил предложения по импортозамещению в сфере критической инфраструктуры 10 ч.
МТС создает конкурента «Ростелеком-Солар» в сфере кибербезопасности 10 ч.
Выход тактической ролевой игры Metal Slug Tactics перенесли на будущий год 11 ч.
Начало раннего доступа сетевого симулятора выживания Nightingale откладывается — игру улучшают и переводят на Unreal Engine 5 12 ч.
«Одержимый» роглайт Cult of the Lamb добрался до прилавков и приглянулся критикам 13 ч.
Uptime Institute: сервисы в облаках можно сделать значительно устойчивее к сбоям, но в этом случае они обойдутся намного дороже 13 ч.
Студия-разработчик Elite Dangerous сменила гендиректора — впервые с момента основания почти 30 лет назад 13 ч.
Приключенческий роглайк-боевик Lovecraft’s Untold Stories 2 получил новую дату выхода — ждать осталось чуть больше месяца 14 ч.
Авторы средневековой стратегии Inkulinati подтвердили релиз в Game Pass и намекнули на скорые новости о дате выхода 14 ч.
Apple рассчитывает сохранить высокий объём продаж iPhone в 2022 году даже на фоне общего замедления рынка 41 мин.
Параллельный импорт может не справиться с увеличением спроса на электронику в России 2 ч.
К 2025 году половина новых смартфонов Samsung премиум-уровня будут с гибкими дисплеями 2 ч.
К началу следующего года SK hynix определится с местом строительства предприятия в США 2 ч.
Сроки ожидания поставок полупроводниковых компонентов сокращаются уже третий месяц подряд 3 ч.
Даже в условиях санкций китайская SMIC смогла увеличить квартальную выручку на 41,6 % 4 ч.
SpaceX получила лицензию на запуск секретных военных спутников с помощью ракеты Falcon Heavy 5 ч.
Xiaomi представила TWS-наушники Buds 4 Pro: до 38 часов автономности и активное шумоподавление за $163 8 ч.
ASUS ROG представила игровой роутер Rapture GT-AX11000 Pro с поддержкой Wi-Fi 6 и UNII 4 8 ч.
Новая статья: Обзор часов Amazfit T-Rex 2: большой шаг вперёд 9 ч.