Новости Hardware

Samsung будет оснащать встроенными ускорителями вычислений все типы памяти — от DDR4 до HBM3

На конференции Hot Chips 33 компания Samsung сообщила о планах встраивать ускорители вычислений во все типы оперативной памяти от смартфонов до компьютеров, видеокарт и серверов. Это позволит увеличить производительность платформ и снизить их энергопотребление. Самое приятное, что чипы памяти с ускорителями можно использовать вместо обычной памяти, а программная поддержка довольно простая, что уже заинтересовало разработчиков CPU и GPU.

 Модуль AXDIMM DDR4. Источник изображения: Samsung

Модуль AXDIMM DDR4. Источник изображения: Samsung

Память PIM (processing-in-memory, вычисления в памяти) применительно к чипам HBM2 компания Samsung показала в феврале этого года. Каждый чип HBM2 вооружался программируемым ИИ-ускорителем производительностью 1,2 терафлопс (FP16) и мог обрабатывать хранящиеся в памяти данные непосредственно, не перегоняя их в центральный процессор и обратно. Сегодня компания сообщила, что работает над вооружением ускорителями расчётов всех основных типов оперативной памяти, что обещает появление PIM-блоков в подсистемах ноутбуков, видеокарт и так далее.

 Чип памяти HBM-PIM. Источник изображения: Samsung

Чип памяти HBM-PIM. Источник изображения: Samsung

Следует сказать, что сегодня PIM-ускоритель забирает под себя примерно половину площади кристалла памяти, что не очень приятно с точки зрения наращивания объёмов. В будущем Samsung обещает уменьшить ускоритель, представляя всё более и более плотные микросхемы ОЗУ всех типов. В частности, для чипов HBM третьего поколения компания обещает ту же ёмкость для PIM-HBM3, что и для обычных микросхем HBM3. Можно предположить, что это возможно благодаря стековой структуре этой памяти.

Слои HBM-PIM (теперь это бренд Samsung Aquabolt-XL) вставляются непосредственно в стек HBM2 на ту же самую подложку-контроллер, что и раньше. Тем самым стеки HBM2 проще простого подменить стеками с включением HBM-PIM, заменив одни на другие. Такие гибридные стеки были испытаны компанией Xilinx вместе с продуктами Alveo без каких-либо модификаций процессоров и адаптеров (монтажной платы или интерпозера). По сообщению партнёров, производительность подскочила в 2,5 раза с одновременным снижением потребления энергии на 62 %. Такую же операцию, уверяют в Samsung, можно провести с GPU и CPU со сходной компоновкой и разработчики этих решений уже заинтересовались предложением компании.

 Слои HBM-PIM могут быть встроены в стандартный стек HBM и процессору об этом даже не нужно знать. Источник изображения: Samsung

Слои HBM-PIM могут быть встроены в стандартный стек HBM и процессору об этом даже не нужно знать. Источник изображения: Samsung

Для самых нетерпеливых Samsung предлагает готовое решение в виде модулей AXDIMM DDR4 (Acceleration DIMM). Модули имеют буфер, который помогает обрабатывать данные в памяти, одновременно работая со всеми рангами DRAM на планке. Такой модуль устанавливается в обычный сервер в стандартный слот памяти. Всю работу — обработку данных в памяти с точностью FP16 с применением стандартных процедур TensorFlow и Python — модуль обеспечивает самостоятельно, а Samsung делает всё возможное, чтобы обеспечить поддержку других программных инструментов.

Компания заявляет, что её тесты (проведённые на рабочей нагрузке Facebook* AI) показали увеличение производительности в 1,8 раза и снижение энергопотребления на 42,6 % с 2-ранговым комплектом. Всё это повторим, без доработок в стандартном сервере, что, безусловно, впечатляет.

 Модуль AXDIMM значительно ускоряет обработку ИИ-ориентированных данных. Источник изображения: Samsung

Модуль AXDIMM значительно ускоряет обработку ИИ-ориентированных данных. Источник изображения: Samsung

В мобильных платформах, если говорить о применении PIM с чипами LPDDR5 и подобной, использование вычислений в памяти принесёт такой же ряд новых возможностей. Пока компания лишь моделирует такие процессы, но со временем они обещают появиться в ноутбуках и даже смартфонах. Например, для памяти LPDDR5X-6400 заявлено повышение производительности в 2,3 раза при рабочих нагрузках по распознаванию речи, в 1,8 раза при преобразовании перевода и в 2,4 раза при генерации текста GPT-2. Эти улучшения производительности сопровождаются снижением потребления в 3,85, 2,17 и 4,35 раза соответственно. Другой вопрос, когда это выйдет на рынок? Ведь эта технология пока не стала стандартом, утверждённым JEDEC.


* Внесена в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности».

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Microsoft подтвердила повышение цен на эксклюзивы Xbox с 2023 года — Forza Motorsport, Redfall и Starfield будут стоить по $70 7 ч.
Не все супергерои носят плащи: разработчики Marvel's Midnight Suns помогли смертельно больному фанату сыграть в игру за год до релиза 12 ч.
Google закроет интернет-помощника Duplex on the Web и сосредоточится на голосовых технологиях 13 ч.
CD Projekt RED полностью свернёт поддержку «Гвинта» к началу 2024 года 14 ч.
IBS в третий раз перенесла IPO и уволила «невозвращенцев» 15 ч.
«Это будет или великолепно, или ужасно»: новый трейлер сериала The Last of Us воодушевил игроков перед скорой премьерой 16 ч.
Еженедельный чарт Steam: The Callisto Protocol и Need for Speed Unbound не попали в тройку лидеров, но это удалось другой проблемной новинке 16 ч.
Геральт из Ривии добрался до Fortnite благодаря боевому пропуску четвёртой главы 16 ч.
Для Skyrim вышел масштабный мод Warden of the Coast с нелинейным сюжетом, озвучкой и компаньонами в стиле Mass Effect и Dragon Age 19 ч.
Алексей Кудрин станет советником по корпоративному развитию в «Яндексе» 19 ч.
Intel не будет сокращать бюджет на освоение новых техпроцессов ради экономии средств 37 мин.
Новая статья: Компьютер месяца — декабрь 2022 года 6 ч.
AWS обещает добиться положительного водного баланса к 2030 году 8 ч.
Рынок ПК в США сжался на 12 % в третьем квартале, но Apple нарастила продажи на 26 % 8 ч.
InfiniBand между ЦОД: NVIDIA представила третье поколение систем высокоскоростной связи MetroX-3 XC 9 ч.
Samsung представила 27-дюймовый монитор ViewFinity S8UT с двумя портами Thunderbolt 4 12 ч.
Thermalright представила компактный башенный кулер Assassin X 90 SE 12 ч.
Toocki предлагает кабель USB Type-C для быстрой зарядки на 240 Вт и зарядное устройство на 140 Вт со скидками 13 ч.
Airbus намерена выпустить авиалайнер на жидком водороде к 2035 году — первый прототип протестируют в 2026 году 13 ч.
Проект Far North Fiber получил первые инвестиции для прокладки арктического подводного интернет-кабеля длиной 17 тыс. км 14 ч.