Сегодня 27 ноября 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → hpc

JEDEC определилась с предварительным стандартом памяти HBM4

Ассоциация JEDEC опубликовала предварительную спецификацию памяти HBM4 четвёртого поколения, которая обещает значительное увеличение объёма и пропускной способности для систем искусственного интеллекта и высокопроизводительных вычислений.

 Источник изображения: AMD

Источник изображения: AMD

JEDEC представила спецификацию памяти HBM4 (High-Bandwidth Memory) нового поколения, приближаясь к завершению разработки нового стандарта DRAM, сообщает Tom's Hardware. Согласно опубликованным данным, HBM4 будет поддерживать 2048-битный интерфейс на стек, хотя и с более низкой скоростью передачи данных по сравнению с HBM3E. Кроме того, новый стандарт предусматривает более широкий диапазон слоёв памяти, что позволит лучше адаптировать её для различных типов приложений.

Новый стандарт HBM4 будет поддерживать стеки объёмом 24 Гбайт и 32 Гбайт, а также предложит конфигурации для 4-, 8-, 12- и 16-слойных стеков с вертикальными межсоединениями TSV. Комитет JEDEC предварительно согласовал скоростные режимы до 6,4 Гт/с, но при этом ведутся дискуссии о возможности достижения ещё более высокой скорости передачи данных.

16-слойный стек на основе 32-гигабитных чипов сможет обеспечить ёмкость 64 Гбайт, то есть в этом случае процессор с четырьмя модулями памяти сможет поддерживать 256 Гбайт памяти с пиковой пропускной способностью 6,56 Тбайт/с при использовании 8192-битного интерфейса.

Несмотря на то, что HBM4 будет иметь удвоенное количество каналов на стек по сравнению с HBM3 и больший физический размер для обеспечения совместимости, один контроллер сможет работать как с HBM3, так и с HBM4. Однако для размещения различных формфакторов потребуются разные подложки. Интересно, что JEDEC не упомянула о возможности интеграции памяти HBM4 непосредственно в процессоры, что, пожалуй, является наиболее интригующим аспектом нового типа памяти.

Ранее компании SK hynix и TSMC объявили о сотрудничестве в разработке базовых кристаллов HBM4, а несколько позднее на Европейском симпозиуме 2024, TSMC подтвердила, что будет использовать свои технологические процессы 12FFC+ (12-нм класс) и N5 (5-нм класс) для производства этих кристаллов.

Процесс N5 от TSMC позволяет интегрировать больше логики и функций, с шагом межсоединений от 9 до 6 микрон, что критически важно для интеграции на кристалле. Процесс 12FFC+, основанный на 16-нм FinFET-технологии TSMC, обеспечит производство экономически эффективных базовых кристаллов, соединяющих память с хост-процессорами с помощью кремниевых подложек.

Отметим, что HBM4 в первую очередь разработана для потребностей генеративного искусственного интеллекта и высокопроизводительных вычислений, которые требуют обработки очень больших объёмов данных и выполнения сложных вычислений. Поэтому маловероятно, что мы увидим HBM4 в клиентских приложениях, таких как GPU. Компания SK hynix рассчитывает наладить выпуск HBM4 в 2026 году.

Мощь 52 ускорителей NVIDIA H200 за 1/100 стоимости — Tachyum начнёт массово выпускать 192-ядерные чипы Prodigy в этом году

Компания Tachyum сообщила, что в этом году начнёт массовое производство универсального процессора Prodigy, сочетающего вычислительные и графические ядра, а также нейродвижок TPU. Производитель обещает, что новинка обеспечит выдающийся уровень производительности и сможет потягаться с самыми мощными ускорителями вычислений NVIDIA.

 Источник изображения: Tachyum

Источник изображения: Tachyum

Разработчик заявляет, что её 192-ядерный чип, выполненный на основе 5-нм технологического процесса, обеспечивает в 4,5 раза более высокую производительность, чем любой другой процессор, предназначенный для вычислительных нагрузок в облачной среде. Кроме того, он до трёх раз быстрее любого GPU, предназначенного для высокопроизводительных вычислений и до шести раз энергетически эффективнее специализированных GPU для ИИ-задач.

Tachyum анонсировала чип Prodigy Universal Processor в 2022 году и пообещала с его помощью трансформировать узкоспециализированные ЦОДы в универсальные компьютерные центры, способные обеспечить необходимую вычислительную мощность и эффективность для различных ИИ-нагрузок. В декабре 2023 года компания выпустила видео, показывающее способность Prodigy эмулировать работу в x86-совместимых приложениях. Однако есть одно существенное «но»: несмотря на внушительные цифры производительности и заявления Tachyum, процессоры Prodigy существуют только на бумаге и в виде эмулируемой с помощью FPGA платформы с небольшим количеством ядер.

«Успехи, которых нам удалось достичь при корректировке нашего плана выпуска продуктов, привели нас к 2024 году, полному ожиданий, поскольку мы движемся к началу массового производства Prodigy и реализации многомиллиардного канала продаж. Мы с нетерпением ждём возможности выполнить наше обещание и обязательство по преобразованию обычных центров обработки данных в универсальные вычислительные центры в ближайшем будущем», — заявил генеральный директор и основатель Tachyum Радослав Данилак (Radoslav Danilak).

Поскольку в составе Prodigy Universal Processor используются функциональные компоненты, предназначенные для разных типов нагрузок, он может динамически переключаться между вычислительными кластерами, исключая необходимость в использовании разнонаправленного и дорогостоящего аппаратного обеспечения для отдельных типов ИИ-нагрузок в составе вычислительной системы. По крайней мере, так говорится в свежем пресс-релизе компании.

Там же заявляется, что всего один процессор Prodigy Universal Processor стоимостью $23 000 способен сравниться по производительности в задачах обучения ИИ с системой из 52 специализированных ускорителей NVIDIA H200, являющихся одними из лучших на рынке. Компания заявила, что стоимость такого количества графических процессоров в составе семи серверов Supermicro GPU составит 2 349 028 долларов или в 100 раз больше, чем одна система с Prodigy Universal Processor и 2 Тбайт оперативной памяти DDR5.

Tachyum также заявила, что уже планирует разработку более передового универсального процессора Prodigy 2 на базе 3-нм техпроцесса, который получит поддержку интерфейсов PCIe 6.0 и CXL, и будет оснащаться набортной высокопроизводительной памятью HBM3. Его планируется выпустить где-то в 2026 году.

Санкции США обрушат китайский спрос на ИИ-оборудование в полтора раза, но производители найдут лазейки

Очередной виток противостояния США и Китая обозначился 17 октября, когда американский Минторг обновил правила экспортного контроля — в них включили оборудование для производства полупроводников, чипы для высокопроизводительных вычислений, в основном для ИИ-систем; а список организаций под санкциями пополнили две новые компании. В результате китайский спрос на HPC-компоненты снизится до 3–4 % от мирового, уверены аналитики TrendForce.

 Источник изображения: nvidia.com

Источник изображения: nvidia.com

Существенным изменением оказалось формальное включение в список контролируемых товаров литографической системы ASML Twinscan NXT:1980Di, которая ранее находилась в серой зоне. ASML получила разрешение завершить намеченные поставки, поэтому последствия этой меры скажутся несколько позже. А вот сегмент HPC ожидает встряска, поскольку новый запрет коснулся ускорителей серий NVIDIA A800, H800 и L40S. Из-за этого китайские технологические гиганты ByteDance, Baidu, Alibaba и Tencent умерят свои аппетиты в отношении высокопроизводительных серверов с ускорителями NVIDIA — ранее Китай обеспечивал 5–6 % мирового спроса в этом сегменте, теперь же он снизится до 3–4 %. Китайские поставщики облачных услуг, как ожидается, в краткосрочной перспективе начнут запасаться импортными ИИ-ускорителями, а в среднесрочной и долгосрочной — ускорят разработку собственных.

Ещё одной тенденцией обещает стать новая стратегия производителей ИИ-чипов в лице NVIDIA и AMD — они расширят ассортимент решений и позволят клиентам адаптироваться к ограничениям, которые диктует геополитика. К примеру, это будет продукция с более скромными показателями производительности или более крупными кристаллами, что поможет соблюсти ограничения, не жертвуя охватом рынка.

Китайские техногиганты, кроме того, помогут местным академическим и исследовательским институтам рассмотреть возможность аренды ресурсов для обучения ИИ за пределами Китая, а его настройка и непосредственная работа будут организованы уже внутри страны. В этом проекте может принять участие и NVIDIA, которая начнёт активнее продвигать услуги по подписке на ИИ-серверы DGX Cloud. Это позволит привлечь клиентов не только из Китая, но и из других стран, где есть собственные геополитические проблемы.

Samsung запустит 4-нм техпроцесс SFX4 для высокопроизводительных CPU и GPU — +10 % к производительности и -23 % к энергопотреблению

На симпозиуме 2023 Symposium on VLSI Technology and Circuits компания Samsung расскажет о новом техпроцессе SF4X, который предназначен для выпуска CPU и GPU для высокопроизводительных вычислений (HPC). Технология, ранее известная как 4HPC (4 нм для высокопроизводительных вычислений), призвана не только обеспечить повышение тактовой частоты и энергоэффективности чипов, но также будет обладать потенциалом для дополнительного разгона.

 Источник изображений: Samsung

Источник изображений: Samsung

Новый техпроцесс Samsung SF4X обещает повышение на 10 % производительности и при этом на 23 % более низкий уровень энергопотребления. Правда, компания пока не уточнила, с каким именно техпроцессом приводит сравнение. Вероятно, речь идёт о стандартном 4-нм техпроцессе SF4 (4LPP). Добиться улучшения производительности и энергоэффективности удалось с помощью перепроектирования стоков и истоков транзисторов, а также благодаря дальнейшей оптимизацией конструкции транзистора и перепроектированием промежуточной схемы (MOL).

Благодаря новой MOL техпроцесс SF4X может похвастаться подтверждённым минимальным напряжением для CPU (Vmin) в 60 мВ, 10-процентным снижением колебаний тока в выключенном состоянии, гарантией работы при высоком напряжении (Vdd) более 1 В без снижения производительности и более эффективной работой с SRAM.

Предполагается, что техпроцесс SF4X будет конкурировать с N4P и N4X компании TSMC, чей запуск запланирован на 2024–2025 годы. Какой техпроцесс в конечном итоге обеспечит наилучшее сочетание производительности, мощности, плотности транзисторов, эффективности и стоимости, основываясь исключительно на заявлениях производителей, предугадать невозможно.

Компоненты для высокопроизводительных вычислений (CPU и GPU для дата-центров) требуют значительного количества энергии, рассчитаны на регулярную работу с большими нагрузками и могут значительно повышать свою тактовую частоту, если возрастает потребность в более высокой производительности. Одна из главных задач новых техпроцессов, применяемых при производстве этих компонентов, связана не только с повышением производительности, но также и с повышением их энергоэффективности. Поэтому снижение у SF4X энергопотребления на 23 % по сравнению с предшествующим техпроцессом создаёт потенциал к существенной экономии средств держателей ЦОД и одновременному снижению негативных воздействий на окружающую среду этими системами.

Примечательно, что SF4X — это первый передовой техпроцесс Samsung, разработанный специально для использования в сфере HPC. Если учесть, что высокопроизводительные вычисления, в частности, ИИ, сейчас пользуются повышенным спросом как со стороны признанных лидеров рынка полупроводников (AMD, IBM, Intel и NVIDIA), так и со стороны новичков, таких как Ampere или Graphcore, у Samsung Foundry есть все основания ожидать, что эта технология будет принята по крайней мере некоторыми из более 150 её клиентов.


window-new
Soft
Hard
Тренды 🔥
It Takes Two, Aliens: Dark Descent и аналог «Покемонов»: Sony подтвердила декабрьскую подборку игр PS Plus 13 мин.
«Зима близко»: разработчики Atomic Heart раскрыли, когда выйдет третье дополнение, а новый тизер привёл фанатов в восторг 57 мин.
Количество загрузок «Смуты» и учебных пособий «Смутное время» превысило миллион — это было условием получения госфинансирования 2 ч.
Фаталити: NetherRealm отменила Kombat Pack 3 и второй аддон для Mortal Kombat 1 после провала Khaos Reigns 3 ч.
Искусственный интеллект научили разоблачать учёных-шарлатанов 3 ч.
Ветеран PlayStation Сюхэй Ёсида покинет компанию после 31 года работы 4 ч.
Илон Маск возвращает долги за покупку Twitter акциями своего ИИ-стартапа xAI 4 ч.
Huawei предложила буквально хватать файлы руками и переносить их на другие устройства — это ИИ-телепортация 5 ч.
Мемная криптовалюта Dogecoin обогнала Porsche по рыночной стоимости 6 ч.
Microsoft отмела обвинения в сборе данных из пользовательских документов Word и Excel для обучения ИИ 6 ч.
Китайцы придумали изучать астероиды с помощью робопсов — для этого им привили один из талантов кошки 7 мин.
Xiaomi представила беспроводные наушники Redmi Buds 6 Pro с тройными динамиками и радиусом подключения до 130 метров 19 мин.
Sony и Microsoft всё сложнее убедить геймеров обновить игровую приставку 2 ч.
VK предоставит интернет-провайдерам «Телеком Радар» — инструмент для оценки качества услуг связи 3 ч.
Xiaomi представила смарт-часы Redmi Watch 5 с большим AMOLED-экраном и eSIM за $110 3 ч.
Xiaomi представила Redmi K80 Pro — флагман для экономных со Snapdragon 8 Elite и ёмкой батареей 3 ч.
В России поступил в продажу первый смартфон на Snapdragon 8 Elite — Realme GT 7 Pro по цене от 89 999 рублей 4 ч.
Chieftec представила блоки питания Vega стандарта ATX 3.1 мощностью до 850 Вт с неотсоединяемыми кабелями 4 ч.
Китайцы создали Ethernet для ИИ- и HPC-кластеров 5 ч.
SilverStone представила 1650-Вт блок питания ZEUS 1650R Titanium — к нему можно подключить девять видеокарт 6 ч.