Сегодня 04 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

ИИ-ускорители упёрлись в предел скорости HBM, и эта проблема пострашнее дефицита памяти

По оценкам представителей отрасли, современные ИИ-ускорители в своём развитии достигли того этапа, когда пропускная способность интерфейса памяти становится узким местом на пути дальнейшего масштабирования быстродействия. Дефицит памяти или её объём в этом отношении уходят на второй план, и устранение этого барьера главным образом зависит от разработчиков GPU и больших языковых моделей.

 Источник изображения: Nvidia

Источник изображения: Nvidia

По словам сооснователя Majestic Labs Ша Рабии (Sha Rabii), на которого ссылается CNBC, если непосредственно ускорители вычислений в последние годы продвинулись в своём быстродействии весьма значительно, сопутствующая им память стала не особо быстрее. По сути, именно производительность памяти ограничивает сейчас дальнейший рост быстродействия больших языковых моделей. При этом переход к инференсу увеличит потребности в объёме памяти, так что спрос на неё будет расти очень быстро. В любом случае, чем больше в инфраструктуре ИИ памяти, тем большее количество клиентов она способна обслуживать в единицу времени. О необходимости наращивать объёмы выпуска памяти на CES 2026 говорил и основатель Nvidia Дженсен Хуанг (Jensen Huang). Он даже отметил, что покупатели игровых решений компании типа видеокарт и консолей «обижены» на отрасль ИИ, поскольку дефицит памяти толкает цены вверх даже в указанных смежных сегментах рынка.

Даже запланированный AMD и Nvidia переход на использование памяти типа HBM4 не позволит полностью решить проблему пропускной способности. Память этого семейства всё равно ограничена в количестве задействованных каналов и высоте стека микросхем, не говоря уже о ширине интерфейса. Пропускная способность вычислительных систем могла бы масштабироваться гораздо эффективнее, если бы не свойственные HBM ограничения. Наращивать количество вычислительных блоков в составе GPU в таких условиях не имеет особого смысла, ибо память не будет успевать передавать все данные при вычислительных нагрузках, имеющих отношение как к обучению больших языковых моделей, так и инференсу.

Доступные разработчикам компонентов методы упаковки чипов также выступают в роли специфического ограничивающего фактора, в условиях высокого спроса профильные мощности сильно загружены, усиливая дефицит скоростной памяти и повышая расходы производителей.

На архитектурном уровне разработчики пытаются изучать альтернативы типа осуществления вычислений прямо внутри микросхем памяти (PIM), увеличения плотности компоновки микросхем в составе стека памяти, а также применения в многокристальных решениях прогрессивных интерфейсов типа UCIe, которые позволяют не только увеличить эффективную полосу пропускания, но и снизить задержки при работе с данными. Темпы дальнейшего масштабирования инфраструктуры ИИ будут зависеть от прогресса в сфере внедрения более скоростной памяти.

HBM4 предложит прирост быстродействия в полтора раза относительно HBM3E, позволяя через свою более широкую 2048-разрядную шину передавать до 2 терабайт данных в секунду. К 2027 году на арену выйдет память типа HBM4E, которая потенциально увеличить скорость передачи информации ещё в полтора раза. Внедрение интерфейса CXL также должно способствовать повышению эффективности обмена данными между компонентами вычислительных систем. В части памяти переход к CXL обеспечит увеличение степени загрузки на 50 %, а также снижение энергопотребления на величину до 20–30 %. Появление новых методов трёхмерной компоновки памяти тоже должно способствовать повышению производительности и снижению энергопотребления.

Источник:


window-new
Soft
Hard
Тренды 🔥
Новая статья: Life is Strange: Reunion — отчаяние приводит к успеху. Рецензия 5 ч.
Креативный директор Naughty Dog заинтриговал фанатов фотографией из командировки — на снимке углядели тизер Uncharted 5 8 ч.
Комедийная ретрофутуристическая игра Breathedge 2 пережила тотальную переработку геймплея и взяла курс на ранний доступ Steam 9 ч.
State of Decay 3 восстала из мёртвых и спустя шесть лет после анонса готовится к публичной «альфе» 10 ч.
ИИ-модель Claude обнаружила уязвимость и разработала рабочий эксплойт для FreeBSD 11 ч.
Китайские власти ополчились на цифровых людей 11 ч.
Google, Meta и другие бигтехи больше не смогут избегать ответственности за контент пользователей, как делали 30 лет 11 ч.
Фэнтезийная ролевая игра Songs of Glimmerwick отправит в мир, где магия рождается из музыки — новый трейлер, релиз в 2026 году и демо на подходе 11 ч.
Microsoft признала, что Copilot — для развлечений, а не профессиональных задач 12 ч.
Издатель GTA VI неожиданно уволил главу ИИ-отдела и его команду 12 ч.
Восстание стиральных машин: программное обновление не позволило клиентам Samsung выстирать одежду 23 мин.
Соучредитель Supermicro с соучастником отрицают участие в контрабанде ИИ-чипов NVIDIA в Китай 5 ч.
На память теперь уходит до 30 % расходов при создании ЦОД — в четыре раза больше, чем в 2023 году 9 ч.
MSI выпустила беспроводной PCIe-адаптер Herald BE9400 с поддержкой Wi-Fi 7 и Bluetooth 5.4 9 ч.
В России представили антропоморфного робота-курьера «Аркус» 11 ч.
Intel прикупит ещё чуть-чуть SambaNova 11 ч.
Японский энтузиаст исхитрился подключить M.2 SSD к консоли Switch 2 через слот microSD Express 11 ч.
Asus сэкономила на упаковке, из-за чего OLED-мониторы за $1299 приходят покупателям треснувшими 11 ч.
США хотят полностью запретить ввоз всей продукции Huawei и ряда других китайских компаний 11 ч.
Сооснователь Supermicro не признал вину в контрабанде чипов Nvidia в Китай и вышел под залог 11 ч.