Сегодня 21 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

ИИ-ускорители упёрлись в предел скорости HBM, и эта проблема пострашнее дефицита памяти

По оценкам представителей отрасли, современные ИИ-ускорители в своём развитии достигли того этапа, когда пропускная способность интерфейса памяти становится узким местом на пути дальнейшего масштабирования быстродействия. Дефицит памяти или её объём в этом отношении уходят на второй план, и устранение этого барьера главным образом зависит от разработчиков GPU и больших языковых моделей.

 Источник изображения: Nvidia

Источник изображения: Nvidia

По словам сооснователя Majestic Labs Ша Рабии (Sha Rabii), на которого ссылается CNBC, если непосредственно ускорители вычислений в последние годы продвинулись в своём быстродействии весьма значительно, сопутствующая им память стала не особо быстрее. По сути, именно производительность памяти ограничивает сейчас дальнейший рост быстродействия больших языковых моделей. При этом переход к инференсу увеличит потребности в объёме памяти, так что спрос на неё будет расти очень быстро. В любом случае, чем больше в инфраструктуре ИИ памяти, тем большее количество клиентов она способна обслуживать в единицу времени. О необходимости наращивать объёмы выпуска памяти на CES 2026 говорил и основатель Nvidia Дженсен Хуанг (Jensen Huang). Он даже отметил, что покупатели игровых решений компании типа видеокарт и консолей «обижены» на отрасль ИИ, поскольку дефицит памяти толкает цены вверх даже в указанных смежных сегментах рынка.

Даже запланированный AMD и Nvidia переход на использование памяти типа HBM4 не позволит полностью решить проблему пропускной способности. Память этого семейства всё равно ограничена в количестве задействованных каналов и высоте стека микросхем, не говоря уже о ширине интерфейса. Пропускная способность вычислительных систем могла бы масштабироваться гораздо эффективнее, если бы не свойственные HBM ограничения. Наращивать количество вычислительных блоков в составе GPU в таких условиях не имеет особого смысла, ибо память не будет успевать передавать все данные при вычислительных нагрузках, имеющих отношение как к обучению больших языковых моделей, так и инференсу.

Доступные разработчикам компонентов методы упаковки чипов также выступают в роли специфического ограничивающего фактора, в условиях высокого спроса профильные мощности сильно загружены, усиливая дефицит скоростной памяти и повышая расходы производителей.

На архитектурном уровне разработчики пытаются изучать альтернативы типа осуществления вычислений прямо внутри микросхем памяти (PIM), увеличения плотности компоновки микросхем в составе стека памяти, а также применения в многокристальных решениях прогрессивных интерфейсов типа UCIe, которые позволяют не только увеличить эффективную полосу пропускания, но и снизить задержки при работе с данными. Темпы дальнейшего масштабирования инфраструктуры ИИ будут зависеть от прогресса в сфере внедрения более скоростной памяти.

HBM4 предложит прирост быстродействия в полтора раза относительно HBM3E, позволяя через свою более широкую 2048-разрядную шину передавать до 2 терабайт данных в секунду. К 2027 году на арену выйдет память типа HBM4E, которая потенциально увеличить скорость передачи информации ещё в полтора раза. Внедрение интерфейса CXL также должно способствовать повышению эффективности обмена данными между компонентами вычислительных систем. В части памяти переход к CXL обеспечит увеличение степени загрузки на 50 %, а также снижение энергопотребления на величину до 20–30 %. Появление новых методов трёхмерной компоновки памяти тоже должно способствовать повышению производительности и снижению энергопотребления.

Источник:


window-new
Soft
Hard
Тренды 🔥
Новая статья: Mewgenics — девяти жизней может не хватить. Рецензия 2 ч.
«Гонка вооружений» в сфере ИИ бессмысленна — США и Китай преследуют совершенно разные цели 2 ч.
«Один нас подвёл. Другой отверг»: датамайнер нашёл в файлах God of War Ragnarok указания, что новая God of War отправится в Египет 5 ч.
«Блокнот» всё больше превращается в WordPad — теперь Microsoft добавила поддержку изображений 6 ч.
Ubisoft подтвердила разработку двух «очень многообещающих» Far Cry и нескольких Assassin’s Creed, включая мультиплеерные 6 ч.
USDT ожидает самое большое месячное падение со времён краха FTX 6 ч.
Почти полтора года Microsoft рекомендовала обучать ИИ на пиратских книгах о Гарри Поттере 6 ч.
Capcom отправила юристов бороться с утечками Resident Evil Requiem и призвала фанатов не распространять спойлеры 8 ч.
«Продолжение следует»: продажи Nier: Automata превысили 10 миллионов копий, а Square Enix подарила фанатам новую надежду 9 ч.
Дипфейки захватывают интернет — Microsoft предложила план спасения от подделок 10 ч.
Google подала на SerpApi в суд за парсинг — та ответила, что Google сама является «крупнейшим веб-скрейпером в мире» 34 мин.
Не $100 млрд, а $30 млрд, и не выиграл, а переиграл — NVIDIA и OpenAI готовят новую инвестиционную сделку 4 ч.
«Москвич» запустил производство электромобилей Umo для «Яндекс Такси» — внутри у них ИИ «Яндекса» 4 ч.
Марсоход NASA Perseverance научился самостоятельно ориентироваться на Марсе — теперь его не удержать 4 ч.
Первым ИИ-гаджетом OpenAI станет умная колонка с камерой — она сможет узнавать владельца 4 ч.
NASA наконец удалось провести «мокрую» генеральную репетицию запуска лунной ракеты SLS — теперь только в путь 6 ч.
Винокурня Dewar’s завела робопса, который чует утечку паров виски 8 ч.
OpenAI и Tata договорились о строительстве 1 ГВт ИИ ЦОД в Индии 9 ч.
Узкие специалисты: Talaas, разрабатывающая оптимизированные под конкретные ИИ-модели ускорители, получила на развитие $169 млн 10 ч.
Thermal Grizzly начала продавать скальпированные процессоры Ryzen 7 9850X3D по €749 за штуку 10 ч.