Сегодня 22 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

SK hynix предложила неоригинальный костыль для ускорения ИИ-моделей — гибридную архитектуру памяти HBM/HBF

Светлая мысль разместить больше памяти рядом с процессором пришла не в одну голову. Год назад о разработке концепции замены памяти HBM (DRAM) памятью HBF (флеш) сообщила компания SanDisk. На днях работу о таком подходе опубликовала компания SK Hynix. Флеш-память NAND попросту плотнее памяти DRAM, и с позиции увеличения места под токены для ИИ замена одной на другую даст впечатляющий результат в виде роста скорости принятия решений.

 Источник изображения: SK Hynix

Источник изображения: SK Hynix

Не секрет, что современные платформы на базе центральных, графических и тензорных процессоров сталкиваются с серьёзным ограничением по объёму приданной им памяти High Bandwidth Memory (HBM), что сплошь и рядом происходит при работе с большими языковыми моделями. Например, модели вроде Llama 4 поддерживают до 10 млн токенов, что требует кэш объёмом до 5,4 Тбайт. Стандартные решения, такие как частичный сброс кэша на локальные SSD, приводят к значительным задержкам из-за низкой пропускной способности шины и медленного доступа к накопителям. В результате образуется узкое место по пропускной способности, что можно обойти только наращиванием массива ускорителей, а это — лишние деньги и энергопотребление.

Предложенная компанией SK hynix гибридная иерархия памяти или архитектура H³ (Hybrid³), объединяющая HBM и новый пока тип памяти High Bandwidth Flash (HBF) на одном интерпозере вместе с процессором, решает проблему нехватки памяти для токенов ИИ. Память HBM продолжит использоваться так же, как и раньше — для данных с высокой частотой записи и чтения (динамически генерируемый кэш), а HBF — для данных с интенсивным чтением.

Использование флеш-памяти HBF обеспечит до 16 раз большую ёмкость при пропускной способности, близкой к HBM, хотя задержка доступа останется выше на один или даже два порядка, износостойкость будет ниже, а энергопотребление может быть в 4 раза больше. В то же время массив гибридной памяти окажется единым для процессора, а грамотная маршрутизация запросов сведёт на нет все негативные последствия «тормозов» флеш-памяти.

Результаты моделирования на конфигурации Nvidia Blackwell GPU с 8 стеками HBM3E и 8 стеками HBF на интерпозере демонстрируют впечатляющие улучшения. При 1 млн токенов контекста производительность в токенах в секунду вырастает в 1,25 раза, при 10 млн токенов — уже в 6,14 раза по сравнению с чисто HBM-системой, а энергоэффективность становится выше в 2,69 раза. И если раньше для обработки запросов такого масштаба требовалось 32 GPU, то теперь работа может быть выполнена всего на 2 GPU с существенным снижением энергозатрат и общей стоимости системы. Ради такого стоит рискнуть и создать коммерческие решения, считают в компании.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
В Steam и на консолях стартовала закрытая «бета» амбициозного ролевого боевика The Expanse: Osiris Reborn в духе Mass Effect — 35 минут геймплея 12 мин.
Первая за 25 лет новая игра о приключениях разумного дельфина Экко войдёт в сборник Ecco the Dolphin: Complete — подробности «правильного ремастера» 24 мин.
«Google Карты» скоро получат мощную порцию искусственного интеллекта 2 ч.
Паранормальный экшен Control теперь доступен на iPhone и iPad — с переработанным управлением и не только 2 ч.
В популярном ИИ-протоколе нашли критическую уязвимость — отвечающая за него Anthropic ничего исправлять не будет 2 ч.
Разработчики приложения Telega пожаловались на Apple в ФАС 3 ч.
Google Chrome начнёт показывать созданные ИИ картинки на разных сайтах, но непонятно зачем 5 ч.
Дизельпанковый эвакуационный шутер Marauders готовится к перерождению после двух лет простоя в раннем доступе Steam 5 ч.
xAI готова купить ИИ-стартап Cursor за $60 млрд или заплатить $10 млрд в рамках партнёрства 6 ч.
«Вызывает привыкание. Ни в коем случае не покупайте»: безумный карточный роглайк Vampire Crawlers ворвался в Steam с 98 % положительных отзывов 6 ч.
Стартап Миры Мурати закупил у Google мощности для обучения ИИ на несколько миллиардов 2 ч.
Asus перестала выпускать смартфоны, но готовит большой планшет 2 ч.
Anthropic ищет аналитика для оценки геополитических рисков и угроз персоналу, офисам и дата-центрам 3 ч.
Гигантская звезда заставила джет чёрной дыры трепетать как пламя свечи на ветру 4 ч.
ЕС всё-таки разрешит несъёмные батареи в смартфонах, но будут лазейки 4 ч.
Кинотеатр дома: TCL X11L — огромный флагманский телевизор с передовой подсветкой SQD-Mini LED 4 ч.
«Джеймс Уэбб» построил первый полный спектр колец Урана и указал на неизвестные луны 4 ч.
Meta зарезервировала 100 ГВт·ч ёмкости для хранения энергии на базе инновационных накопителей Noon Energy 4 ч.
MediaTek неожиданно отменила доклад гендира Цая на Computex 2026 — в этом усмотрели намёк на совместный анонс с Nvidia 5 ч.
Анонсирован смартфон Motorola Edge 70 Pro с чипом Dimensity 8500 Extreme по цене от $415 5 ч.