Сегодня 18 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

SK hynix предложила неоригинальный костыль для ускорения ИИ-моделей — гибридную архитектуру памяти HBM/HBF

Светлая мысль разместить больше памяти рядом с процессором пришла не в одну голову. Год назад о разработке концепции замены памяти HBM (DRAM) памятью HBF (флеш) сообщила компания SanDisk. На днях работу о таком подходе опубликовала компания SK Hynix. Флеш-память NAND попросту плотнее памяти DRAM, и с позиции увеличения места под токены для ИИ замена одной на другую даст впечатляющий результат в виде роста скорости принятия решений.

 Источник изображения: SK Hynix

Источник изображения: SK Hynix

Не секрет, что современные платформы на базе центральных, графических и тензорных процессоров сталкиваются с серьёзным ограничением по объёму приданной им памяти High Bandwidth Memory (HBM), что сплошь и рядом происходит при работе с большими языковыми моделями. Например, модели вроде Llama 4 поддерживают до 10 млн токенов, что требует кэш объёмом до 5,4 Тбайт. Стандартные решения, такие как частичный сброс кэша на локальные SSD, приводят к значительным задержкам из-за низкой пропускной способности шины и медленного доступа к накопителям. В результате образуется узкое место по пропускной способности, что можно обойти только наращиванием массива ускорителей, а это — лишние деньги и энергопотребление.

Предложенная компанией SK hynix гибридная иерархия памяти или архитектура H³ (Hybrid³), объединяющая HBM и новый пока тип памяти High Bandwidth Flash (HBF) на одном интерпозере вместе с процессором, решает проблему нехватки памяти для токенов ИИ. Память HBM продолжит использоваться так же, как и раньше — для данных с высокой частотой записи и чтения (динамически генерируемый кэш), а HBF — для данных с интенсивным чтением.

Использование флеш-памяти HBF обеспечит до 16 раз большую ёмкость при пропускной способности, близкой к HBM, хотя задержка доступа останется выше на один или даже два порядка, износостойкость будет ниже, а энергопотребление может быть в 4 раза больше. В то же время массив гибридной памяти окажется единым для процессора, а грамотная маршрутизация запросов сведёт на нет все негативные последствия «тормозов» флеш-памяти.

Результаты моделирования на конфигурации Nvidia Blackwell GPU с 8 стеками HBM3E и 8 стеками HBF на интерпозере демонстрируют впечатляющие улучшения. При 1 млн токенов контекста производительность в токенах в секунду вырастает в 1,25 раза, при 10 млн токенов — уже в 6,14 раза по сравнению с чисто HBM-системой, а энергоэффективность становится выше в 2,69 раза. И если раньше для обработки запросов такого масштаба требовалось 32 GPU, то теперь работа может быть выполнена всего на 2 GPU с существенным снижением энергозатрат и общей стоимости системы. Ради такого стоит рискнуть и создать коммерческие решения, считают в компании.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Лабораторные атаки показали уязвимости в менеджерах паролей LastPass, Bitwarden и Dashlane — ими пользуются 60 млн человек 16 мин.
Windows 11 получила полноценную поддержку MIDI 2.0 39 мин.
Суд запретил OpenAI использовать бренд Cameo 3 ч.
VK неделю назад объявила о закрытии «заменителя Telegram» TamTam, но это заметили лишь сейчас 3 ч.
Реестр российского ПО разросся до 30 тысяч продуктов — на это ушло 10 лет 3 ч.
Google мельком показала интерфейс AR-очков с Android XR и объяснила принципы, которыми руководствуется в разработке 3 ч.
Ветеран CDPR назвал эпилог The Witcher ошибкой — из-за него The Witcher 2 пришлось делать игрой «про ведьмаков, которые почему-то убивают королей» 4 ч.
Bethesda наконец починила The Elder Scrolls V: Skyrim на Nintendo Switch 2 — легендарная RPG получила поддержку 60 кадров/с и не только 5 ч.
Perplexity первой встроила рекламу в ИИ, но теперь отказалась от неё из-за угрозы доверию пользователей 5 ч.
Microsoft показала, чего ждать от следующих обновлений Windows 11 — измеритель скорости интернета, новые настройки и эмодзи 5 ч.
ПК-версию Cyberpunk 2077 запустили на Android — RedMagic 11 Pro справился на 30–40 FPS 2 ч.
Китайский конкурент Neuralink сообщил о первых успехах — пациент с имплантом научился управлять курсором за 5 дней 3 ч.
Wavepiston построит на Барбадосе волновую электростанцию на 50 МВт, каких мир ещё не видел 3 ч.
Новый дата‑центр «Мегафона» начал работу в Хабаровском крае 3 ч.
Авиадвигатели сработали: ЦОД получили реактивный импульс благодаря переделке б/у турбин 3 ч.
Британский бизнес обеспокоен грядущим запретом VPN 3 ч.
Бум ИИ разогнал станкостроителей: прибыль поставщиков чипового оборудования растёт восьмой квартал подряд 5 ч.
Технология древних на новых лад: учёные научились записывать 2 Тбайт данных на лист керамики формата A4 6 ч.
Adani вложит $100 млрд в создание 5 ГВт «зелёных» ИИ ЦОД в Индии 6 ч.
США бросили миллиарды на редкоземельную независимость от Китая — это может затянуться на десятилетие 6 ч.