Сегодня 05 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Phison придумала, как с помощью SSD в шесть раз удешевить обучение больших языковых моделей

Phison продемонстрировала на мероприятии Nvidia GTC 2024 рабочую станцию с четырьмя графическими процессорами, производительности которой хватило для обучения модели искусственного интеллекта с 70 млрд параметров. Это стало возможным за счёт задействования ресурсов SSD и системной DRAM, передаёт Tom’s Hardware. В обычных условиях эта задача требует шести серверов с 24 ускорителями Nvidia H100 и 1,4 Тбайт видеопамяти.

 Источник изображения: phison.com

Источник изображения: phison.com

Платформа Phison aiDaptiv+ помогает снижать барьеры для обучения больших языковых моделей ИИ за счёт использования системной памяти и твердотельных накопителей для увеличения объёма доступной графическим процессорам памяти. Это решение позволит компаниям снизить затраты на обучение ИИ и избежать дефицита графических процессоров, который угрожает отрасли. Производительность такой системы, конечно, уступает дорогим серверным решениям, но открывает возможности представителям малого и среднего бизнеса запускать передовые модели локально, обеспечивая конфиденциальность данных, если затраты времени на обучение не являются критичными.

 Источник изображения: phison.com

Источник изображения: phison.com

Для демонстрации использовалась рабочая станция Maingear Pro AI с процессором Intel Xeon W7-3445X, 512 Гбайт памяти DDR5-5600 и двумя специализированными твердотельными накопителями Phison aiDaptiveCache ai100E формата M.2 по 2 Тбайт, специально предназначенными для кеширования рабочих нагрузок. Эти диски на основе чипов SLC рассчитаны на 100 циклов перезаписи в день в течение пяти лет. Программное решение Phison aiDaptiv+ «отрезает» слои ИИ-модели от видеопамяти, которые активно не обрабатываются, и отправляет их в системную память машины; если это необходимая информация, она остаётся здесь, а данные с низким приоритетом сбрасываются на твердотельные накопители. По мере необходимости они перемещаются в видеопамять графического процессора для дополнительной обработки, а обработанные данные направляются в DRAM и SSD.

 Источник изображения: tomshardware.com

Источник изображения: tomshardware.com

Рабочая станция Maingear Pro AI выпускается в нескольких вариантах от $28 тыс. за версию с одним графическим ускорителем Nvidia RTX 6000 Ada A100 до $60 тыс. за комплектацию с четырьмя GPU. Ведущим партнёром Phison по поставке оборудования для новой платформы является Maingear, но разработчик сотрудничает также с MSI, Gigabyte, ASUS и Deep Mentor, которые готовы предложить свои решения.

Промежуточная библиотека Phison aiDaptiv+ работает с Pytorch/Tensor Flow и не требует модификации приложений ИИ. Затраты на обучение модели на такой установке в шесть раз ниже, чем её запуск на восьми кластерах с 30 ИИ-ускорителями, но процедура занимает примерно в четыре раза больше времени. Есть также вариант горизонтального масштабирования с запуском четырёх рабочих станций при чуть более чем половине стоимости — в этом случае обучение модели на 70 млрд параметров займёт около 1,2 часа, тогда как система с 30 ИИ-ускорителями проведёт его за 0,8 часа.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Полёты на вивернах, пинбол и переработка блокад: для Crimson Desert вышло крупное обновление 1.10.00 53 мин.
Интернет не для людей — автоматизированный трафик ботов в сети впервые в истории превысил человеческий 57 мин.
Reddit захлестнул спам с сомнительными медицинскими процедурами, который транслируется в ИИ-поиск Google 2 ч.
У биткоина выдалась худшая неделя с февраля — средства инвесторов перетекают в другие активы 3 ч.
В 2026 году на ПК выйдет научно-фантастический хоррор-шутер Derelikt, который выглядит как потерянная игра с PS1 3 ч.
Google завершила обновление значков приложений Workspace в рамках концепции «Эра Gemini» 5 ч.
Новая статья: ОСновной расклад: гид по российским Linux-дистрибутивам 11 ч.
OpenAI прокачала память ChatGPT — вскоре бот сможет помнить разное и для бесплатных пользователей 12 ч.
Отправление задерживается: безумный платформер про неподвластный гравитации поезд Denshattack! не выйдет 17 июня 16 ч.
AMD не планирует наделять поддержкой FSR 4.1 встроенную графику RDNA 3.5 17 ч.
Репортаж со стенда G.Skill на Computex 2026: модули DDR5 будущего с очень низкими задержками, высокой скоростью и объёмом до 512 Гбайт 18 мин.
Репортаж со стенда 1stPlayer на Computex 2026: панорамные корпуса, СЖО и кулеры с экранами и компактные, но мощные блоки питания 42 мин.
В российских поездах дальнего следования появится спутниковый интернет — но не уточняется, когда 43 мин.
Китайцы научили квантовый компьютер работать с большими данными — он мгновенно впитает всё 55 мин.
На площадке Саяно-Шушенской ГЭС в Хакасии появится ЦОД от «РусГидро» 2 ч.
Valve заявила о готовности выпустить Steam Machine и Steam Frame до конца лета 2 ч.
США заподозрили существование лазеек для выпуска китайских чипов на передовых техпроцессах TSMC и Samsung 2 ч.
Geometric Future представила на Computex 2026 огромные корпуса, яркие блоки питания и новые СЖО 2 ч.
«Билайн» присоединится к проекту трансъевразийской оптоволоконной магистрали TEA NEXT 2 ч.
«Сбер» переведёт обучение ИИ на фотонику — представлен первый в России оптический чип 2 ч.