Сегодня 20 июня 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Phison придумала, как с помощью SSD в шесть раз удешевить обучение больших языковых моделей

Phison продемонстрировала на мероприятии Nvidia GTC 2024 рабочую станцию с четырьмя графическими процессорами, производительности которой хватило для обучения модели искусственного интеллекта с 70 млрд параметров. Это стало возможным за счёт задействования ресурсов SSD и системной DRAM, передаёт Tom’s Hardware. В обычных условиях эта задача требует шести серверов с 24 ускорителями Nvidia H100 и 1,4 Тбайт видеопамяти.

 Источник изображения: phison.com

Источник изображения: phison.com

Платформа Phison aiDaptiv+ помогает снижать барьеры для обучения больших языковых моделей ИИ за счёт использования системной памяти и твердотельных накопителей для увеличения объёма доступной графическим процессорам памяти. Это решение позволит компаниям снизить затраты на обучение ИИ и избежать дефицита графических процессоров, который угрожает отрасли. Производительность такой системы, конечно, уступает дорогим серверным решениям, но открывает возможности представителям малого и среднего бизнеса запускать передовые модели локально, обеспечивая конфиденциальность данных, если затраты времени на обучение не являются критичными.

 Источник изображения: phison.com

Источник изображения: phison.com

Для демонстрации использовалась рабочая станция Maingear Pro AI с процессором Intel Xeon W7-3445X, 512 Гбайт памяти DDR5-5600 и двумя специализированными твердотельными накопителями Phison aiDaptiveCache ai100E формата M.2 по 2 Тбайт, специально предназначенными для кеширования рабочих нагрузок. Эти диски на основе чипов SLC рассчитаны на 100 циклов перезаписи в день в течение пяти лет. Программное решение Phison aiDaptiv+ «отрезает» слои ИИ-модели от видеопамяти, которые активно не обрабатываются, и отправляет их в системную память машины; если это необходимая информация, она остаётся здесь, а данные с низким приоритетом сбрасываются на твердотельные накопители. По мере необходимости они перемещаются в видеопамять графического процессора для дополнительной обработки, а обработанные данные направляются в DRAM и SSD.

 Источник изображения: tomshardware.com

Источник изображения: tomshardware.com

Рабочая станция Maingear Pro AI выпускается в нескольких вариантах от $28 тыс. за версию с одним графическим ускорителем Nvidia RTX 6000 Ada A100 до $60 тыс. за комплектацию с четырьмя GPU. Ведущим партнёром Phison по поставке оборудования для новой платформы является Maingear, но разработчик сотрудничает также с MSI, Gigabyte, ASUS и Deep Mentor, которые готовы предложить свои решения.

Промежуточная библиотека Phison aiDaptiv+ работает с Pytorch/Tensor Flow и не требует модификации приложений ИИ. Затраты на обучение модели на такой установке в шесть раз ниже, чем её запуск на восьми кластерах с 30 ИИ-ускорителями, но процедура занимает примерно в четыре раза больше времени. Есть также вариант горизонтального масштабирования с запуском четырёх рабочих станций при чуть более чем половине стоимости — в этом случае обучение модели на 70 млрд параметров займёт около 1,2 часа, тогда как система с 30 ИИ-ускорителями проведёт его за 0,8 часа.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Датамайнер показал взрывной финал сюжетной миссии из новой Battlefield — фанаты в восторге 2 ч.
Длительная работа с ИИ-инструментами ослабляет у людей когнитивные способности, выяснили учёные 3 ч.
Google давно использует контент YouTube для обучения ИИ и никогда это не скрывала 3 ч.
Релиз СУБД Tantor Postgres 17.5.0: доработки безопасности и аналитики, оптимизации для «1С» и прочие улучшения 3 ч.
WhatsApp не сможет запустить рекламу в Евросоюзе до следующего года 4 ч.
Дурову разрешили ездить из Франции в Дубай, но только на две недели 4 ч.
«Наконец-то Uncharted 5»: первый трейлер китайского AAA-боевика Blood Message впечатлил игроков 5 ч.
«Яндекс» встроит ИИ-рекомендации почти во все свои сервисы 5 ч.
С начала июня трафик Cloudflare в России сократился на 30 % — Роскомнадзор говорит о «проблемах на их стороне» 5 ч.
ИИ стал экзистенциальной угрозой для интернет-СМИ: посетителей на сайтах вытесняют роботы 5 ч.
AMD «поместит геймеров в центр событий», — в компании прокомментировали сотрудничество с Microsoft 47 мин.
В Германии протестировали рядовую оптическую магистраль на рекордную дальность квантовой связи 2 ч.
Смартфон-раскладушка Samsung Galaxy Z Flip 7 в чёрном и синем цветах предстал на рендерах 2 ч.
AMD готовит шестиядерный Ryzen 5 9600X3D с дополнительной кеш-памятью 3D V-Cache 2 ч.
Японцы изменили атомарную структуру оксида марганца и сделали суперкатализатор для производства водорода 2 ч.
Изображения несуразных накладных наушников Nothing Headphone (1) утекли в интернет 3 ч.
Дизайн и некоторые характеристики смартфона Samsung Galaxy Z Fold 7 раскрыты до анонса 3 ч.
«Мегафон» заканчивает строительство 5-МВт ЦОД в Новосибирске 3 ч.
Kioxia анонсировала 61,44-Тбайт SSD CD9P для ИИ-серверов с PCIe 5.0 4 ч.
Softbank вместе с Nvidia и TSMC предлагает построить мини-Шэньчжэнь в Аризоне за $1 трлн 4 ч.