Сегодня 29 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Alibaba нашла способ сократить потребность в количестве используемых ускорителей Nvidia на 82 %

Нехватка вычислительных мощностей, присущая динамично развивающемуся рынку искусственного интеллекта, в Китае усугубляется ограничениями на импорт специализированных ускорителей. Разработчики вынуждены заниматься оптимизацией, и Alibaba нашла способ сократить количество необходимых ускорителей Nvidia для работы своих языковых моделей на 82 %.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Как поясняет South China Morning Post, бета-тестирование профильной системы Aegaeon уже проводится одним их подразделений Alibaba Cloud на протяжении более чем трёх месяцев. По информации, представленной Alibaba на мероприятии SOSP в столице Южной Кореи, данная система позволила сократить количество обслуживающих десятки языковых моделей ускорителей Nvidia H20 с 1192 до 213 штук. При этом соответствующие языковые модели используют до 72 млн параметров, как поясняет источник.

Представителям Alibaba в создании такой системы помогали учёные Пекинского университета, которые назвали её «первой попыткой выявить излишние затраты, связанные с одновременным обслуживанием нагрузок с большими языковыми моделями». Провайдеры облачных услуг типа Alibaba сталкиваются с необходимостью одновременного обслуживания тысяч ИИ-моделей, но в сфере инференса наиболее часто используются лишь несколько моделей типа Qwen или DeepSeek, а прочие вызываются довольно редко. Это приводит к нерациональному расходованию ресурсов. В экосистеме Alibaba Cloud, например, до 17,7 % ускорителей выделяются для обработки 1,35 % запросов.

Исследователи во всём мире начали предлагать повысить эффективность использования вычислительных ресурсов за счёт объединения в пулы, когда один GPU обслуживает несколько моделей. Система Aegaeon использует автомасштабирование на уровне токенов, позволяющее GPU переключаться между разными моделями прямо в процессе генерирования токенов. Один GPU в результате способен обрабатывать до семи моделей, тогда как в альтернативно устроенных системах их количество в лучшем случае достигает двух или трёх. Задержки, необходимые на переключение между моделями, при этом сократились на 97 % в случае с Aegaeon.

Alibaba эту систему испытывает на маркетплейсе моделей Bailian, который предлагает модели Qwen корпоративным пользователям. Ускорители Nvidia H20 одноимённой американской компанией были созданы специально для китайского рынка, в апреле они попали под временный запрет на поставку в КНР, но к лету он был снят. Однако, китайские власти начали настоятельно рекомендовать национальным разработчикам отдавать предпочтение местной компонентной базе. В результате позиции Nvidia на китайском рынке передовых чипов для ИИ, по словам руководителя компании, буквально сократились до нуля.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Мы просто поражены приёмом»: авторы олдскульного хоррора Tormented Souls 2 продали свыше 100 тыс. его копий и занялись первым DLC 4 ч.
Роскомнадзор увидел в Roblox угрозу детям — на платформе нашли неподобающий контент 5 ч.
Asus предупредила об очередной критической уязвимости в маршрутизаторах с AiCloud 6 ч.
Infinix проведёт в декабре турнир по PUBG Mobile, для участия в котором нужно быть студентом вуза или ссуза России 7 ч.
Президент Signal призвала не спешить с внедрением ИИ в мессенджерах 7 ч.
ИИ-модель DeepseekMath-V2 достигла уровня золотой медали на Международной математической олимпиаде 8 ч.
Практическое использование ИИ в работе остаётся весьма неравномерным 14 ч.
Новая статья: PowerWash Simulator 2 — опять работать. Рецензия 22 ч.
Team Cherry подтвердила работу над DLC для Hollow Knight: Silksong и заинтриговала фанатов тизерами нового контента 23 ч.
Американцы стали уходить из X, отдавая предпочтение TikTok 23 ч.
Первый в мире частный научный спутник успешно выведен в космос — он будет изучать звёзды в ультрафиолете 3 ч.
Главы технологических компаний наперебой заговорили о ЦОД в космосе 4 ч.
В 2027 году Intel может наладить выпуск процессоров Apple M по техпроцессу 18A-P 5 ч.
Samsung выпустила внешние SSD T7 Resurrected с ударопрочным корпусом из вторсырья и скоростью до 1050 Мбайт/с 6 ч.
Битва за Северную Европу: Digital Realty и Equinix борются за покупку скандинавского оператора ЦОД atNorth за €4,5 млрд 6 ч.
Asustor представила десктопные NAS Lockerstor Gen2+ с двумя портами 5GbE и чипом Intel Jasper Lake 7 ч.
На орбиту запущен пятый «завод» компании Varda Space — теперь их там два одновременно 7 ч.
MGX-сервер MSI CG480-S6053 получил чипы AMD EPYC Turin и восемь слотов PCIe 5.0 x16 для FHFL-карт двойной ширины 7 ч.
OpenAI не выйдет на прибыльность до 2030 года, но потребует $207 млрд на развитие 7 ч.
Благодаря Google и ИИ акции MediaTek показали лучшую неделю с 2002 года 7 ч.