Сегодня 18 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Alibaba нашла способ сократить потребность в количестве используемых ускорителей Nvidia на 82 %

Нехватка вычислительных мощностей, присущая динамично развивающемуся рынку искусственного интеллекта, в Китае усугубляется ограничениями на импорт специализированных ускорителей. Разработчики вынуждены заниматься оптимизацией, и Alibaba нашла способ сократить количество необходимых ускорителей Nvidia для работы своих языковых моделей на 82 %.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Как поясняет South China Morning Post, бета-тестирование профильной системы Aegaeon уже проводится одним их подразделений Alibaba Cloud на протяжении более чем трёх месяцев. По информации, представленной Alibaba на мероприятии SOSP в столице Южной Кореи, данная система позволила сократить количество обслуживающих десятки языковых моделей ускорителей Nvidia H20 с 1192 до 213 штук. При этом соответствующие языковые модели используют до 72 млн параметров, как поясняет источник.

Представителям Alibaba в создании такой системы помогали учёные Пекинского университета, которые назвали её «первой попыткой выявить излишние затраты, связанные с одновременным обслуживанием нагрузок с большими языковыми моделями». Провайдеры облачных услуг типа Alibaba сталкиваются с необходимостью одновременного обслуживания тысяч ИИ-моделей, но в сфере инференса наиболее часто используются лишь несколько моделей типа Qwen или DeepSeek, а прочие вызываются довольно редко. Это приводит к нерациональному расходованию ресурсов. В экосистеме Alibaba Cloud, например, до 17,7 % ускорителей выделяются для обработки 1,35 % запросов.

Исследователи во всём мире начали предлагать повысить эффективность использования вычислительных ресурсов за счёт объединения в пулы, когда один GPU обслуживает несколько моделей. Система Aegaeon использует автомасштабирование на уровне токенов, позволяющее GPU переключаться между разными моделями прямо в процессе генерирования токенов. Один GPU в результате способен обрабатывать до семи моделей, тогда как в альтернативно устроенных системах их количество в лучшем случае достигает двух или трёх. Задержки, необходимые на переключение между моделями, при этом сократились на 97 % в случае с Aegaeon.

Alibaba эту систему испытывает на маркетплейсе моделей Bailian, который предлагает модели Qwen корпоративным пользователям. Ускорители Nvidia H20 одноимённой американской компанией были созданы специально для китайского рынка, в апреле они попали под временный запрет на поставку в КНР, но к лету он был снят. Однако, китайские власти начали настоятельно рекомендовать национальным разработчикам отдавать предпочтение местной компонентной базе. В результате позиции Nvidia на китайском рынке передовых чипов для ИИ, по словам руководителя компании, буквально сократились до нуля.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Bethesda наконец починила The Elder Scrolls V: Skyrim на Nintendo Switch 2 — легендарная RPG получила поддержку 60 кадров/с и не только 40 мин.
Perplexity первой встроила рекламу в ИИ, но теперь отказалась от неё из-за угрозы доверию пользователей 60 мин.
Microsoft показала, чего ждать от следующих обновлений Windows 11 — улучшение панели задач, новые настройки и эмодзи 2 ч.
Google сделает ссылки в ИИ-поиске заметнее на фоне жалоб издателей 2 ч.
AWS внедрила вложенную виртуализацию для инстансов EC2 2 ч.
Перевод на русский, приручение животных и многое другое: ролевая песочница Hytale в духе Minecraft получила крупное обновление 2 ч.
После скандального взлома обновления Notepad++ защитили по схеме «двойной блокировки» 3 ч.
Психологический хоррор-шутер Total Chaos от создателя Turbo Overkill скоро станет ещё сложнее и страшнее — дата выхода «Новой игры +» 3 ч.
«Немного ошеломлены»: кошачий роглайк Mewgenics от автора The Binding of Isaac и Super Meat Boy за неделю достиг миллиона проданных копий 4 ч.
Google рассказала, как сделает работу всех смартфонов более плавной в Android 17 5 ч.
Бум ИИ разогнал станкостроителей: прибыль поставщиков чипового оборудования растёт восьмой квартал подряд 53 мин.
Технология древних на новых лад: учёные научились записывать 2 Тбайт данных на лист керамики формата A4 2 ч.
Adani вложит $100 млрд в создание 5 ГВт «зелёных» ИИ ЦОД в Индии 2 ч.
США бросили миллиарды на редкоземельную независимость от Китая — это может затянуться на десятилетие 2 ч.
Эхо несостоявшейся сделки на $40 млрд: Nvidia продала последние акции Arm 4 ч.
Meta развернёт ИИ-инфраструктуру на «миллионах GPU-ускорителей NVIDIA Blackwell и Rubin», а также Arm-чипах Grace 5 ч.
От распознавания кошек к задачам Эрдёша: ИИ всё активнее штурмует высшую математику 5 ч.
SpaceX вошла в секретный конкурс Пентагона по созданию ИИ для голосового управления роями дронов 7 ч.
Apple готовит «умный» домофон с Face ID — он будет впускать в дом по лицу 9 ч.
Meta закупит миллионы ИИ-чипов у Nvidia, включая центральные Arm-процессоры Grace и Vera 9 ч.