Сегодня 02 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Ant Group придумала, как эффективно обучать ИИ на китайских чипах вместо Nvidia

Ant Group представила новый метод обучения ИИ-моделей, позволяющий использовать китайские полупроводники, включая чипы Huawei и Alibaba. Компания применила архитектуру Mixture of Experts и уже достигла результатов, сопоставимых с использованием графических процессоров (GPU) Nvidia H800, что укрепляет позиции Китая на фоне ограничений, введённых США.

 Источник изображений: Ant Group CO

Источник изображений: Ant Group CO

Это достижение знаменует собой важный этап в технологическом противостоянии между китайскими и американскими компаниями, которое резко обострилось после того, как DeepSeek доказала возможность создания современных больших языковых моделей (LLM) без миллиардных вливаний, аналогичных тем, которые делают OpenAI и Google. Хотя Ant Group по-прежнему использует решения Nvidia в ряде проектов, в новых разработках компания отдаёт предпочтение альтернативным поставщикам, включая AMD, а также местным китайским производителям полупроводников, особенно в условиях нарастающего давления со стороны экспортных ограничений США. Это позволяет китайским компаниям сохранять темп технологического прогресса и снижать зависимость от иностранных поставщиков, прежде всего от Nvidia.

Согласно опубликованной в марте научной статье, Ant Group утверждает, что её ИИ-модели в отдельных тестах превзошли разработки компании Meta. Однако эти заявления пока не получили независимого подтверждения. При этом важно отметить, что модель H800, хотя и не относится к передовому классу ускорителей Nvidia, остаётся мощным инструментом, способным справляться с ресурсоёмкими задачами обучения ИИ. Благодаря собственной оптимизированной стратегии Ant Group удалось сократить расходы на обучение ИИ-модели объёмом в 1 трлн токенов с 6,35 млн юаней ($880 000) до 5,1 млн юаней ($707 000). В данном контексте токены — это минимальные единицы текста, на которых обучаются LLM, чтобы впоследствии генерировать осмысленные ответы на запросы пользователей.

 Источник изображений: Ant Group CO

В компании заявили о намерении внедрить свои новые языковые модели — Ling-Plus и Ling-Lite — в решения, ориентированные на промышленное применение, включая здравоохранение и финансовую сферу. Ant Group уже приобрела китайскую платформу Haodf.com, специализирующуюся на медицинских онлайн-сервисах, чтобы расширить возможности своей ИИ-инфраструктуры в области здравоохранения. Кроме того, компания развивает мобильное приложение Zhixiaobao, позиционируемое как ИИ-ассистент для повседневной жизни, а также Maxiaocai — сервис на основе ИИ, предоставляющий финансовые рекомендации.

В опубликованной научной работе подчёркивается, что модель Ling-Lite показала лучшие результаты в одном из ключевых англоязычных тестов по сравнению с одной из версий Llama компании Meta. При этом обе модели — Ling-Lite и Ling-Plus — превзошли аналоги DeepSeek в бенчмарках на китайском языке. Ling-Lite содержит 16,8 млрд параметров — это настраиваемые элементы модели, определяющие её поведение при генерации текста. Модель Ling-Plus насчитывает 290 млрд параметров и по масштабности относится к категории больших языковых систем. Обе модели были представлены сообществу разработчиков в виде решений с открытым исходным кодом. По оценке MIT Technology Review, GPT-4.5 компании OpenAI содержит около 1,8 трлн параметров, а DeepSeek-R1 — 671 млрд.

Архитектура Mixture of Experts, использованная в Ling-моделях, предполагает активацию отдельных подсетей внутри модели в зависимости от типа задачи, тем самым обеспечивая оптимальное распределение вычислительных ресурсов. Эта система напоминает команду специалистов, в которой каждый элемент ИИ-модели отвечает за строго определённую, узкоспециализированную функцию. Однако в процессе обучения возникли сложности: как сообщается в научной статье, даже незначительные изменения в аппаратной конфигурации или в структуре модели приводили к резкому росту числа ошибок. Такая нестабильность делает процесс обучения чувствительным к параметрам окружения и требует дополнительной адаптации на каждом этапе.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Microsoft не будет перегружать Windows 11 ИИ-функциями — возможности Copilot и Recall урежут 17 ч.
Gartner: к 2029 году обеспечение цифрового ИИ-суверенитета будет обходиться странам в 1 % ВВП 17 ч.
Новая статья: Quarantine Zone: The Last Check — эмоций при досмотре не выявлено. Рецензия 01-02 00:05
Новая статья: Gamesblender № 761: GTA VI только в «цифре», иск к Valve на $900 млн и тайны отмененного «Принца» 31-01 23:32
IBM превзошла прогнозы Уолл-стрит благодаря спросу на ИИ, а мейнфреймы показали лучший старт продаж за всю историю 31-01 21:05
ИИ-агенты в «бесчеловечной» соцсети Moltbook основали собственную религию — «панцифарианство» 31-01 18:26
Соцсети вскоре столкнутся с массовыми набегами ИИ-агентов, предупредили учёные 31-01 16:47
Apple проигрывает борьбу за ИИ-специалистов — ценные кадры уходят в Meta и Google DeepMind 31-01 16:09
Instagram разрешит удалять себя из чужих списков «Близкие друзья» 31-01 16:04
Экс-инженера Google осудили за кражу коммерческих тайн для Китая 31-01 14:54
Новая статья: Гид по выбору умных часов (2026 год) 5 ч.
SpaceX попросила разрешение запустить 1 млн спутников для формирования космических ЦОД на сотни гигаватт 8 ч.
Intel показала образец огромного ИИ-чипа с четырьмя логическими блоками и 12 стеками HBM4 13 ч.
Портативная приставка MSI Claw A8 на Ryzen Z2 Extreme добралась до США и Европы по цене $1149 за вариант с 24 Гбайт ОЗУ 16 ч.
Южнокорейский стартап FuriosaAI начал массовое производство ИИ-ускорителей RNGD 17 ч.
SK hynix на фоне бума ИИ впервые обошла Samsung по величине годовой прибыли 17 ч.
Курс биткоина опустился ниже $80 000 впервые с апреля прошлого года 21 ч.
Крупнейшим направлением инвестирования для Nvidia станет OpenAI, но речь идёт не о $100 млрд 22 ч.
10 тыс. ампер на ускоритель: AmberSemi представила чип питания PowerTile для повышения энергоэффективности ИИ ЦОД 31-01 21:37
Флеш-альянс без срока давности: Kioxia и SanDisk продлили партнёрство по выпуску NAND до 2034 года 31-01 21:07