Сегодня 19 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → ant group

Ant Group придумала, как эффективно обучать ИИ на китайских чипах вместо Nvidia

Ant Group представила новый метод обучения ИИ-моделей, позволяющий использовать китайские полупроводники, включая чипы Huawei и Alibaba. Компания применила архитектуру Mixture of Experts и уже достигла результатов, сопоставимых с использованием графических процессоров (GPU) Nvidia H800, что укрепляет позиции Китая на фоне ограничений, введённых США.

 Источник изображений: Ant Group CO

Источник изображений: Ant Group CO

Это достижение знаменует собой важный этап в технологическом противостоянии между китайскими и американскими компаниями, которое резко обострилось после того, как DeepSeek доказала возможность создания современных больших языковых моделей (LLM) без миллиардных вливаний, аналогичных тем, которые делают OpenAI и Google. Хотя Ant Group по-прежнему использует решения Nvidia в ряде проектов, в новых разработках компания отдаёт предпочтение альтернативным поставщикам, включая AMD, а также местным китайским производителям полупроводников, особенно в условиях нарастающего давления со стороны экспортных ограничений США. Это позволяет китайским компаниям сохранять темп технологического прогресса и снижать зависимость от иностранных поставщиков, прежде всего от Nvidia.

Согласно опубликованной в марте научной статье, Ant Group утверждает, что её ИИ-модели в отдельных тестах превзошли разработки компании Meta. Однако эти заявления пока не получили независимого подтверждения. При этом важно отметить, что модель H800, хотя и не относится к передовому классу ускорителей Nvidia, остаётся мощным инструментом, способным справляться с ресурсоёмкими задачами обучения ИИ. Благодаря собственной оптимизированной стратегии Ant Group удалось сократить расходы на обучение ИИ-модели объёмом в 1 трлн токенов с 6,35 млн юаней ($880 000) до 5,1 млн юаней ($707 000). В данном контексте токены — это минимальные единицы текста, на которых обучаются LLM, чтобы впоследствии генерировать осмысленные ответы на запросы пользователей.

 Источник изображений: Ant Group CO

В компании заявили о намерении внедрить свои новые языковые модели — Ling-Plus и Ling-Lite — в решения, ориентированные на промышленное применение, включая здравоохранение и финансовую сферу. Ant Group уже приобрела китайскую платформу Haodf.com, специализирующуюся на медицинских онлайн-сервисах, чтобы расширить возможности своей ИИ-инфраструктуры в области здравоохранения. Кроме того, компания развивает мобильное приложение Zhixiaobao, позиционируемое как ИИ-ассистент для повседневной жизни, а также Maxiaocai — сервис на основе ИИ, предоставляющий финансовые рекомендации.

В опубликованной научной работе подчёркивается, что модель Ling-Lite показала лучшие результаты в одном из ключевых англоязычных тестов по сравнению с одной из версий Llama компании Meta. При этом обе модели — Ling-Lite и Ling-Plus — превзошли аналоги DeepSeek в бенчмарках на китайском языке. Ling-Lite содержит 16,8 млрд параметров — это настраиваемые элементы модели, определяющие её поведение при генерации текста. Модель Ling-Plus насчитывает 290 млрд параметров и по масштабности относится к категории больших языковых систем. Обе модели были представлены сообществу разработчиков в виде решений с открытым исходным кодом. По оценке MIT Technology Review, GPT-4.5 компании OpenAI содержит около 1,8 трлн параметров, а DeepSeek-R1 — 671 млрд.

Архитектура Mixture of Experts, использованная в Ling-моделях, предполагает активацию отдельных подсетей внутри модели в зависимости от типа задачи, тем самым обеспечивая оптимальное распределение вычислительных ресурсов. Эта система напоминает команду специалистов, в которой каждый элемент ИИ-модели отвечает за строго определённую, узкоспециализированную функцию. Однако в процессе обучения возникли сложности: как сообщается в научной статье, даже незначительные изменения в аппаратной конфигурации или в структуре модели приводили к резкому росту числа ошибок. Такая нестабильность делает процесс обучения чувствительным к параметрам окружения и требует дополнительной адаптации на каждом этапе.

Китай закончил кампанию против IT-гигантов, оштрафовав Ant Group на $984 млн и Tencent на $414 млн

Кажется, что развёрнутая властями Китая кампания по усмирению местных IT-гигантов Alibaba и Tencent подошла к концу. Регулирующие органы решили, что обе компании должны будут уплатить штраф в сумме на 1,4 миллиарда долларов в качестве компенсации за прошлые проступки, в то время как Пекин переходит к «нормализованному» надзору.

Китайский финансовый регулятор в прошлую пятницу объявил о штрафе в размере 7,123 миллиарда юаней (984 миллиона долларов) для финтех-подразделения Alibaba, компании Ant Group, и постановила прекратить работу его службы медицинского страхования, Xianghubao. В свою очередь Tencent признала, что получила уведомление о штрафе в размере 2,9 миллиарда юаней (414 миллионов долларов) от Народного банка Китая.

Было установлено, что Ant Group нарушила законы, регулирующие страхование, инвестиции, отмывание денег и многое другое. Alibaba уже решила закрыть Xianghubao. Tencent была оштрафована за недостаточно должное управление некоторыми аспектами своей услуги Tencent Pay.

В своё время Пекин ополчился на Ant Group за слова основателя Alibaba Джека Ма (Jack Ma), который раскритиковал власти Китая. В итоге в последний момент компанию вынудили отменить планировавшийся дебют Ant Group на фондовом рынке в 2020 году ­— на тот момент времени он должен был стать одним из самых высокооцененных IPO в мире. Официальной причиной для отмены выхода на биржу стало беспокойство властей Китая о некоторых кредитных продуктах, которые предлагала Ant Group.

После объявления о штрафе на прошлой неделе, Ant предложила новый план, чтобы помочь инвесторам превратить их акции в наличные: выкуп акций 7,6 % акций. Однако выкуп акций не является хорошей новостью, поскольку он оценивает Ant Group на 70 % ниже суммы, указанные при ценообразовании отмененного IPO 2020 года.

Китайские власти ранее заявляли, что их кампания по корректировке в отношении 14 платформенных бизнесов «по сути, завершена», оставив всего несколько вопросов для решения. Объявление Пекина о штрафах вместе с подробным объяснением причин их наложения, а также упоминанием о возвращении к нормализованной регулировке, намекает на то, что Китай теперь решил эти вопросы и завершил свое многолетнее расследование поведения своих веб-гигантов.

Действия властей оставили значительный след на Alibaba, которая, в свою очередь, приняла решение разделиться на шесть компаний и перестроила структуру своего исполнительного руководства.


window-new
Soft
Hard
Тренды 🔥
Новая статья: South of Midnight — соткана по лекалам. Рецензия 4 ч.
Вежливость — это дорого: OpenAI тратит миллионы долларов на «спасибо» и «пожалуйста» в ChatGPT 5 ч.
ChatGPT научился использовать воспоминания о пользователе для персонализации веб-поиска 6 ч.
Создатели следующей Battlefield рассказали о новом «языке разрушения» и показали его в деле 8 ч.
Глава Microsoft Gaming Фил Спенсер намекнул на продолжение Indiana Jones and the Great Circle 8 ч.
Разработчики Everspace 2 решили снизить цену на дополнение Wrath of the Ancients, потому что «вокруг дорожает буквально всё» 10 ч.
Google обжалует «неблагоприятное» решение суда о признании её монополистом в интернет-рекламе 10 ч.
84 % россиян выходят в интернет каждый день, подсчитал Mediascope 10 ч.
Cloud.ru представил первый в России управляемый облачный сервис для инференса ИИ-моделей — Evolution ML Inference 12 ч.
Автор Loretta раскрыл дату выхода новой игры — хоррор-стратегии Anoxia Station про погоню за нефтью в недрах умирающей Земли 15 ч.
Western Digital начала добывать редкоземельные и драгоценные металлы из жёстких дисков 7 ч.
HP отделалась выплатой $4 млн по иску о завышенных ценах и фиктивных скидках 10 ч.
Xiaomi представила компактный домашний проектор Redmi 3 Lite за $100 10 ч.
Nintendo Switch 2 избежала подорожания, несмотря на новые пошлины США — аксессуары тем же похвастаться не могут 10 ч.
Western Digital запустила в США масштабную программу извлечения редкоземельных элементов из HDD — уже переработано почти 23 т дисков Microsoft 11 ч.
Физики обнаружили аномальный эффект Холла в неожиданном месте 12 ч.
Из-за политики США европейские пользователи задумались об уходе из американских облаков 13 ч.
Продажи российского электромобиля Lada e-Largus выросли до одного экземпляра в первом квартале 13 ч.
Intel расследует падение производительности видеокарт Arc при работе со старыми CPU 13 ч.
Китайская EHang пообещала запустить сервис летающих такси по разумной цене до конца года 14 ч.