Сегодня 06 сентября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Проблемы с ускорителями Huawei задержали выпуск передовой ИИ-модели DeepSeek R2

Китайская компания DeepSeek изначально продемонстрировала впечатляющие успехи в обучении своих языковых моделей с использованием ограниченных вычислительных ресурсов, но санкции США помешали ей двигаться уверенным темпом в своём развитии. Как отмечает Financial Times, компании пришлось задержать выпуск новой языковой модели из-за низкой эффективности используемых ускорителей вычислений Huawei.

 Источник изображения: Huawei Technologies

Источник изображения: Huawei Technologies

Выпустив с большим успехом в январе этого года языковую модель R1, эта китайская компания столкнулась с рекомендациями со стороны местных властей перейти на использование ускорителей Huawei Ascend. Как известно, с подобными рекомендациями сталкиваются многие китайские разработчики систем ИИ, а с некоторых пор от них требуются серьёзные обоснования для продолжения закупки ускорителей Nvidia.

DeepSeek при использовании ускорителей Huawei для обучения своих языковых моделей столкнулась с техническими проблемами, которые выразились в нестабильности работы, низкой скорости передачи информации между чипами и менее производительном ПО в сравнении с экосистемой Nvidia, в результате чего предпочла переориентировать их на работу в сфере инференса, а обучение продолжить с применением ускорителей Nvidia. Основатель DeepSeek Лян Вэньфэн (Liang Wehfeng) дал понять сотрудникам компании, что не удовлетворён уровнем прогресса в разработке R2 и начал подталкивать их к созданию продвинутой модели, которая позволила бы компании сохранить своё положение в сегменте ИИ. Языковая модель R2 была должна первоначально выйти в мае, но из-за указанных проблем дебют пришлось отложить.

Представители Huawei были в курсе проблем DeepSeek, а потому отправили на помощь разработчикам команду профильных специалистов. Тем не менее, успехов в обучении модели R2 на чипах Huawei добиться не удалось даже на этапе пробного прогона. Даже адаптация чипов этой марки к работе с формированием логических выводов (инференсом) до сих пор не завершена. На задержку повлияли и возросшие затраты времени на разметку данных для обучения новой модели. Тем не менее, некоторые источники рассчитывают на скорый выход R2.

Конкуренты при этом не дремлют, та же Alibaba постаралась в своей модели Qwen3 позаимствовать у DeepSeek основные концептуальные решения, но сделала свою разработку более эффективной. Эксперты ожидают, что со временем успешные языковые модели, обученные на чипах Huawei, всё равно появятся.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новая статья: Shinobi: Art of Vengeance — молчаливый и опасный. Рецензия 3 ч.
«Нам есть что рассказать»: глава MachineGames подтвердил планы на Wolfenstein 3 5 ч.
Microsoft Copilot научился создавать сводки по файлам и документам из облака OneDrive 7 ч.
«Красиво, страшно, залипательно»: хоррор Cronos: The New Dawn от авторов ремейка Silent Hill 2 стартовал в Steam с «очень положительными» обзорами 7 ч.
VI Форум «Мой бизнес» в Архангельске: малый бизнес, цифровизация и новые правила 9 ч.
После выхода Hollow Knight: Silksong самой желанной игрой пользователей Steam стала скандальная Subnautica 2 9 ч.
Apple обвинили в нарушении патентов на технологию «Привет, Siri» 9 ч.
«Внушает оптимизм»: журналисты раскрыли, когда выйдут первые обзоры Ghost of Yotei 10 ч.
Россиянам вернут важнейшие сервисы во время отключений мобильного интернета 11 ч.
Microsoft уберёт Teams из пакета офисных приложений, чтобы избежать штрафа в ЕС 13 ч.
Google тайком удалила обещание стать углеродно-нейтральной к 2030 году — всему виной аппетиты ИИ 2 ч.
Европа оштрафовала Google почти на €3 млрд за злоупотребления на рекламном рынке 2 ч.
Karri Messenger позволит детям безопасно общаться с родителями и друзьями при помощи голосовых сообщений 6 ч.
Qualcomm и BMW представили систему автономного вождения, которую будут продавать на сторону 7 ч.
Huawei заняла почти половину мирового рынка складных смартфонов — Samsung даже не вторая по популярности 7 ч.
На IFA 2025 показали пауэрбанк, который работает даже с пробитой батареей 9 ч.
Tesla предложила Илону Маску до $1 трлн за десять лет работы гендиректором 9 ч.
Mitsubishi Heavy Industries удвоит производство газовых турбин в связи с ростом индустрии ЦОД 9 ч.
Сверхтонкий 5,9-мм смартфон Nubia Air получил 6,78″ AMOLED-экран и защиту IP69K 10 ч.
Lenovo представила мобильные рабочие станции ThinkPad P с процессорами Core Ultra 200 и графикой Nvidia RTX Blackwell 10 ч.