Сегодня 27 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Проблемы с ускорителями Huawei задержали выпуск передовой ИИ-модели DeepSeek R2

Китайская компания DeepSeek изначально продемонстрировала впечатляющие успехи в обучении своих языковых моделей с использованием ограниченных вычислительных ресурсов, но санкции США помешали ей двигаться уверенным темпом в своём развитии. Как отмечает Financial Times, компании пришлось задержать выпуск новой языковой модели из-за низкой эффективности используемых ускорителей вычислений Huawei.

 Источник изображения: Huawei Technologies

Источник изображения: Huawei Technologies

Выпустив с большим успехом в январе этого года языковую модель R1, эта китайская компания столкнулась с рекомендациями со стороны местных властей перейти на использование ускорителей Huawei Ascend. Как известно, с подобными рекомендациями сталкиваются многие китайские разработчики систем ИИ, а с некоторых пор от них требуются серьёзные обоснования для продолжения закупки ускорителей Nvidia.

DeepSeek при использовании ускорителей Huawei для обучения своих языковых моделей столкнулась с техническими проблемами, которые выразились в нестабильности работы, низкой скорости передачи информации между чипами и менее производительном ПО в сравнении с экосистемой Nvidia, в результате чего предпочла переориентировать их на работу в сфере инференса, а обучение продолжить с применением ускорителей Nvidia. Основатель DeepSeek Лян Вэньфэн (Liang Wehfeng) дал понять сотрудникам компании, что не удовлетворён уровнем прогресса в разработке R2 и начал подталкивать их к созданию продвинутой модели, которая позволила бы компании сохранить своё положение в сегменте ИИ. Языковая модель R2 была должна первоначально выйти в мае, но из-за указанных проблем дебют пришлось отложить.

Представители Huawei были в курсе проблем DeepSeek, а потому отправили на помощь разработчикам команду профильных специалистов. Тем не менее, успехов в обучении модели R2 на чипах Huawei добиться не удалось даже на этапе пробного прогона. Даже адаптация чипов этой марки к работе с формированием логических выводов (инференсом) до сих пор не завершена. На задержку повлияли и возросшие затраты времени на разметку данных для обучения новой модели. Тем не менее, некоторые источники рассчитывают на скорый выход R2.

Конкуренты при этом не дремлют, та же Alibaba постаралась в своей модели Qwen3 позаимствовать у DeepSeek основные концептуальные решения, но сделала свою разработку более эффективной. Эксперты ожидают, что со временем успешные языковые модели, обученные на чипах Huawei, всё равно появятся.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Необходимое зло: Ubisoft объяснила, зачем добавила в Assassin's Creed Shadows микротранзакции 4 мин.
Paradox взяла на себя вину за провал Vampire: The Masquerade — Bloodlines 2 и списала больше половины бюджета игры 8 мин.
Создатели The Alters объявили дату выхода крупного обновления — в нём переработают сохранения, добавят фоторежим и многое другое 2 ч.
Opera добавила в ИИ-браузер Neon минутные глубокие исследования и интеграцию с «Google Документами» 5 ч.
CD Projekt подтвердила, что не покажет The Witcher 4 на The Game Awards 2025 5 ч.
Google начала внедрять Gemini в «Google Карты» для всех режимов навигации 10 ч.
Cyberpunk 2077 стала главным источником дохода CD Projekt — компания отчиталась об ударных результатах за третий квартал 16 ч.
«Новый год пришёл раньше времени»: Sony включила в декабрьскую линейку PS Plus сразу пять игр, в том числе Lego Horizon Adventures и Killing Floor 3 18 ч.
Продажи Cyberpunk 2077 превысили 35 миллионов копий, а команда Cyberpunk 2 растёт не по дням, а по часам 18 ч.
ЕС откажется от сканирования переписок — ИТ-гиганты выиграли битву за конфиденциальность пользователей 19 ч.
HSBC: OpenAI придётся где-то найти ещё $207 млрд к 2030 году для достижения поставленных целей 2 ч.
Нетоксичное и дармовое: учёные создали пьезоэлектрический материал для выработки электричества в движении 2 ч.
Китайские разработчики отправляют ИИ учиться за границу — там есть санкционные ускорители Nvidia 2 ч.
Celestica выпустила JBOD-массив SD6300 на 108 накопителей для ИИ-платформ 2 ч.
Человекоподобные роботы UBTech начнут служить на границе Китая и Вьетнама 3 ч.
Почти 5 Гбайт на квадратный миллиметр: Kioxia и SanDisk готовят флеш-память рекордной плотности 4 ч.
Атмосфера Марса вовсю искрит, выяснил марсоход NASA Perseverance 4 ч.
Дизайнер превратил кроссовки Nike в полноценную ретро-консоль с играми SNES 4 ч.
Intel охотится за инженерами TSMC в Аризоне — зарплаты обещают на 20–30 % выше 5 ч.
Basis Dynamix стала основой инфраструктуры первого отечественного ядра 4G-сети оператора Т2 5 ч.