Сегодня 13 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

ИИ-модель DeepSeek R1 заработала на суверенных китайских ускорителях Sophgo

Высокий спрос на ускорители вычислений Nvidia и других популярных марок сам по себе ограничивает их доступность, а в случае с китайскими разработчиками систем ИИ всё усугубляется американскими санкциями. Нет ничего удивительного, что в сложившихся условиях они предпочли опираться на ускорители местного происхождения, для DeepSeek в этом смысле подошли ускорители Sophgo.

 Источник изображения: DeepSeek

Источник изображения: DeepSeek

По крайней мере, об их успешном применении докладывает South China Morning Post со ссылкой на заявления Sophgo. Ускорители SC11 FP300 этой компании, по данным китайской лаборатории CTTL, продемонстрировали высокое быстродействие и стабильную работу в задачах, связанных с формированием логических выводов (инференсе) при использовании большой языковой модели DeepSeek R1. Подобные задачи требуют меньших вычислительных ресурсов по сравнению с этапом обучения больших языковых моделей.

Ускоритель FP300 был выпущен Sophgo в прошлом году, он оснащается 256 Гбайт высокоскоростной памяти, обеспечивающей пропускную способность до 1,1 Тбайт/с, технически он пригоден и для обучения больших языковых моделей. В то же время, данное аппаратное решение всё же в большей мере заточено под работу с рассуждающими моделями.

Как отмечалось ранее, китайской компании DeepSeek уже пришлось задержать выпуск своей модели R2, который был намечен на май, из-за проблем с доступом к вычислительным ресурсам, необходимым для её обучения. Китайская компания iFlyTek, между тем, уже сообщила о полном переходе на ускорители вычислений Huawei. Китайские решения серии Ascend 910B позволяют добиться эффективности вычислений на уровне 73 % против 25 %, которые были доступны при использовании Nvidia A800 в конце прошлого года. Правда, миграция на китайские ускорители всё же вызвала задержку в выпуске новых языковых моделей на три месяца. Компании iFlyTek и Sophgo находятся под различными санкциями США, поэтому им невольно приходится сближаться для достижения поставленных целей в условиях внешних ограничений.

Источник:


window-new
Soft
Hard
Тренды 🔥
Взломщики Rockstar опубликуют украденные данные — разработчик GTA VI не выполнил требования хакеров 6 мин.
Большинство австралийских подростков продолжило сидеть в соцсетях, несмотря на запрет 20 мин.
Microsoft подтвердила презентацию новой «Метро» — где и когда смотреть Xbox First Look: Metro 2039 53 мин.
Microsoft задумала продавать ИИ-агентам лицензии Office и другое ПО, как обычным людям 3 ч.
Бойкот рекламодателями соцсети X проверят на сговор — FTC запустило расследование 3 ч.
Марк Цукерберг создаёт себе ИИ-двойника, который будет общаться с подчинёнными за него 5 ч.
После блокировки Telegram россияне распробовали азиатские мессенджеры 6 ч.
«Хотите — верьте, хотите — нет»: разработчик Graveyard Keeper 2 отреагировал на подозрения в использовании генеративного ИИ 7 ч.
Escape from Tarkov в космосе: анонсирован хардкорный научно-фантастический шутер следующего поколения Fragmentary Order 8 ч.
Red Hat уволила сотни программистов в Китае, чтобы перенести разработку в Индию 8 ч.
Microsoft выпустила виртуальную мышь Gamepad Cursor для портативных консолей на Windows 25 мин.
570-Тбит/с подводный интернет-кабель Candle объединит страны Азиатско-Тихоокеанского региона к 2028 году 2 ч.
Aligned построит в Техасе 540-МВт кампус ЦОД Project Caprock с фирменной СЖО DeltaFlow~ 3 ч.
Учёные научились извлекать до 90 % лития из отработанных аккумуляторов 3 ч.
EXEED представил твердотельные аккумуляторы Rhino: запас хода на 500 км за 8 минут зарядки 3 ч.
Утечка раскрыла характеристики настольных Intel Nova Lake-S: до 52 ядер, DDR5-8000 и до 175 Вт 4 ч.
Хранилище Backblaze Storage Pod стало экспонатом Музея компьютерной истории 5 ч.
Nothing Phone (4a) Pro удивительно хорошо прошёл проверку на прочность, но обнаружился нюанс по защите от воды 5 ч.
Huawei показала складной смартфон Pura X Max с широкоформатным дисплеем 5 ч.
Aria Networks представила «думающую» сетевую платформу Deep Networking для высокоэффективных ИИ-инфраструктур 5 ч.