Сегодня 25 марта 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

ИИ-модель DeepSeek R1 заработала на суверенных китайских ускорителях Sophgo

Высокий спрос на ускорители вычислений Nvidia и других популярных марок сам по себе ограничивает их доступность, а в случае с китайскими разработчиками систем ИИ всё усугубляется американскими санкциями. Нет ничего удивительного, что в сложившихся условиях они предпочли опираться на ускорители местного происхождения, для DeepSeek в этом смысле подошли ускорители Sophgo.

 Источник изображения: DeepSeek

Источник изображения: DeepSeek

По крайней мере, об их успешном применении докладывает South China Morning Post со ссылкой на заявления Sophgo. Ускорители SC11 FP300 этой компании, по данным китайской лаборатории CTTL, продемонстрировали высокое быстродействие и стабильную работу в задачах, связанных с формированием логических выводов (инференсе) при использовании большой языковой модели DeepSeek R1. Подобные задачи требуют меньших вычислительных ресурсов по сравнению с этапом обучения больших языковых моделей.

Ускоритель FP300 был выпущен Sophgo в прошлом году, он оснащается 256 Гбайт высокоскоростной памяти, обеспечивающей пропускную способность до 1,1 Тбайт/с, технически он пригоден и для обучения больших языковых моделей. В то же время, данное аппаратное решение всё же в большей мере заточено под работу с рассуждающими моделями.

Как отмечалось ранее, китайской компании DeepSeek уже пришлось задержать выпуск своей модели R2, который был намечен на май, из-за проблем с доступом к вычислительным ресурсам, необходимым для её обучения. Китайская компания iFlyTek, между тем, уже сообщила о полном переходе на ускорители вычислений Huawei. Китайские решения серии Ascend 910B позволяют добиться эффективности вычислений на уровне 73 % против 25 %, которые были доступны при использовании Nvidia A800 в конце прошлого года. Правда, миграция на китайские ускорители всё же вызвала задержку в выпуске новых языковых моделей на три месяца. Компании iFlyTek и Sophgo находятся под различными санкциями США, поэтому им невольно приходится сближаться для достижения поставленных целей в условиях внешних ограничений.

Источник:


window-new
Soft
Hard
Тренды 🔥
Разработчик «Мира танков» и «Мира кораблей» задолжал государству более 11 миллиардов рублей 22 мин.
Конец эпохи: Xiaomi отправила на пенсию MIUI — оболочку, которая прославила компанию 42 мин.
Минцифры хочет фильтровать весь трафик Рунета — средства блокировки разгонят в 2,5 раза к 2030 году 43 мин.
Apple выпустила iOS 26.4 и iPadOS 26.4 с новыми эмодзи и функциями 53 мин.
Продажи Marathon за три недели достигли 1,2 миллиона копий, но Sony ждала большего 2 ч.
Meta врала насчёт безопасности Facebook, Instagram и WhatsApp для детей — суд назначил штраф в $375 млн 2 ч.
Анонсирована нелинейная тактическая стратегия Arbiter 131, где «всё решается через геймплей» 3 ч.
Meta нацелилась на капитализацию в $9 трлн и мотивирует ключевых руководителей щедрыми опционами впервые с момента IPO 4 ч.
Apple подтвердила появление рекламы в «Картах» и пообещала не следить за перемещениями пользователей 14 ч.
Sony закроет новую студию режиссёра Call of Duty: Black Ops 3 спустя год после открытия 15 ч.
Nerpa разработала новую IP-фабрику для ЦОД и облаков 15 мин.
Россияне переходят на вторичную память: продажи SSD на «Авито» взлетели в 5,5 раз, а ОЗУ — в два раза 2 ч.
Дефицит процессоров для ПК обостряется — цены растут, а поставки уже растянулись на месяцы 3 ч.
Arm нацелилась увеличить выручку в шесть раз и зарабатывать $15 млрд в год на собственных процессорах 4 ч.
В России стартовали продажи ноутбуков Prestige 16 AI+ и 16 Flip AI+, а суперлёгкий Prestige 13 AI+ выйдет в апреле 4 ч.
SK hynix нужны миллиарды, чтобы не отстать в гонке ИИ-памяти — компания нацелилась на IPO в США в этом году 5 ч.
Новая статья: Обзор мини-ПК MSI Cubi Z AI 8M: размеры — меньше, портов — больше 11 ч.
OpenAI внезапно закрыла Sora — завоевавший вирусную популярность генератор ИИ-слопа 11 ч.
Apple выпустит отдельное приложение Siri для iOS 27 и macOS 27 11 ч.
Новая статья: NVIDIA Groq 3: SRAM, дезагрегация, детерминизм 12 ч.