Сегодня 22 марта 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Новейшая ИИ-модель DeepSeek V4 должна быть оптимизирована под китайские ускорители вычислений

На этой неделе, как сообщает Financial Times, китайская DeepSeek должна представить долгожданную мультимодальную ИИ-модель V4, которая была оптимизирована под использование ускорителей Huawei и Cambricon. В совокупности это позволит китайским компаниям добиться определённых успехов во внедрении технологий ИИ без чрезмерной зависимости от импортных решений.

 Источник изображения: DeepSeek

Источник изображения: DeepSeek

По данным источника, сроки анонса модели DeepSeek V4 будут привязаны к парламентскому заседанию в КНР, которое начнётся 4 марта. Данный релиз для DeepSeek станет крупнейшим с января прошлого года, когда была представлена рассуждающая модель R1. Тогда утверждалось, что китайской компании удалось создать сопоставимую по эффективности с западными решениями ИИ-модель при значительно меньших затратах. Позже выяснилось, что DeepSeek не только могла использовать данные американских моделей для обучения своих, но и опираться на ускорители вычислений Nvidia, которые в необходимом компании ассортименте моделей находятся в КНР под санкциями.

Как ожидается, оптимизация DeepSeek V4 под ускорители Huawei и Cambricon будет способствовать росту спроса на эти аппаратные решения в Китае, а также снижению импортозависимости. DeepSeek якобы даже намеренно не оптимизировала свою новейшую модель под ускорители Nvidia. Ранее сообщалось, что первые попытки DeepSeek обучать модель V4 на ускорителях Huawei не увенчались особым успехом. Аннотация к DeepSeek V4 выйдет на этой неделе в сокращённом виде, но примерно через месяц будет опубликована в полном размере. Американская Anthropic недавно обвинила DeepSeek в «дистилляции» собственных ИИ-моделей.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Франция обвинила Илона Маска в завышении стоимости X и xAI дипфейками с обнажёнкой 3 ч.
OpenAI планирует удвоить штат ради укрепления корпоративных продаж ChatGPT 9 ч.
Новая статья: John Carpenter's Toxic Commando — весёлый экшен для совместного отдыха. Рецензия 16 ч.
Apple хотела поглотить разработчика приложения камеры Halide, но рассорила учредителей стартапа 20 ч.
Реклама в ChatGPT забуксовала: крупные агентства вложили сотни тысяч, но аудитории не хватает 23 ч.
«Google Переводчик» научит пользователей правильному произношению с помощью ИИ 21-03 14:39
На PlayStation появится ИИ-генератор кадров, как у Radeon — но не в ближайшее время 21-03 12:55
Чиновников обяжут пользоваться мессенджером Max 21-03 12:22
Пентагон принял боевую ИИ-систему Palantir Maven в качестве основной для армии США 21-03 12:18
Microsoft представила MAI-Image-2 — ИИ-генератор изображений, который оказался неожиданно хорош в фотореализме и инфографике 21-03 12:07
Почти втрое быстрее NVIDIA H20: Huawei представила ИИ-ускоритель Atlas 350 для инференса 3 ч.
Apple распродала запасы MacBook Neo — новым покупателям придётся ждать до середины апреля 5 ч.
Huawei представила ИИ-ускоритель Atlas 350, превосходящий Nvidia H20 по производительности 5 ч.
Tesla и SpaceX построят гигантскую фабрику по выпуску ИИ-чипов в Техасе 7 ч.
Micron сейчас способна покрывать спрос на память от силы на две трети от требуемого уровня 8 ч.
Китайские мозговые импланты на три года отстают от американских Neuralink 9 ч.
Supermicro выгнала сооснователя компании, попавшегося на контрабанде в Китай подсанкционного ИИ-оборудования 18 ч.
Скандал с контрабандой обрушил акции Supermicro на 33 % — компания запустила реорганизацию 22 ч.
AMD «забыла» представить Ryzen 9 9950X3D2 с двойным 3D V-Cache на этой неделе, показал пресс-релиз ASRock 23 ч.
«Ты получаешь лучшее из обоих миров»: Apple объяснила, почему в процессорах M5 стало три типа ядер 23 ч.