Сегодня 18 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

DeepSeek упёрся в санкции: разработка модели R2 забуксовала из-за нехватки чипов Nvidia

В начале этого года китайская компания DeepSeek удивила всех выпуском своей языковой модели R1, которая достигала сопоставимых с лучшими западными образцами результатов в сфере ИИ, но требовала от разработчиков предположительно меньших затрат. Создание более новой модели R2, по некоторым данным, упёрлось в доступность ускорителей вычислений Nvidia, которые сложно найти на территории Китая.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Как напоминает Reuters со ссылкой на The Information, первоначально DeepSeek планировала представить R2 в конце мая, но руководство компании было недовольно достигаемым ею уровнем быстродействия, поэтому доводка этой языковой модели затянулась во времени. По данным источника, прогресс в известной степени тормозится отсутствием в Китае достаточного количества производительных ускорителей вычислений, а DeepSeek пока предпочитает полагаться главным образом на решения Nvidia, поставки которых в КНР серьёзно ограничены из-за санкций США.

Облачная инфраструктура на территории Китая, которая сейчас используется для работы с языковой моделью R1, опирается преимущественно на ускорители Nvidia H20, которые до апреля этого года можно было поставлять вполне легально. В своей отчётности Nvidia отметила, что весенний запрет на поставки ускорителей H20 будет стоить ей нескольких миллиардов долларов США, поскольку предусмотреть иное назначение для такой продукции не получится, и весь запас придётся просто списать. Одновременно с этим Nvidia пытается найти возможность поставлять в Китай менее производительные ускорители, которые соответствовали бы существующим требованиям США в данной сфере. Предполагается, что эти ускорители будут созданы с использованием архитектуры Blackwell и памяти типа GDDR7.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Хакеры приспособили GitHub для массового распространения вредоносов как услуги 6 мин.
Java-инспекция: новая политики лицензирования Oracle привела к бесконечной череде аудитов 53 мин.
Инсайдер заинтриговал фанатов Dark Souls и Armored Core первыми подробностями неанонсированной игры FromSoftware 3 ч.
Meta воспользовалась неразберихой в Apple и переманила ещё двух специалистов по ИИ 3 ч.
Китайские разработчики за полгода вложили в рекламу в RuStore больше, чем за весь прошлый год 6 ч.
Mistral добавила в Le Chat функции конкурентов: глубокие исследования, редактирование фото и мультиязычность 6 ч.
Илон Маск получил больше времени на подготовку к судебному заседанию по делу о покупке Twitter 6 ч.
Консорциум Unicode утвердил новые эмодзи — в их числе снежный человек и яблочный огрызок 6 ч.
OpenAI представила ChatGPT Agent — ИИ-агент для выполнения сложных задания от имени пользователя на собственном «виртуальном компьютере» 7 ч.
Neverwinter Nights 2: Enhanced Edition пропала из продажи в российском Steam спустя сутки после релиза 14 ч.
Самый большой ЦОД Центральной Азии появится в 2026 году в Астане 52 мин.
В Китае создан спасательный беспилотник самолётного типа с вертикальным взлётом и посадкой 2 ч.
HBM скоро утратит статус «золотой жилы»: передовой памяти спрогнозировали падение цен 2 ч.
Учёные впервые обнаружили начало рождения экзопланеты 2 ч.
Lenovo анонсировала четырёхсокетные серверы ThinkSystem SR850 V4 и SR860 V4 на базе Intel Xeon 6 3 ч.
Uber наймёт 20 000 электромобилей Lucid для работы в роботакси 3 ч.
Faraday Future напомнила о своём существовании анонсом электрического минивэна с дисплеем вместо радиаторной решётки 5 ч.
Вкалывают роботы: UBTech показала технологию автоматической замены батарей, которая позволит роботам трудиться без остановки 7 ч.
HP начнёт сама показывать неотключаемую рекламу на своих ноутбуках и ПК 9 ч.
Новая статья: Обзор игрового QD-OLED 4K-монитора Gigabyte MO32U: снова в яблочко 13 ч.