Сегодня 27 июня 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

DeepSeek упёрся в санкции: разработка модели R2 забуксовала из-за нехватки чипов Nvidia

В начале этого года китайская компания DeepSeek удивила всех выпуском своей языковой модели R1, которая достигала сопоставимых с лучшими западными образцами результатов в сфере ИИ, но требовала от разработчиков предположительно меньших затрат. Создание более новой модели R2, по некоторым данным, упёрлось в доступность ускорителей вычислений Nvidia, которые сложно найти на территории Китая.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Как напоминает Reuters со ссылкой на The Information, первоначально DeepSeek планировала представить R2 в конце мая, но руководство компании было недовольно достигаемым ею уровнем быстродействия, поэтому доводка этой языковой модели затянулась во времени. По данным источника, прогресс в известной степени тормозится отсутствием в Китае достаточного количества производительных ускорителей вычислений, а DeepSeek пока предпочитает полагаться главным образом на решения Nvidia, поставки которых в КНР серьёзно ограничены из-за санкций США.

Облачная инфраструктура на территории Китая, которая сейчас используется для работы с языковой моделью R1, опирается преимущественно на ускорители Nvidia H20, которые до апреля этого года можно было поставлять вполне легально. В своей отчётности Nvidia отметила, что весенний запрет на поставки ускорителей H20 будет стоить ей нескольких миллиардов долларов США, поскольку предусмотреть иное назначение для такой продукции не получится, и весь запас придётся просто списать. Одновременно с этим Nvidia пытается найти возможность поставлять в Китай менее производительные ускорители, которые соответствовали бы существующим требованиям США в данной сфере. Предполагается, что эти ускорители будут созданы с использованием архитектуры Blackwell и памяти типа GDDR7.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Хакеры могут захватить тысячи серверов — в популярном контроллере для удалённого управления найдена критическая уязвимость 20 мин.
Google выпустила приложение Doppl для виртуальной примерки нарядов 22 мин.
Ущерб российскому бизнесу от DDoS-атак утроился в 2025 году, и это не предел 3 ч.
Digital Realty выбрала HPE Private Cloud для модернизации своего парка ЦОД по всему миру 3 ч.
Минспорт разработал новый стандарт физподготовки киберспортсменов — сколько нужно накликать за 30 секунд, чтобы получить квалификацию 3 ч.
Google доработала и перезапустила ИИ-функцию Ask Photos для поиска фото по содержимому 4 ч.
«Насмешка над конкуренцией»: Apple дала разработчикам выбор — 5 % комиссии или урезанные функции App Store 4 ч.
В очаровательном приключении The Plucky Squire появился хардкорный режим для тех, кому игра показалась слишком лёгкой 5 ч.
Страшно интересно: Capcom показала первый геймплей Resident Evil Requiem и раскрыла подробности амбициозного хоррора 6 ч.
Microsoft выведет антивирусное ПО за пределы ядра Windows, кардинально изменив безопасность ОС 10 ч.
Asus выпустила GeForce RTX 5070 Ti и RTX 5090 со съёмным коннектором GC-HPWR для скрытого питания 6 мин.
«Удомля-3»: в Тверской области заработала третья очередь дата-центра «РТК-ЦОД» 15 мин.
Франция создаст многоразовый космоплан, похожий на «Шаттл» — деньги на него уже нашли 16 мин.
К 2050 году в мире будет 4 млрд роботов с ИИ — и TSMC планирует на этом хорошо заработать 2 ч.
Плёночные фотографии сравнили с имитацией фотоплёнки у смартфона Honor 400 Pro 3 ч.
Взрыв забросил обломки Starship в Мексику — местные начали сдавать в цветмет 3 ч.
Самый маленький в мире одноплатный компьютер на базе Intel Core Raptor Lake — AAEON de next-RAP8 4 ч.
Проблемный запуск роботакси Tesla показал, насколько недооценена конкурирующая Waymo 4 ч.
HPE анонсировала серверы ProLiant Compute Gen12 на базе AMD EPYC Turin 4 ч.
Nothing Phone (3) показал свой нетривиальный дизайн на качественных изображениях в преддверии анонса 4 ч.