Сегодня 10 мая 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → sambanova systems

DeepSeek разогнали до рекордной скорости всего на 16 чипах SambaNova — чипов Nvidia потребовалось бы в 20 раз больше

Стартап в области искусственного интеллекта SambaNova Systems, основанный в 2017 году выходцами из Sun, Oracle и Стэнфордского университета, объявил о создании самой быстрой в мире системы для развёртывания модели DeepSeek-R1 671B. Для оборудования Nvidia такие показатели недоступны.

 Источник изображения: sambanova.ai

Источник изображения: sambanova.ai

SambaNova добилась скорости работы DeepSeek-R1 в 198 токенов в секунду всего на 16 специально изготовленных ускорителях — аналогичного результата можно достичь, только развернув 40 стоек с 320 графическими процессорами Nvidia. «SambaNova на чипах SN40L RDU стала самой быстрой платформой для запуска DeepSeek. Это пятикратный прирост по сравнению со скоростью новейшего графического процессора на одной стойке, а к концу года мы предложим 100-кратную ёмкость для DeepSeek-R1», — пообещал соучредитель и генеральный директор SambaNova Родриго Лян (Rodrigo Liang).

Ресурсоёмкие рабочие нагрузки систем искусственного интеллекта традиционно обеспечиваются графическими процессорами Nvidia, но в SambaNova утверждают, что созданная компанией конфигурируемая архитектура потока данных представляет собой более эффективное решение. Её оборудование работает втрое быстрее и потребляет в пять раз меньше энергии, чем самые мощные из современных графических процессоров, сохраняя при этом полную вычислительную мощность модели DeepSeek-R1. Достижение подтвердили эксперты компании Artificial Analysis, которая проводит независимую оценку систем ИИ.

Открытая модель DeepSeek-R1 671B доступна в облаке SambaNova через API. Компания активно наращивает мощности и в ближайшем будущем надеется достичь общей пропускной способности в 20 000 токенов в секунду.


window-new
Soft
Hard
Тренды 🔥
В США придумали простой и надёжный спидометр для спутников 38 мин.
«Джеймс Уэбб» заделался геологом — учёные научили его заглядывать в недра далёких экзопланет 4 ч.
Škoda вернулась к истокам, представив концепт электрического мотоцикла Slavia B 4 ч.
xAI может построить 1,56-ГВт газовую электростанцию для очередного ИИ-суперкомпьютера 7 ч.
Советская станция «Космос-482» упала в Индийский океан после 53 лет на орбите 7 ч.
Временный глава Sonos признал серьёзные ошибки компании и начал их исправлять 7 ч.
MediaTek представила чип Helio G200 для доступных смартфонов — он очень похож на Helio G100 10 ч.
Утечка раскрыла новые подробности о Samsung Galaxy S25 Edge и его аксессуарах в преддверии анонса 10 ч.
Nokia представила решение Aurelis Optical LAN для оптических локальных сетей 11 ч.
NVIDIA ослабит и без того урезанные ускорители H20, чтобы вернуть возможность поставок в Китай 12 ч.