Сегодня 21 августа 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → sambanova systems

DeepSeek разогнали до рекордной скорости всего на 16 чипах SambaNova — чипов Nvidia потребовалось бы в 20 раз больше

Стартап в области искусственного интеллекта SambaNova Systems, основанный в 2017 году выходцами из Sun, Oracle и Стэнфордского университета, объявил о создании самой быстрой в мире системы для развёртывания модели DeepSeek-R1 671B. Для оборудования Nvidia такие показатели недоступны.

 Источник изображения: sambanova.ai

Источник изображения: sambanova.ai

SambaNova добилась скорости работы DeepSeek-R1 в 198 токенов в секунду всего на 16 специально изготовленных ускорителях — аналогичного результата можно достичь, только развернув 40 стоек с 320 графическими процессорами Nvidia. «SambaNova на чипах SN40L RDU стала самой быстрой платформой для запуска DeepSeek. Это пятикратный прирост по сравнению со скоростью новейшего графического процессора на одной стойке, а к концу года мы предложим 100-кратную ёмкость для DeepSeek-R1», — пообещал соучредитель и генеральный директор SambaNova Родриго Лян (Rodrigo Liang).

Ресурсоёмкие рабочие нагрузки систем искусственного интеллекта традиционно обеспечиваются графическими процессорами Nvidia, но в SambaNova утверждают, что созданная компанией конфигурируемая архитектура потока данных представляет собой более эффективное решение. Её оборудование работает втрое быстрее и потребляет в пять раз меньше энергии, чем самые мощные из современных графических процессоров, сохраняя при этом полную вычислительную мощность модели DeepSeek-R1. Достижение подтвердили эксперты компании Artificial Analysis, которая проводит независимую оценку систем ИИ.

Открытая модель DeepSeek-R1 671B доступна в облаке SambaNova через API. Компания активно наращивает мощности и в ближайшем будущем надеется достичь общей пропускной способности в 20 000 токенов в секунду.


window-new
Soft
Hard
Тренды 🔥
Разработчики Subnautica 2 подали в суд на бывших руководителей — в том числе за кражу 172 тысяч конфиденциальных файлов 10 мин.
«Катастрофа»: Elden Ring на Nintendo Switch 2 шокировала журналистов ужасной производительностью 43 мин.
Олдскульный хоррор на выживание Tormented Souls 2 в антураже чилийской глубинки обзавёлся датой релиза 44 мин.
В Steam стартовало открытое тестирование Militsioner — сюрреалистической игры о побеге от милиционера-великана 2 ч.
ИИ-помощник Google Gemini Live научился видеть мир через камеру смартфона — точно и без задержек 2 ч.
Национальный мессенджер Max обяжут предустанавливать на все новые смартфоны в России с 1 сентября 3 ч.
«Google Фото» научились редактировать фото по голосовым и текстовым командам 3 ч.
Приложение Copilot для Windows 11 научилось искать файлы и фото, и получило новый интерфейс 4 ч.
Майкл Майерс возвращается: по мотивам культового фильма ужасов «Хэллоуин» выйдет хоррор Halloween от авторов Friday the 13th: The Game 4 ч.
iKS-Consulting: «Базис» — лидер российского рынка ПО управления динамической ИТ-инфраструктурой 5 ч.
Автопилот оказался бесполезен в городе: его приходится подстраховывать каждые 9 минут 10 мин.
В России стало больше интернет-провайдеров после массовых сбоев мобильного интернета 31 мин.
Робопёс с крошечным человеческим мозгом научился избегать препятствий 36 мин.
Google наконец построит ЦОД в Австрии — через 17 лет после покупки земли 40 мин.
Samsung готова сбить цены, чтобы перехватить у SK hynix заказы Nvidia на память HBM 44 мин.
Google представила процессор Tensor G5 — он переехал на 3-нм техпроцесс TSMC и стал на 34 % быстрее предшественника 2 ч.
Foxconn начал привлекать китайцев на сборку iPhone 17 повышенными зарплатами 3 ч.
Oracle запитает гигантский ЦОД целиком от газовых генераторов, это будет стоить $1 млрд/год 3 ч.
NVIDIA представила ИИ-платформу Jetson AGX Thor Developer Kit с GPU Blackwell 4 ч.
TCL 57R94: один огромный 57″ монитор вместо двух 4K-дисплеев для игр, работы и развлечений 4 ч.