Сегодня 02 июня 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → sambanova systems

DeepSeek разогнали до рекордной скорости всего на 16 чипах SambaNova — чипов Nvidia потребовалось бы в 20 раз больше

Стартап в области искусственного интеллекта SambaNova Systems, основанный в 2017 году выходцами из Sun, Oracle и Стэнфордского университета, объявил о создании самой быстрой в мире системы для развёртывания модели DeepSeek-R1 671B. Для оборудования Nvidia такие показатели недоступны.

 Источник изображения: sambanova.ai

Источник изображения: sambanova.ai

SambaNova добилась скорости работы DeepSeek-R1 в 198 токенов в секунду всего на 16 специально изготовленных ускорителях — аналогичного результата можно достичь, только развернув 40 стоек с 320 графическими процессорами Nvidia. «SambaNova на чипах SN40L RDU стала самой быстрой платформой для запуска DeepSeek. Это пятикратный прирост по сравнению со скоростью новейшего графического процессора на одной стойке, а к концу года мы предложим 100-кратную ёмкость для DeepSeek-R1», — пообещал соучредитель и генеральный директор SambaNova Родриго Лян (Rodrigo Liang).

Ресурсоёмкие рабочие нагрузки систем искусственного интеллекта традиционно обеспечиваются графическими процессорами Nvidia, но в SambaNova утверждают, что созданная компанией конфигурируемая архитектура потока данных представляет собой более эффективное решение. Её оборудование работает втрое быстрее и потребляет в пять раз меньше энергии, чем самые мощные из современных графических процессоров, сохраняя при этом полную вычислительную мощность модели DeepSeek-R1. Достижение подтвердили эксперты компании Artificial Analysis, которая проводит независимую оценку систем ИИ.

Открытая модель DeepSeek-R1 671B доступна в облаке SambaNova через API. Компания активно наращивает мощности и в ближайшем будущем надеется достичь общей пропускной способности в 20 000 токенов в секунду.


window-new
Soft
Hard
Тренды 🔥
Календарь релизов — 2–8 июня: Nintendo Switch 2, Deltarune и Atomfall: Wicked Isle 12 мин.
CD Projekt Red покажет «инновационные технологии» в основе The Witcher 4 на презентации State of Unreal — где и когда смотреть 60 мин.
Apple намекнула на масштабный редизайн iOS 26 в новом слогане WWDC25 2 ч.
«Алиса» научится сама бронировать столики и не только — «Яндекс» превратит помощницу в ИИ-агента 2 ч.
Astra Linux получит интеграцию с нейросетью GigaChat 2 ч.
Представлена автомобильная версия российской ОС «Аврора» — первыми её получат Lada, УАЗ и другие отечественные авто 2 ч.
Амбициозная игра про Джеймса Бонда от разработчиков Hitman готовится выйти из тени — IO Interactive анонсировала 007 First Light 3 ч.
Исследование раскрыло, что почти 60 % российских родителей сталкивались с неконтролируемыми тратами детей в играх 4 ч.
Apple отказалась пускать конкурентов к личным данным пользователей iPhone — этого требует закон ЕС 4 ч.
«Tango Gameworks наконец вернулась»: создатели Hi-Fi Rush возобновили работу и подтвердили производство секретной игры 5 ч.