Сегодня 21 августа 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → sambanova systems

DeepSeek разогнали до рекордной скорости всего на 16 чипах SambaNova — чипов Nvidia потребовалось бы в 20 раз больше

Стартап в области искусственного интеллекта SambaNova Systems, основанный в 2017 году выходцами из Sun, Oracle и Стэнфордского университета, объявил о создании самой быстрой в мире системы для развёртывания модели DeepSeek-R1 671B. Для оборудования Nvidia такие показатели недоступны.

 Источник изображения: sambanova.ai

Источник изображения: sambanova.ai

SambaNova добилась скорости работы DeepSeek-R1 в 198 токенов в секунду всего на 16 специально изготовленных ускорителях — аналогичного результата можно достичь, только развернув 40 стоек с 320 графическими процессорами Nvidia. «SambaNova на чипах SN40L RDU стала самой быстрой платформой для запуска DeepSeek. Это пятикратный прирост по сравнению со скоростью новейшего графического процессора на одной стойке, а к концу года мы предложим 100-кратную ёмкость для DeepSeek-R1», — пообещал соучредитель и генеральный директор SambaNova Родриго Лян (Rodrigo Liang).

Ресурсоёмкие рабочие нагрузки систем искусственного интеллекта традиционно обеспечиваются графическими процессорами Nvidia, но в SambaNova утверждают, что созданная компанией конфигурируемая архитектура потока данных представляет собой более эффективное решение. Её оборудование работает втрое быстрее и потребляет в пять раз меньше энергии, чем самые мощные из современных графических процессоров, сохраняя при этом полную вычислительную мощность модели DeepSeek-R1. Достижение подтвердили эксперты компании Artificial Analysis, которая проводит независимую оценку систем ИИ.

Открытая модель DeepSeek-R1 671B доступна в облаке SambaNova через API. Компания активно наращивает мощности и в ближайшем будущем надеется достичь общей пропускной способности в 20 000 токенов в секунду.


window-new
Soft
Hard
Тренды 🔥
Microsoft придумала, как ускорить загрузку в играх до 10 раз — разработан новый метод компиляции шейдеров 26 мин.
Paradox объяснила, почему за два из шести кланов на релизе Vampire: The Masquerade — Bloodlines 2 придётся платить 2 ч.
Microsoft отключила китайским компаниям оповещения об уязвимостях в ПО 2 ч.
Разработчики Subnautica 2 подали в суд на бывших руководителей — в том числе за кражу 172 тысяч конфиденциальных файлов 3 ч.
«Катастрофа»: Elden Ring на Nintendo Switch 2 шокировала журналистов ужасной производительностью 4 ч.
Олдскульный хоррор на выживание Tormented Souls 2 в антураже чилийской глубинки обзавёлся датой релиза 4 ч.
В Steam стартовало открытое тестирование Militsioner — сюрреалистической игры о побеге от милиционера-великана 5 ч.
ИИ-помощник Google Gemini Live научился видеть мир через камеру смартфона — точно и без задержек 5 ч.
Национальный мессенджер Max обяжут предустанавливать на все новые смартфоны в России с 1 сентября 5 ч.
«Google Фото» научились редактировать фото по голосовым и текстовым командам 6 ч.
Kioxia разогнала флеш-память до 64 Гбайт/с в прототипе SSD будущего 14 мин.
Vivo представила ответ Apple Vision Pro — лёгкую MR-гарнитуру Vision с 8K-дисплеями Micro-OLED 31 мин.
В России стартовали продажи смартфона Poco M7 с батареей на 7000 мА·ч по цене от 13,5 тыс. рублей 2 ч.
Состоялся пятый успешный запуск лёгкой ракеты-носителя «Ангара-1.2» 2 ч.
Xiaomi скатилась на девятое место среди крупнейших производителей электромобилей в мире 2 ч.
Доступность колокейшн-ЦОД в Северной Америке установила антирекорд — 2,3 % 2 ч.
В США создали роботов-геодезистов — они разметят участок в любую погоду без перерывов на обед 3 ч.
Автопилот оказался бесполезен в городе: его приходится подстраховывать каждые 9 минут 3 ч.
В России стало больше интернет-провайдеров после массовых сбоев мобильного интернета 4 ч.
Робопёс с крошечным человеческим мозгом научился избегать препятствий 4 ч.