Сегодня 14 марта 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

DeepSeek разогнали до рекордной скорости всего на 16 чипах SambaNova — чипов Nvidia потребовалось бы в 20 раз больше

Стартап в области искусственного интеллекта SambaNova Systems, основанный в 2017 году выходцами из Sun, Oracle и Стэнфордского университета, объявил о создании самой быстрой в мире системы для развёртывания модели DeepSeek-R1 671B. Для оборудования Nvidia такие показатели недоступны.

 Источник изображения: sambanova.ai

Источник изображения: sambanova.ai

SambaNova добилась скорости работы DeepSeek-R1 в 198 токенов в секунду всего на 16 специально изготовленных ускорителях — аналогичного результата можно достичь, только развернув 40 стоек с 320 графическими процессорами Nvidia. «SambaNova на чипах SN40L RDU стала самой быстрой платформой для запуска DeepSeek. Это пятикратный прирост по сравнению со скоростью новейшего графического процессора на одной стойке, а к концу года мы предложим 100-кратную ёмкость для DeepSeek-R1», — пообещал соучредитель и генеральный директор SambaNova Родриго Лян (Rodrigo Liang).

Ресурсоёмкие рабочие нагрузки систем искусственного интеллекта традиционно обеспечиваются графическими процессорами Nvidia, но в SambaNova утверждают, что созданная компанией конфигурируемая архитектура потока данных представляет собой более эффективное решение. Её оборудование работает втрое быстрее и потребляет в пять раз меньше энергии, чем самые мощные из современных графических процессоров, сохраняя при этом полную вычислительную мощность модели DeepSeek-R1. Достижение подтвердили эксперты компании Artificial Analysis, которая проводит независимую оценку систем ИИ.

Открытая модель DeepSeek-R1 671B доступна в облаке SambaNova через API. Компания активно наращивает мощности и в ближайшем будущем надеется достичь общей пропускной способности в 20 000 токенов в секунду.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Игры для ПК избавятся от компиляции шейдеров — Microsoft повсеместно распространит ASD на Windows 3 ч.
Группа ИИ-агентов взломала базу данных несуществующей компании, хотя их об этом не просили 4 ч.
Adobe заплатит $150 млн по иску о платной отмене подписок на Photoshop и другие приложения 6 ч.
Meta скоро отключит сквозное шифрование для личных сообщений в Instagram 6 ч.
Администрации Трампа перепадут $10 млрд в качестве вознаграждения за «приземление» TikTok 8 ч.
xAI накрыла новая волна увольнений — компанию покинули ещё два сооснователя, которых Маск обвинил в отставании Grok от конкурентов 10 ч.
Новая статья: Styx: Blades of Greed — одни и те же гоблинские шутки. Рецензия 16 ч.
VK Tech нарастила выручку в 2025 году на 38,0 %, а облако VK Cloud — на 13,5 % 17 ч.
Nvidia пообещала ускорить «в миллион раз» трассировку лучей и путей в будущих GPU 17 ч.
Microsoft подтвердила, когда игровой ИИ-помощник Gaming Copilot появится на Xbox Series X и S 18 ч.
Китай начал строить космические аппараты для доставки образцов грунта с Марса 3 ч.
В Meta назревает новая волна увольнений: из-за ИИ могут уволить каждого пятого 3 ч.
Chuwi снова поймали на подмене процессоров: внутри ноутбука оказался менее мощный Ryzen, чем в характеристиках 3 ч.
Apple отпразднует 50-летие мероприятиями «по всему миру» — на первом спела Алиша Киз 3 ч.
Телескоп LOFAR обнаружил 13,7 млн ранее неизвестных объектов в крупнейшем радиообзоре Вселенной 5 ч.
Amazon начнёт запускать ИИ-модели на гигантских чипах Cerebras 6 ч.
Silicon Motion представила контроллер SM8008 для загрузочных SSD в дата-центрах 6 ч.
MediaTek представила чипы Genio Pro 5100 и Genio 420 для AIoT-приложений 6 ч.
Власти США передумали продавать ИИ-чипы только в те страны, которые строят ЦОД в США 9 ч.
AMD рассказала, как запускать ИИ-агентов прямо на ПК с Ryzen или Radeon — нужно всего 128 Гбайт оперативки 15 ч.