Сегодня 04 марта 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

DeepSeek разогнали до рекордной скорости всего на 16 чипах SambaNova — чипов Nvidia потребовалось бы в 20 раз больше

Стартап в области искусственного интеллекта SambaNova Systems, основанный в 2017 году выходцами из Sun, Oracle и Стэнфордского университета, объявил о создании самой быстрой в мире системы для развёртывания модели DeepSeek-R1 671B. Для оборудования Nvidia такие показатели недоступны.

 Источник изображения: sambanova.ai

Источник изображения: sambanova.ai

SambaNova добилась скорости работы DeepSeek-R1 в 198 токенов в секунду всего на 16 специально изготовленных ускорителях — аналогичного результата можно достичь, только развернув 40 стоек с 320 графическими процессорами Nvidia. «SambaNova на чипах SN40L RDU стала самой быстрой платформой для запуска DeepSeek. Это пятикратный прирост по сравнению со скоростью новейшего графического процессора на одной стойке, а к концу года мы предложим 100-кратную ёмкость для DeepSeek-R1», — пообещал соучредитель и генеральный директор SambaNova Родриго Лян (Rodrigo Liang).

Ресурсоёмкие рабочие нагрузки систем искусственного интеллекта традиционно обеспечиваются графическими процессорами Nvidia, но в SambaNova утверждают, что созданная компанией конфигурируемая архитектура потока данных представляет собой более эффективное решение. Её оборудование работает втрое быстрее и потребляет в пять раз меньше энергии, чем самые мощные из современных графических процессоров, сохраняя при этом полную вычислительную мощность модели DeepSeek-R1. Достижение подтвердили эксперты компании Artificial Analysis, которая проводит независимую оценку систем ИИ.

Открытая модель DeepSeek-R1 671B доступна в облаке SambaNova через API. Компания активно наращивает мощности и в ближайшем будущем надеется достичь общей пропускной способности в 20 000 токенов в секунду.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
IBM закрыла R&D-центр в Китае, оставив без работы 1,8 тыс. специалистов 23 мин.
Ubisoft объяснила, почему тянула с разработкой Assassin’s Creed Shadows, хотя фанаты годами требовали перенести серию в Японию 2 ч.
Monster Hunter Wilds уже стала самой быстро продаваемой игрой в истории Capcom, побив рекорд Monster Hunter: World 3 ч.
«Эффект Трампа исчерпан», — биткоин снова откатился к $83 000 3 ч.
Увлечённый фанат вычислил, на какой версии Minecraft базируется фильм «Minecraft в кино» 4 ч.
Компания «Базис» по итогам 2024 года нарастила выручку в полтора раза до более 4,5 млрд рублей 5 ч.
Экзистенциальный платформер Peppered предложит спасти мир или стать вечным корпоративным рабом бога смерти — дата выхода и новый трейлер 7 ч.
Opera представила концепт ИИ-функции, которая поможет пользователю совершать покупки 9 ч.
Oppo возьмёт пример с Apple и защитит данные пользователей от своего ИИ с помощью Google 16 ч.
Microsoft анонсировала медицинского ИИ-ассистента Dragon Copilot, который снимет с врачей бумажную работу 16 ч.