Сегодня 09 мая 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

DeepSeek разогнали до рекордной скорости всего на 16 чипах SambaNova — чипов Nvidia потребовалось бы в 20 раз больше

Стартап в области искусственного интеллекта SambaNova Systems, основанный в 2017 году выходцами из Sun, Oracle и Стэнфордского университета, объявил о создании самой быстрой в мире системы для развёртывания модели DeepSeek-R1 671B. Для оборудования Nvidia такие показатели недоступны.

 Источник изображения: sambanova.ai

Источник изображения: sambanova.ai

SambaNova добилась скорости работы DeepSeek-R1 в 198 токенов в секунду всего на 16 специально изготовленных ускорителях — аналогичного результата можно достичь, только развернув 40 стоек с 320 графическими процессорами Nvidia. «SambaNova на чипах SN40L RDU стала самой быстрой платформой для запуска DeepSeek. Это пятикратный прирост по сравнению со скоростью новейшего графического процессора на одной стойке, а к концу года мы предложим 100-кратную ёмкость для DeepSeek-R1», — пообещал соучредитель и генеральный директор SambaNova Родриго Лян (Rodrigo Liang).

Ресурсоёмкие рабочие нагрузки систем искусственного интеллекта традиционно обеспечиваются графическими процессорами Nvidia, но в SambaNova утверждают, что созданная компанией конфигурируемая архитектура потока данных представляет собой более эффективное решение. Её оборудование работает втрое быстрее и потребляет в пять раз меньше энергии, чем самые мощные из современных графических процессоров, сохраняя при этом полную вычислительную мощность модели DeepSeek-R1. Достижение подтвердили эксперты компании Artificial Analysis, которая проводит независимую оценку систем ИИ.

Открытая модель DeepSeek-R1 671B доступна в облаке SambaNova через API. Компания активно наращивает мощности и в ближайшем будущем надеется достичь общей пропускной способности в 20 000 токенов в секунду.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Google обновила дизайн поискового виджета на Android 6 мин.
В Telegram добавились маркетплейс подарков, публикация нескольких историй сразу и автоматический перевод в каналах 13 мин.
«Лучшая карточная игра с RPG-элементами»: с 2022 года пользователи The Witcher 3: Wild Hunt наиграли в «Гвинт» более 458 миллионов партий 2 ч.
Исследовательскую лабораторию ИИ в Meta возглавил выходец из Google DeepMind 2 ч.
Хоррор-шутер Alien: Rogue Incursion Evolved Edition отправит игроков выживать под натиском небывало хитрых ксеноморфов — трейлер и дата выхода 4 ч.
Сэм Альтман передал управление ChatGPT новому руководителю, а сам займётся исследованиями 6 ч.
Google защитит пользователей Chrome от фишинга с помощью локальной ИИ-модели Gemini Nano 6 ч.
Microsoft упростит установку приложений в Windows 11, но это может привести к засорению системы 14 ч.
Первое сюжетное дополнение к Kingdom Come: Deliverance 2 не заставит себя долго ждать — новый трейлер и дата выхода Brushes with Death 15 ч.
Meta наделит следующие умные очки Ray-Ban «супервосприятием» — функцией распознавания лиц окружающих 17 ч.
Частный японский модуль Resilience с маленьким луноходом на борту добрался до Луны и готовится к спуску 4 мин.
Тарифы Трампа способствовали росту апрельской выручки TSMC на 48 % 12 мин.
Видео: взбесившийся гуманоидный робот Unitree H1 напал на рабочих 30 мин.
Учёные установили мировой рекорд по ионной проводимости в материалах для литиевых аккумуляторов 2 ч.
Китайский контрактный производитель чипов SMIC более чем удвоил квартальную прибыль до $188 млн 2 ч.
Китайцы не смогли с Земли найти воду на Луне — строительство лунных баз отменяется? 2 ч.
Китайские дилеры уже начали демонстрировать электромобиль Audi E5 3 ч.
OpenAI планирует развивать ИИ-инфраструктуру Stargate за пределами США 3 ч.
Apple продвинулась в разработке новых процессоров для умных очков и компьютеров 4 ч.
ASML ускорит строительство нового кампуса, где будет производиться оборудование для выпуска чипов 5 ч.