Сегодня 23 мая 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

DeepSeek разогнали до рекордной скорости всего на 16 чипах SambaNova — чипов Nvidia потребовалось бы в 20 раз больше

Стартап в области искусственного интеллекта SambaNova Systems, основанный в 2017 году выходцами из Sun, Oracle и Стэнфордского университета, объявил о создании самой быстрой в мире системы для развёртывания модели DeepSeek-R1 671B. Для оборудования Nvidia такие показатели недоступны.

 Источник изображения: sambanova.ai

Источник изображения: sambanova.ai

SambaNova добилась скорости работы DeepSeek-R1 в 198 токенов в секунду всего на 16 специально изготовленных ускорителях — аналогичного результата можно достичь, только развернув 40 стоек с 320 графическими процессорами Nvidia. «SambaNova на чипах SN40L RDU стала самой быстрой платформой для запуска DeepSeek. Это пятикратный прирост по сравнению со скоростью новейшего графического процессора на одной стойке, а к концу года мы предложим 100-кратную ёмкость для DeepSeek-R1», — пообещал соучредитель и генеральный директор SambaNova Родриго Лян (Rodrigo Liang).

Ресурсоёмкие рабочие нагрузки систем искусственного интеллекта традиционно обеспечиваются графическими процессорами Nvidia, но в SambaNova утверждают, что созданная компанией конфигурируемая архитектура потока данных представляет собой более эффективное решение. Её оборудование работает втрое быстрее и потребляет в пять раз меньше энергии, чем самые мощные из современных графических процессоров, сохраняя при этом полную вычислительную мощность модели DeepSeek-R1. Достижение подтвердили эксперты компании Artificial Analysis, которая проводит независимую оценку систем ИИ.

Открытая модель DeepSeek-R1 671B доступна в облаке SambaNova через API. Компания активно наращивает мощности и в ближайшем будущем надеется достичь общей пропускной способности в 20 000 токенов в секунду.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Bandai Namco подтвердила слухи об экранизации Elden Ring — фильм снимет большой фанат игры и режиссёр «Аннигиляции» Алекс Гарланд 43 мин.
«Победа здравого смысла»: FTC оставила попытки отменить покупку Activision Blizzard компанией Microsoft 51 мин.
«Блокнот» в Windows 11 научился генерировать текст, а Paint — создавать стикеры 56 мин.
«Только со смертью заканчивается долг»: разработчики Warhammer 40,000: Space Marine 2 раскрыли дату выхода горячо ожидаемого режима «Осада» 2 ч.
Google вслед за Microsoft заявила о готовности поддержать клиентов из Евросоюза и представила новые решения для защиты цифрового суверенитета 4 ч.
Anthropic представила Claude 4 — ИИ научился избегать «лазеек» и точнее выполнять сложные задания 8 ч.
Sega анонсировала «вдумчивую реставрацию» оригинальной Warhammer 40,000: Space Marine для нового поколения игроков 13 ч.
Warhammer 40,000: Boltgun 2 выйдет в 2026 году, а бесплатный «печатный» шутер по мотивам первой части ждать не придётся 14 ч.
Owlcat Games анонсировала ролевую игру про борьбу с ересью Warhammer 40,000: Dark Heresy и новые дополнения для Warhammer 40,000: Rogue Trader 15 ч.
Чемпионат мира по киберспорту в Саудовской Аравии остался без GeoGuessr — разработчики отказались от участия после протеста фанатов 16 ч.
Asustor представила стоечные NAS серии Lockerstor R Pro Gen2 на чипах AMD Ryzen 7 Pro 5 мин.
Репортаж со стенда GIGABYTE на выставке Computex 2025: геймерские ноутбуки и мощные компьютеры для ИИ и игр 15 мин.
Репортаж со стенда GIGABYTE на выставке Computex 2025: геймерские мониторы 60 мин.
Репортаж со стенда Formula V Line на выставке Computex 2025: корпуса, охлаждение и блоки питания для мощных ПК 2 ч.
Apple начала заманивать дополнительными скидками желающих обновить iPhone, но только в Китае 2 ч.
Девятый пуск SpaceX Starship одобрен регуляторами в США при условии расширения зоны безопасности 4 ч.
Apple рассчитывает выпустить умные очки до конца 2026 года, но передумала создавать «подглядывающие» часы Watch 7 ч.
Новая статья: Система жидкостного охлаждения ID-Cooling DX360 Max с радиатором увеличенной толщины 10 ч.
Qualcomm готовит 80-ядерный серверный Arm-процессор SD1 для ИИ-платформ 13 ч.
Xiaomi представила огромный 14-дюймовый планшет Pad 7 Ultra на фирменном процессоре Xring O1 16 ч.