Сегодня 18 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Qualcomm вернулась в большие вычисления: представлены ИИ-ускорители AI200 и AI250 для дата-центров

Компания Qualcomm анонсировала два ускорителя ИИ-инференса (запуска уже обученных больших языковых моделей) — AI200 и AI250, которые выйдут на рынок в 2026 и 2027 годах. Новинки должны составить конкуренцию стоечным решениям AMD и Nvidia, предложив повышенную эффективность и более низкие эксплуатационные расходы при выполнении масштабных задач генеративного ИИ.

 Источник изображений: Qualcomm

Источник изображений: Qualcomm

Оба ускорителя — Qualcomm AI200 и AI250 — основаны на нейронных процессорах (NPU) Qualcomm Hexagon, адаптированных для задач ИИ в центрах обработки данных. В последние годы компания постепенно совершенствовала свои нейропроцессоры Hexagon, поэтому последние версии чипов уже оснащены скалярными, векторными и тензорными ускорителями (в конфигурации 12+8+1). Они поддерживают такие форматы данных, как INT2, INT4, INT8, INT16, FP8, FP16, микротайловый вывод для сокращения трафика памяти, 64-битную адресацию памяти, виртуализацию и шифрование моделей Gen AI для дополнительной безопасности.

Ускорители AI200 представляют собой первую систему логического вывода для ЦОД от Qualcomm и предлагают до 768 Гбайт встроенной памяти LPDDR. Система будет использовать интерфейсы PCIe для вертикального масштабирования и Ethernet — для горизонтального. Расчётная мощность стойки с ускорителями Qualcomm AI200 составляет 160 кВт. Система предполагает использование прямого жидкостного охлаждения. Для Qualcomm AI200 также заявлена поддержка конфиденциальных вычислений для корпоративных развертываний. Решение станет доступно в 2026 году.

Qualcomm AI250, выпуск которого состоится годом позже дебютирует с новой архитектурой памяти, которая обеспечит увеличение пропускной способности более чем в 10 раз. Кроме того, система будет поддерживать возможность дезагрегированного логического вывода, что позволит динамически распределять ресурсы памяти между картами. Qualcomm позиционирует его как более эффективное решение с высокой пропускной способностью, оптимизированное для крупных ИИ-моделей трансформеров. При этом система сохранит те же характеристики теплопередачи, охлаждения, безопасности и масштабируемости, что и AI200.

Помимо разработки аппаратных платформ, Qualcomm также сообщила о разработке гипермасштабируемой сквозной программной платформы, оптимизированной для крупномасштабных задач логического вывода. Платформа поддерживает основные наборы инструментов машинного обучения и генеративного ИИ, включая PyTorch, ONNX, vLLM, LangChain и CrewAI, обеспечивая при этом беспроблемное развертывание моделей. Программный стек будет поддерживать дезагрегированное обслуживание, конфиденциальные вычисления и подключение предварительно обученных моделей «одним щелчком мыши», заявляет компания.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Глава Take-Two раскрыл изначальные планы Rockstar на GTA VI — игра должна была выйти ещё весной 2025 года 24 мин.
Легендарной Terraria исполнилось 15 лет — продажи приключенческой песочницы перевалили за 70 млн 3 ч.
Apple научит Siri автоматически удалять переписку ради приватности пользователей 3 ч.
В Forza Horizon 6 уже сыграли миллион человек, хотя игра ещё даже официально не вышла 4 ч.
Genmoji в iOS 27 будет предлагать сгенерировать эмодзи на основе пользовательских фото и истории ввода на клавиатуре 5 ч.
Китайские компании превзошли американских конкурентов в сфере генерации видео при помощи ИИ 6 ч.
ИИ-функции Google Gemini Intelligence появятся лишь на нескольких производительных Android-смартфонах 16 ч.
Мейнфреймы тоже «поржавеют»: для IBM z готовится поддержка Rust в ядре Linux 20 ч.
Microsoft расширила поддержку технологии Advanced Shader Delivery на видеокарты AMD 23 ч.
Konami ограничит доступ к своим игровым серверам для пользователей из России и Белоруссии 17-05 11:59
Британский ИИ-стартап Fractile привлёк $220 млн на ускорение разработки ИИ-ускорителей 2 ч.
VoltaGrid привлекла $1 млрд от Blackstone и Halliburton на развитие систем электрогенерации для ЦОД и купила Propell 3 ч.
10 Пбайт в 2U-шасси: Dell и Kixoa анонсировали сервер хранения PowerEdge R7725xd на платформе AMD 4 ч.
SpaceX Dragon доставил на МКС очередную партию грузов и оборудования 4 ч.
Квартальная прибыль CXMT взлетела почти в 18 раз на фоне высокого спроса на память 6 ч.
Новая статья: Обзор Intel Core Ultra 7 270K Plus — лучший Arrow Lake за полцены 12 ч.
NEC завершила прокладку подводной кабельной системы EMCS, связывающей Федеративные Штаты Микронезии, Кирибати и Науру 14 ч.
Huawei запустила продажи восстановленных смартфонов Mate XT и Mate X6 17 ч.
Asus сертифицировала 17 модулей DDR5 — они точно совместимы с платами ROG 19 ч.
Xiaomi подтвердила, что в этом году выпустит новый фирменный процессор серии Xring 21 ч.