AMD готовит мини-ПК Ryzen AI Halo для вайб-кодинга без облака за $3999

Читать в полной версии

AMD вот-вот представит компактную рабочую станцию Ryzen AI Halo, а предзаказы на ней стартуют в следующем месяце. Версия со 128 Гбайт памяти будет стоить от $3999. Компания позиционирует устройство как локальную альтернативу облачным системам, доступным через API, а также Nvidia DGX Spark для вайб-кодинга: по её расчётам, при восьми часах работы с ИИ в день система может сэкономить разработчику до $750 в месяц.

Источник изображений: amd.com

Цена выглядит высокой для мини-ПК с ИИ, тем более что похожее железо менее года назад стоило $2200–2999. AMD, однако, делает ставку не на дешевизну, а на замену регулярных облачных расходов и готовую среду для локального запуска ИИ-моделей. К слову, Nvidia DGX Spark тоже подорожала: сейчас она продаётся за $4699, хотя прошлой осенью стоила $3999.

Ryzen AI Halo построен на 120-ваттном гибридном процессоре (APU) Ryzen AI Max+ 395. В корпусе размером 150 × 150 × 43 мм находятся 16 ядер Zen 5, 40 вычислительных блоков GPU на архитектуре RDNA 3.5 и 128 Гбайт LPDDR5x-памяти со скоростью 8000 МТ/с. Память общая для CPU и GPU, её пропускная способность достигает 256 Гбайт/с.

По расчётам AMD, локальный запуск моделей на Ryzen AI Halo вместо облачных API может снизить расходы разработчиков до $750 в месяц при восьмичасовой ежедневной нагрузке

Этого достаточно, чтобы запускать локальные ИИ-модели размером до 200 млрд параметров. По этому показателю Ryzen AI Halo соответствует более дорогой DGX Spark. Встроенная графика AMD выдаёт около 56 Тфлопс при 16-битной точности, но это на 55–88 % ниже заявленного уровня Spark. В отличие от Blackwell GB10 в системе Nvidia, Strix Halo не поддерживает FP8 и FP4 на аппаратном уровне.

Разница в теоретической производительности будет заметна не во всех задачах. AMD утверждает, что при инференсе больших языковых моделей (LLM), то есть генерации ответов уже обученной моделью, Ryzen AI Halo выдаёт токены на 4–14 % быстрее DGX Spark. Всё потому, что скорость генерации токенов сильнее зависит от пропускной способности памяти, чем от пиковой вычислительной мощности. При обработке длинных промтов, генерации изображений и дообучении моделей Spark может оказаться быстрее благодаря более мощным тензорным ядрам.

У Ryzen AI Halo есть два преимущества перед Spark. Первое — нейронный процессор (NPU) на базе XDNA 2 с заявленной производительностью 50 TOPS (триллионов операций в секунду). Его польза зависит от приложения: часть программ для создания контента уже умеют задействовать NPU, но движков генеративного ИИ с полноценной поддержкой этого блока пока немного. Второе преимущество — обычная x86-платформа. На Ryzen AI Halo можно установить Windows или любой дистрибутив Linux, тогда как Spark привязана к слегка изменённой Ubuntu 24.04.

По сетевым возможностям система AMD уступает Nvidia. DGX Spark оснащена адаптером ConnectX-7 на 200 Гбит/с и рассчитана на объединение нескольких систем. У Ryzen AI Halo есть один порт на 10 Гбит/с. Его хватит для загрузки больших файлов моделей, но для кластеризации этого мало. Теоретически высокоскоростную сеть можно организовать через USB4, однако AMD пока не описала такой сценарий.

Важная часть предложения AMD — программные сценарии. Разработчики ИИ и машинного обучения (ML) часто тратят время на несовместимые версии драйверов, ROCm, HIP, SYCL, CUDA, PyTorch, TensorFlow и JAX. У AMD есть готовые окружения для vLLM, Llama.cpp, Ollama, ComfyUI и других инструментов, которые должны сократить время на настройку.

На старте Ryzen AI Halo получит пять предустановленных плейбуков — готовых сценариев настройки и запуска рабочих задач. Ещё 10 будут доступны онлайн, а новые плейбуки AMD обещает добавлять каждый месяц. Покупатели также получат доступ к программе AMD для разработчиков, облачным кредитам и эксклюзивным плейбукам.

Версию Ryzen AI Halo со 128 Гбайт памяти можно будет предзаказать в следующем месяце по цене от $3999. AMD уже готовит вариант со 192 Гбайт памяти на обновлённом APU Ryzen AI Max+ 495. Он получит умеренное повышение частот CPU, GPU и NPU без крупных архитектурных изменений, зато больший объём объединённой памяти позволит запускать более крупные ИИ-модели.