Сегодня 26 февраля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Низкопробный софт AMD не даёт раскрыть потенциал ИИ-ускорителей Instinct MI300X и обойти Nvidia, выяснили эксперты

Пятимесячное расследование компании SemiAnalysis показало, что специализированные ИИ-ускорители серии AMD MI300X не раскрывают свой потенциал из-за серьёзных проблем в работе программного обеспечения. Этот факт делает все усилия компании по навязыванию жёсткой конкуренции Nvidia, доминирующей на рынке аппаратного обеспечения для ИИ, бессмысленными.

 Источник изображения: The Decoder

Источник изображения: The Decoder

Исследование показало, что программное обеспечение AMD изобилует ошибками, которые делают обучение моделей ИИ практически невозможным без значительной отладки. Таким образом, пока AMD работает над обеспечением качества и простоты использования своих ускорителей, Nvidia продолжает увеличивать разрыв, развёртывая новые функции, библиотеки и повышая производительность своих решений.

По итогам обширных тестов, включая тесты GEMM и одноузловое обучение, исследователи пришли к выводу, что AMD не в состоянии преодолеть то, что они называют «неприступным рвом CUDA» — сильное преимущество в виде программного обеспечения, которым обладают ускорители Nvidia.

 Источник изображения: SemiAnalysis

Источник изображения: SemiAnalysis

AMD MI300X «на бумаге» выглядят впечатляюще: 1307 Тфлопс в вычислениях FP16 и 192 Гбайт памяти HBM3. Для сравнения, ускорители Nvidia H100 обладают производительностью 989 Тфлопс и имеют только 80 Гбайт памяти. Однако новое поколение ИИ-ускорителей Nvidia H200 с конфигурациями до 141 Гбайт памяти сокращает разрыв в объёме доступного буфера памяти. Кроме того, системы на базе ускорителей AMD также предлагают более низкую общую стоимость владения благодаря более низким ценам на такие системы и более доступной поддержке сетевой инфраструктуры.

 Источник изображения: SemiAnalysis

Источник изображения: SemiAnalysis

Однако эти преимущества мало что значат на практике. По данным SemiAnalysis, сравнение «голых» спецификаций похоже на «сравнение камер, когда просто проверяешь количество мегапикселей у одной и другой». AMD, отмечают аналитики, таким образом «просто играет с цифрами», но её решения не обеспечивают достаточный уровень производительности в реальных задачах.

Исследователи отмечают, что им пришлось напрямую работать с инженерами AMD, чтобы исправить многочисленные ошибки в ПО для получения пригодных для оценки результатов тестов. В то же время системы на базе ускорителей Nvidia работали гладко и без каких-либо дополнительных настроек.

«С OOBE от AMD (опыт, который пользователь получает при получении продукта после распаковки или при запуске установщика и подготовке к первому использованию, так называемый "опыт из коробки" — прим. ред.) очень сложно работать. И для перехода к пригодному к использованию состоянию [оборудования] может потребоваться немало терпения и усилий», — пишут эксперты.

Особенно показательным для SemiAnalysis оказался случай, когда компания TensorWave, крупнейший поставщик облачных решений на базе графических процессоров AMD, была вынуждена предоставить команде инженеров AMD бесплатный доступ к своим графическим процессорам — тому же оборудованию, которое TensorWave приобрела у AMD — только для устранения проблем с программным обеспечением.

Для решения проблем эксперты SemiAnalysis рекомендуют генеральному директору AMD Лизе Су (Lisa Su) более активно инвестировать в разработку и тестирование программного обеспечения. В частности, они предлагают выделить тысячи чипов MI300X для автоматизированного тестирования (аналогичному подходу следует Nvidia для своих ускорителей), упростить сложные переменные среды, одновременно внедрив более эффективные настройки для ускорителей по умолчанию. «Сделайте готовый опыт пригодным к использованию!» — призывают специалисты.

Представители SemiAnalysis в своём отчёте признаются, что желают успеха компании AMD в конкуренции с Nvidia, но отмечают, что «к сожалению, для этого ещё многое предстоит сделать». Без существенных улучшений программного обеспечения AMD рискует ещё больше отстать, поскольку Nvidia готовится к массовому выпуску ускорителей нового поколения Blackwell. Хотя, по сообщениям, этот процесс у Nvidia также проходит не совсем гладко.

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
ByteDance намерена убедить Трампа не лишать её контроля над TikTok в США, но времени остаётся всё меньше 40 мин.
ИИ начал стримить в Twitch, как играет в Pokémon Red 2 ч.
Сингапурский регулятор рассекретил Tony Hawk's Pro Skater 3 + 4 до официального анонса 2 ч.
ИИ-агент OpenAI для написания рефератов стал доступен всем платным пользователям ChatGPT 3 ч.
Первый шаг к победе над смертью: бесплатный пролог «Карантин» к Pathologic 3 получил дату выхода и новый трейлер 4 ч.
Резервное копирование с ИИ: Microsoft инвестировала в Veeam 6 ч.
YouTube перестанет показывать рекламу в неподходящие моменты, но меньше её не станет 9 ч.
Yandex B2B Tech запустил платформу для разработчиков SourceCraft, которая должна стать аналогом американской GitLab 13 ч.
Warner Bros. Games отменила боевик Wonder Woman и закрыла три студии, включая Monolith Productions — создателей F.E.A.R. и Middle-earth: Shadow of Mordor 15 ч.
Успех ремейка Silent Hill 2 открыл «польским мастерам хоррора» из Bloober Team дорогу к новой совместной игре с Konami 16 ч.
«В целом успешно»: «Ростелеком» отчитался о падении чистой прибыли на 43 % в 2024 году 31 мин.
Framework представила Desktop — модульный мини-ПК с распаянной памятью и мощнейшим мобильным Ryzen 2 ч.
Framework представила первый в мире модульный Copilot+PC — ноутбук Laptop 13 получил чипы AMD Strix Point 2 ч.
Steam Deck популярнее всех конкурентов вместе — продажи портативных приставок для ПК-игр превысили 6 млн 2 ч.
Опечатка заставила OnePlus отложить старт продаж Watch 3 на полтора месяца 3 ч.
Продажи электромобилей Tesla в Европе рухнули почти вдвое в январе, хотя рынок вырос на 37 % — в этом замешаны политические амбиции Маска 3 ч.
Космический грузовик «Прогресс МС-28» затопили в Тихом океане после полугода на МКС 3 ч.
Vodafone испытала дроны с лазерными терминалами Google X Taara для организации экстренной связи 4 ч.
Intel представила 200GbE-адаптеры E830 и 10GbE-адаптеры E610 5 ч.
Раскладушка с QWERTY-клавиатурой — чехлы Clicks вышли для Motorola Razer, а также смартфонов Google и Samsung 7 ч.