Сегодня 15 мая 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → cdna 3

AMD объединит RDNA для игр и CDNA для ИИ-ускорителей в единую графическую архитектуру UDNA

В разговоре с порталом Tom’s Hardware старший вице-президент и генеральный менеджер группы вычислительных и графических решений AMD Джек Гуинь (Jack Huynh) сообщил, что компания снова планирует объединить свои графические архитектуры для игровых видеокарт и ускорителей вычислений. Это необходимо для масштабирования и удовлетворения потребностей разработчиков.

 Источник изображений: AMD

Источник изображений: AMD

Ранее сообщилось, что AMD решила сместить акцент с ограниченного сегмента флагманских видеокарт для энтузиастов на расширение присутствия в сегменте массовых моделей GPU. Однако в том же разговоре Гуинь сообщил, что архитектуры RDNA и CDNA в перспективе будут объединены.

В 2020 году AMD сообщила о разделении своих графических архитектур после GCN на RDNA (для игр) и CDNA (для дата-центров). Графическая архитектура CDNA начала использоваться в качестве основы для специализированных ускорителей Radeon Instinct, позже переименованных просто в Instinct. Хотя на тот момент разделение и оптимизация графических архитектур под определённые сценарии казалась оправданной, разработчикам стало сложно ориентироваться в этих оптимизациях. В результате компания решила снова унифицировать архитектуру.

«Часть большого изменения в AMD связана с тем, что сегодня у нас есть архитектура CDNA для ускорителей Instinct для дата-центров и архитектура RDNA для потребительских видеокарт. Они разветвлены. Двигаясь вперёд, мы их объединим в одну с названием UDNA. Это будет унифицированная архитектура, предназначенная как для Instinct, так и для потребительских решений. Благодаря этому объединению мы значительно упростим задачи для разработчиков, которым сегодня приходится выбирать с какой архитектурой работать», — заяви Гуинь.

Благодаря упрощению архитектуры разработчикам необходимо будет сосредоточить своё внимание только на одной системе, независимо от того, работают ли они с большими кластерами графических процессоров или одним игровым GPU.

Компания теперь также будет планировать разработки графических архитектур на три поколения вперёд (RDNA5, UDNA6 и UDNA7) с целью поддержания оптимизаций без необходимости сбрасывать их каждый раз, когда AMD меняет свою иерархию памяти.

AMD официально пока не объявляла о стратегии перехода на унифицированную графическую архитектуру UDNA. Когда это случится — с выходом RDNA 5 или позже — неизвестно. На самом деле, компания пока мало что рассказала и о будущей графической архитектуре RDNA 4, которая, как ожидается, должна стать основной видеокарт Radeon 8000.

AMD представила мощнейший ИИ-ускоритель MI325X с 288 Гбайт HBM3e и рассказала про MI350X на архитектуре CDNA4

Компания AMD представила на выставке Computex 2024 обновлённые планы по выпуску ускорителей вычислений Instinct, а также анонсировала новый флагманский ИИ-ускоритель Instinct MI325X.

 Источник изображений: AMD

Источник изображений: AMD

Ранее компания выпустила ускорители MI300A и MI300X с памятью HBM3, а также несколько их вариаций для определённых регионов. Новый MI325X основан на той же архитектуре CDNA 3 и использует ту же комбинацию из 5- и 6-нм чипов, но тем не менее представляет собой существенное обновление для семейства Instinct. Дело в том, что в данном ускорителе применена более производительная память HBM3e.

Instinct MI325X предложит 288 Гбайт памяти, что на 96 Гбайт больше, чем у MI300X. Что ещё важнее, использование новой памяти HBM3e обеспечило повышение пропускной способности до 6,0 Тбайт/с — на 700 Гбайт/с больше, чем у MI300X с HBM3. AMD отмечает, что переход на новую память обеспечит MI325X в 1,3 раза более высокую производительность инференса (работа уже обученной нейросети) и генерации токенов по сравнению с Nvidia H200.

Компания AMD также предварительно анонсировала ускоритель Instinct MI350X, который будет построен на чипе с новой архитектурой CDNA 4. Переход на эту архитектуру обещает примерно 35-кратный прирост производительности в работе обученной нейросети по сравнению с актуальной CDNA 3.

Для производства ускорителей вычислений MI350X будет использоваться передовой 3-нм техпроцесс. Instinct MI350X тоже получат до 288 Гбайт памяти HBM3e. Для них также заявляется поддержка типов данных FP4/FP6, что принесёт пользу в работе с алгоритмами машинного обучения. Дополнительные детали об Instinct MI350X компания не сообщила, но отметила, что они будут выпускаться в формфакторе Open Accelerator Module (OAM).

 Источник изображения: AnandTech

Источник изображения: AnandTech

ИИ-ускорители Instinct MI325X начнут продаваться в четвёртом квартале этого года. Выход MI350X ожидается в 2025 году. Кроме того, AMD сообщила, что ускорители вычислений серии MI400 на архитектуре CDNA-Next будут представлены в 2026 году.

AMD продемонстрировала ускоритель вычислений MI300X, который превосходит решение NVIDIA по объёму поддерживаемой памяти

В этот вторник глава AMD Лиза Су (Lisa Su) на специальном мероприятии предсказуемо продемонстрировала образец ускорителя вычислений MI300X, который начнёт поставляться клиентам до конца текущего года. По сравнению с конкурирующим решением NVIDIA H100, он обеспечивает поддержку до 192 Гбайт памяти против 120 Гбайт соответственно.

 Источник изображения: Getty Images, David Becker

Источник изображения: Getty Images, David Becker

В ходе демонстрации способностей ускорителей на базе MI300X была показана их способность работать с языковой моделью для искусственного интеллекта, содержащей 40 млрд параметров. Для сравнения, известная GPT-3 стартапа OpenAI располагает 175 млрд параметров. Как пояснила Лиза Су, языковые модели становятся значительно больше по этому критерию, поэтому разработчикам потребуется сразу несколько GPU для работы с одной моделью. Правда, за счёт поддержки большего объёма памяти AMD MI300X способен сократить потребность собственно в дополнительных ускорителях.

Поддержка архитектуры Infinity Architecture позволяет клиентам AMD объединять в одной системе до восьми ускорителей MI300X. Конкурирующие решения NVIDIA опираются на программную экосистему CUDA для разработки приложений, формирующих систему искусственного интеллекта, а AMD опирается на платформу ROCm, которая работает с открытой экосистемой моделей. Архитектурно MI300X опирается на вычислительные ядра с архитектурой Zen 4 и CDNA 3, дополняя их стеками памяти типа HBM3 общим количеством до восьми штук. Общее количество транзисторов на одной подложке ускорителя MI300X достигает 153 млрд штук. Решение AMD превосходит продукт NVIDIA и по пропускной способности памяти, которая достигает 5,2 Тбайт/с, а интерфейс Infinity Fabric обеспечивает передачу до 896 Гбайт информации в секунду.


window-new
Soft
Hard
Тренды 🔥
Google представила ИИ-систему AlphaEvolve, которая отлично создаёт и оптимизирует алгоритмы — она ускорит обучение других ИИ 35 мин.
Stability AI выпустила ИИ-генератор музыки, который быстро работает даже на смартфоне 46 мин.
Релиз окончательного издания Mortal Kombat 1 возмутил фанатов — игру обещали поддерживать годами 2 ч.
Ubisoft уточнила, когда выйдет многострадальный ремейк Prince of Persia: The Sands of Time 3 ч.
«Достойна получить ремастер»: бывший технический директор Rockstar прокомментировал слухи о переиздании GTA IV 4 ч.
Улучшенная графика, бесшовный мир и быстрые загрузки: Nintendo показала сравнение Hogwarts Legacy на Switch и Switch 2 5 ч.
GSC анонсировала улучшенный сборник S.T.A.L.K.E.R. Legends of the Zone Trilogy для ПК и консолей — дата выхода, бесплатный апгрейд и системные требования 6 ч.
«Яндекс Маркет» внедрил ИИ для превентивного выявления мошенничества 7 ч.
«Нас разорили»: сайты сравнения цен потребовали от Google компенсации на €12 млрд 8 ч.
Слухи: хакер украл данные 89 миллионов пользователей Steam и выставил их на продажу 8 ч.
Продажи серверов в России падают второй год подряд — потенциал импортозамещения практически исчерпан 10 мин.
Флагманские смартфоны Realme GT 7 дебютируют на глобальном рынке 27 мая 15 мин.
США отменили спорные ограничения на экспорт ИИ-ускорителей в другие страны, но запретили им покупать ускорители Huawei 58 мин.
Samsung высмеяла толстые и тяжёлые iPhone в рекламе Galaxy S25 Edge 4 ч.
Раскрыты характеристики аппаратной платформы Nintendo Switch 2: низкие частоты и медленная память 4 ч.
AMD прозрачно намекнула на анонс Radeon RX 9060 XT через неделю 4 ч.
LG показала растягивающиеся, скручивающиеся и прозрачные дисплеи для автомобилей 4 ч.
MediaTek представила платформу Dimensity 9400e для доступных флагманов — она очень похожа на Dimensity 9300+ 4 ч.
Экс-главу китайского производителя чипов приговорили к смертной казни за коррупцию и хищение 6 ч.
$2849 за идеальный сон: Eight Sleep представила умную постель, которая борется с храпом и регулирует температуру 6 ч.