Сегодня 22 декабря 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → gpgpu

El Capitan на базе чипов AMD стал самым быстрым суперкомпьютером в мире

El Capitan, оснащённый процессорами AMD, занял первое место в рейтинге самых мощных суперкомпьютеров мира с производительностью 1,7 эксафлопс, превзойдя предыдущего лидера Frontier с показателем 1,3 эксафлопс. Aurora компании Intel опустилась на третье место.

 Источник изображения: AMD

Источник изображения: AMD

El Capitan представляет из себя массивную систему, состоящую из 44 544 гибридных процессоров AMD Instinct MI300A и 11 136 узлов. Объём основной памяти составляет 5,4 петабайта, а за обработку больших объёмов данных отвечает локальная система хранения «Rabbit». Как сообщает Tom's Hardware, в рамках теста High-Performance Linpack (HPL) была показана реальная производительность в 1,742 эксафлопс, что на 45 % быстрее, чем у ближайшего конкурента. Теоретический пик производительности достигает 2,746 эксафлопс, однако такие показатели в реальном мире практически недостижимы.

Суперкомпьютер будет использоваться в США для моделирования ядерных взрывов и оценки состояния ядерного арсенала страны. Помимо этого, система позволит разрабатывать новые межконтинентальные баллистические ракеты (ICBM) и решать задачи, связанные с высокопроизводительными вычислениями и искусственным интеллектом. El Capitan способен обрабатывать данные с высокой точностью (FP64), что необходимо для научных и инженерных задач, в отличие от систем, ориентированных только на задачи ИИ.

 Источник изображения: AMD

Источник изображения: AMD

El Capitan был построен компанией HPE на базе архитектуры Shasta, которая также используется в других экcафлопсных системах, таких как Frontier и Aurora. Все три суперкомпьютера занимают ведущие позиции в рейтинге Top500, что подтверждает лидерство HPE в создании высокопроизводительных вычислительных систем. Frontier, который теперь находится на втором месте, также продемонстрировал улучшенные результаты по сравнению с предыдущими тестами, увеличив свою производительность до 1,353 эксафлопс.

Известно также, что система потребляет более 35 МВт энергии при полной нагрузке и занимает 18-е место в рейтинге самых энергоэффективных суперкомпьютеров Green500, демонстрируя 58,89 GFLOPS на Вт. Суперкомпьютер El Capitan насчитывает более 11 миллионов вычислительных ядер, интегрированных в процессоры Instinct MI300A, которые объединяют в одном корпусе как CPU, так и GPU. Каждый процессор MI300A включает в себя 146 миллиардов транзисторов и использует передовые технологии 3D-упаковки чипов, что позволяет значительно улучшить энергоэффективность и производительность.

Отдельное внимание привлекает ситуация с суперкомпьютером Aurora, построенным на базе технологий Intel. Несмотря на заявленные ранее результаты, система не смогла предоставить новые данные для рейтинга, что указывает на продолжающиеся проблемы с оборудованием и охлаждением. При этом Aurora всё ещё остаётся самым мощным ИИ-суперкомпьютером в мире с производительностью 10,6 эксафлопс в задачах смешанной точности.

Очередь за ускорителями вычислений NVIDIA H100 растянулась до 2024 года

Ажиотажный спрос на ускорители вычислений NVIDIA для систем искусственного интеллекта уже привёл к дефициту данного вида продукции, и старшая карта H100 с архитектурой Hopper востребована в такой степени, что все доступные объёмы таких ускорителей уже распределены до начала следующего года.

 Источник изображения: NVIDIA

Источник изображения: NVIDIA

По крайней мере, уверенность в этом в интервью ресурсу Barron’s выразил технический директор стартапа CoreWeave Брайан Вентуро (Brian Venturo), поскольку приближённый к NVIDIA поставщик инфраструктурных решений для ускорения вычислений силами GPU имеет актуальное представление о положении дел на рынке. Как пояснил Брайан Вентуро, ещё в первом квартале текущего года с доступом к нужным объёмам ускорителей проблем не было, но в апреле всё резко изменилось. Сроки исполнения заказов растянулись до конца текущего года, и спрос неожиданно подскочил буквально за одну неделю. Ускорители теперь нужны не только крупным облачным провайдерам, но и исследовательским лабораториям, и крупным предприятиям, которые экспериментируют с внедрением систем искусственного интеллекта.

Как поясняет этот поставщик ускорителей, сейчас желающие получить самую производительную версию в исполнении NVIDIA, которая обозначается H100, вынуждены рассчитывать сроки поставки на первый или второй квартал следующего года. Непосредственно CoreWeave, инвестором которой является сама NVIDIA, сможет возобновить закупку ускорителей серии H100 не ранее второго или третьего квартала следующего года. По словам руководителя компании, решения NVIDIA в этой сфере востребованы в силу наличия развитой экосистемы для разработчиков, универсальности и сопутствующей инфраструктуры передачи информации в виде скоростных решений InfiniBand.

Американская NVIDIA на треть замедлила ускорители для китайского рынка

В конце прошлого года власти США запретили компании NVIDIA поставлять в Китай ускорители вычислений с уровнем быстродействия A100 и H100. В качестве ответа NVIDIA решила выпустить для Китая ускорители H800 и A800, являющиеся их менее производительными аналогами, а потому не подпадающими под санкционные ограничения.

 Источник изображения: NVIDIA

Источник изображения: NVIDIA

Рост спроса на сложные нейронные языковые модели (LLM), такие как Generative Pre-trained Transformer (GPT), которые обучаются на больших наборах текстовых данных, чтобы генерировать текст, схожий с человеческим, привёл к повышению спроса и инвестициям в ускорители вычислений, с помощью которых эти модели обучаются.

Как сообщает издание MyDrivers, ускоритель вычислений A800 для китайского рынка обеспечивает 70 % производительности обычного A100. Последний демонстрирует 9,7 Тфлопс в операциях FP64, 19,5 Тфлопс в задачах FP64 с использованием тензорных ядер и до 624 Тфлопс в смешанных задачах FP16 и BF16. Таким образом, при сниженной на 30 % производительности ускорители A800 показывают 6,8 Тфлопс в задачах FP64, 13,7 Тфлопс в операциях FP64 с использованием тензорных ядер и 437 Тфлопс в смешанных задачах FP16 и BF16.

По данным MyDrivers, стоимость NVIDIA A800 в Китае достигает 100 тыс. юаней, что примерно равно 14 462 долларам. Однако это не самый быстрый из доступных для китайского рынка ускоритель NVIDIA. Ведь есть ещё модель H800, позиционируемая классом выше. Правда, более подробных данных о его производительности издание не приводит.


window-new
Soft
Hard
Тренды 🔥
Вышел первый настольный компьютер Copilot+PC — Asus NUC 14 Pro AI на чипе Intel Core Ultra 9 25 мин.
Foxconn немного охладела к покупке Nissan, но вернётся к этой теме, если слияние с Honda не состоится 6 ч.
В следующем году выйдет умная колонка Apple HomePod с 7-дюймовым дисплеем и поддержкой ИИ 6 ч.
Продажи AirPods превысили выручку Nintendo, они могут стать третьим по прибыльности продуктом Apple 7 ч.
Прорывы в науке, сделанные ИИ в 2024 году: археологические находки, разговоры с кашалотами и сворачивание белков 15 ч.
Arm будет добиваться повторного разбирательства нарушений лицензий компанией Qualcomm 19 ч.
Поставки гарнитур VR/MR достигнут почти 10 млн в 2024 году, но Apple Vision Pro занимает лишь 5 % рынка 21 ч.
Первая частная космическая станция появится на два года раньше, но летать на неё будет нельзя 22 ч.
В США выпущены федеральные нормы для автомобилей без руля и педалей 23 ч.
Для невыпущенного суперчипа Tachyum Prodigy выпустили 1600-страничное руководство по оптимизации производительности 24 ч.