Сегодня 07 мая 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → tachyum

Мощь 52 ускорителей NVIDIA H200 за 1/100 стоимости — Tachyum начнёт массово выпускать 192-ядерные чипы Prodigy в этом году

Компания Tachyum сообщила, что в этом году начнёт массовое производство универсального процессора Prodigy, сочетающего вычислительные и графические ядра, а также нейродвижок TPU. Производитель обещает, что новинка обеспечит выдающийся уровень производительности и сможет потягаться с самыми мощными ускорителями вычислений NVIDIA.

 Источник изображения: Tachyum

Источник изображения: Tachyum

Разработчик заявляет, что её 192-ядерный чип, выполненный на основе 5-нм технологического процесса, обеспечивает в 4,5 раза более высокую производительность, чем любой другой процессор, предназначенный для вычислительных нагрузок в облачной среде. Кроме того, он до трёх раз быстрее любого GPU, предназначенного для высокопроизводительных вычислений и до шести раз энергетически эффективнее специализированных GPU для ИИ-задач.

Tachyum анонсировала чип Prodigy Universal Processor в 2022 году и пообещала с его помощью трансформировать узкоспециализированные ЦОДы в универсальные компьютерные центры, способные обеспечить необходимую вычислительную мощность и эффективность для различных ИИ-нагрузок. В декабре 2023 года компания выпустила видео, показывающее способность Prodigy эмулировать работу в x86-совместимых приложениях. Однако есть одно существенное «но»: несмотря на внушительные цифры производительности и заявления Tachyum, процессоры Prodigy существуют только на бумаге и в виде эмулируемой с помощью FPGA платформы с небольшим количеством ядер.

«Успехи, которых нам удалось достичь при корректировке нашего плана выпуска продуктов, привели нас к 2024 году, полному ожиданий, поскольку мы движемся к началу массового производства Prodigy и реализации многомиллиардного канала продаж. Мы с нетерпением ждём возможности выполнить наше обещание и обязательство по преобразованию обычных центров обработки данных в универсальные вычислительные центры в ближайшем будущем», — заявил генеральный директор и основатель Tachyum Радослав Данилак (Radoslav Danilak).

Поскольку в составе Prodigy Universal Processor используются функциональные компоненты, предназначенные для разных типов нагрузок, он может динамически переключаться между вычислительными кластерами, исключая необходимость в использовании разнонаправленного и дорогостоящего аппаратного обеспечения для отдельных типов ИИ-нагрузок в составе вычислительной системы. По крайней мере, так говорится в свежем пресс-релизе компании.

Там же заявляется, что всего один процессор Prodigy Universal Processor стоимостью $23 000 способен сравниться по производительности в задачах обучения ИИ с системой из 52 специализированных ускорителей NVIDIA H200, являющихся одними из лучших на рынке. Компания заявила, что стоимость такого количества графических процессоров в составе семи серверов Supermicro GPU составит 2 349 028 долларов или в 100 раз больше, чем одна система с Prodigy Universal Processor и 2 Тбайт оперативной памяти DDR5.

Tachyum также заявила, что уже планирует разработку более передового универсального процессора Prodigy 2 на базе 3-нм техпроцесса, который получит поддержку интерфейсов PCIe 6.0 и CXL, и будет оснащаться набортной высокопроизводительной памятью HBM3. Его планируется выпустить где-то в 2026 году.

«Бумажный» суперпроцессор Tachyum Prodigy разросся до 192-ядерного

Словацкий разработчик так называемых универсальных процессоров Prodigy для HPC, компания Tachyum, сообщила, что ей удалось увеличить расчётное количество ядер своего будущего чипа на 50 % — с 128 до 192 штук. Помогло в этом применение новых средств автоматизированного проектирования (EDA).

 Источник изображений: Tachyum

Источник изображений: Tachyum

Как пишет портал ComputerBase, о разработке чипов Prodigy известно ещё с 2020 года. Эти суперпроцессоры объединяют возможности CPU, GPU и TPU. Они предназначены для решения ресурсоёмких задач в сфере облачных и высокопроизводительных вычислений (HPC), ИИ-систем, машинного обучения и пр.

В Tachyum отмечают, что помимо увеличения количества ядер ей удалось увеличить с 64 до 96 количество блоков SerDes, которые используются в высокоскоростной связи, для преобразования данных между последовательным и параллельным интерфейсами в обоих направлениях. При этом площадь кристалла Prodigy выросла незначительно и теперь составляет 600 мм2 вместо прежних 500 мм2 (прибавка 20 %). Теоретически возможно добавление дополнительных ядер с попутным увеличением площади до 858 мм2, но в таком случае возникнут ограничения в пропускной способности памяти.

Прежняя версия кристалла уже обладала 16-канальным интерфейсом DDR5-7200 и поддерживала работу с 32 модулями DIMM. В новой версии реализована поддержка DDR5-6400, а общий размер кеш-памяти L2 и L3 был увеличен с 128 до 192 Мбайт.

Даже при наличии только 128 ядер процессор Prodigy в тестовых симуляциях показывает неоспоримое превосходство над всеми передовыми решениями конкурентов, утверждает словацкая компания. При наличии у процессора 192 ядер разница значительно увеличится.

Однако, несмотря на все улучшения, Prodigy пока существует только на бумаге. Компания рассчитывает на проведение демонстрации работы первых процессоров в этом году.

Tachyum раскрыла характеристики процессоров Prodigy: до 128 ядер, до 5,7 ГГц и TDP до 950 Вт

Словацкая компания Tachyum обнародовала технические характеристики своих процессоров семейства Prodigy, предназначенных для решения различных ресурсоёмких задач в сфере высокопроизводительных вычислений, искусственного интеллекта (ИИ) и пр.

 Источник изображения: Tachyum

Источник изображения: Tachyum

Говорится о подготовке восьми чипов, которые объединяют от 32 до 128 проприетарных 64-битных ядер с архитектурой VLIW (см. таблицу ниже). Каждое из ядер содержит два 1024-битных векторных блока и один 4096-битный матричный блок. Размер кеша инструкций и данных составляет по 64 Кбайт в расчёте на ядро. Кроме того, есть 1 Мбайт кеша второго уровня (L2). Чипы могут применяться в составе двух- и четырёхпроцессорных систем.

Наиболее мощное изделие Prodigy T16128-AIX работает на частоте до 5,7 ГГц, а показатель TDP (максимальное значение рассеиваемой тепловой энергии) составляет 950 Вт. Реализованы 16 каналов памяти DDR5-7200; поддерживаются 64 линии PCIe 5.0. Максимально возможный объём ОЗУ равен 8 Тбайт.

 Источник изображения: Golem.de

Источник изображения: Golem.de

В семейство Prodigy также вошли модели с показателем TDP в 180, 300, 600 и 700 Вт. Они функционируют на частоте от 3,2 до 5,7 ГГц, поддерживают 32 или 64 линии PCIe 5.0.

Что касается быстродействия, то упомянутое изделие Prodigy T16128-AIX обеспечивает до 90 терафлопс (FP64) для высокопроизводительных вычислений и до 12 петафлопс (AI PetaFLOPS) для ИИ и обучения.


window-new
Soft
Hard
Тренды 🔥