Облачные провайдеры Microsoft, Meta✴ и OpenAI объединились с разработчиками оборудования AMD, Broadcom и Nvidia для разработки протокольно-независимой технологии масштабируемого межсоединения для кластеров ИИ. Новое соглашение о сотрудничестве (Multi-Source Agreement, MSA) определит универсальную волоконно-оптическую инфраструктуру для масштабируемых межсоединений на коротких расстояниях для кластеров ИИ.
Источник изображений: unsplash.com
В телекоммуникационной отрасли MSA — это соглашение о выпуске продуктов, совместимых между различными поставщиками, выступающее в качестве де-факто стандартов и создающее конкурентный рынок для совместимых продуктов. Спецификация, разработанная MSA, определяет форм-факторы устройств и их интерфейс управления. К продуктам, соответствующим MSA, относятся: оптические трансиверы, волоконно-оптические кабели и другие сетевые устройства.
MSA в области оптических вычислительных межсоединений (Optical Compute Interconnect, OCI) должно определить открытую спецификацию оптической связи для масштабируемых межсоединений, используемых внутри крупных систем и стоек ИИ, что позволит использовать оптические кабели вместо медных для подключения большего количества ускорителей на высокой скорости и с предсказуемым энергопотреблением. На практике это означает, что консорциум разработает общий физический уровень (Physical Layer, PHY) и унифицированные компоненты для поддержки различных протоколов, таких как UALink для AMD и Broadcom, и NVLink для Nvidia.
Технология связи OCI для оптических каналов малой дальности, используемых в стойках ИИ и масштабируемых кластерах, определит общий PHY на основе сигнализации NRZ и мультиплексирования с разделением по длинам волн (Wavelength-Division Multiplexing, WDM), начиная с четырёх длин волн × 50 Гбит/с (200 Гбит/с в каждом направлении) с возможностью масштабирования до 800 Гбит/с на волокно. Ожидается, что со временем количество длин волн будет увеличено, а скорость передачи сигналов возрастёт до 3,2 Тбит/с на волокно. Технология будет поддерживать подключаемые оптические модули, встроенную оптику и интегрированную оптику (Co-Packaged Optics, CPO) непосредственно с вычислительными микросхемами.

Общий PHY позволит различным процессорам и протоколам межсоединений работать на одной и той же волоконно-оптической инфраструктуре и коммутаторах от разных поставщиков, обеспечивая гибкость для крупных компаний, сохраняя при этом конкурентные преимущества протоколов, используемых разработчиками ускорителей ИИ и графических процессоров. Стандартизированная дорожная карта OCI призвана упростить системную интеграцию, снизить риски разработки и сократить циклы развёртывания для новых поколений оборудования ИИ.
Хотя группу OCI MSA возглавляют AMD, Broadcom и Microsoft, известные сторонники открытых отраслевых стандартов, это явно не традиционный орган по стандартизации, такой как консорциумы Ultra Ethernet или UALink, что должно заметно повлиять на развитие технологии и ускорить её внедрение:
- Во-первых, OCI MSA ориентирована на гиперскейлеров, что отличает это соглашение от большинства отраслевых консорциумов, которые организуются и возглавляются независимыми поставщиками оборудования (IHV), IP-компаниями и поставщиками сетевого оборудования.
- Во-вторых, OCI нацелена на очень специфический архитектурный уровень систем ИИ — каналы связи ближнего действия, соединяющие ускорители и коммутаторы в масштабируемой области. В отличие от этого, традиционные группы разработчиков оборудования, как правило, стандартизируют вертикально интегрированный набор технологий.
- В-третьих, сама структура MSA подразумевает, что работа будет вестись быстрее, чем в типичном отраслевом органе по стандартизации. MSA призваны позволить участникам согласовывать электрические/оптические интерфейсы и быстро создавать совместимые продукты, без длительных процессов достижения консенсуса, характерных для классических организаций, таких как JEDEC или Ultra Ethernet Consortium, которые призваны объединять десятки или сотни компаний и поддерживать всю отрасль.

«Растущая потребность в масштабируемых оптических межсоединениях для поддержки крупных систем ИИ в конце этого десятилетия очевидна, — уверен старший вице-президент по технологиям и инженерии AMD Брайан Амик (Brian Amick). — AMD является одним из основателей и активным сторонником OCI MSA, поскольку она устанавливает открытую спецификацию для отрасли, способствующую развитию надёжной многовендорной экосистемы масштабируемых оптических межсоединений».
«Компания Broadcom гордится тем, что использует свою платформу CPO и отраслевые партнёрства для продвижения спецификации OCI, — заявил вице-президент и генеральный директор подразделения оптических систем Broadcom Нир Маргалит (Near Margalit). — OCI-MSA обеспечивает бесшовную интеграцию с существующими электрическими ASIC на базе SerDes, предоставляя при этом чёткий путь к прямой интеграции ASIC, гарантируя, что экосистема останется гибкой и высокопроизводительной».
«Nvidia является одним из основателей OCI MSA, призванного установить общий оптический стандарт для глобальных инфраструктур ИИ, — отметил старший вице-президент по сетевым технологиям Nvidia Гилад Шайнер (Gilad Shainer). — Оснастив лучшие в своём классе вычислительные мощности передовой оптикой, OCI MSA может обеспечить масштабируемость и производительность, необходимые для следующей эры сверхинтеллекта».
Источник:


MWC 2018
2018
Computex
IFA 2018






