Сегодня 01 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → интерконнект

Microsoft, Meta✴ и OpenAI объединились с AMD и Nvidia для создания быстрого оптического интерконнекта для ИИ-мегакластеров

Облачные провайдеры Microsoft, Meta✴ и OpenAI объединились с разработчиками оборудования AMD, Broadcom и Nvidia для разработки протокольно-независимой технологии масштабируемого межсоединения для кластеров ИИ. Новое соглашение о сотрудничестве (Multi-Source Agreement, MSA) определит универсальную волоконно-оптическую инфраструктуру для масштабируемых межсоединений на коротких расстояниях для кластеров ИИ.

 Источник изображений: unsplash.com

Источник изображений: unsplash.com

В телекоммуникационной отрасли MSA — это соглашение о выпуске продуктов, совместимых между различными поставщиками, выступающее в качестве де-факто стандартов и создающее конкурентный рынок для совместимых продуктов. Спецификация, разработанная MSA, определяет форм-факторы устройств и их интерфейс управления. К продуктам, соответствующим MSA, относятся: оптические трансиверы, волоконно-оптические кабели и другие сетевые устройства.

MSA в области оптических вычислительных межсоединений (Optical Compute Interconnect, OCI) должно определить открытую спецификацию оптической связи для масштабируемых межсоединений, используемых внутри крупных систем и стоек ИИ, что позволит использовать оптические кабели вместо медных для подключения большего количества ускорителей на высокой скорости и с предсказуемым энергопотреблением. На практике это означает, что консорциум разработает общий физический уровень (Physical Layer, PHY) и унифицированные компоненты для поддержки различных протоколов, таких как UALink для AMD и Broadcom, и NVLink для Nvidia.

Технология связи OCI для оптических каналов малой дальности, используемых в стойках ИИ и масштабируемых кластерах, определит общий PHY на основе сигнализации NRZ и мультиплексирования с разделением по длинам волн (Wavelength-Division Multiplexing, WDM), начиная с четырёх длин волн × 50 Гбит/с (200 Гбит/с в каждом направлении) с возможностью масштабирования до 800 Гбит/с на волокно. Ожидается, что со временем количество длин волн будет увеличено, а скорость передачи сигналов возрастёт до 3,2 Тбит/с на волокно. Технология будет поддерживать подключаемые оптические модули, встроенную оптику и интегрированную оптику (Co-Packaged Optics, CPO) непосредственно с вычислительными микросхемами.

Общий PHY позволит различным процессорам и протоколам межсоединений работать на одной и той же волоконно-оптической инфраструктуре и коммутаторах от разных поставщиков, обеспечивая гибкость для крупных компаний, сохраняя при этом конкурентные преимущества протоколов, используемых разработчиками ускорителей ИИ и графических процессоров. Стандартизированная дорожная карта OCI призвана упростить системную интеграцию, снизить риски разработки и сократить циклы развёртывания для новых поколений оборудования ИИ.

Хотя группу OCI MSA возглавляют AMD, Broadcom и Microsoft, известные сторонники открытых отраслевых стандартов, это явно не традиционный орган по стандартизации, такой как консорциумы Ultra Ethernet или UALink, что должно заметно повлиять на развитие технологии и ускорить её внедрение:

  • Во-первых, OCI MSA ориентирована на гиперскейлеров, что отличает это соглашение от большинства отраслевых консорциумов, которые организуются и возглавляются независимыми поставщиками оборудования (IHV), IP-компаниями и поставщиками сетевого оборудования.
  • Во-вторых, OCI нацелена на очень специфический архитектурный уровень систем ИИ — каналы связи ближнего действия, соединяющие ускорители и коммутаторы в масштабируемой области. В отличие от этого, традиционные группы разработчиков оборудования, как правило, стандартизируют вертикально интегрированный набор технологий.
  • В-третьих, сама структура MSA подразумевает, что работа будет вестись быстрее, чем в типичном отраслевом органе по стандартизации. MSA призваны позволить участникам согласовывать электрические/оптические интерфейсы и быстро создавать совместимые продукты, без длительных процессов достижения консенсуса, характерных для классических организаций, таких как JEDEC или Ultra Ethernet Consortium, которые призваны объединять десятки или сотни компаний и поддерживать всю отрасль.

«Растущая потребность в масштабируемых оптических межсоединениях для поддержки крупных систем ИИ в конце этого десятилетия очевидна, — уверен старший вице-президент по технологиям и инженерии AMD Брайан Амик (Brian Amick). — AMD является одним из основателей и активным сторонником OCI MSA, поскольку она устанавливает открытую спецификацию для отрасли, способствующую развитию надёжной многовендорной экосистемы масштабируемых оптических межсоединений».

«Компания Broadcom гордится тем, что использует свою платформу CPO и отраслевые партнёрства для продвижения спецификации OCI, — заявил вице-президент и генеральный директор подразделения оптических систем Broadcom Нир Маргалит (Near Margalit). — OCI-MSA обеспечивает бесшовную интеграцию с существующими электрическими ASIC на базе SerDes, предоставляя при этом чёткий путь к прямой интеграции ASIC, гарантируя, что экосистема останется гибкой и высокопроизводительной».

«Nvidia является одним из основателей OCI MSA, призванного установить общий оптический стандарт для глобальных инфраструктур ИИ, — отметил старший вице-президент по сетевым технологиям Nvidia Гилад Шайнер (Gilad Shainer). — Оснастив лучшие в своём классе вычислительные мощности передовой оптикой, OCI MSA может обеспечить масштабируемость и производительность, необходимые для следующей эры сверхинтеллекта».

TSMC предлагает использовать microLED-соединения, если нужна скорость и энергоэффективность

TSMC, мировой лидер в области производства полупроводников, и компания Avicena объявили о сотрудничестве в области создания оптических соединений нового поколения. Их цель — разработать технологию microLED-интерконнектов, которая заменит медные кабели внутри серверных стоек и обеспечит высокоскоростную и энергоэффективную передачу данных между графическими процессорами (GPU) в ИИ-инфраструктуре.

 Источник изображения: Bardia Pezeshki / IEEE Spectrum

Источник изображения: Bardia Pezeshki / IEEE Spectrum

Необходимость перехода к оптике вызвана стремительно растущими требованиями к ИИ-инфраструктуре, где объём данных увеличивается кратно, задержка в передаче становится критичной, а существующие медные соединения больше не справляются с нагрузкой. Как пояснил Лукас Цай (Lucas Tsai), вице-президент TSMC, индустрия стремится интегрировать оптические каналы как можно ближе к печатной плате. Речь идёт об интерконнектах внутри стоек, где сотни GPU обмениваются данными в режиме почти постоянной загрузки.

Технология LightBundle, созданная Avicena, представляет собой инновационный способ передачи данных без использования лазеров. Вместо них применяются сотни синих microLED, каждый из которых передаёт данные через отдельное многоканальное оптоволокно — так называемое изображающее волокно (англ. — imaging fiber), обеспечивающее параллельную передачу. Передатчик работает как миниатюрный дисплей, а приёмник — как камера. Каждая линия соответствует одному пикселю и обеспечивает скорость 10 Гбит/с. Даже базовая конфигурация на 300 пикселей позволяет передавать до 3 Тбит/с на расстояние до 10 метров при энергозатратах менее 1 пДж на бит. Как подчёркивает генеральный директор Avicena Бардиа Пезешки (Bardia Pezeshki), его компания создаёт оптические соединения без всей сложности, связанной с лазерами.

Сегодняшние оптические соединения, основанные на лазерах, уже используются на расстояниях в десятки и сотни метров. Однако такие решения включают в себя сложные и дорогостоящие компоненты: модуляторы, гребенчатые лазеры, кольцевые резонаторы и трансиверы. Основной вызов в лазерной архитектуре связан с надёжностью и высокой стоимостью соединений волокна с чипами. Кроме того, при использовании многоволновых сигналов возрастает нагрузка на вычислительную систему, так как требуется электронное разбиение канала на отдельные потоки. В отличие от этого, система Avicena использует по одному физическому каналу на каждый поток данных — решение, которое проще, надёжнее и масштабируемо.

Принципиальным отличием технологии Avicena является ставка на зрелые потребительские компоненты. Светодиоды, матрицы камер и дисплеи — это производственные ниши с десятилетиями практики, налаженной логистикой и стабильной себестоимостью. Как подчёркивает Пезешки, компания может масштабировать подход до необходимых объёмов и стоимости гораздо быстрее, чем если бы разрабатывала всё с нуля. В отличие от кремниевой фотоники, которая за последние 30 лет продвинулась далеко, но по-прежнему требует создания сложных элементов, таких как кольцевые резонаторы и гребенчатые лазеры, технология LightBundle обходится лишь минимальными модификациями существующих дисплейных и камерных решений. Именно такая практичность, вероятно, и стала ключевым аргументом для TSMC, которая согласилась производить фотодетекторные массивы для оптических чиплетов Avicena.

Результаты уже впечатляют. По словам Пезешки, прототип LightBundle демонстрирует энергопотребление менее 1 пДж/бит, тогда как другие технологии оптических соединений с трудом преодолевают порог в 5 пДж/бит. Эта разница критична при масштабировании на десятки или сотни тысяч соединений внутри дата-центра. По его словам, решения Avicena уже «перекрывают» возможности кремниевой фотоники — как по энергетике, так и по стоимости. И хотя компании ещё предстоит путь к полноценному производству, сочетание высоких показателей и зрелости используемых компонентов уже создаёт устойчивую основу для массового внедрения.


window-new
Soft
Hard
Тренды 🔥
Лабиринт откроет двери на следующей неделе: стратегическая головоломка Minos по мотивам мифа о Тесее и Минотавре получила дату выхода в Steam 13 мин.
Стратегия Stormgate от экс-разработчиков StarCraft 2 скоро останется без мультиплеера, потому что провайдера серверов игры выкупила ИИ-компания 2 ч.
Anthropic вспомнила об авторских правах — она пытается смягчить последствия утечки кода Claude Code 3 ч.
Официально: апрельская подборка PS Plus включает пять игр вместо трёх, но есть нюанс 3 ч.
Амбициозный боевик Saros от разработчиков Returnal не опоздает к релизу — игра ушла на золото почти за месяц до выхода 4 ч.
Ollama получила поддержку аппаратного ускорения на чипах Apple M5 — при наличии 32 Гбайт памяти 5 ч.
Создатель Disco Elysium рассказал, при каком условии выйдет Disco Elysium 2 5 ч.
ЕС решил запретить ИИ-контент в официальных материалах 6 ч.
Эксперты призвали Google не показывать детям ИИ-контент на YouTube 6 ч.
Microsoft выпустила экстренное обновление для Windows 11, призванное исправить ошибки мартовского накопительного обновления 6 ч.