Китайцы учат роботов «думать» со скоростью света — кремниевая фотоника набирает обороты

Читать в полной версии

Учёные из Университета Сидянь (Xidian University) разработали фотонную нейроморфную вычислительную систему, которая впервые позволяет выполнять обучение с подкреплением полностью на основе света (фотонов), без перевода сигналов в импульсы тока для выполнения ключевых операций. До этого в массе фотонные спайковые нейронные сети могли совершать только линейные вычисления, но новая разработка ворвалась в сферу нелинейных преобразований и это изменит многое.

Источник изображения: Xidian University

Перевод сигналов из состояния фотонов в поток электронов и обратно — это дополнительные потери как энергии, так и времени (задержки). Для функционирования робототехники в режиме реального времени такие потери чреваты быстрым выходом из строя и даже авариями. Поэтому стремление разработчиков создать универсальные фотонные чипы для сложных вычислений и обучения роботов и автопилотов — это один из ключевых путей для безопасного сосуществования робототехники с людьми и среди людей.

Созданный учёными двухчиповый оптический прототип решает три основные проблемы: отсутствие ранее крупномасштабных массивов нелинейных фотонных спайковых нейронов с низким порогом срабатывания (теперь такие массивы есть, и порог срабатывания очень низкий, что позволяет создавать намного более плотные массивы нейронов, чем раньше); невозможность создания полностью программируемых чипов спайковых сетей (они были «жёсткими» — запрограммированными аппаратно) и, как итог, отсутствие возможности аппаратной реализации фотонного обучения с подкреплением, что успешно преодолено учёной группой.

Первая предложенная исследователями система, о которой они рассказали в свежем выпуске журнала «Оптика» (Optica), состоит из 16-канального фотонного нейроморфного чипа с 272 обучаемыми параметрами (на основе матрицы 16 × 16 интерферометров Маха — Зендера) и чипа с массивом лазеров с обратной связью и насыщаемым поглотителем для низкого порога нелинейной активации спайков. Как положено, также разработан аппаратно-программный фреймворк: модель сначала обучается в программном пакете, затем на чипах, а потом дообучается с учётом особенностей аппаратной реализации.

Тестирование проводилось на классических задачах: CartPole (балансировка шеста на тележке) и Pendulum (раскачивание маятника из висячего положения в вертикальное с его последующей стабилизацией в таком положении). Аппаратные результаты показали минимальное падение точности — всего 1,5 % для CartPole и 2 % для Pendulum по сравнению с чисто программной моделью; на CartPole достигнута идеальная производительность, на более сложной задаче Pendulum — хорошая.

Производительность впечатляет: энергоэффективность линейных вычислений достигла 1,39 TOPS/Вт при плотности 0,13 TOPS/мм², нелинейных — 987,65 GOPS/Вт и 533,33 GOPS/мм²; задержка вычислений на чипе — всего 320 пикосекунд. Эти показатели выводят оптическую систему в класс GPU по энергоэффективности (1 TOPS/Вт) и плотности вычислений (0,1–0,5 TOPS/мм²), но с преимуществом полной оптической обработки, исключающей потери на конвертацию сигналов. Система демонстрирует быстрое обучение посредством серии проб и ошибок в реальном времени.

Разработка открывает перспективы для автономного вождения, встроенного в роботы интеллекта и периферийных вычислений, где требуется сверхнизкая задержка и минимальное энергопотребление. В будущем авторы планируют масштабировать систему до 128-канального чипа для более сложных задач, таких как нейроморфная автономная навигация, и создать компактные гибридно-интегрированные фотонные нейроморфные чипы. Это один из важных шагов к энергоэффективному ИИ, работающему на импульсах света.