Cайт веб-разработчика, программиста Ruby on Rails ESV Corp. Екатеринбург, Москва, Санкт-Петербург, Новосибирск, Первоуральск

Свет захватил нейросети — электричество больше не нужно для обучения

Берегись, мир. Теперь беспилотники Китая будут думать молниеносно.

Китайские исследователи представили фотонные вычислительные чипы, которые решают одну из главных проблем так называемых фотонных спайковых нейросетей. Новая архитектура позволяет выполнять обучение и принятие решений полностью в оптической среде, без перевода сигналов в электронную форму. Такой подход может ускорить работу автономных систем: от беспилотных автомобилей до роботов, которые учатся прямо во время взаимодействия с окружающей средой.

Фотонные спайковые нейросети пытаются воспроизвести принцип работы биологических нейронов. Вместо непрерывных сигналов система использует короткие импульсы света, которые играют роль «спайков», то есть быстрых всплесков активности. Однако у фотонных решений до сих пор оставалось серьёзное ограничение: свет хорошо справлялся только с линейными операциями. Нелинейные вычисления, которые нужны для тренировки алгоритмов и принятия решений, приходилось переводить в электронную форму. Такой переход добавлял задержку и частично сводил на нет преимущества подхода.

Команда под руководством Шуйин Сян из Сианьского университета предложила схему, в которой оба типа вычислений выполняются напрямую в оптическом домене. Исследователи построили программируемую фотонную нейроморфную платформу, способную обрабатывать сигналы и выполнять обучение без промежуточной электронной обработки.

Основу системы составляют два специализированных чипа. Первый представляет собой фотонный нейроморфный процессор с 16 каналами и 272 настраиваемыми параметрами. Такая структура позволяет одновременно работать с несколькими потоками оптических сигналов и изменять связи между нейронами в процессе обучения. Второй чип содержит массив лазеров с распределённой обратной связью и насыщаемым поглотителем. Этот элемент обеспечивает нелинейную активацию спайков при относительно низком пороге, что как раз и позволяет выполнять те операции, которые раньше приходилось передавать электронике.

Разработчики также создали совместную аппаратно-программную схему обучения. Сначала модель обучается в программной среде, где проще контролировать параметры сети. Затем обучение продолжается уже на фотонных чипах, а финальная настройка снова выполняется программно, чтобы компенсировать различия между отдельными экземплярами микросхем.

Для проверки системы исследователи собрали гибридную экспериментальную установку и запустили на ней алгоритмы обучения с подкреплением. Этот тип обучения часто используют в робототехнике и автономных системах: алгоритм постепенно улучшает стратегию, получая награду или штраф за результат своих действий.

В экспериментах система решала две классические задачи управления. В первой задаче под названием CartPole нужно удерживать вертикально стоящий шест на тележке, которая может двигаться влево и вправо. Во второй задаче, Pendulum, маятник сначала раскачивается из висячего положения, после чего алгоритм должен поднять его в вертикальное положение и удерживать баланс.

Испытания показали, что решения, принимаемые аппаратной системой, почти не уступают программной модели. В задаче CartPole точность снизилась всего на 1,5%, а в задаче Pendulum — примерно на 2%. При совместной работе аппаратной и программной части система достигла идеального результата в задаче CartPole и уверенно справилась с более сложной Pendulum. Это означает, что фотонные чипы способны воспроизводить поведение обученной нейросети практически в реальном времени.

Авторы также оценили вычислительные характеристики системы. При выполнении линейных операций фотонная часть показала энергоэффективность около 1,39 триллиона операций в секунду на ватт (TOPS/W) и плотность вычислений 0,13 TOPS на квадратный миллиметр. Для нелинейных операций показатели составили около 987,65 миллиардов операций в секунду на ватт (GOPS/W) и 533,33 GOPS на квадратный миллиметр. По энергоэффективности такие значения уже сопоставимы с графическими процессорами, а по плотности вычислений попадают в диапазон современных GPU и специализированных ускорителей.

Важным параметром оказалась и задержка вычислений на самом чипе. В новой системе она составляет около 320 пикосекунд — примерно 320 триллионных долей секунды. Такая скорость делает фотонные схемы потенциально интересными для задач, где требуется мгновенная реакция, например в автономном транспорте или роботах, работающих в реальной среде.

Следующий шаг команды — создание более крупной версии системы с 128 каналами. Более масштабный фотонный нейроморфный чип позволит решать сложные задачи обучения с подкреплением, включая навигацию автономных систем. Одновременно исследователи планируют разработать компактную гибридную архитектуру, которую можно будет использовать в устройствах на периферии сети, где важны низкое энергопотребление и минимальные задержки.

SecurityLab