
Хотите назвать кого-нибудь сообразительным? Самый простой способ сделать это — назвать её компьютером. На самом деле, «компьютеры» — это буквально название профессии математиков из фильма «Скрытые фигуры», которые обеспечили успех НАСА на заре его существования.
Но хотя современные электронные компьютеры намного быстрее, чем даже те математические гении, которые использовали бумагу, карандаши и логарифмические линейки, существует другой тип вычислений, который превосходит их по скорости — оптические вычисления, работающие со скоростью света, поскольку вместо электронов они используют сам свет.
Потребность в более быстрых вычислениях возникает не только для удовлетворения нетерпеливых потребителей, жаждущих смотреть фильмы онлайн во время видеочатов, играть в VR-игры и заниматься 3D-печатью. Речь идёт о том, чтобы справиться с колоссальным ростом объёмов данных в современном цифровом мире. Скромные графические процессоры (GPU) в стандартных компьютерах просто не способны масштабироваться или работать достаточно быстро, чтобы справиться с таким огромным объёмом данных. Хуже того, как утверждают журналы The Smithsonian Magazine и Sustainability Magazine, Согласно отчету, центры обработки данных для ИИ, оснащенные графическими процессорами, потребляют огромное количество электроэнергии (в основном из невозобновляемых источников) и воды (часто в засушливых регионах).
В дело вступают Юфэн Чжан (группа фотоники кафедры электроники и наноинженерии Университета Аалто) и Сяобин Лю (Китайская академия наук, Чанчунь). В своей статье в журнале Nature Photonics под названием «Прямая обработка тензоров с помощью когерентного света» ведущий автор Чжан и его коллеги описывают свой вычислительный метод, использующий однократное распространение света, что и дало название « однократное тензорное вычисление со скоростью света в параллельном оптическом умножении матриц» (POMMM).
Подобные прорывы приближают создание искусственного общего интеллекта на один важный шаг.
«Наш метод выполняет те же операции, что и современные графические процессоры, — говорит Чжан, — например, свертки и слои внимания, но делает это со скоростью света». Вместо стандартного двоичного кодирования информации с использованием электронных схем, работающих с сигналами единиц и нулей, исследователи используют амплитуду и фазу световых волн для хранения, обработки и передачи данных. Это не только экономит энергию, но и обеспечивает колоссальное расширение полосы пропускания и скорости обработки — фактически, многие процессы выполняются одновременно.
Взаимодействие световых полей естественным образом порождает математические операции, включая умножение тензоров . Тензорная обработка организует данные в многомерные массивы (представьте двумерный массив как одну полку в картотечном шкафу, а трехмерный массив как картотечный шкаф с несколькими вертикально расположенными полками), называемые тензорами данных. Тензорная обработка повсеместно используется в передовых технологиях, особенно в анализе данных и искусственном интеллекте, включая обработку естественного языка и распознавание изображений. Она лежит в основе алгоритмов глубокого обучения.
Однако существующие оптические методы плохо справляются с задачами, основанными на тензорах, что делает их неэффективными для нейронных сетей и других очень сложных приложений. Именно здесь метод Аалто предлагает значительный шаг вперед, используя несколько длин волн света, которые могут справиться даже с чрезвычайно сложными тензорными операциями.
Чтобы объяснить разницу между электронными и оптическими вычислениями, разработанными его командой, Чжан использует аналогию с сортировкой посылок.
«Представьте, что вы таможенник, которому необходимо проверить каждую посылку с помощью множества устройств с различными функциями, а затем рассортировать их по соответствующим контейнерам», — говорит Чжан. «Обычно вы обрабатываете каждую посылку по отдельности. Наш метод оптических вычислений объединяет все посылки и все устройства, создавая множество «оптических точек», которые соединяют каждый вход с соответствующим выходом. Всего за одну операцию, за один проход света, все проверки и сортировка происходят мгновенно и параллельно».
Параллельная обработка тензоров (также называемая параллельной обработкой тензорных моделей или TP) — это стратегия выполнения в глубоком обучении, которая использует несколько устройств для обработки компонентов одной и той же модели, что позволяет им быстрее вычислять более крупные модели. Другими словами, множество умов облегчают работу. Или, в данном случае, работу со скоростью света.
По словам Чжипэя Суня, руководителя группы фотоники Университета Аалто, новый метод может работать практически на любой оптической платформе, и его команда планирует «интегрировать эту вычислительную структуру непосредственно в фотонные чипы, что позволит процессорам на основе света выполнять сложные задачи искусственного интеллекта с чрезвычайно низким энергопотреблением».
Если этот метод окажется эффективным, они рассчитывают внедрить его для интеграции с существующим оборудованием и основными платформами в течение пяти лет. Это «позволит создать новое поколение оптических вычислительных систем, значительно ускоряющих выполнение сложных задач искусственного интеллекта в самых разных областях».




