Исследователи представили новую архитектуру оптических вычислений, которая способна преодолеть критическое узкое место в разработке искусственного интеллекта (ИИ): скорость, с которой ИИ-модели обрабатывают данные. Прорыв, опубликованный в журнале Nature Photonics, использует свет вместо электричества для выполнения вычислений, что потенциально может революционизировать способы обучения и функционирования ИИ-систем.
Узкое место тензоров в современных ИИ-системах
Современный ИИ полагается на «тензоры» – сложные структуры данных, которые организуют информацию как высокоэффективный карточный шкаф. По мере обучения ИИ-модели сортируют данные в эти тензоры. Скорость обработки этих тензоров является фундаментальным ограничением; чем больше модель, тем медленнее становится обработка. В настоящее время даже самые мощные ИИ-системы от таких компаний, как OpenAI и Google, требуют тысячи графических процессоров (GPU), работающих параллельно, только для функционирования.
Проблема заключается в том, что большинство оптических вычислительных систем, хотя и быстрее и энергоэффективнее в небольших масштабах, не могут быть легко масштабированы. В отличие от GPU, которые можно объединять в цепочки для экспоненциального увеличения производительности, оптические системы обычно работают линейно. Это ограничение исторически делало их менее привлекательными для разработчиков, несмотря на их теоретические преимущества.
Параллельное оптическое матричное умножение (POMMM)
Новая архитектура, названная Параллельным оптическим матричным умножением (POMMM), обходит эту проблему масштабируемости. Она выполняет несколько тензорных операций одновременно, используя один лазерный импульс, в отличие от предыдущих оптических методов, которым требовались повторяющиеся лазерные выстрелы. Это означает, что ИИ-системы теоретически могут обрабатывать данные со скоростями, ранее недостижимыми, одновременно снижая энергопотребление.
Исследователи закодировали цифровые данные в амплитуду и фазу световых волн, превратив их в физическое свойство внутри оптического поля. В результате математические операции происходят пассивно по мере распространения света без необходимости дополнительного питания. Ученые утверждают, что этот подход можно реализовать на существующем оптическом оборудовании.
Последствия для развития ИИ
Потенциальное влияние значительное. По словам Чжипея Суна, руководителя фотонной группы Аалто, эта структура может быть интегрирована в фотонные чипы в ближайшие три-пять лет, что позволит процессорам на основе света выполнять сложные ИИ-задачи с чрезвычайно низким энергопотреблением.
Некоторые эксперты считают, что этот прорыв является шагом к Общему искусственному интеллекту (AGI) – гипотетической ИИ-системе, которая превосходит человеческий интеллект и обучается в различных областях. Хотя в исследовательской статье явно не упоминается AGI, в ней подчеркивается универсальное вычисление. Идея о том, что масштабирование текущих методов ИИ приведет к AGI, популярна среди некоторых представителей компьютерного сообщества. Другие, такие как Янн Лекун из Meta, утверждают, что текущие ИИ-архитектуры никогда не достигнут AGI, независимо от масштаба.
Независимо от дебатов об AGI, архитектура POMMM устраняет ключевое узкое место в этой области. Преодолев ограничения скорости обработки тензоров, разработчики смогут создавать ИИ-модели, превосходящие текущие возможности. Это может ускорить прогресс в различных областях, от научных открытий до автоматизированного принятия решений.
Это развитие может ускорить темпы инноваций в области ИИ, потенциально меняя будущее вычислений и искусственного интеллекта.






























