Innovazione nell’elaborazione dell’intelligenza artificiale: il calcolo ottico raggiunge le capacità della “velocità della luce”.

4

I ricercatori hanno svelato una nuova architettura di calcolo ottico che potrebbe superare un collo di bottiglia critico nello sviluppo dell’intelligenza artificiale (AI): la velocità con cui i modelli AI elaborano i dati. La svolta, pubblicata su Nature Photonics, utilizza la luce anziché l’elettricità per eseguire calcoli, rivoluzionando potenzialmente il modo in cui i sistemi di intelligenza artificiale vengono addestrati e gestiti.

Il collo di bottiglia del tensore negli attuali sistemi di intelligenza artificiale

L’intelligenza artificiale moderna si basa su “tensori” : strutture di dati complesse che organizzano le informazioni come uno schedario altamente efficiente. Man mano che i modelli di intelligenza artificiale apprendono, ordinano i dati in questi tensori. La velocità con cui questi tensori possono essere elaborati è una limitazione fondamentale; più grande è il modello, più lenta diventa l’elaborazione. Attualmente, anche i sistemi di intelligenza artificiale più potenti di aziende come OpenAI e Google richiedono migliaia di unità di elaborazione grafica (GPU) che funzionano in parallelo solo per funzionare.

Il problema è che la maggior parte dei sistemi di calcolo ottico, sebbene più veloci ed efficienti dal punto di vista energetico su piccola scala, non possono essere facilmente ampliati. A differenza delle GPU, che possono essere concatenate insieme per ottenere guadagni di elaborazione esponenziali, i sistemi ottici in genere funzionano in modo lineare. Questa limitazione li ha storicamente resi meno attraenti per gli sviluppatori nonostante i loro vantaggi teorici.

Moltiplicazione matrice-matrice ottica parallela (POMMM)

La nuova architettura, denominata Parallel Optical Matrix-Matrix Multiplication (POMMM), aggira questo problema di scalabilità. Conduce più operazioni tensoriali simultaneamente utilizzando un singolo burst laser, a differenza dei precedenti metodi ottici che richiedevano ripetute attivazioni laser. Ciò significa che i sistemi di intelligenza artificiale potrebbero teoricamente elaborare i dati a velocità precedentemente irraggiungibili, riducendo al tempo stesso il consumo di energia.

I ricercatori hanno codificato i dati digitali nell’ampiezza e nella fase delle onde luminose, trasformandole in una proprietà fisica all’interno del campo ottico. Di conseguenza, le operazioni matematiche avvengono passivamente mentre la luce si propaga senza bisogno di energia aggiuntiva. Gli scienziati affermano che questo approccio può essere implementato sull’hardware ottico esistente.

Implicazioni per lo sviluppo dell’intelligenza artificiale

L’impatto potenziale è significativo. Secondo Zhipei Sun, leader del Photonics Group dell’Università di Aalto, questa struttura potrebbe essere integrata nei chip fotonici entro i prossimi tre-cinque anni, consentendo ai processori basati sulla luce di eseguire compiti complessi di intelligenza artificiale con requisiti di potenza estremamente bassi.

Alcuni esperti ritengono che questa svolta sia un passo verso l’Intelligenza Generale Artificiale (AGI), un ipotetico sistema di intelligenza artificiale che supera l’intelligenza umana e apprende attraverso le discipline. Anche se il documento di ricerca non menziona esplicitamente l’AGI, enfatizza l’informatica per scopi generali. L’idea che il ridimensionamento delle attuali tecniche di intelligenza artificiale porterà all’AGI è popolare tra alcuni nella comunità informatica. Altri, come Yann LeCun di Meta, sostengono che le attuali architetture di intelligenza artificiale non raggiungeranno mai l’AGI, indipendentemente dalla scala.

Indipendentemente dal dibattito sull’AGI, l’architettura POMMM rimuove un collo di bottiglia chiave nel campo. Superando le limitazioni nella velocità di elaborazione del tensore, gli sviluppatori potrebbero creare modelli di intelligenza artificiale che superano le capacità attuali. Ciò potrebbe accelerare il progresso in vari campi, dalla scoperta scientifica al processo decisionale automatizzato.

Questo sviluppo potrebbe accelerare il ritmo dell’innovazione dell’intelligenza artificiale, rimodellando potenzialmente il futuro dell’informatica e dell’intelligenza artificiale.