Avanço no processamento de IA: a computação óptica atinge recursos da “velocidade da luz”

3

Os pesquisadores revelaram uma nova arquitetura de computação óptica que poderia superar um gargalo crítico no desenvolvimento da inteligência artificial (IA): a velocidade com que os modelos de IA processam dados. A descoberta, publicada na Nature Photonics, utiliza luz em vez de eletricidade para realizar cálculos, revolucionando potencialmente a forma como os sistemas de IA são treinados e operados.

O gargalo do tensor nos sistemas atuais de IA

A IA moderna depende de “tensores” – estruturas de dados complexas que organizam informações como um arquivo altamente eficiente. À medida que os modelos de IA aprendem, eles classificam os dados nesses tensores. A velocidade com que esses tensores podem ser processados ​​é uma limitação fundamental; quanto maior o modelo, mais lento se torna o processamento. Atualmente, mesmo os sistemas de IA mais poderosos de empresas como OpenAI e Google requerem milhares de unidades de processamento gráfico (GPUs) funcionando em paralelo apenas para funcionar.

O problema é que a maioria dos sistemas de computação óptica, embora mais rápidos e mais eficientes em termos energéticos em pequenas escalas, não podem ser facilmente ampliados. Ao contrário das GPUs, que podem ser encadeadas para obter ganhos exponenciais de processamento, os sistemas ópticos normalmente operam linearmente. Esta limitação historicamente os tornou menos atraentes para os desenvolvedores, apesar de suas vantagens teóricas.

Multiplicação Matriz-Matriz Óptica Paralela (POMMM)

A nova arquitetura, chamada Parallel Optical Matrix-Matrix Multiplication (POMMM), contorna esse problema de escalabilidade. Ele conduz múltiplas operações de tensor simultaneamente usando uma única rajada de laser, ao contrário dos métodos ópticos anteriores que exigiam disparos repetidos de laser. Isto significa que os sistemas de IA poderiam, teoricamente, processar dados a velocidades anteriormente inatingíveis, ao mesmo tempo que reduziam o consumo de energia.

Os pesquisadores codificaram dados digitais na amplitude e fase das ondas de luz, transformando-os em uma propriedade física dentro do campo óptico. Como resultado, as operações matemáticas ocorrem passivamente à medida que a luz se propaga sem a necessidade de energia adicional. Os cientistas dizem que esta abordagem pode ser implementada em hardware óptico existente.

Implicações para o desenvolvimento de IA

O impacto potencial é significativo. De acordo com Zhipei Sun, líder do Grupo Fotônico da Universidade Aalto, esta estrutura poderá ser integrada em chips fotônicos nos próximos três a cinco anos, permitindo que processadores baseados em luz executem tarefas complexas de IA com requisitos de energia extremamente baixos.

Alguns especialistas acreditam que este avanço é um passo em direção à Inteligência Geral Artificial (AGI) – um hipotético sistema de IA que excede a inteligência humana e aprende através de disciplinas. Embora o artigo de pesquisa não mencione explicitamente a AGI, ele enfatiza a computação de uso geral. A ideia de que o dimensionamento das técnicas atuais de IA levará à AGI é popular entre alguns membros da comunidade da ciência da computação. Outros, como Yann LeCun da Meta, argumentam que as atuais arquiteturas de IA nunca alcançarão a AGI, independentemente da escala.

Independentemente do debate sobre AGI, a arquitetura POMMM elimina um gargalo importante no campo. Ao superar as limitações na velocidade de processamento do tensor, os desenvolvedores poderiam construir modelos de IA que superassem as capacidades atuais. Isto poderia acelerar o progresso em vários domínios, desde a descoberta científica até à tomada de decisões automatizada.

Este desenvolvimento pode acelerar o ritmo da inovação em IA, potencialmente remodelando o futuro da computação e da inteligência artificial.