Przełom w przetwarzaniu danych AI: obliczenia optyczne osiągają prędkość światła

9

Naukowcy zaprezentowali nową optyczną architekturę obliczeniową, która może pokonać krytyczne wąskie gardło w rozwoju sztucznej inteligencji (AI): szybkość, z jaką modele sztucznej inteligencji przetwarzają dane. Przełomowe odkrycie, opublikowane w czasopiśmie Nature Photonics, wykorzystuje do wykonywania obliczeń światło zamiast prądu, potencjalnie rewolucjonizując sposób uczenia się i działania systemów sztucznej inteligencji.

Wąskie gardło tensorów w nowoczesnych systemach AI

Współczesna sztuczna inteligencja opiera się na „tensorach” – złożonych strukturach danych, które organizują informacje niczym bardzo wydajna szafka na karty. W miarę uczenia się modeli sztucznej inteligencji sortują dane według tych tensorów. Podstawowym ograniczeniem jest szybkość przetwarzania tych tensorów; im większy model, tym wolniejsze staje się przetwarzanie. Obecnie nawet najpotężniejsze systemy sztucznej inteligencji firm takich jak OpenAI i Google wymagają do działania tysięcy procesorów graficznych (GPU) działających równolegle.

Problem polega na tym, że większość optycznych systemów obliczeniowych, choć szybszych i bardziej energooszczędnych w małych skalach, nie można łatwo skalować. W przeciwieństwie do procesorów graficznych, które można łączyć ze sobą w celu wykładniczego zwiększenia wydajności, systemy optyczne zazwyczaj działają liniowo. To ograniczenie w przeszłości czyniło je mniej atrakcyjnymi dla programistów, pomimo ich teoretycznych zalet.

Równoległe mnożenie macierzy optycznej (POMMM)

Nowa architektura o nazwie Parallel Optical Matrix Multiplication (POMMM) pozwala obejść ten problem skalowalności. Wykonuje jednocześnie wiele operacji tensorowych za pomocą pojedynczego impulsu laserowego, w przeciwieństwie do poprzednich metod optycznych, które wymagały powtarzanych strzałów laserowych. Oznacza to, że systemy AI mogłyby teoretycznie przetwarzać dane z wcześniej nieosiągalnymi prędkościami, jednocześnie zmniejszając zużycie energii.

Naukowcy zakodowali dane cyfrowe, określając amplitudę i fazę fal świetlnych, przekształcając je we właściwość fizyczną w polu optycznym. W rezultacie operacje matematyczne zachodzą pasywnie w miarę rozchodzenia się światła, bez potrzeby stosowania dodatkowej mocy. Naukowcy twierdzą, że to podejście można wdrożyć w istniejącym sprzęcie optycznym.

Konsekwencje dla rozwoju sztucznej inteligencji

Potencjalny wpływ jest znaczący. Według Zhipei Sun, szefa grupy fotonicznej w Aalto, strukturę można zintegrować z chipami fotonicznymi w ciągu najbliższych trzech do pięciu lat, co umożliwi procesorom wykorzystującym światło wykonywanie złożonych zadań AI przy wyjątkowo niskim zużyciu energii.

Część ekspertów uważa, że ​​ten przełom to krok w kierunku sztucznej inteligencji ogólnej (AGI) – hipotetycznego systemu sztucznej inteligencji, który przewyższa ludzką inteligencję i uczy się w różnych dziedzinach. Chociaż artykuł badawczy nie wspomina wyraźnie o AGI, podkreśla on uniwersalne przetwarzanie danych. Pomysł, że skalowanie obecnych technik AI doprowadzi do AGI, jest popularny wśród niektórych członków społeczności komputerowej. Inni, jak Yann LeCun z Meta, twierdzą, że obecne architektury sztucznej inteligencji nigdy nie osiągną AGI, niezależnie od skali.

Niezależnie od debaty na temat AGI, architektura POMMM rozwiązuje kluczowe wąskie gardło w tym obszarze. Pokonując ograniczenia prędkości narzucone przez tensory, programiści będą mogli tworzyć modele sztucznej inteligencji przekraczające obecne możliwości. Mogłoby to przyspieszyć postęp w różnych obszarach, od odkryć naukowych po zautomatyzowane podejmowanie decyzji.

Rozwój ten może przyspieszyć tempo innowacji w zakresie sztucznej inteligencji, potencjalnie zmieniając przyszłość informatyki i sztucznej inteligencji.