Naukowcy zaprezentowali nową optyczną architekturę obliczeniową, która może pokonać krytyczne wąskie gardło w rozwoju sztucznej inteligencji (AI): szybkość, z jaką modele sztucznej inteligencji przetwarzają dane. Przełomowe odkrycie, opublikowane w czasopiśmie Nature Photonics, wykorzystuje do wykonywania obliczeń światło zamiast prądu, potencjalnie rewolucjonizując sposób uczenia się i działania systemów sztucznej inteligencji.
Wąskie gardło tensorów w nowoczesnych systemach AI
Współczesna sztuczna inteligencja opiera się na „tensorach” – złożonych strukturach danych, które organizują informacje niczym bardzo wydajna szafka na karty. W miarę uczenia się modeli sztucznej inteligencji sortują dane według tych tensorów. Podstawowym ograniczeniem jest szybkość przetwarzania tych tensorów; im większy model, tym wolniejsze staje się przetwarzanie. Obecnie nawet najpotężniejsze systemy sztucznej inteligencji firm takich jak OpenAI i Google wymagają do działania tysięcy procesorów graficznych (GPU) działających równolegle.
Problem polega na tym, że większość optycznych systemów obliczeniowych, choć szybszych i bardziej energooszczędnych w małych skalach, nie można łatwo skalować. W przeciwieństwie do procesorów graficznych, które można łączyć ze sobą w celu wykładniczego zwiększenia wydajności, systemy optyczne zazwyczaj działają liniowo. To ograniczenie w przeszłości czyniło je mniej atrakcyjnymi dla programistów, pomimo ich teoretycznych zalet.
Równoległe mnożenie macierzy optycznej (POMMM)
Nowa architektura o nazwie Parallel Optical Matrix Multiplication (POMMM) pozwala obejść ten problem skalowalności. Wykonuje jednocześnie wiele operacji tensorowych za pomocą pojedynczego impulsu laserowego, w przeciwieństwie do poprzednich metod optycznych, które wymagały powtarzanych strzałów laserowych. Oznacza to, że systemy AI mogłyby teoretycznie przetwarzać dane z wcześniej nieosiągalnymi prędkościami, jednocześnie zmniejszając zużycie energii.
Naukowcy zakodowali dane cyfrowe, określając amplitudę i fazę fal świetlnych, przekształcając je we właściwość fizyczną w polu optycznym. W rezultacie operacje matematyczne zachodzą pasywnie w miarę rozchodzenia się światła, bez potrzeby stosowania dodatkowej mocy. Naukowcy twierdzą, że to podejście można wdrożyć w istniejącym sprzęcie optycznym.
Konsekwencje dla rozwoju sztucznej inteligencji
Potencjalny wpływ jest znaczący. Według Zhipei Sun, szefa grupy fotonicznej w Aalto, strukturę można zintegrować z chipami fotonicznymi w ciągu najbliższych trzech do pięciu lat, co umożliwi procesorom wykorzystującym światło wykonywanie złożonych zadań AI przy wyjątkowo niskim zużyciu energii.
Część ekspertów uważa, że ten przełom to krok w kierunku sztucznej inteligencji ogólnej (AGI) – hipotetycznego systemu sztucznej inteligencji, który przewyższa ludzką inteligencję i uczy się w różnych dziedzinach. Chociaż artykuł badawczy nie wspomina wyraźnie o AGI, podkreśla on uniwersalne przetwarzanie danych. Pomysł, że skalowanie obecnych technik AI doprowadzi do AGI, jest popularny wśród niektórych członków społeczności komputerowej. Inni, jak Yann LeCun z Meta, twierdzą, że obecne architektury sztucznej inteligencji nigdy nie osiągną AGI, niezależnie od skali.
Niezależnie od debaty na temat AGI, architektura POMMM rozwiązuje kluczowe wąskie gardło w tym obszarze. Pokonując ograniczenia prędkości narzucone przez tensory, programiści będą mogli tworzyć modele sztucznej inteligencji przekraczające obecne możliwości. Mogłoby to przyspieszyć postęp w różnych obszarach, od odkryć naukowych po zautomatyzowane podejmowanie decyzji.
Rozwój ten może przyspieszyć tempo innowacji w zakresie sztucznej inteligencji, potencjalnie zmieniając przyszłość informatyki i sztucznej inteligencji.






























