Průlom ve zpracování dat AI: Optické výpočty dosahují schopností „rychlosti světla“

7

Výzkumníci odhalili novou optickou výpočetní architekturu, která může překonat kritické úzké hrdlo ve vývoji umělé inteligence (AI): rychlost, jakou modely AI zpracovávají data. Průlom, publikovaný v časopise Nature Photonics, využívá k provádění výpočtů světlo místo elektřiny, což může způsobit revoluci ve způsobu, jakým se systémy AI učí a fungují.

Úzké místo tenzorů v moderních systémech umělé inteligence

Moderní umělá inteligence spoléhá na „tenzory“ – složité datové struktury, které organizují informace jako vysoce efektivní skříňka na karty. Jak se modely AI učí, třídí data do těchto tenzorů. Zásadním omezením je rychlost zpracování těchto tenzorů; čím větší je model, tím pomalejší je zpracování. V současné době vyžadují i ​​ty nejvýkonnější systémy umělé inteligence od společností jako OpenAI a Google tisíce grafických procesorových jednotek (GPU) běžících paralelně, aby fungovaly.

Problém je v tom, že většinu optických výpočetních systémů, i když jsou rychlejší a energeticky účinnější v malých měřítcích, nelze snadno zvětšit. Na rozdíl od GPU, které mohou být spojeny dohromady pro exponenciální zvýšení výkonu, optické systémy obvykle fungují lineárně. Toto omezení je historicky činí méně atraktivními pro vývojáře, navzdory jejich teoretickým výhodám.

Paralelní násobení optické matice (POMMM)

Nová architektura s názvem Parallel Optical Matrix Multiplication (POMMM) řeší tento problém škálovatelnosti. Provádí více tenzorových operací současně pomocí jediného laserového pulzu, na rozdíl od předchozích optických metod, které vyžadovaly opakované laserové výstřely. To znamená, že systémy umělé inteligence by teoreticky mohly zpracovávat data rychlostí dříve nedosažitelnou a zároveň snížit spotřebu energie.

Výzkumníci zakódovali digitální data do amplitudy a fáze světelných vln a přeměnili je na fyzikální vlastnost v optickém poli. Výsledkem je, že matematické operace probíhají pasivně, když se světlo šíří, bez potřeby dalšího napájení. Vědci tvrdí, že tento přístup lze implementovat na stávající optické zařízení.

Důsledky pro vývoj AI

Potenciální dopad je významný. Struktura by mohla být integrována do fotonických čipů v příštích třech až pěti letech, což by podle Zhipei Suna, vedoucího fotonické skupiny Aalto, umožnilo procesorům založeným na světle provádět složité úkoly AI s extrémně nízkou spotřebou energie.

Někteří odborníci se domnívají, že tento průlom je krokem k umělé obecné inteligenci (AGI) – hypotetickému systému umělé inteligence, který překonává lidskou inteligenci a učí se v různých oblastech. Ačkoli výzkumný článek výslovně nezmiňuje AGI, zdůrazňuje univerzální výpočetní techniku. Myšlenka, že škálování současných technik umělé inteligence povede k AGI, je mezi některými v počítačové komunitě populární. Jiní, jako například Yann LeCun z Meta, tvrdí, že současné architektury AI nikdy nedosáhnou AGI, bez ohledu na měřítko.

Bez ohledu na debatu o AGI architektura POMMM řeší klíčové úzké hrdlo v této oblasti. Překonáním rychlostních limitů tenzorů budou vývojáři schopni vytvářet modely AI, které překračují současné možnosti. To by mohlo urychlit pokrok v oblastech od vědeckých objevů po automatizované rozhodování.

Tento vývoj by mohl urychlit tempo inovací v AI a potenciálně změnit budoucnost výpočetní techniky a umělé inteligence.