Прорив у обробці даних ШІ: оптичні обчислення досягають можливостей «швидкості світла»

1

Дослідники представили нову оптичну обчислювальну архітектуру, яка може подолати критичну перешкоду в розробці штучного інтелекту (ШІ): швидкість, з якою моделі ШІ обробляють дані. Прорив, опублікований у журналі Nature Photonics, використовує світло замість електрики для виконання обчислень, потенційно кардинально змінюючи спосіб навчання та роботи систем ШІ.

Вузьке місце тензорів у сучасних системах ШІ

Сучасний штучний інтелект покладається на «тензори» – складні структури даних, які організовують інформацію, як високоефективний картковий кабінет. Коли моделі ШІ навчаються, вони сортують дані за цими тензорами. Швидкість обробки цих тензорів є фундаментальним обмеженням; чим більша модель, тим повільніша обробка. Зараз навіть найпотужніші системи штучного інтелекту таких компаній, як OpenAI і Google, потребують тисяч графічних процесорів (GPU), що працюють паралельно, щоб просто функціонувати.

Проблема полягає в тому, що більшість оптичних обчислювальних систем, хоча вони швидші та енергоефективніші в малих масштабах, не можуть бути легко масштабовані. На відміну від графічних процесорів, які можна об’єднати разом для експоненціального збільшення продуктивності, оптичні системи зазвичай працюють лінійно. Це обмеження історично зробило їх менш привабливими для розробників, незважаючи на їхні теоретичні переваги.

Паралельне множення оптичної матриці (POMMM)

Нова архітектура під назвою Паралельне множення оптичної матриці (POMMM) обходить цю проблему масштабованості. Він виконує кілька тензорних операцій одночасно за допомогою одного лазерного імпульсу, на відміну від попередніх оптичних методів, які вимагали повторних лазерних пострілів. Це означає, що системи штучного інтелекту теоретично можуть обробляти дані зі швидкістю, яка раніше була недосяжною, одночасно зменшуючи енергоспоживання.

Дослідники закодували цифрові дані в амплітуду та фазу світлових хвиль, перетворивши їх на фізичні властивості в оптичному полі. У результаті математичні операції відбуваються пасивно, коли світло поширюється, без потреби в додатковому живленні. Вчені кажуть, що такий підхід можна реалізувати на існуючому оптичному обладнанні.

Наслідки для розробки ШІ

Потенційний вплив є значним. Цю структуру можна буде інтегрувати у фотонні чіпи протягом наступних трьох-п’яти років, що дозволить процесорам на основі світла виконувати складні завдання штучного інтелекту з надзвичайно низьким енергоспоживанням, за словами Жіпея Сана, керівника групи фотоніки Аалто.

Деякі експерти вважають, що цей прорив є кроком до загального штучного інтелекту (AGI) – гіпотетичної системи ШІ, яка перевершує людський інтелект і навчається в різних сферах. Хоча в дослідницькій статті прямо не згадується AGI, у ній висвітлюються універсальні обчислення. Ідея про те, що масштабування сучасних методів штучного інтелекту призведе до AGI, популярна серед деяких представників комп’ютерної спільноти. Інші, такі як Янн ЛеКун з Meta, стверджують, що поточні архітектури ШІ ніколи не досягнуть AGI, незалежно від масштабу.

Незалежно від дебатів щодо AGI, архітектура POMMM усуває ключове вузьке місце в цій галузі. Долаючи обмеження швидкості тензорів, розробники зможуть створювати моделі ШІ, які перевищують поточні можливості. Це може прискорити прогрес у різних сферах, починаючи від наукових відкриттів і закінчуючи автоматизованим прийняттям рішень.

Ця розробка може прискорити темпи інновацій у ШІ, потенційно змінивши майбутнє обчислювальної техніки та штучного інтелекту.