首頁歷史 > 正文

清華團隊打造光學人工智慧,讓《三體》中的計算機成為現實

2021-10-18由 風火輪技術團隊 發表于 歷史

以深度學習為代表的人工智慧技術已在包括自動駕駛、醫療診斷、語音翻譯等眾多領域帶來巨大的變革。隨著深度學習演算法的迅猛發展,人工神經網路規模的不斷增大,迫切需要不斷提升計算處理器的運算速度和能效。採用傳統電子計算方式已經越來越難以滿足未來人工智慧對處理器計算效能的需求。近年來,基於光計算高速、低功耗、高並行的顛覆性優勢,透過光電融合的方式構建光學神經網路與智慧光電計算處理器已經成為國際資訊科技前沿的熱點研究領域。

然而,現有的光電智慧計算技術距離實際應用還面臨著以下挑戰:(1)模型構架簡單,現有的光學神經網路模型複雜度較低,光學非線性實現較為困難,因此模型效能與電子的人工神經網路有較大的差距;(2)系統誤差難校正,光計算系統誤差大小和系統複雜度成正相關,因此誤差校正演算法對於構建大規模智慧光計算系統至關重要,然而迄今為止尚缺普適性的誤差校正方法;(3)系統重構困難,現有光學神經網路結構難以重構,因此計算功能單一,而網路引數程式設計則依賴較為複雜的光學效應,大規模引數的快速精準寫入仍存在困難。

清華團隊打造光學人工智慧,讓《三體》中的計算機成為現實

圖一:光電智慧衍射計算處理器的基本原理

針對上述挑戰,來自清華大學資訊學院的戴瓊海教授研究團隊提出並構建了光電智慧衍射計算處理器(Diffractive Processing Unit, DPU),能夠有效地重構實現包含百萬神經元的多類新型光電神經網路,透過自適應的線上訓練演算法實現了高效能的視覺分類任務,並驗證了光電智慧計算的優越性。

DPU 的構架採用了光學衍射的物理現象,能夠產生大規模的光學互聯,從而助力構建高複雜度的光學神經網路(圖一)。此外,該光學處理器原理充分利用了光的波粒二象性,神經網路權重的調整透過控制光波傳播的波前分佈來實現,採用光電效應能夠實現人工神經元的功能。DPU 的執行過程光計算部分則幾乎承擔所有的計算操作,採用高通量可程式設計的光電器件並結合電子計算的靈活特性,能夠實現高速資料調控以及大規模網路結構和引數的程式設計。“在這項工作中我們定義了光電的衍射人工神經元,能夠實現對衍射光場的線性加權求和以及非線性啟用響應,這是構建複雜光電深度學習系統的基礎。” 林星特聘研究員說到。

清華團隊打造光學人工智慧,讓《三體》中的計算機成為現實

圖二:DPU 實現手寫數字識別

清華團隊打造光學人工智慧,讓《三體》中的計算機成為現實

圖三:DPU 實現人類動作識別

將所構建的系統應用於分類和識別任務,並在深度學習的標準資料集上進行了效能驗證,包括手寫數字影象資料集(MNIST,圖二)、時尚物品影象資料集(Fashion-MNIST),以及人類動作影片資料集(Wetzmann 和 KTH,圖三)。光電智慧計算模型效能首次超越了 LeNet-4 電子神經網路模型。系統還能實現高速、高精度的人類動作識別。運行同樣的神經網路,光電計算系統與特斯拉 V100 圖形處理器(GPU)相比,計算速度提高了 8 倍,系統能效提升超過一個數量級,核心模組計算能效則能夠提升四個數量級。

清華團隊打造光學人工智慧,讓《三體》中的計算機成為現實

戴瓊海教授指出,“當前光電智慧計算技術的潛力還有待深入挖掘,未來使用超材料構建片上相控陣列,能夠極大提升處理器的計算效能,而實現光電計算機的目標則需要多學科的交叉融合。” 未來已來,推動類腦光電子晶片的研發將極大促進人工智慧的發展,將為大規模資料的實時智慧處理,高速低功耗智慧化無人系統,以及從十億畫素到百億畫素光場成像奠定基礎,具備極為廣闊的應用前景。

這項工作發表在 Nature Photonics 期刊上,周天貺博士研究生為該論文的第一作者,林星特聘研究員(清華腦與認知科學研究院、未來晶片技術高精尖創新中心)、方璐副教授(清華電子系)、戴瓊海教授(北京資訊科學與技術國家研究中心)為通訊作者。工作得到了國家科技部和國家自然科學基金委的支援。

頂部