在光電混合算力領域,可能很多人都熟悉由美國麻省理工學院博士畢業(yè)生沈亦晨回國創(chuàng)辦的曦智科技,沈亦晨和他在麻省理工學院的同學尼古拉斯·哈里斯(Nicholas Harris)曾是一篇論文的共同作者,同時他們還曾共同入選 2021 年度《麻省理工科技評論》全球“35 歲以下科技創(chuàng)新 35 人”榜單。
頗為相似的是,依托于這篇論文,哈里斯在美國加州創(chuàng)辦了一家名為Lightmatter的公司。就在最近,哈里斯的 Lightmatter 發(fā)布了一系列新產品。

此次發(fā)布的第一款新品是一個名為 Passage M1000 的光子超級芯片(下稱“M1000”),該公司表示其能實現全球最快的 AI 互連,并表示其采用突破性的 3D 光子互連層技術,為下一代 AI 基礎設施的硅設計提供了最高的帶寬和最大的芯片復合體。
此次發(fā)布的第二款新品是一個名為 Passage L200 的共封裝光學器件(下稱“L200”),L200 通過全球首個無邊緣 I/O 實現了整個芯片區(qū)域帶寬的擴展。該公司表示這是 AI 領域最快的共封裝光學器件,并表示其采用革命性的 3D 光子互連解決方案消除了帶寬瓶頸,能使 AI 模型的訓練速度提升 8 倍。
Lightmatter 的創(chuàng)始人兼 CEO 尼克·哈里斯(Nick Harris)表示:“帶寬擴展已成為 AI 發(fā)展的關鍵障礙。L200 系列 3D 共封裝光學解決方案所代表的工程突破,為下一代 AI 處理器和交換機提供了基礎構建模塊?!?/p>
毫無疑問,Lightmatter 希望利用光子計算技術來重塑芯片的通信和計算方式。麻省理工學院官網在新聞稿中評價稱,本次產品加速了向光速計算邁進的步伐。

M1000:能在單一域為數千個 GPU 提供互聯支持
M1000 是一款專為下一代 XPU(X Processing Unit)和交換機設計的 3D 光子超級芯片,能為要求相對苛刻的 AI 基礎設施應用提供 114 Tbps 的總光帶寬。
M1000 基準平臺的面積超過 4000 平方毫米,這種基準平臺是一個多光罩的主動式光子中介層?;谠撈脚_能夠構建全球最大的 3D 封裝裸片復合體,在單一域中為數千個 GPU 提供互聯支持。

在現有的芯片設計中,處理器、內存和 I/O 小芯片的互連帶寬比較有限,因為電 I/O 連接僅限于這些芯片的邊緣。而 M1000 可以在其表面的幾乎任何位置為堆疊的芯片復合體釋放電光 I/O,成功地克服了上述限制。
M1000 通過大規(guī)模可重構波導網絡來實現全域中介層互聯,這種網絡能在整個平臺之內傳輸高帶寬波分復用(WDM,Wavelength Division Multiplexing)光信號。其擁有完全集成的光纖接口,支持多達 256 根光纖的突破性配置。相比傳統共封裝光學器件(CPO,Co-Packaged Optics)以及同類方案,這讓 M1000 能在更小的封裝尺寸之下實現帶寬性能的數量級提升。
目前,Lightmatter 正與包括格芯和 Amkor 在內的企業(yè)緊密合作,力爭實現 M1000 的量產。據了解,M1000 采用格芯 Fotonix 硅光平臺技術,這一技術通過將光子元件與高性能 CMOS 邏輯無縫集成至單一晶粒,能構建出一種可以隨 AI 需求進行擴展的量產設計方案。預計 M1000 將于 2025 年夏季推出,屆時還將推出由該公司推出的光引擎 Guide。

L200:全球首款 3D 共封裝光學產品
此次推出的第二款產品 L200,被 Lightmatter 稱為是全球首款 3D 共封裝光學產品。
L200 旨在與最新的 XPU 和交換機芯片設計集成,通過消除互連帶寬瓶頸,實現 AI 性能的擴展。L200 3D 共封裝光學系列包括 32Tbps 和 64 Tbps 兩個版本,相比現有解決方案其性能提升了 5 至 10 倍,這讓每個芯片封裝的總 I/O 帶寬超過 200 Tbps。

據了解,當前的帶寬擴展遠遠不及計算性能的提升。AI 計算的持續(xù)進步要求互連技術發(fā)生根本性變革。當前的連接解決方案,包括電、光學和傳統共封裝光學都會受到帶寬的限制,因為它們的 I/O 接口僅僅限于芯片的邊緣。
L200 通過全球首個無邊緣 I/O 克服了這些限制,實現了整個芯片區(qū)域帶寬的擴展。這種模塊化的 3D 共封裝光學解決方案利用了通用小芯片互連技術裸片到裸片(D2D,die-to-die)接口,并促進了基于可擴展小芯片的架構與下一代 XPU 和交換機的無縫集成。
L200 3D 共封裝光學集成了 Alphawave Semi 公司的最新小芯片技術,并將通用小芯片互連接口與光通信就緒的串行器/解串器,與 Lightmatter 的光子集成電路技術加以結合。
據介紹,Alphawave Semi 公司的先進節(jié)點電子集成電路采用標準晶圓上芯片技術,并在光子集成電路上進行 3D 集成。3D 集成技術使得串行器/解串器 I/O 可以放置在芯片上的任何位置,而不僅僅局限于其邊緣位置,從而能為每個 L200 提供相當于 40 個可插拔光收發(fā)器的帶寬。此外,一個封裝中可以集成多個 L200,從而能夠廣泛用于 XPU 和交換機應用。
L200 采用先進的冗余設計和彈性設計,搭載 Lightmatter 的 Guide 光引擎,每個模塊提供卓越的激光集成度和總光功率,能夠支持 L200 的全帶寬。
目前,Lightmatter 提供兩種產品型號:L200(32Tbps)和 L200X(64Tbps)3D 共封裝光學引擎。這些解決方案基于 Lightmatter 已經過驗證的 Passage 技術平臺,每個波導/光纖提供 16 個波分復用波長,并具備最先進且完全集成的光子控制能力。
據了解,L200 專門為大規(guī)模生產而設計,硅光子工廠和外包封裝測試合作伙伴包括格芯 、日月光半導體和 Amkor。
Lightmatter 的 L200 和 L200X 3D 共封裝光學芯片將于 2026 年上市,旨在加速下一代基礎 AI 模型所需的下一代 XPU 和交換機的上市時間和性能提升。

Cignal AI 的創(chuàng)始人兼首席分析師安德魯·施米特(Andrew Schmitt)評價稱:“AI 數據中心互連面臨著日益增長的帶寬和功耗挑戰(zhàn)。”“共封裝光學——將光學器件直接集成到 XPU 和交換機上——是必然的解決方案。Lightmatter 的大膽方法提供了共封裝光學的基本要素,并為超大規(guī)模數據中心運營商和芯片制造商提供了一條實現高性能系統的途徑?!?/p>
“生逢其時”的光芯片
當前,人類將越來越小的晶體管集成到芯片上的能力,促成了當今無處不在的計算時代。但這種方法終于逼近了極限,一些專家宣稱摩爾定律以及與之相關的登納德縮放定律(Dennard’s Scaling)即將終結。這些技術進展遭遇瓶頸的時機可謂糟糕至極。近年來,計算需求尤其是 AI 的爆發(fā)已呈指數級增長,且毫無放緩跡象。
與此同時,幾十年以來人們一直希望能夠研制出使用光子而不是電子的光學芯片來進行計算任務。光學芯片兼具速度快和能耗低的優(yōu)點。然而,讓它們真正運行起來并非易事。
2017 年,哈里斯和沈亦晨等同事,共同發(fā)表了上述Nature論文。論文中,他們運用光學芯片的方案,計算出了經過傳統方式訓練的神經網絡的輸出結果。
在論文中,他們介紹了一種由 56 個可編程干涉儀設備構成的“光路”,其中干涉儀設備可以分解并重組光波。這種方法解決了一個正確識別元音的問題,在 180 個案例中它分辨出了四分之三的元音。
雖然這一結果暫時比不上識別率準確率超過 90% 的普通計算機,但是該電路的表現尚算亮眼。之后不久,哈里斯和沈奕晨分別在美國和中國創(chuàng)立了各自的初創(chuàng)公司。
一旦這樣的神經網絡能在光學芯片上實現功能以及訓練,一些推理過程例如找出元音對應的聲音,就會像光子通過芯片一樣順滑,同時還兼具高速和節(jié)能的優(yōu)點。
在進入麻省理工學院讀博之前,哈里斯曾在半導體公司美光科技工作,研究集成芯片背后的基本器件。這段經歷讓他意識到,在每個芯片上塞入更多晶體管的提高計算機性能的傳統方法已經達到極限。
當時,他看到計算領域的路線圖正在放緩,于是想弄清楚如何才能繼續(xù)推進它。那么,哪些方法可以增強計算機的性能?量子計算和光子學就是其中兩條途徑。
哈里斯來到麻省理工學院,在電氣工程與計算機科學系副教授德克·恩格倫(Dirk Englund)的指導下攻讀博士學位,研究光子量子計算。作為博士工作的一部分,他構建了基于硅的集成光子芯片,該芯片能夠利用光而非電來發(fā)送和處理信息。
這項工作促成了數十項專利的申請,并在Nature等著名期刊上發(fā)表了 80 多篇研究論文。但在麻省理工學院,另一項技術也引起了哈里斯的注意。
“我記得自己走過大廳,看到學生們從這些禮堂大小的教室里蜂擁而出,觀看實時轉播的講座視頻,聆聽教授們講授深度學習?!惫锼垢嬖V媒體,“校園里的每個人都知道深度學習將會是一件大事,于是我開始更多地了解它,我們意識到,我正在為光子量子計算構建的系統實際上可以用來進行深度學習。”
哈里斯原本計劃在獲得博士學位后成為一名教授,但他意識到通過創(chuàng)業(yè)可以吸引更多資金并更快地實現創(chuàng)新,于是他與同樣在恩格倫實驗室學習的達里烏斯·布南達爾(Darius Bunandar,2019 屆麻省理工學院博士畢業(yè)生)以及托馬斯·格雷厄姆(Thomas Graham,2018 屆麻省理工學院 MBA 畢業(yè)生)聯手。這三位聯合創(chuàng)始人憑借在 2017 年麻省理工學院 10 萬美元創(chuàng)業(yè)大賽中的勝利,成功進軍創(chuàng)業(yè)領域。

重新思考芯片的生命線
在 Lightmatter,哈里斯希望通過重新思考芯片的生命線來延續(xù)計算的顯著進步。該公司不僅依賴電力,還利用光來進行數據處理和傳輸。該公司的前兩款產品分別是一種專門用于 AI 運算的芯片和一種促進芯片間數據傳輸的互連器,同時它們利用光子和電子來驅動更高效的運算。
哈里斯目前正在解決的兩個問題是:芯片如何交流?如何進行 AI 計算?Lightmatter 在此之前的兩款產品 Envise 和 Passage,能夠同時解決這兩個問題。
鑒于問題的嚴重性和對 AI 的需求,Lightmatter 在 2023 年籌集了近 3 億美元的資金,估值達到 12 億美元。哈里斯告訴媒體:“我們將在由數十萬個下一代計算單元組成的互連技術之上構建平臺。如果沒有我們正在開發(fā)的技術,這根本不可能實現。”
據了解,Lightmatter 的上一代產品 Envise 芯片實現了電子擅長的計算部分比如存儲功能,同時還能將其與光擅長的方面相結合,例如執(zhí)行深度學習模型中大規(guī)模的矩陣乘法運算。
利用光子學可以同時執(zhí)行多項計算,因為數據是以不同顏色的光的形式輸入的。一種顏色的光可能代表一張狗的照片,另一種顏色的光可能代表一張貓的照片,還有一種顏色的光可能代表一棵樹。通過在同一時間通過同一個光學計算單元,即讓這個矩陣加速器執(zhí)行所有這三種操作,就能提高單位面積的計算能力,并能重復利用已有的硬件,從而能夠提高能源效率。
光通道利用光的延遲和帶寬優(yōu)勢,以類似于光纖電纜利用光長距離傳輸數據的方式,將處理器連接起來。它還使整個晶圓大小的芯片能夠作為單個處理器運行。在芯片之間傳輸信息對于運行大規(guī)模服務器群至關重要,這些服務器群為云計算和像 ChatGPT 這樣的 AI 模型提供支持。
據預測,到 2040 年,全球約 80% 的能源使用將用于數據中心和計算,而 AI 將占據其中的很大一部分,當我們審視這些 AI 大模型的訓練計算部署時,就會發(fā)現它們將使用數百兆瓦的電力。它們的用電量達到了城市的規(guī)模。
Lightmatter 目前正與芯片制造商和云服務提供商合作,以實現大規(guī)模部署。哈里斯指出,由于該公司的設備是在硅片上運行的,因此可以通過現有的半導體制造設施進行生產,而無需對工藝進行大規(guī)模更改。
未來,該公司將繼續(xù)研究計算機的所有部件,以找出光可以在哪些方面加速它們,使它們更節(jié)能、更快。未來,Lightmatter 希望能夠助力于構建下一代計算機,而這一切都將以光為中心。
參考資料:
https://www.linkedin.com/in/nicholas-harris-7114b233/
https://mp.weixin.qq.com/s/pcytbDIzrEJ3T9s69afMZg
https://lightmatter.co/
運營/排版:何晨龍
熱門跟貼