通信世界網(wǎng)消息(CWW)大模型對(duì)算力的需求呈指數(shù)級(jí)增長(zhǎng),促使智算業(yè)務(wù)飛速發(fā)展。以生成式預(yù)訓(xùn)練(GPT)大模型ChatGPT為例,ChatGPT-6的計(jì)算量(Flops)相較于GPT-4提升了1444至1936倍,所使用的圖形處理單元(GPU)數(shù)量,也從數(shù)萬(wàn)個(gè)GPU,提高至百萬(wàn)個(gè)GPU。

因此,人工智能(AI)下的各類智算應(yīng)用與業(yè)務(wù),要求高速光通信網(wǎng)絡(luò)具備大帶寬、低時(shí)延與高可靠等特性以支持算力的發(fā)展。同時(shí),也需要高速光通信在組網(wǎng)能力、高速互聯(lián)、傳輸時(shí)延、可靠傳輸?shù)确矫娉掷m(xù)革新。

智算時(shí)代的兩種集群組網(wǎng)方式

當(dāng)前,AI智算中心以單點(diǎn)大集群為主,即在同一個(gè)物理機(jī)房實(shí)現(xiàn)模型的訓(xùn)練。而模型規(guī)模的擴(kuò)展、算卡數(shù)量提升帶來(lái)的巨大電力消耗,以及算力碎片化,使得分布式集群成為另一個(gè)重要的選擇,即利用多個(gè)物理機(jī)房進(jìn)行模型訓(xùn)練。此外,目前國(guó)產(chǎn)GPU的性能尚與國(guó)際先進(jìn)水平存在一定的差距,因而未來(lái)分布式集群更為重要。上述兩種不同的集群組網(wǎng)方式,對(duì)高速光通信技術(shù)提出了差異化的承載需求。

對(duì)于單點(diǎn)集群,當(dāng)前數(shù)據(jù)中心以Spine-leaf(葉脊)網(wǎng)絡(luò)架構(gòu)為主,形成Full-mesh(全互聯(lián))拓?fù)?。相較于傳統(tǒng)三層網(wǎng)絡(luò)架構(gòu),葉脊網(wǎng)絡(luò)對(duì)光模塊的數(shù)量需求顯著增加,尤其是400G、800G,乃至1.6T這類高速光模塊。同時(shí),隨著速率的提升,其對(duì)光模塊封裝工藝的要求也不斷提高,以降低單比特成本與功耗。此外,全光交換技術(shù)在單點(diǎn)集群中可突破電交換在功耗和時(shí)延方面的瓶頸,在國(guó)外已經(jīng)開展了商用實(shí)踐。谷歌公司基于光路交換(OCS)技術(shù)構(gòu)建了Jupiter數(shù)據(jù)中心網(wǎng)絡(luò),英偉達(dá)將OCS引入到Spine、Leaf與AI服務(wù)器之間,為硬件與軟件提供彈性保護(hù)。

然而,隨著算力需求的高速增長(zhǎng),未來(lái)單點(diǎn)集群將面臨算力不足的問(wèn)題,且電力供應(yīng)也將成為大規(guī)模智算建設(shè)的瓶頸。例如,OpenAI為訓(xùn)練ChatGPT-6,需要在美國(guó)同一個(gè)州部署約10萬(wàn)張H100 GPU,每張H100 GPU一年的耗電量約為3.74MW h,而10萬(wàn)張H100 GPU一年的耗電量就達(dá)到了驚人37.4萬(wàn)MW h。同時(shí),如何將各類數(shù)據(jù)中心建設(shè)導(dǎo)致的碎片化算力充分利用,也成為一大挑戰(zhàn)。此外,受限于當(dāng)前國(guó)產(chǎn)GPU的能力以及GPU生態(tài)割裂等問(wèn)題,國(guó)內(nèi)對(duì)多個(gè)智算中心間協(xié)同計(jì)算更加關(guān)注,需求也更加迫切。目前業(yè)界正在積極探索分布式智算集群應(yīng)用,并聚焦更長(zhǎng)距離、更大帶寬與更低時(shí)延需求。

對(duì)于分布式集群,萬(wàn)卡、十萬(wàn)卡,乃至百萬(wàn)卡級(jí)的互聯(lián)帶寬往往達(dá)到數(shù)十P比特級(jí),甚至超百P比特級(jí)。因此,分布式集群間互聯(lián)帶寬需要足夠大,以保證算效,并配合帶寬收斂技術(shù)減少光層的數(shù)量來(lái)降低成本。當(dāng)前,業(yè)界通過(guò)引入波分復(fù)用(WDM)技術(shù)、提高單波長(zhǎng)速率與擴(kuò)展傳輸波段,實(shí)現(xiàn)帶寬增大的目標(biāo)。例如,谷歌公司目前已完成跨多個(gè)數(shù)據(jù)中心的Gemini Ultra大模型訓(xùn)練,中國(guó)電信在其現(xiàn)網(wǎng)中基于波分復(fù)用技術(shù)完成了業(yè)內(nèi)首例超百千米分布式無(wú)損智算網(wǎng)現(xiàn)網(wǎng)驗(yàn)證。同時(shí),也可引入空分復(fù)用(SDM)技術(shù),以在物理層面增加傳輸通道,提高傳輸帶寬。

基于此,本文從單點(diǎn)集群與分布式集群出發(fā),介紹了兩種集群方式的關(guān)鍵技術(shù)、發(fā)展現(xiàn)狀與應(yīng)用實(shí)例,并結(jié)合中國(guó)電信自身的需求,對(duì)智算時(shí)代的高速光通信技術(shù)進(jìn)行展望。

面向單點(diǎn)集群的數(shù)據(jù)中心內(nèi)部(DCN)光通信技術(shù)

高速短距光模塊

當(dāng)前,高速光模塊電接口單通道100G SerDes(串行器/解串器)速率技術(shù)已成熟,配合100G與200G的光口速率,可分別應(yīng)用于400G與800G短距光模塊。對(duì)于1.6T的短距光模塊,可采用200G SerDes技術(shù),配合200G光口速率實(shí)現(xiàn)。目前來(lái)看,電接口單通道200G SerDes技術(shù)預(yù)計(jì)于2025年啟動(dòng)研究。高速光模塊標(biāo)準(zhǔn)進(jìn)展情況如表1所示,從標(biāo)準(zhǔn)化角度來(lái)看,目前部分標(biāo)準(zhǔn)組織的800G光模塊相關(guān)標(biāo)準(zhǔn)已基本完成,如IPEC(國(guó)際光電委員會(huì))與IEEE(電氣電子工程師學(xué)會(huì))標(biāo)準(zhǔn)協(xié)會(huì)等,而1.6T的光模塊相關(guān)標(biāo)準(zhǔn)正處于研究階段。

表1高速光模塊標(biāo)準(zhǔn)進(jìn)展情況

打開網(wǎng)易新聞 查看精彩圖片

高速封裝工藝

對(duì)于單點(diǎn)集群,能耗與成本一直是關(guān)注的焦點(diǎn)。其中,高速光模塊的封裝技術(shù)在近期也呈現(xiàn)多元化演進(jìn)趨勢(shì),尤其是光模塊速率的持續(xù)提升,對(duì)功耗控制、單比特傳輸成本優(yōu)化、傳輸時(shí)延降低等方面提出了更高的要求。

對(duì)于400G、800G乃至1.6T光模塊而言,線性驅(qū)動(dòng)可插拔光模塊(LPO)和線性接收光模塊(LRO)成為低功耗與低時(shí)延的方案。標(biāo)準(zhǔn)光模塊、LPO封裝、LRO封裝對(duì)比如圖1所示,標(biāo)準(zhǔn)封裝的光模塊通常集成了數(shù)字信號(hào)處理(DSP)芯片,而LPO與LRO光模塊則將DSP芯片移至設(shè)備側(cè)。其中,LRO光模塊僅在發(fā)端部署DSP芯片,接收端采用線性接收的方式,雖然這種光模塊的封裝形態(tài)不如LPO降低的功耗與成本多,但與傳統(tǒng)包含完全重定時(shí)的模塊相比有在一定程度的降低。需要指出的是,LPO光模塊由于無(wú)DSP芯片,在互操作方面仍然存在挑戰(zhàn)。目前,業(yè)界有11家企業(yè)聯(lián)合成立了LPO-MSA,于2024年第三季度完成LPO系列標(biāo)準(zhǔn)。對(duì)于3.2T甚至更高速率的光模塊而言,共封裝光學(xué)(CPO)或?yàn)橹髁鞣庋b形態(tài)。相較于傳統(tǒng)可插拔模塊,CPO模塊的功耗更低、每路的速率更高、電路衰耗更低,有利于進(jìn)一步提升帶寬,且集成度高,降成本的潛力較大。

打開網(wǎng)易新聞 查看精彩圖片

圖1標(biāo)準(zhǔn)光模塊、LPO封裝、LRO封裝對(duì)比

注:中英文對(duì)照如下,F(xiàn)EC(前向糾錯(cuò))、DSP(數(shù)字信號(hào)處理)、CDR(時(shí)鐘數(shù)據(jù)恢復(fù))、

DRV(驅(qū)動(dòng)器)、TIA(跨阻放大器)、TOSA(光發(fā)射組件)、ROSA(光接收組件)。

在100G SerDes速率下,LPO與LRO技術(shù)可以有效降低成本與功耗,但面向200G SerDes速率下的LPO技術(shù),業(yè)界觀點(diǎn)仍有一定的分歧。在今年OFC(光纖通信大會(huì))上,業(yè)界專家學(xué)者展開了激烈的討論:Macom與Arista對(duì)LPO在200G SerDes下的應(yīng)用持積極態(tài)度,而華為、Meta與谷歌等公司考慮到高速SerDes的鏈路噪聲與劣化等,認(rèn)為L(zhǎng)PO在200G SerDes時(shí)代應(yīng)該引入CDR,并采用傳統(tǒng)的DSP方案以提高性能??傮w來(lái)看,LPO與LRO在100G SerDes時(shí)代的優(yōu)勢(shì)已得到業(yè)界的認(rèn)可,而面向更高速率的DCN互聯(lián),還有待進(jìn)一步探究;而CPO技術(shù)因其光電共封裝的特性,更加適用于高速互聯(lián)場(chǎng)景。因此,面向下一代更高速的DCN場(chǎng)景,CPO或?qū)⒊蔀橐粋€(gè)具備優(yōu)勢(shì)的技術(shù)方案;而對(duì)于可插拔性與模塊成本敏感的短距離場(chǎng)景而言,LPO或?qū)⒊蔀槲磥?lái)演進(jìn)趨勢(shì)。

光路交換(OCS)技術(shù)

單點(diǎn)集群的另一個(gè)關(guān)鍵技術(shù)是OCS,近些年因被谷歌大力推動(dòng)在數(shù)據(jù)中心內(nèi)應(yīng)用而受到廣泛關(guān)注。相較于傳統(tǒng)的電交換,OCS技術(shù)省去了“光-電-光”這一過(guò)程,降低了傳輸?shù)臅r(shí)延與功耗,并具備全光透明的特性。

目前,OCS產(chǎn)品有多種實(shí)現(xiàn)方式,主流的如壓電陶瓷方案、微電機(jī)系統(tǒng)(MEMS)方案以及硅基液晶(LCoS)方案等。壓電陶瓷方案采用壓電陶瓷材料帶動(dòng)準(zhǔn)直器旋轉(zhuǎn),在空間直接耦合對(duì)準(zhǔn)(“針尖對(duì)麥芒”),實(shí)現(xiàn)任意端口光路切換,目前矩陣規(guī)模最大可實(shí)現(xiàn)576×576,基于壓電陶瓷方案的OCS產(chǎn)品具有光開關(guān)矩陣規(guī)模特別大、插回?fù)p超低、切換時(shí)間短等特點(diǎn);MEMS方案采用微型鏡片在二維/三維方向轉(zhuǎn)動(dòng),對(duì)輸入信號(hào)進(jìn)行反射,從而實(shí)現(xiàn)任意端口光路切換,目前矩陣規(guī)模最大可實(shí)現(xiàn)320×320,基于MEMS方案的OCS產(chǎn)品具有功耗低、時(shí)延低的特點(diǎn),但切換時(shí)間長(zhǎng)、校準(zhǔn)時(shí)間長(zhǎng)且成本和插損較高;其他光開關(guān)方案諸如硅基液晶方案、液晶光開關(guān)、二氧化硅平面光波導(dǎo)(Silica PLC)、熱光開關(guān)、電光開關(guān)等也可實(shí)現(xiàn)OCS產(chǎn)品,基于硅基液晶技術(shù)的OCS產(chǎn)品可靠性高,切換時(shí)間短(200ms以內(nèi)),但成本較高,而基于其他光開關(guān)方案的OCS產(chǎn)品性能仍需進(jìn)一步驗(yàn)證。

OCS技術(shù)在數(shù)據(jù)中心的典型應(yīng)用有兩種:一種是谷歌將Spine層傳統(tǒng)電交換機(jī)用OCS代替,另一種是英偉達(dá)在Spine、Leaf與AI服務(wù)器之間加入OCS。對(duì)于前者,谷歌進(jìn)一步引入了波分復(fù)用技術(shù),并在鏈路中加入了環(huán)形器,實(shí)現(xiàn)在單根光纖上的速率翻倍;對(duì)于后者,OCS技術(shù)的引入主要通過(guò)控制器構(gòu)建全新物理拓?fù)?,?duì)硬件故障和軟件故障提供彈性修復(fù),并實(shí)現(xiàn)物理層設(shè)備之間的應(yīng)用隔離。

總體來(lái)說(shuō),OCS技術(shù)未來(lái)將向兩個(gè)方向發(fā)展。一是隨著數(shù)據(jù)中心內(nèi)部規(guī)模的不斷增長(zhǎng),時(shí)延、功耗等要求會(huì)不斷提升。OCS因其具有全光交換、光層透明等特征,將向著大端口、低切換時(shí)間與低功耗演進(jìn),以配合代替Spine層,形成無(wú)需“光-電-光”全過(guò)程、任意速率/格式/波長(zhǎng)的全光交換。同時(shí),繼續(xù)下沉至Leaf層,需要更低的切換時(shí)間、更低的成本與更少的端口數(shù),以提升系統(tǒng)的性能與效果。二是隨著數(shù)據(jù)中心規(guī)模的增大,線路的故障率也會(huì)有一定的提升,OCS可部署在數(shù)據(jù)中心多層之間,并通過(guò)控制器構(gòu)建全新的拓?fù)?,以?shí)現(xiàn)物理層設(shè)備的應(yīng)用隔離,提高大規(guī)模數(shù)據(jù)中心的可靠性。

面向分布式集群的數(shù)據(jù)中心之間光通信技術(shù)

大容量波分(WDM)傳輸技術(shù)

分布式集群對(duì)帶寬(容量)的需求日益增加,尤其是未來(lái)萬(wàn)卡,甚至十萬(wàn)卡級(jí)別的智算中心間互聯(lián)。目前通常采用波分復(fù)用技術(shù)實(shí)現(xiàn)傳輸容量的提升,包括提高單波長(zhǎng)速率與擴(kuò)展傳輸波段。

對(duì)于單波長(zhǎng)速率的提升,當(dāng)前單波長(zhǎng)400Gbit/s已開始商用部署,單波長(zhǎng)800Gbit/s還處于發(fā)展階段。按照單波長(zhǎng)800Gbit/s相干光模塊的規(guī)格來(lái)劃分,可分為兩種:一種是基于90GBaud左右的短距離800G模塊,采用概率成型的雙偏振64維正交幅度調(diào)制(PS-PM-64QAM),現(xiàn)網(wǎng)一般覆蓋數(shù)據(jù)中心光互聯(lián);另一種是基于130GBaud左右的城域800G模塊,采用概率成型的雙偏振16維正交幅度調(diào)制(PS-PM-16QAM)。其中,第二種800G模塊可通過(guò)配置軟件參數(shù),實(shí)現(xiàn)覆蓋數(shù)據(jù)中心應(yīng)用的單波長(zhǎng)1.2Tbit/s。

對(duì)于傳輸波段的擴(kuò)展,當(dāng)前擴(kuò)展C波段與擴(kuò)展L波段技術(shù)已經(jīng)開始商用部署,且傳輸?shù)牟ǘ畏秶筛哌_(dá)12THz,結(jié)合單波長(zhǎng)400Gbit/s技術(shù),可實(shí)現(xiàn)單根光纖32Tbit/s的容量。面向未來(lái),隨著帶寬需求的持續(xù)提升,S波段將是下一代波段擴(kuò)展的熱點(diǎn)方向。然而,S波段的光纖放大器(如摻銩光纖放大器、TDFA)、收發(fā)光器件還處于準(zhǔn)備階段。同時(shí),“C+L+S”波段面臨更加嚴(yán)重的受激拉曼散射效應(yīng),因此需要進(jìn)行深度的功率優(yōu)化,提高多波段的傳輸性能。此外,系統(tǒng)級(jí)的聯(lián)合優(yōu)化也是下一代多波段傳輸?shù)暮诵碾y點(diǎn),包括入纖功率優(yōu)化與預(yù)加載技術(shù)的引入,以實(shí)現(xiàn)最大的鏈路吞吐量。

對(duì)于未來(lái)的分布式集群,考慮智算中心內(nèi)單算卡的帶寬為200Gbit/s,那么一千卡、一萬(wàn)卡與兩萬(wàn)卡的互聯(lián)帶寬分別為100Tbit/s、1Pbit/s與2Pbit/s,不同配置下所需的光層數(shù)量如表2所示。需要說(shuō)明的是,這里的千卡互聯(lián)是指收發(fā)兩端各500卡,萬(wàn)卡與兩萬(wàn)卡同理;分析僅為體現(xiàn)光層配置對(duì)光層數(shù)量與成本的影響,并未考慮帶寬收斂技術(shù),實(shí)際上數(shù)據(jù)中心會(huì)采用帶寬收斂技術(shù)降低成本。在系統(tǒng)配置上,考慮400G采用PM-QPSK調(diào)制、800G采用PS-PM-64QAM與PS-PM-16QAM兩種調(diào)制、1.2T采用PS-PM-64QAM調(diào)制,C波段、L波段、S波段與U波段譜寬均為6THz。不難發(fā)現(xiàn),最大帶寬越大,所需的光層數(shù)量越少。

表2 不同配置下數(shù)據(jù)中心集群所需的光層數(shù)量

打開網(wǎng)易新聞 查看精彩圖片

現(xiàn)以400G“C+L”與800G“C+L”(16-QAM)方案為例,詳細(xì)計(jì)算兩種方案的成本。假設(shè)一塊400G OTU(光轉(zhuǎn)換單元)的成本為1,一塊800G OTU的成本約為1.2,“C+L”的ROADM(可重構(gòu)光分插復(fù)用)、OTM(光終端復(fù)用)電子架與光放等其他光層與電層設(shè)備成本一致。考慮系統(tǒng)配置為4個(gè)跨段、兩套OTM與ROADM、三套光放,則一套400G“C+L”與一套800G“C+L”的成本比值約為1﹕1.16。因此,在傳輸帶寬相同的情況下,對(duì)于一萬(wàn)卡與兩萬(wàn)卡互聯(lián),800G“C+L”的成本僅為400G“C+L”的58%與58.9%。由此可見(jiàn),提高系統(tǒng)最大帶寬不僅能有效降低光層數(shù)量,還可以進(jìn)一步降低整個(gè)系統(tǒng)的成本。

高速相干光模塊技術(shù)

高速光通信系統(tǒng)需要高性能光模塊的支持,相干光模塊的發(fā)展情況如圖2所示。當(dāng)前,相干光模塊的波特率已實(shí)現(xiàn)130GBaud,正在加速向20 0GBaud演進(jìn)。對(duì)于130GBaud,目前大多數(shù)主流廠商均可實(shí)現(xiàn)。對(duì)于200GBaud,預(yù)計(jì)基于3nm工藝采用約190GBaud PM-PS-16QAM實(shí)現(xiàn)單波長(zhǎng)800Gbit/s DSP芯片,有望覆蓋城域或長(zhǎng)距離應(yīng)用場(chǎng)景;或者基于2nm工藝采用約240GBaud~270GBaud PM-QPSK實(shí)現(xiàn)單波長(zhǎng)800Gbit/s DSP芯片,有望覆蓋長(zhǎng)距離應(yīng)用場(chǎng)景。

打開網(wǎng)易新聞 查看精彩圖片

圖2 相干光模塊的發(fā)展情況

目前,800G相干光模塊存在可插拔與固定兩種形態(tài);1.2T相干光模塊僅有固定形態(tài),可插拔產(chǎn)品目前業(yè)界沒(méi)有明確的方向;對(duì)于1.6T相干光模塊,預(yù)計(jì)2024年底固定形態(tài)產(chǎn)品將發(fā)布,可插拔形態(tài)產(chǎn)品在2025年或之后發(fā)布。

在相干光模塊的光芯片材料方面,目前主流的材料有薄膜鈮酸鋰、銦磷與硅光三種。三種材料因特性的不同,在選擇上也有區(qū)別,光芯片材料特性對(duì)比如表3所示。硅光材料可支持“C+L”波段工作,成本低且集成度高,因而成為目前可插拔模塊的主流選擇,但面向下一代超200GBaud仍存在技術(shù)挑戰(zhàn)。因此,應(yīng)考慮采用具有大帶寬優(yōu)勢(shì)的薄膜鈮酸鋰材料,推動(dòng)長(zhǎng)距離骨干網(wǎng)以及超高速傳輸應(yīng)用。然而,受限于材料的特性,薄膜鈮酸鋰僅可用于調(diào)制。而銦磷材料的理論調(diào)制帶寬比硅光更大,模塊出光功率也更高,具備更好的傳輸性能;但其封裝較為復(fù)雜,且單芯片僅支持單波段工作??傮w來(lái)說(shuō),需綜合考慮應(yīng)用場(chǎng)景、材料特性、成本與集成度等因素,選擇合適的技術(shù)方案。

表3 相干光模塊的光芯片材料特性對(duì)比

打開網(wǎng)易新聞 查看精彩圖片

未來(lái),相干光模塊將向著高集成度、小型化、低功耗的方向發(fā)展,產(chǎn)業(yè)各方需進(jìn)一步優(yōu)化材料的性能、模塊的設(shè)計(jì)以及與DSP芯片的適配等。

新型光纖技術(shù)

除了通過(guò)波分復(fù)用技術(shù)提高傳輸帶寬外,也可以采用新型光纖技術(shù)在物理上提高傳輸帶寬或降低傳輸時(shí)延。其中,以多芯光纖與少模光纖為基礎(chǔ)的空分復(fù)用技術(shù)可以通過(guò)增加傳輸通道的密度,實(shí)現(xiàn)傳輸帶寬的翻倍。此外,以空氣為介質(zhì)的空芯光纖具有超低傳輸時(shí)延、超低非線性效應(yīng)和超低損耗等特性,延遲相對(duì)于普通單模光纖可降低約30%;在相同時(shí)延下,可實(shí)現(xiàn)的最大覆蓋范圍提升近46%。目前,國(guó)際上已研制出最低0.1dB/km衰耗的空芯光纖,并且損耗在持續(xù)降低。

2024年,中國(guó)電信在杭州智算中心和義橋互聯(lián)網(wǎng)數(shù)據(jù)中心之間完成空芯光纜現(xiàn)網(wǎng)部署,標(biāo)志著空芯光纖具備實(shí)際應(yīng)用的巨大潛力。基于現(xiàn)網(wǎng)部署的20km空芯光纖,實(shí)現(xiàn)了100.4Tbit/s的信號(hào)實(shí)時(shí)傳輸,容量距離積達(dá)到了2008Tbit/s·km。在光纖鏈路方面,實(shí)現(xiàn)超10km空芯光纖連續(xù)拉絲長(zhǎng)度,并在擴(kuò)展C與擴(kuò)展L波段上實(shí)現(xiàn)最低0.6dB/km的衰減系數(shù)。在光纖接續(xù)方面,基于梯度放大斜切優(yōu)化技術(shù),實(shí)現(xiàn)單模光纖與空芯光纖單點(diǎn)連接損耗0.25dB、回?fù)p小于50dB的高性能連接。在實(shí)際部署方面,考慮到空芯光纖的實(shí)際結(jié)構(gòu),中國(guó)電信提出了三種防水方案,并解決了無(wú)法使用加強(qiáng)芯牽引穿管的問(wèn)題。最終,在擴(kuò)展C波段和擴(kuò)展L波段分別傳輸41個(gè)單波1.2Tbit/s與64個(gè)單波800Gbit/s。

未來(lái),應(yīng)進(jìn)一步提升空芯光纖制備工藝,降低損耗與成本,并深入研究部署運(yùn)維方案,如快速便捷熔接、熔接損耗檢測(cè)、斷點(diǎn)檢測(cè)等,以加速空芯光纖的商用部署。

中國(guó)電信面向智算時(shí)代的光通信新技術(shù)應(yīng)用探索

400G/800G現(xiàn)網(wǎng)混合速率傳輸驗(yàn)證

面向城域以及長(zhǎng)距離應(yīng)用場(chǎng)景,中國(guó)電信于2024年在長(zhǎng)江中下游地區(qū)的ROADM網(wǎng)絡(luò),開展了業(yè)界首個(gè)單波長(zhǎng)400G/800G混合速率傳輸系統(tǒng)現(xiàn)網(wǎng)試點(diǎn),并基于擴(kuò)展C波段與擴(kuò)展L波段12THz譜寬,實(shí)現(xiàn)了最大傳輸容量64Tbit/s、最長(zhǎng)傳輸距離超1200km的無(wú)電中繼傳輸,證實(shí)了混合速率傳輸?shù)目尚行浴?/p>

目前,400G技術(shù)已在現(xiàn)網(wǎng)商用部署,預(yù)計(jì)其生命周期較長(zhǎng)。同時(shí),800G技術(shù)也在不斷發(fā)展之中,針對(duì)“長(zhǎng)三角”“京津冀”與“粵港澳”等流量需求較大的熱點(diǎn)區(qū)域,開通800G波長(zhǎng),并與400G骨干網(wǎng)共用光層,進(jìn)一步降低了建網(wǎng)的成本,僅需在現(xiàn)有的網(wǎng)絡(luò)上增加800G板卡即可實(shí)現(xiàn)。若400G與800G采用相同符號(hào)速率,甚至只需要在軟件層面修改收發(fā)板卡的調(diào)制格式等參數(shù),即可實(shí)現(xiàn)速率的切換,大大降低了實(shí)現(xiàn)難度。

此次400G/800G混合速率現(xiàn)網(wǎng)試點(diǎn)可以加速推進(jìn)800G商用部署,進(jìn)一步提高網(wǎng)絡(luò)吞吐量和利用率,減少設(shè)備數(shù)量及降低能耗,提升網(wǎng)絡(luò)資源的利用效率,并可面向熱點(diǎn)區(qū)域打造差異化服務(wù)。

“S+C+L”超120Tbit/s實(shí)時(shí)傳輸

面向短距離智算中心互聯(lián)場(chǎng)景,2024年中國(guó)電信基于“S+C+L”波段實(shí)現(xiàn)了單纖超120Tbit/s實(shí)時(shí)傳輸紀(jì)錄,最高的單波長(zhǎng)速率可達(dá)1.2Tbit/s;S波段譜寬為5THz,C波段與L波段的譜寬均為6THz,系統(tǒng)總譜寬達(dá)到了17THz。中國(guó)電信“S+C+L”實(shí)時(shí)超120Tbit/s實(shí)驗(yàn)設(shè)置如圖3所示。

打開網(wǎng)易新聞 查看精彩圖片

圖3 中國(guó)電信“S+C+L”實(shí)時(shí)超120Tbit/s實(shí)驗(yàn)設(shè)置

實(shí)驗(yàn)針對(duì)每個(gè)波段都采用了差異化的調(diào)制格式、符號(hào)速率、信道間隔,以最大化系統(tǒng)的頻譜效率。此外,針對(duì)多波段系統(tǒng)的波長(zhǎng)相關(guān)損耗與功率轉(zhuǎn)移效應(yīng),采用了多波段系統(tǒng)填充波與自動(dòng)功率均衡技術(shù)。對(duì)于S波段的信號(hào)放大,采用了摻銩光纖放大器,并針對(duì)放大器的噪聲與增益特性,系統(tǒng)性地調(diào)節(jié)激光器出光功率等參數(shù),優(yōu)化鏈路的光信噪比(OSNR)性能。最終,基于大有效面積(150μm2)的G.654光纖,實(shí)現(xiàn)了75km的傳輸,覆蓋數(shù)據(jù)中心互聯(lián)應(yīng)用場(chǎng)景。

總結(jié)與展望

智算時(shí)代下的高速光通信技術(shù)已進(jìn)入飛速發(fā)展階段,各類新技術(shù)的應(yīng)用正以前所未有的速度改變著時(shí)代的進(jìn)程。一方面,高速光通信技術(shù)將貫通智算集群間、智算中心間與智算中心內(nèi)組網(wǎng);另一方面,高速光通信技術(shù)將滲透進(jìn)系統(tǒng)內(nèi)、芯片間與芯片內(nèi)。

面向單點(diǎn)集群的數(shù)據(jù)中心內(nèi)部光通信技術(shù),1.6T超高速光模塊配合先進(jìn)的封裝工藝,可實(shí)現(xiàn)大帶寬、低成本與低功耗的DCN互聯(lián);OCS技術(shù)的引入,突破傳統(tǒng)電交換功耗與時(shí)延的瓶頸,為DCN網(wǎng)絡(luò)架構(gòu)提供了全新的技術(shù)路徑。

面向分布式集群的數(shù)據(jù)中心之間光通信技術(shù),800G/1.2T超高單波速率配合不斷擴(kuò)展的傳輸波段,可大幅減少DCI互聯(lián)光層數(shù)量并降低成本;空分復(fù)用技術(shù)的引入在物理層面成倍地提高傳輸容量;空芯光纖的使用,為DCI提供全新的思路。

面向未來(lái),高速光通信產(chǎn)業(yè)各方將不斷革新,催生各類顛覆性技術(shù),助力構(gòu)建數(shù)據(jù)中心全新網(wǎng)絡(luò)架構(gòu),并在AI時(shí)代,為大模型的高效訓(xùn)練提供堅(jiān)實(shí)的承載底座,推動(dòng)未來(lái)產(chǎn)業(yè)的創(chuàng)新協(xié)同發(fā)展。