去年AMD、博通(Broadcom)、思科(Cisco)、谷歌(Google)、Hewlett Packard Enterprise (HPE)、英特爾(Intel)、Meta和微軟(Microsoft)宣布成立Ultra Accelerator Link (UALink)聯(lián)盟,共同制定一項新的行業(yè)標(biāo)準(zhǔn),致力于推進(jìn)數(shù)據(jù)中心中擴(kuò)展AI系統(tǒng)的高速和低延遲通信。隨后蘋果、阿里云、以及Synopsys加入,被選為UALink聯(lián)盟董事會新成員。
UALink聯(lián)盟宣布,正式發(fā)布UALink 1.0規(guī)范,意味著小組成員現(xiàn)在可以對支持新技術(shù)的芯片進(jìn)行流片。其允許在一個計算集群(Pod)內(nèi),讓接入的GPU等加速器附帶的內(nèi)存之間實現(xiàn)直接加載和存儲,提升共同完成大規(guī)模計算任務(wù)的效率。

UALink協(xié)議棧包括四個硬件優(yōu)化層,分別是物理層、數(shù)據(jù)鏈路層、事務(wù)層和協(xié)議層。其中物理層使用標(biāo)準(zhǔn)以太網(wǎng)組件(例如200GBASE-KR1/CR1),并包括使用FEC減少延遲的修改;數(shù)據(jù)鏈路層將事務(wù)層的64字節(jié)的數(shù)據(jù)打包成640字節(jié)的單位,應(yīng)用CRC和可選的重試邏輯,另外還負(fù)責(zé)處理設(shè)備間的消息傳遞;事務(wù)層實現(xiàn)壓縮尋址,在實際工作負(fù)載下以高達(dá)95%的協(xié)議效率簡化數(shù)據(jù)傳輸。針對現(xiàn)代數(shù)據(jù)中心使用,還集成了安全和管理功能,計算集群將通過專用控制軟件和固件代理,使用PCIe和以太網(wǎng)等標(biāo)準(zhǔn)接口進(jìn)行管理。
UALink 1.0規(guī)范支持每通道200 GT/s的雙向數(shù)據(jù)速率,信號速率為212.5 GT/s,以適應(yīng)前向糾錯和編碼開銷。UALink可以配置為x1、x2或x4通道,其中四通道鏈路在發(fā)送和接收方向的速度最高可達(dá)800 GT/s。
單個UALink 1.0系統(tǒng)支持連接多達(dá)1024個AI加速器,通過UALink交換機(jī)連接,每個AI加速器分配一個端口和一個10-bit唯一標(biāo)識符,以實現(xiàn)精確路由。UALink 電纜長度經(jīng)過優(yōu)化,長度小于4米,在64B/640B有效載荷下實現(xiàn)小于1μs的往返延遲。此外,這些鏈路支持跨一到四個機(jī)架的確定性性能。
在外界看來,UALink聯(lián)盟的創(chuàng)立就是為了改變英偉達(dá)在人工智能芯片領(lǐng)域一家獨大的格局,競爭目標(biāo)是稱為“NVLink”的互連通信協(xié)議。UALink 1.0規(guī)范允許在連接到處理器的內(nèi)存之間直接傳輸數(shù)據(jù),這對于AI訓(xùn)練工作負(fù)載尤其重要。
UALink 1.0規(guī)范發(fā)布對行業(yè)的影響解讀
打破NVIDIA的生態(tài)壟斷,推動行業(yè)多元化
NVIDIA憑借NVLink+InfiniBand的封閉生態(tài),在AI加速器市場占據(jù)主導(dǎo)地位。UALink的推出標(biāo)志著頭部廠商聯(lián)合“去NVIDIA化”,通過開放標(biāo)準(zhǔn)降低對單一供應(yīng)商的依賴。為AMD、英特爾等GPU廠商提供跨品牌互聯(lián)方案,加速其AI芯片(如AMD Instinct、Intel Gaudi)的市場滲透。 可能迫使NVIDIA調(diào)整策略,如開放部分技術(shù)或降低NVLink授權(quán)成本。
技術(shù)優(yōu)勢:更高帶寬與擴(kuò)展性
單鏈路帶寬達(dá)1.5TB/s(雙向),超越NVLink 4.0的900GB/s。
拓?fù)潇`活性:支持直接GPU-GPU連接或通過UALink Switch擴(kuò)展至數(shù)千節(jié)點,媲美InfiniBand的集群能力。
低延遲:針對AI訓(xùn)練/推理優(yōu)化,減少數(shù)據(jù)同步開銷。
應(yīng)用場景:
大規(guī)模AI模型訓(xùn)練(如LLM、多模態(tài)模型)。
高性能計算(HPC)中的GPU密集型任務(wù)。
重構(gòu)數(shù)據(jù)中心硬件生態(tài)
設(shè)備層:
加速專用交換芯片(如博通、思科)的研發(fā),替代部分InfiniBand交換機(jī)市場。
推動PCIe 6.0+UALink的混合架構(gòu),提升服務(wù)器內(nèi)/間互聯(lián)效率。
軟件層:
需配套開發(fā)統(tǒng)一驅(qū)動和通信庫(類似NVIDIA的NCCL),兼容PyTorch、TensorFlow等框架。
可能催生新的RDMA協(xié)議優(yōu)化方案。
對云計算與超算的影響
云服務(wù)商如Google Cloud、Azure):
可通過UALink構(gòu)建異構(gòu)加速器集群,靈活搭配AMD/Intel/自研芯片,降低TCO(總擁有成本)。
提供更細(xì)粒度的AI算力租賃服務(wù)(如單GPU到超大規(guī)模集群)。
替代傳統(tǒng)InfiniBand方案,降低部署成本,同時滿足AI與科學(xué)計算的雙重需求。UALink 1.0的發(fā)布是AI基礎(chǔ)設(shè)施領(lǐng)域的一次重要變革,其核心價值在于打破封閉、促進(jìn)競爭。盡管面臨生態(tài)建設(shè)挑戰(zhàn),但憑借聯(lián)盟成員的行業(yè)影響力,有望重塑AI算力底層架構(gòu),最終受益的將是需要高性能、低成本互聯(lián)方案的廣大企業(yè)與研究機(jī)構(gòu)。
平臺近期組織的活動
*若有意向成為本次盛會的合作伙伴,請盡快聯(lián)系我們預(yù)定*
加”GPMI接口供應(yīng)鏈溝通群“加客服申請
工程參考學(xué)習(xí)資訊
更多關(guān)于最新的線纜行業(yè)發(fā)展訊息,請關(guān)注我們的微信公眾號!我們將第一時間搜尋到行業(yè)前沿訊息和您一起分享!不做盈利用途,文中觀點都是基于公開數(shù)據(jù)及信息,僅供交流,不構(gòu)成投資建議!
熱門跟貼