(文/觀察者網(wǎng) 呂棟)
近日,美國(guó)不再限制英偉達(dá)H20芯片對(duì)華出口的消息引發(fā)關(guān)注,也再度凸顯外部算力供給的不穩(wěn)定性。事實(shí)上,在大模型催生的巨大算力需求下,中國(guó)企業(yè)高價(jià)購(gòu)買(mǎi)“閹割版”英偉達(dá)芯片并非長(zhǎng)久之際,如何獲取持續(xù)穩(wěn)定夠用的算力供給,已成為保證業(yè)務(wù)連續(xù)性的關(guān)鍵。
4月10日,國(guó)內(nèi)云計(jì)算領(lǐng)域的兩場(chǎng)大會(huì)成為行業(yè)焦點(diǎn)。
一個(gè)是2025中國(guó)移動(dòng)云智算大會(huì)。中國(guó)移動(dòng)董事長(zhǎng)楊杰表示,以數(shù)智化為主要特征的新一輪科技革命和產(chǎn)業(yè)變革深入發(fā)展,數(shù)據(jù)成為新生產(chǎn)要素,算力成為新基礎(chǔ)設(shè)施和基礎(chǔ)能源,人工智能成為新生產(chǎn)工具,推動(dòng)經(jīng)濟(jì)社會(huì)從“互聯(lián)網(wǎng)+”、“5G+”向“AI+”加速轉(zhuǎn)變,為算網(wǎng)基礎(chǔ)設(shè)施演進(jìn)帶來(lái)新機(jī)遇、提出新要求。
他提到,未來(lái)3年,中國(guó)智能算力規(guī)模增長(zhǎng)將超過(guò)2.5倍,年均復(fù)合增速近40%。同時(shí),推理算力需求將超過(guò)訓(xùn)練算力需求,推理算力年復(fù)合增速將達(dá)到訓(xùn)練算力的近4倍,到2028年,推理算力規(guī)模將超過(guò)訓(xùn)練算力規(guī)模。中國(guó)移動(dòng)將建設(shè)超大規(guī)模的“算力工廠”,推動(dòng)萬(wàn)卡級(jí)、千卡級(jí)智算中心的倍增擴(kuò)容,積極開(kāi)展十萬(wàn)卡智算中心前瞻研究。
一直以來(lái),由于芯片制造工藝受限,國(guó)產(chǎn)芯片的單卡算力比不上英偉達(dá),這也是國(guó)內(nèi)行業(yè)產(chǎn)生算力焦慮、大量囤貨英偉達(dá)的關(guān)鍵原因。但事實(shí)上,隨著大模型的快速迭代,計(jì)算系統(tǒng)也在發(fā)生結(jié)構(gòu)性變化,需要的更多是系統(tǒng)算力,而不僅僅是單芯片的算力。這些結(jié)構(gòu)性變化,為中國(guó)企業(yè)通過(guò)架構(gòu)性創(chuàng)新,開(kāi)創(chuàng)出一條自主可持續(xù)的計(jì)算產(chǎn)業(yè)發(fā)展道路,提供了機(jī)遇。
同日,在華為云生態(tài)大會(huì)2025上,華為常務(wù)董事、華為云CEO張平安公布了AI基礎(chǔ)設(shè)施架構(gòu)突破性進(jìn)展,推出CloudMatrix 384超節(jié)點(diǎn),并宣布已在蕪湖數(shù)據(jù)中心規(guī)模上線。
觀察者網(wǎng)了解到,去年英偉達(dá)NVL72的發(fā)布,為萬(wàn)億參數(shù)的大型語(yǔ)言模型推理提供了30倍實(shí)時(shí)速度提升,引發(fā)大量關(guān)注。而作為國(guó)內(nèi)首個(gè)商用級(jí)別的大規(guī)模超節(jié)點(diǎn),華為CloudMatrix 384在規(guī)模、性能和可靠性上全面超越了英偉達(dá)NVL72。它的核心意義在于實(shí)現(xiàn)了AI算力資源從服務(wù)器級(jí)供給到矩陣級(jí)供給的轉(zhuǎn)變。基于CloudMatrix的昇騰AI云服務(wù),大模型訓(xùn)練作業(yè)可穩(wěn)定運(yùn)行40天,互聯(lián)帶寬斷點(diǎn)恢復(fù)只需10秒級(jí)別。


英偉達(dá)NVL72系統(tǒng)
并且,超節(jié)點(diǎn)架構(gòu)對(duì)于混合專家模型(MOE)天然親和,拿DeepSeek來(lái)說(shuō),以前在傳統(tǒng)8卡英偉達(dá)服務(wù)器上,得搞一堆復(fù)雜的工程創(chuàng)新。但華為超節(jié)點(diǎn)憑借獨(dú)特架構(gòu),天生支持“大規(guī)模專家并行”。
華為云超節(jié)點(diǎn)是如何實(shí)現(xiàn)的?通俗地講,就是通過(guò)將傳統(tǒng)單節(jié)點(diǎn)(如8卡昇騰服務(wù)器)通過(guò)新型高速總線緊耦合互聯(lián),形成一個(gè)單一邏輯計(jì)算單元(即“超節(jié)點(diǎn)”)。這種架構(gòu)突破物理服務(wù)器邊界,實(shí)現(xiàn)資源池化與對(duì)等互聯(lián),使算力規(guī)模提升50倍(單超節(jié)點(diǎn)達(dá)300 Pflops)。華為云將這一技術(shù)轉(zhuǎn)化為昇騰云服務(wù),大幅降低了企業(yè)獲取高性能計(jì)算資源的門(mén)檻。
突破單卡瓶頸,打造系統(tǒng)化算力,是華為一直以來(lái)的策略。華為輪值董事長(zhǎng)徐直軍去年曾表示,華為的戰(zhàn)略核心就是,充分抓住人工智能變革機(jī)遇,基于實(shí)際可獲得的芯片制造工藝,計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)技術(shù)協(xié)同創(chuàng)新,開(kāi)創(chuàng)計(jì)算架構(gòu),打造‘超節(jié)點(diǎn)+集群’系統(tǒng)算力解決方案,長(zhǎng)期持續(xù)滿足算力需求。
在此次生態(tài)大會(huì)上,張平安表示,面向智能世界,華為云致力于做好行業(yè)數(shù)字化的“云底座”和“使能器”,依托昇騰AI云服務(wù)推動(dòng)各行各業(yè)AI快速開(kāi)發(fā)落地?!拔覀兡偷米〖拍?,盤(pán)古大模型將會(huì)堅(jiān)定走行業(yè)AI的道路,幫助各行各業(yè)的客戶打造屬于自己的大模型。華為并不發(fā)布面向C端的大模型應(yīng)用,我們更關(guān)注的是怎么能讓行業(yè)客戶真正落地AI?!?/p>
當(dāng)前,中美備受關(guān)注的不只是貿(mào)易爭(zhēng)端,還有技術(shù)競(jìng)爭(zhēng)。根據(jù)斯坦福最新的2025年AI指數(shù)報(bào)告,中美頂級(jí)AI模型的性能差距已縮小到了 0.3%,而在2023年差距是20%,中國(guó)模型正在快速追趕美國(guó)的領(lǐng)先地位。更明顯的趨勢(shì)是,如今大模型的性能已經(jīng)趨同。在2024年,TOP1和TOP10的模型的差距能有12%,如今差距已經(jīng)越來(lái)越小,銳減至5%。
這種競(jìng)爭(zhēng)態(tài)勢(shì)下,中國(guó)各行各業(yè)如何高效利用國(guó)產(chǎn)算力,推動(dòng)AI應(yīng)用快速落地亦是關(guān)鍵。在4月9日的2025阿里云AI勢(shì)能大會(huì)上,阿里云智能集團(tuán)資深副總裁、公共云事業(yè)部總裁劉偉光表示,2025年AI應(yīng)用爆發(fā)沒(méi)有最快,只有更快,應(yīng)該推動(dòng)基礎(chǔ)模型、推理服務(wù)、開(kāi)發(fā)工具三要素全速演變,為AI應(yīng)用提速蓄力。
他認(rèn)為,過(guò)去一年,很多企業(yè)都在積極擁抱大語(yǔ)言模型,從簡(jiǎn)單的文生圖、文生視頻、創(chuàng)作文檔到數(shù)據(jù)應(yīng)用等,均涌現(xiàn)出一批令人興奮的應(yīng)用,阿里云大語(yǔ)言模型API調(diào)用量增長(zhǎng)接近100倍。未來(lái),AI會(huì)和很多產(chǎn)業(yè)進(jìn)行有機(jī)融合,爆發(fā)出更多嶄新商業(yè)模式和生產(chǎn)路徑。從深度推理模型到多模態(tài)能力,中國(guó)基礎(chǔ)模型能力大幅提升,讓很多產(chǎn)業(yè)有了強(qiáng)化學(xué)習(xí)的想法,也讓更多AI應(yīng)用的落地成為可能。
但不可否認(rèn)的是,讓快速演進(jìn)的AI技術(shù)賦能各行各業(yè),中國(guó)企業(yè)仍然需要合力。正如張平安所說(shuō):“在AI時(shí)代,并不是一家企業(yè)就能解決千行萬(wàn)業(yè)的問(wèn)題,需要整個(gè)生態(tài)合力,比如AI算力提供商、技術(shù)提供商、大模型提供商等協(xié)同在一起,以開(kāi)放的心態(tài)互相支持,才能夠加速迎接AI時(shí)代,盡早享受到AI時(shí)代的紅利?!?/p>
本文系觀察者網(wǎng)獨(dú)家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。
熱門(mén)跟貼