打開網(wǎng)易新聞 查看精彩圖片

自主算力底座,重構(gòu)AI基石。

文 | 華商韜略 熊劍輝

今年以來,從DeepSeek、宇樹機(jī)器人,到“中國版阿斯麥”新凱來……一大批中國科技創(chuàng)新驚艷世人。

很多人并不知道,這背后都閃耀著華為的身影。

特別是華為云,一邊在芯片底層深耕,一邊以CloudMatrix瞄準(zhǔn)超節(jié)點(diǎn)沖鋒,將訓(xùn)練、推理、具身智能全面推上云端,終成英偉達(dá)之外的“算力第二極”。

今天,即便英偉達(dá)AI算力依然占優(yōu),卻悄然喪失壟斷的“鐵王座”。

當(dāng)中國再次面臨科技鏈的硬封鎖,華為的超節(jié)點(diǎn)突破,正引領(lǐng)中國AI邁向更自主、更普惠、更顛覆的新時(shí)代。

【超節(jié)點(diǎn)突圍】

2025年3月18日,美國加州圣何塞。

在號(hào)稱全球“科技春晚”的英偉達(dá)GTC大會(huì)上,黃仁勛重磅發(fā)布了全新的Blackwell Ultra GPU,以及基于該芯片的NVL72服務(wù)器,震驚世界。

由8個(gè)NVL72機(jī)架組成的完整版Blackwell Ultra DGX超節(jié)點(diǎn),算力高達(dá)11.5 ExaFLOPS FP4。

算力爆表背后,英偉達(dá)的“超節(jié)點(diǎn)技術(shù)”,才是不傳之秘。

什么是“超節(jié)點(diǎn)”?

簡單來說,超節(jié)點(diǎn)是一種突破性的智算硬件架構(gòu)。

在傳統(tǒng)的AI服務(wù)器里,一張計(jì)算卡中僅能容納8塊GPU芯片。這導(dǎo)致GPU之間傳輸速度快,但計(jì)算卡之間傳輸速度慢。

本來,這不是什么大問題??扇缃?,伴隨AI崛起,行業(yè)巨頭動(dòng)不動(dòng)要連接起成千上萬、乃至10萬計(jì)的GPU,使其漸漸成了一個(gè)大麻煩。

一個(gè)典型的案例是,當(dāng)年Meta為訓(xùn)練4050億個(gè)參數(shù)的Llama 3大模型,使用了包含16384塊NVIDIA H100 80GB GPU的集群。

常言道:三個(gè)和尚沒水喝。更何況,這是16384個(gè)“和尚”挑“三峽”,導(dǎo)致平均3小時(shí)就發(fā)生一次意外報(bào)錯(cuò),浪費(fèi)了巨量的時(shí)間、算力、人力成本。

而要解決這個(gè)大問題,一要將AI服務(wù)器進(jìn)一步集成,二要提高算卡間的網(wǎng)速。

NVL72超節(jié)點(diǎn)技術(shù),因此應(yīng)運(yùn)而生。

簡單理解,NVL72就是一個(gè)裝了72張GPU的超級(jí)AI服務(wù)器,算卡之間通過NVLink網(wǎng)絡(luò)技術(shù)連接,令A(yù)I的算力和通訊速度幾何倍數(shù)提升。

NVL72基礎(chǔ)上,還能不斷疊加,變成NVL144、NVL288、NVL576……

超節(jié)點(diǎn)技術(shù)加持下,成百上千顆GPU不斷疊加,卻依然能像一顆超級(jí)GPU一樣,協(xié)同高速運(yùn)行。

可這樣的超節(jié)點(diǎn)技術(shù),一度為英偉達(dá)獨(dú)有,且是封閉生態(tài),不容任何人染指。

對(duì)此,連谷歌、亞馬遜都要另辟蹊徑;遭遇高端AI芯片禁運(yùn)的中國,也只能望洋興嘆。

但不論遭遇怎樣的艱難險(xiǎn)阻,中國人相信,一定能突出重圍。

2024年9月,華為全聯(lián)接大會(huì),華為云發(fā)布了AI原生云基礎(chǔ)設(shè)施架構(gòu)CloudMatrix,通過計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)技術(shù)的協(xié)同創(chuàng)新,打造“超節(jié)點(diǎn)+集群”系統(tǒng)算力解決方案。

▲華為公司常務(wù)董事、華為云計(jì)算CEO 張平安
打開網(wǎng)易新聞 查看精彩圖片
▲華為公司常務(wù)董事、華為云計(jì)算CEO 張平安

就在昨天(2025年4月10日),華為云生態(tài)大會(huì)2025上,華為公司常務(wù)董事、華為云計(jì)算CEO張平安又公布了AI基礎(chǔ)設(shè)施架構(gòu)突破性進(jìn)展——CloudMatrix 384超節(jié)點(diǎn),已在蕪湖數(shù)據(jù)中心規(guī)模上線,成為國內(nèi)唯一正式商用的大規(guī)模超節(jié)點(diǎn)。

華為云超節(jié)點(diǎn),強(qiáng)在哪?

【創(chuàng)新大破局】

當(dāng)AI成為推動(dòng)變革的重要力量,如何讓AI更好地走向產(chǎn)業(yè)落地,成為時(shí)代發(fā)展的“必答題”。

而CloudMatrix 384超節(jié)點(diǎn),就是華為云給出的答案。

▲CloudMatrix 384超節(jié)點(diǎn)
打開網(wǎng)易新聞 查看精彩圖片
▲CloudMatrix 384超節(jié)點(diǎn)

傳統(tǒng)的云服務(wù),以單臺(tái)服務(wù)器作為交付單元。

而基于超節(jié)點(diǎn)技術(shù)的華為云CloudMatrix 384,提供的卻是一種動(dòng)態(tài)組合的算力切片。

它通過“一切可池化”“一切皆對(duì)等”“一切可組合”三大創(chuàng)新設(shè)計(jì),以及HCCS等全自研通信協(xié)議,最終在算力密度、互聯(lián)帶寬、長穩(wěn)運(yùn)行上,實(shí)現(xiàn)了全方位提升。

算力上,華為云通過新型高速總線,實(shí)現(xiàn)多卡緊耦合互聯(lián),成為一個(gè)超級(jí)云服務(wù)器。

這使其算力規(guī)模領(lǐng)先,訓(xùn)練超大規(guī)模大模型亦不在話下。

在互聯(lián)帶寬上,華為云CloudMatrix 384通過超高帶寬Scale-Up新型高速總線網(wǎng)絡(luò),實(shí)現(xiàn)從“傳統(tǒng)以太網(wǎng)”向“共享總線網(wǎng)絡(luò)”演進(jìn),資源互聯(lián)帶寬大幅提升。

穩(wěn)定性上,CloudMatrix 384支持長穩(wěn)運(yùn)行,故障分鐘級(jí)恢復(fù)。

簡單來說,CloudMatrix 384,就是384張昇騰算力卡組成的一臺(tái)AI服務(wù)器節(jié)點(diǎn)。這不僅是中國最大的商用超節(jié)點(diǎn),相較英偉達(dá)NVL72,它規(guī)模更大、算力更強(qiáng)、性能更優(yōu),由此成為AI推理時(shí)代的新動(dòng)力。

實(shí)際上,伴隨DeepSeek的橫空出世,華為云超節(jié)點(diǎn)已經(jīng)在其中一展身手。

2025年1月底,硅基流動(dòng)正考慮部署DeepSeek??珊唵我凰阗~,一個(gè)月要?jiǎng)佑?0臺(tái)英偉達(dá)H800,耗費(fèi)五六百萬,還不一定能用滿。

風(fēng)險(xiǎn)之下,硅基流動(dòng)轉(zhuǎn)身找到了華為云。

2月1日,由硅基流動(dòng)與華為云聯(lián)合首發(fā)并上線基于昇騰云服務(wù)的DeepSeekR1/V3推理服務(wù),率先跑通了在國產(chǎn)芯片上部署DeepSeek模型的路徑。

由此,才真正掀起了DeepSeek全面開花的狂潮。

4月10日,硅基流動(dòng)再度宣布:基于華為云CloudMatrix 384 超節(jié)點(diǎn)昇騰云服務(wù),并采用大規(guī)模專家并行最佳實(shí)踐的DeepSeek-R1,正式上線。

該服務(wù)在保證單用戶20TPS水平前提下,單卡“生成回答”(Decode)吞吐突破1920Tokens/s,性能比肩英偉達(dá)H100;在總算力、互聯(lián)帶寬、內(nèi)存帶寬上,更領(lǐng)先業(yè)界。

技術(shù)上,華為云超節(jié)點(diǎn)與DeepSeek,堪稱絕配。

實(shí)際上,DeepSeek訓(xùn)練采用的MoE架構(gòu),會(huì)因All-to-All通信,產(chǎn)生GPU閑置、負(fù)載不均衡等問題。

而超節(jié)點(diǎn),恰恰能通過資源池化、高帶寬低時(shí)延的交換互聯(lián)模式,有效緩解DeepSeek流水線并行計(jì)算的資源空置、MoE架構(gòu)下的GPU閑置等難題,成為部署DeepSeek的最優(yōu)選。

特別是面對(duì)中小企業(yè)、學(xué)校、醫(yī)院等機(jī)構(gòu)快速部署需求,華為云又開發(fā)出昇騰一體機(jī)。

這種“開箱即用”的解決方案,目前已支持150+企業(yè)的DeepSeek服務(wù)迅速上線,在無限次免費(fèi)使用“滿血版”DeepSeek的同時(shí),徹底告別“服務(wù)器繁忙”的困擾。

這既是DeepSeek帶來的AI平權(quán),也是華為云引領(lǐng)的算力普惠。

【共筑繁榮AI生態(tài)】

如今,伴隨DeepSeek的加速部署,中國智能化時(shí)代正呼嘯而來。

有數(shù)據(jù)顯示,當(dāng)下中國每天用AI生成內(nèi)容的用戶高達(dá)3億,五分之一的網(wǎng)民在用AI創(chuàng)作,每天消耗的Tokens高達(dá)10萬億,相當(dāng)于上百萬部《三體》。

國際咨詢機(jī)構(gòu)Gartner則預(yù)測,2027年,中國80%的企業(yè)將使用多模型生成式人工智能(AI)。

“噴薄而出”的AI需求,越發(fā)渴求強(qiáng)大的AI全棧能力。

華為云生態(tài)大會(huì)2025上,華為云最新的“AI全家桶”,也應(yīng)時(shí)而來。

不論是GaussDB數(shù)據(jù)庫、軟件工具鏈CodeArts,還是云安全、數(shù)字內(nèi)容生產(chǎn)線MetaStudio等產(chǎn)品,都經(jīng)過智能化全面升級(jí),展現(xiàn)出華為云在AI領(lǐng)域超強(qiáng)的全棧能力。

AI全棧自研,正是很多人看好華為云的核心原因。

但在華為云看來,僅是“AI全家桶”遠(yuǎn)遠(yuǎn)不夠。

華為云力圖構(gòu)建的AI全棧能力,貫穿著堅(jiān)定打造“自主創(chuàng)新、安全可靠”的AI算力底座、堅(jiān)定深耕行業(yè)、堅(jiān)定推進(jìn)生態(tài)建設(shè)“三大堅(jiān)定”。

面向“三大堅(jiān)定”,華為云正穩(wěn)步推進(jìn)。

▲華為云烏蘭察布數(shù)據(jù)中心
打開網(wǎng)易新聞 查看精彩圖片
▲華為云烏蘭察布數(shù)據(jù)中心

AI算力底座上,華為云一面在貴州貴陽、內(nèi)蒙古烏蘭察布、安徽蕪湖完成了三大云核心樞紐布局,一面不忘攜手生態(tài)伙伴。

2024年10月,科大訊飛與華為聯(lián)合打造的“飛星二號(hào)”正式上線。

這是雙方完全基于昇騰生態(tài),打造的國產(chǎn)超大規(guī)模智算平臺(tái)。

正如科大訊飛董事長劉慶峰所說:

“只有在真正自主研發(fā)、自主創(chuàng)新的平臺(tái)上,才有真正的中國人工智能大未來。”

這樣的“自主創(chuàng)新、安全可靠”,不僅在為“飛星二號(hào)”這一智算平臺(tái)賦能,更通過這一平臺(tái),進(jìn)一步滲透到能源、金融、教育、醫(yī)療等多個(gè)行業(yè)。

而在深耕行業(yè)上,華為云堅(jiān)定以盤古大模型為引擎,打造行業(yè)ToB解決方案,令眾多企業(yè)受益。

在寶鋼,通過華為云盤古大模型對(duì)高爐爐況的場景優(yōu)化,每年降本超10億。

在廣汽,由盤古大模型構(gòu)建的代碼助手,在端開發(fā)、車端開發(fā)的研發(fā)效率提升10%;診斷助手讓工程師查冊(cè)時(shí)間減少50%,故障排診效率提升30%。

在天士力,基于盤古打造的“數(shù)智本草”大模型,參數(shù)高達(dá)380億,可快速進(jìn)行藥材和復(fù)方的篩選和優(yōu)化。

今天,華為云盤古大模型已在30多個(gè)行業(yè)、400多個(gè)場景中落地,廣泛應(yīng)用于城市治理、智慧金融、醫(yī)療健康、氣象預(yù)測等領(lǐng)域。

華為云全棧的AI能力,正持續(xù)給千行萬業(yè)帶來巨大的商業(yè)價(jià)值。

而數(shù)字世界的話語權(quán),終究由生態(tài)的繁榮決定。

畢竟在AI時(shí)代,不是一家企業(yè)就能解決千行萬業(yè)的問題,而需要整個(gè)生態(tài)合力。

誠如《華為2024年年度報(bào)告》中所說:

“生態(tài)是廣袤的沃土,只有生態(tài)伙伴的成長和成功,才有生態(tài)系統(tǒng)的枝繁葉茂?!?/strong>

圍繞鴻蒙、鯤鵬、昇騰等根技術(shù)生態(tài),華為正加速向生態(tài)伙伴開放平臺(tái)能力,為開發(fā)者持續(xù)提供好用易用的工具和產(chǎn)品。

今天,全世界都對(duì)中國AI的進(jìn)步刮目相看。這背后,是華為云做百模千態(tài)、千行萬業(yè)的“黑土地”,從底層為軟硬件的自主創(chuàng)新默默筑基,中國企業(yè)才能在AI領(lǐng)域放手創(chuàng)新,中國的AI應(yīng)用才有了堅(jiān)實(shí)的底氣。

所以,華為的突破,從來不是“獨(dú)行者快”的個(gè)體創(chuàng)新,而是“眾行者遠(yuǎn)”的群體繁榮。

一個(gè)由華為主導(dǎo)的開放、合作、共贏的生態(tài)系統(tǒng),必將在商業(yè)、產(chǎn)業(yè)、社會(huì)意義上實(shí)現(xiàn)更大的價(jià)值。

事實(shí)上,從電子時(shí)代、數(shù)字時(shí)代、再到AI新紀(jì)元,華為每遇科技爆發(fā)的關(guān)鍵節(jié)點(diǎn),都是通過不斷創(chuàng)新、堅(jiān)守底線,終成跨越大周期的科技常青樹。

當(dāng)世界進(jìn)入產(chǎn)業(yè)鏈、科技鏈對(duì)決的“亂紀(jì)元”,這種寶貴的突破,無疑將重筑未來科技權(quán)力的基石。

這是一場國運(yùn)之戰(zhàn),也終將改變中國科技產(chǎn)業(yè)的未來格局。

歡迎關(guān)注【華商韜略】,識(shí)風(fēng)云人物,讀韜略傳奇。

版權(quán)所有,禁止私自轉(zhuǎn)載

部分圖片來源于網(wǎng)絡(luò)

如涉及侵權(quán),請(qǐng)聯(lián)系刪除