關(guān)于中國科技的發(fā)展,我最近聽到一個觀點(diǎn),那就是在這兩年,中國科技的發(fā)展在從以前的追趕式開始進(jìn)步到原創(chuàng)并跑階段。
以前是西方有的,我們也要有,西方封鎖我,那么我們一定要把西方封鎖的技術(shù)搞出來,帶有一種頭懸梁錐刺股,破釜沉舟式的“悲壯”意味,比如我們在中國工業(yè)發(fā)展的不少領(lǐng)域,都聽到過“爭氣機(jī)”的說法,
一般都是我們沒有這項(xiàng)技術(shù),然后我們?nèi)ベI人家不賣,或者故意出高價(jià),還諷刺我們永遠(yuǎn)做不出來,最終我們奮發(fā)圖強(qiáng),一舉做出了這項(xiàng)技術(shù)。
這樣的故事相信大家一定看到過類似的版本。
在以前我們想的也是更多是先填補(bǔ)技術(shù)國內(nèi)空白,先把這個東西做出來,但現(xiàn)在情況不一樣了,中國科技已經(jīng)開始有原創(chuàng)領(lǐng)先科技爆發(fā)的態(tài)勢。
正如DeepSeek創(chuàng)始人梁文鋒說“中國AI不可能永遠(yuǎn)處在跟隨的位置。我們經(jīng)常說中國AI和美國有一兩年差距,但真實(shí)的gap是原創(chuàng)和模仿之差。如果這個不改變,中國永遠(yuǎn)只能是追隨者,所以有些探索也是逃不掉的?!?/p>
國內(nèi)新一代科技人才已經(jīng)有了這個覺悟。
過去的幾個月,從DeepSeek到宇樹科技國產(chǎn)機(jī)器狗等國產(chǎn)新技術(shù)不斷的涌現(xiàn),而且都是世界級的創(chuàng)新成果。
前幾天我看美國財(cái)政部長當(dāng)?shù)貢r(shí)間4月2日接受采訪的視頻,他說美國科技七巨頭(英偉達(dá),亞馬遜,谷歌,特斯拉,蘋果,微軟,Meta)的股價(jià)大跌是因?yàn)閐eepseek的發(fā)布,而不是美國政府的貿(mào)易保護(hù)主義。
不管他說的對不對,
能被美國人拿來當(dāng)成美國科技企業(yè)股價(jià)大跌的理由,說明了至少兩點(diǎn),
一是中國AI技術(shù)進(jìn)步是得到了對手肯定的,
二是AI技術(shù)真的非常重要
其實(shí)對應(yīng)美國的科技七巨頭的話,我們也可以列出國內(nèi)的科技七巨頭,我腦子里最先冒出來的是華為,大疆,DeepSeek三個,
當(dāng)然不管怎么列舉,華為肯定會是其中之一,
另外就是不管怎么列舉,國產(chǎn)科技七巨頭也肯定都在AI方面有不少研究和投入。
到2025年的今天, AI已經(jīng)是確定性的趨勢,日常生活中已經(jīng)有大量想不到的AI應(yīng)用。
1:AI在讓人類生活更方便
我看到一個有意思的事就是燒烤店數(shù)簽子算錢,不需要服務(wù)員一根根的去數(shù)了還容易數(shù)錯,直接拿手機(jī)拍照就能自動識別有多少根簽子。
2:AI在創(chuàng)造更多的娛樂方式
在過去的一年,你有沒有在不知不覺中發(fā)現(xiàn)在短視頻平臺,在AI大模型APP里面,讓圖片里人物動起來跳個舞之類的特效已經(jīng)越來越多了?這其實(shí)也是AI技術(shù)在你不知不覺中進(jìn)步,在之前就沒有這個功能。
現(xiàn)在各種大模型APP里面有很多可以對話的智能體,還可以克隆你的聲音,很有意思。
3:AI在增加人類的安全性和存活概率
再比如汽車的自動駕駛,華為發(fā)布的尊界都已經(jīng)是按照L3來設(shè)計(jì)了,安全性又上了一個臺階,就看國家法律法規(guī)什么時(shí)候跟進(jìn)L3了。
其實(shí)盡管不要過分依賴智駕一直是個社交媒體上面的熱門話題,但是常識告訴我們,過去的幾年智駕其實(shí)拯救了不少生命,尤其是在智駕車型普及很高的中國,這個數(shù)量我相信是全球最高的。
4:AI關(guān)系到國家安全和生存
原因很簡單,因?yàn)锳I可以用于軍事和武器,
舉個例子,下圖是《終結(jié)者4》電影里面攜帶武器,可實(shí)現(xiàn)無人駕駛和自主攻擊摩托車,這個電影是2009年上映的,當(dāng)時(shí)覺得這一幕很科幻,
但是我們現(xiàn)在再看的話,已經(jīng)從思想上并不覺得這是科幻片了,而是覺得這已經(jīng)是在當(dāng)前的技術(shù)上可以實(shí)現(xiàn)的東西。

因此我們更進(jìn)一步,正因?yàn)锳I關(guān)系到我們生活的方方面面,所以AI技術(shù)的進(jìn)步與否就直接關(guān)系到一個公司乃至一個國家財(cái)富的多少,上面美國財(cái)政部長說DeepSeek直接影響了美國科技七巨頭的股價(jià)就是例子,那可是實(shí)打?qū)嵉腻X啊。
由于AI技術(shù)如此重要,因此我們自然也會關(guān)心國產(chǎn)AI技術(shù)的進(jìn)步,那就是一個AI應(yīng)用(大模型),一個AI軟硬件基礎(chǔ)設(shè)施。
我們先說大模型部分,大模型其實(shí)可以看成是應(yīng)用,
2024年年底和2025年初deepseek陸續(xù)發(fā)布了V3和R1,火爆了全球,代表的是成本的下降,可以說在deepseek之前,人類的算力需求增長和成本是可怕的規(guī)模,以致于市場給了類似英偉達(dá)極高的預(yù)期,英偉達(dá)的市值在2025年1月7日這天創(chuàng)下了3.75萬億美元的歷史巔峰。
而有了降成本的deepseek之后,使得市場終于降低了對英偉達(dá)的預(yù)期,
注意我并不認(rèn)為算力總需求會下降,只是會從爆發(fā)增長走向正常增長。
舉個例子,在其他因素不變的情況下,參數(shù)量多少和算力需求是成正比的,Deepseek 發(fā)布的V3和R1滿血版都是671B的參數(shù),也就是6710億個參數(shù),而上一代版本,2024年5月發(fā)布的V2的參數(shù)量就只有2360億,總體還是增長的,而Deepseek更為復(fù)雜的下一代參數(shù)量還會更大,
再比如deepseek 開源大模型展現(xiàn)出來的良好性能,將會刺激千行百業(yè)進(jìn)行部署基于deepseek的推理應(yīng)用,刺激對算力的需求。
所以Deepseek的出現(xiàn)使得AI算力需求增長進(jìn)入更為良性的軌道,更低的成本將大大推動AI的普及,總算力需求仍然是增長的。
這就跟所有的產(chǎn)業(yè)發(fā)展是軌跡一樣的,
當(dāng)年九十年代的大哥大一部就得上萬元人民幣,后來隨著成本降低,單臺價(jià)格下降了90%以上,普通人也逐漸買得起了,市場的總規(guī)模并沒有縮減,是不斷增長的。
再說AI基礎(chǔ)設(shè)施部分,這部分我不得不說,華為扛起了中國AI基礎(chǔ)設(shè)施技術(shù)發(fā)展的重任。
強(qiáng)大的AI社會需要強(qiáng)大的AI基礎(chǔ)設(shè)施,在美國這個基礎(chǔ)設(shè)施供應(yīng)商是英偉達(dá)和亞馬遜云,英偉達(dá)提供底層硬件,亞馬遜以云的形式提供算力服務(wù)。
在中國的話,最大的能對標(biāo)英偉達(dá)的廠家就是華為了,同時(shí)華為云也是中國最大的云服務(wù)供應(yīng)商之一,為政府和千行百業(yè)提供算力服務(wù)。
美國政府一直在為自家企業(yè)保駕護(hù)航,所以早早的就盯著華為,
2019年6月把華為列入實(shí)體清單;
又在2020年9月就禁止了全球芯片代工廠家為華為代工。
當(dāng)然華為在自己努力下,終于實(shí)現(xiàn)了芯片制造的自主供應(yīng),
但芯片工藝制程的限制,還是影響了中國AI硬件的單卡算力進(jìn)步,所以論單卡算力,華為的昇騰目前比不上英偉達(dá)。
也正是因?yàn)槿绱?,所以美國?022年底開始逐漸禁售了英偉達(dá)的H100/H800/A100/A800等高端算力芯片。
但是華為并沒有放棄,而是采取多路徑的方式進(jìn)行技術(shù)攻關(guān),
一方面是在半導(dǎo)體設(shè)備研發(fā)制造方面有所動作,今年3月底在上海召開的 SEMICON China 2025半導(dǎo)體展會上公開亮相的某半導(dǎo)體生產(chǎn)設(shè)備公司,其各種以“山”命名的設(shè)備,加上含有“凱旋歸來”意味的名字,讓廣大網(wǎng)友一下子就猜出了其血統(tǒng)。
另一方面華為也在AI基礎(chǔ)設(shè)施技術(shù)方面不斷探索進(jìn)步,
華為云在4月10日發(fā)布了CloudMatrix 384超節(jié)點(diǎn)技術(shù),成功實(shí)現(xiàn)超節(jié)點(diǎn)技術(shù)商用,在當(dāng)下先進(jìn)工藝制程尚未突破的情況下,這也是華為持續(xù)追趕英偉達(dá)的關(guān)鍵。
同時(shí)通過云服務(wù)的形式,向國內(nèi)各行各業(yè)提供超節(jié)點(diǎn)技術(shù)算力,
因?yàn)殡S著企業(yè)對AI應(yīng)用需求的規(guī)模越來越大,那么需要的算力就會增加,企業(yè)會走向千卡甚至萬卡數(shù)據(jù)中心算力集群,
而這個集群內(nèi)各個節(jié)點(diǎn)的通信就成為發(fā)揮性能的瓶頸,這就好比一支龐大的軍隊(duì),如果各個單位之間不能及時(shí)有效的通信,那么戰(zhàn)斗力就會大打折扣。
想象一下,如果算力集群中一張算力卡已經(jīng)完成了計(jì)算任務(wù),但是數(shù)據(jù)卻不能快速地流動到其他算力卡進(jìn)行計(jì)算,導(dǎo)致大量算力卡在閑置和等待,這就讓集群性能不能充分發(fā)揮。
什么是超節(jié)點(diǎn)?
當(dāng)前業(yè)界一臺算力服務(wù)器通常是8張算力卡,這一臺服務(wù)器就稱為一個節(jié)點(diǎn),在一臺服務(wù)器以內(nèi)的8張卡之間的通信速度是非??斓?,
而相比之下服務(wù)器與服務(wù)器之間的通信速度則慢的多,其速度相差甚至能夠達(dá)到10倍以上,也就是說一張算力卡和同一個服務(wù)器里的另一張算力卡,以及和另一個服務(wù)器的算力卡通信速度是天壤之別。
不僅僅是算力卡之間,算力卡和內(nèi)存之間的通信也是一樣的,
和同一個服務(wù)器節(jié)點(diǎn)里面的內(nèi)存通信,速度要比和跨服務(wù)器的內(nèi)存通信要快的多。
所以如果能用高速通信技術(shù)把更多張算力卡,內(nèi)存融合在一起,成為一個超節(jié)點(diǎn),超節(jié)點(diǎn)內(nèi)的算力卡,內(nèi)存都可以實(shí)現(xiàn)高速互聯(lián)和通信,這就能大大的提高算力集群的性能。
當(dāng)然,這不僅需要有深厚的通信技術(shù)積累,也需要有軟件來進(jìn)行大規(guī)模協(xié)同。
英偉達(dá)已經(jīng)率先在2024年3月發(fā)布了NVL72超節(jié)點(diǎn),可以把72張訓(xùn)練卡組成一個超節(jié)點(diǎn)。
而華為云在4月10日發(fā)布的CloudMatrix 384超節(jié)點(diǎn)技術(shù)則更進(jìn)一步,可以實(shí)現(xiàn)384張昇騰算力卡成為一個超節(jié)點(diǎn),這不僅是中國最大的商用超節(jié)點(diǎn),而且超節(jié)點(diǎn)規(guī)模比英偉達(dá)的NVL72更大,算力更強(qiáng),性能比NVL72更優(yōu)。
或者換句話說,它是目前已商用的超節(jié)點(diǎn)中,單體規(guī)模全球最大,有效算力全球最高。
超節(jié)點(diǎn)充分發(fā)揮了華為在通信領(lǐng)域的技術(shù)積累和優(yōu)勢,使其能在國內(nèi)率先突破和領(lǐng)先,畢竟華為是全球領(lǐng)先的通信廠家。
目前國內(nèi)在AI基礎(chǔ)設(shè)施的趕超方向我認(rèn)為是比較明確的,
那就是近兩年朝超節(jié)點(diǎn)方向發(fā)展,未來則單卡算力會發(fā)力,原因如下:
其一隨著算力的增長,國內(nèi)需求千卡集群,萬卡集群的數(shù)量越來越多,而大規(guī)模集群必然會涉及到高速通信互聯(lián),以及網(wǎng)絡(luò)負(fù)載算法等通信相關(guān)的技術(shù),在這些技術(shù)方面中國目前是沒有限制的,尤其對華為而言這還是強(qiáng)項(xiàng),超節(jié)點(diǎn)會符合國內(nèi)算力需求增長的需要。
其二單卡算力主要和芯片工藝制程相關(guān),因此在生產(chǎn)設(shè)備突破后會迎來一個躍升,但這個突破的時(shí)間會在未來幾年,到時(shí)候單卡算力的提升會比現(xiàn)在更快。
對于國內(nèi)千行百業(yè)的企業(yè)而言,除了少數(shù)具備極強(qiáng)IT技術(shù)和運(yùn)維能力的頭部客戶,大部分企業(yè)都會選擇類似華為昇騰云服務(wù)這樣的云廠家,而非選擇自建數(shù)據(jù)中心。
原因很簡單,可以總結(jié)為四點(diǎn):
1:超節(jié)點(diǎn)在提升性能的同時(shí),也有更大的算力規(guī)模,自建的話一次性投入成本高,而在使用云服務(wù)時(shí),你既可以選擇租用一個超節(jié)點(diǎn),也可以選擇只租用超節(jié)點(diǎn)的一部分,相比自己購買更為靈活。
2:超節(jié)點(diǎn)更為復(fù)雜的技術(shù)架構(gòu)也意味著對運(yùn)維團(tuán)隊(duì)的技術(shù)能力要求更高,需要解決的各種故障和運(yùn)維問題更復(fù)雜,
對于一般企業(yè)而言,顯然沒有必要維持一個高成本的運(yùn)維專家團(tuán)隊(duì),還是直接把底層軟硬件的運(yùn)維和穩(wěn)定性直接交給云服務(wù)廠家比較簡單。
例如華為的昇騰云服務(wù)可以實(shí)現(xiàn)萬億參數(shù)模型長達(dá)40天的長穩(wěn)訓(xùn)練,遠(yuǎn)優(yōu)于業(yè)界平均無中斷2.8天的水平,故障實(shí)現(xiàn)從業(yè)界平均的60分鐘恢復(fù)縮短到10分鐘內(nèi)恢復(fù),不需要從頭重新訓(xùn)練。
3:現(xiàn)在國內(nèi)云服務(wù)廠家是算力節(jié)點(diǎn)在地理布局上已經(jīng)非常完善
例如華為云在全國就有3+N+X云數(shù)據(jù)中心,其中這個三是指內(nèi)蒙烏蘭察布,貴州貴安,安徽蕪湖三個最大的數(shù)據(jù)中心,部署了幾萬張昇騰卡的算力, 需要超節(jié)點(diǎn)服務(wù)時(shí)可以分鐘級開通昇騰云服務(wù),
而華為云其余N+X數(shù)據(jù)中心也是遍布全國,在服務(wù)時(shí)延和數(shù)據(jù)傳輸成本上都可以就近,從而得到低成本的良好體驗(yàn)。
4:國產(chǎn)AI硬件的進(jìn)步速度將會加速
這是我的一個判斷,因?yàn)閺?018年以來的七年,在美國在半導(dǎo)體領(lǐng)域的強(qiáng)力狙擊下,中國半導(dǎo)體產(chǎn)業(yè)不得不開始補(bǔ)短板,強(qiáng)基礎(chǔ)的艱難過程,因此國產(chǎn)硬件性能的進(jìn)步也放緩了。
而在七年后的今天,基礎(chǔ)實(shí)力已經(jīng)大大增強(qiáng),國產(chǎn)半導(dǎo)體生產(chǎn)設(shè)備,材料技術(shù)已經(jīng)不可同日而語,可以說有一種已經(jīng)在突破前夜的感覺。
以華為云為代表的國產(chǎn)超節(jié)點(diǎn)技術(shù)今年的率先商用,其他國內(nèi)廠家預(yù)計(jì)也遲早會跟進(jìn),因此可以預(yù)期的是國產(chǎn)AI硬件的技術(shù)進(jìn)步將會加速。
而選擇云服務(wù)則不會面臨技術(shù)快速進(jìn)步下,出現(xiàn)硬件過時(shí)的問題,
你需要多少算力云服務(wù)廠家就給你多少,你不需要去關(guān)心底層的硬件資源,這也省去了若自建可能會導(dǎo)致硬件資源因?yàn)檫^時(shí)而閑置的煩惱。
從目前的情況看,華為在外部壓力下,成功的實(shí)現(xiàn)了兩個重要的成果:
在國內(nèi)人工智能需求猛增的情況下確保了AI軟硬件基礎(chǔ)設(shè)施的交付,使得國內(nèi)的算力需求方可以快速的獲得華為云提供的算力服務(wù),避免了國內(nèi)的算力短缺,我們今天在國內(nèi)能夠大量的享受和使用各種AI應(yīng)用帶來的好處,華為是做了很大貢獻(xiàn)的;
另一個重要成果就是在實(shí)現(xiàn)了國內(nèi)AI基礎(chǔ)設(shè)施技術(shù)的持續(xù)進(jìn)步,今年華為云超節(jié)點(diǎn)技術(shù)的商用就讓國內(nèi)的算力基礎(chǔ)設(shè)施服務(wù)進(jìn)入了更高性能的時(shí)代。
而展望未來,我可以比較確定的說,超節(jié)點(diǎn)之后的下一次國產(chǎn)AI基礎(chǔ)設(shè)施技術(shù)的進(jìn)步,也會是來自華為。
熱門跟貼