這幾天對我來說最大的新聞,就是當(dāng)?shù)貢r間12月2日美國大幅擴大對中國半導(dǎo)體產(chǎn)業(yè)鏈企業(yè)封鎖,包括大批中國半導(dǎo)體生產(chǎn)設(shè)備企業(yè)的140家企業(yè)被新列入了實體清單。感覺美國的“小院高墻”政策,在半導(dǎo)體領(lǐng)域并不成立,而是在走向?qū)χ袊雽?dǎo)體企業(yè)全面封鎖。

尤其是北方華創(chuàng), 盛美半導(dǎo)體,拓荊科技,芯源微等生產(chǎn)設(shè)備企業(yè)也上了清單, 北方華創(chuàng)一直是我最喜歡的企業(yè),可能是因為2019年以來這是我賺最多錢的一支股票的緣故。

我國四大行業(yè)協(xié)會罕見的同一時間(巧了,都在12月3日下午五點多)發(fā)聲反對,包括中國互聯(lián)網(wǎng)協(xié)會、中國汽車工業(yè)協(xié)會、中國半導(dǎo)體行業(yè)協(xié)會、中國通信企業(yè)協(xié)會。

而且措辭風(fēng)格都還比較相似,都不約而同的、也是歷史上第一次明確提到了美國芯片不再安全可靠,建議中國企業(yè)謹(jǐn)慎采購。

我對比了下以前我國行業(yè)協(xié)會的反應(yīng),可以說在措辭上大不相同,這是頭一次出現(xiàn)建議謹(jǐn)慎采購美國芯片的說法,以前發(fā)的聲明在對美措辭上要柔和的多,可見國內(nèi)行業(yè)從業(yè)者的自信心這幾年增強了。

從2018年的中興事件開始,這些年美國在半導(dǎo)體產(chǎn)業(yè)方面和中國全面脫鉤的趨勢是明確的。

我想最后最大的原因還是,人工智能技術(shù)是現(xiàn)在和未來人類社會和經(jīng)濟發(fā)展最大的變量,是會影響千行百業(yè)的技術(shù),會極大的改變?nèi)祟惿鐣拿婷玻?/strong>而半導(dǎo)體又是為人工智能提供算力的底層技術(shù)之一。

而我國各界對于美國的制裁加碼,反應(yīng)已經(jīng)越來越淡定,而這正是因為我國對此已經(jīng)有可以應(yīng)對的解決辦法。

說到這里,我又不得不提起華為了,原因很簡單, 華為是目前國內(nèi)唯一一家可以提供從芯片,操作系統(tǒng),AI框架,網(wǎng)絡(luò)(網(wǎng)卡,交換機),存儲等全套自主研發(fā)AI算力基礎(chǔ)設(shè)施的廠家。

而且在可見的將來,我覺得國內(nèi)也很難出現(xiàn)第二家做到這一點。

面對美國不斷在半導(dǎo)體領(lǐng)域加大封鎖, 華為公司的輪值董事長徐直軍,就 在2024年9月19日的華為全聯(lián)接大會2024上做主題發(fā)言中講述了華為如何應(yīng)對:

首先認(rèn)為要面對現(xiàn)實,國產(chǎn)芯片在相當(dāng)長時間內(nèi)先進性將受到制約,這是中國打造算力解決方案必須面對的挑戰(zhàn)。

打開網(wǎng)易新聞 查看精彩圖片

然后華為認(rèn)為人工智能正在成為主導(dǎo)性算力需求,需要的是系統(tǒng)算力,而不僅僅是單處理器的算力。這是包括華為在內(nèi)的國產(chǎn)算力供應(yīng)商的一個機遇。

而華為在這方面的戰(zhàn)略核心是,基于實際可獲得的芯片制造工藝,計算、存儲和網(wǎng)絡(luò)技術(shù)協(xié)同創(chuàng)新,開創(chuàng)計算架構(gòu),打造“超節(jié)點+集群”系統(tǒng)算力解決方案,長期持續(xù)滿足算力需求

華為的這個“超節(jié)點+集群”是什么意思呢?

在算力中心里面,單臺服務(wù)器就叫做節(jié)點,而算力中心一定是幾百臺上千臺甚至可能更多的服務(wù)器節(jié)點組成的,那對于算力中心來說,算力的瓶頸就不只是單臺服務(wù)器節(jié)點的能力了,大規(guī)模節(jié)點之間的穩(wěn)定和高速的通信就變得很重要了。

而通信則是華為的強項,因此如果通過華為擅長的高速互聯(lián)通信技術(shù),把多個節(jié)點視為一個超節(jié)點,在超節(jié)點內(nèi)部的各個節(jié)點之間實現(xiàn)高速度互聯(lián),可以有效地提升訓(xùn)練效率,還能減少各種故障發(fā)生。

而多個超節(jié)點,就又能組成集群了。

如何讓集群發(fā)揮最大功效,這里不得不提華為又一個聰明之處,就是集群裝上“指揮大腦”,華為用自研的瑤光智能云腦對云上資源進行多遠(yuǎn)算力統(tǒng)一建模,靈活調(diào)度組合,按需提供給應(yīng)用。

也就是說,不管是存儲服務(wù)器也好,計算服務(wù)器的NPU芯片也好,CPU芯片也好,還是服務(wù)器的內(nèi)存也好,還是不同的服務(wù)器之間也好,互相之間都支持高速通信,速度從以前的百GB/s級別達到TB/s級別。

另外,不只是通信,超節(jié)點集群內(nèi)部的各種資源都可以統(tǒng)一快速的智能調(diào)度,訓(xùn)練和推理需要內(nèi)存就分配內(nèi)存資源,需要算力就分配NPU芯片資源,需要存儲就分配存儲硬盤資源,實現(xiàn)統(tǒng)一調(diào)配。

這就讓我想起了拿破侖說過的:

“兩個馬木留克兵可以對付三個法國兵,因為馬木留克兵武器更好、馬匹更好、訓(xùn)練更好,擁有兩雙手槍、一支喇叭槍、一支馬槍、一頂有面甲的頭盔、一副鎖子甲、幾匹戰(zhàn)馬以及幾個步行仆役。但100名法軍騎兵無需害怕100名馬木留克兵,300法國兵就足以戰(zhàn)勝300個馬木留克兵,而1000個法國兵就總能打敗1500個馬木留克兵:戰(zhàn)術(shù)、隊形和隊形變換的影響實在是太大了!”

預(yù)計明年,華為云基于CloudMatrix全新架構(gòu)的昇騰AI云服務(wù)將正式商用,用的就是這個思路。

實際上華為云經(jīng)過這幾年的努力,打造的昇騰AI云服務(wù)就已經(jīng)在國內(nèi)向大量企業(yè)提供了大規(guī)模的AI算力。華為云分別在內(nèi)蒙的烏蘭察布,安徽的蕪湖,貴州的貴安,以及香港建成了四大AI算力中心集群。

像如果是華東地區(qū)的企業(yè)上AI推理應(yīng)用,可以就近通過昇騰云接入到蕪湖的算力中心,時延可以低至10ms。

這是華為將自己多年來打造的全自研獨立自主技術(shù),為全社會提供安全可靠的算力服務(wù),支撐中國人工智能產(chǎn)業(yè)的發(fā)展。

下圖就是華為云今年六月在蕪湖落成的智算中心,10ms時延專線直達華東六省一市及華中(湖南、湖北、江西)20多個熱點城市。

打開網(wǎng)易新聞 查看精彩圖片

我們都知道自從2022年11月30日ChatGPT發(fā)布后,中國接著在2023年也迎來了大模型的大爆發(fā),誕生了幾百個大模型,其中有不少就跑在昇騰云上面。

像騰訊音樂2024年9月發(fā)布的Muselight大模型就是在昇騰云上運行。這個大模型可以能夠輔助音樂人進行旋律構(gòu)思、和聲編排以及歌詞撰寫等,還能對聽歌的用戶實現(xiàn)更加精準(zhǔn)的個性化推薦,以及對音樂通過元素分析進行版權(quán)評估等。

同樣在今年9月順豐發(fā)布的豐語大模型也跑在昇騰云上面??爝f小哥不少是新員工,即使是老員工也有不少專業(yè)事情搞不清楚,比如寄國際快遞某項物品是否符合規(guī)定,不同價格的寄送時效等等,有了大模型能力加持,小哥直接在順豐自己的APP上問,馬上就能得到專業(yè)的回答,大大提升了工作效率。

華為云昇騰AI云服務(wù)為了能為國內(nèi)的幾百個大模型提供算力,已經(jīng)對一百多個主流大模型都做了適配,企業(yè)在用的大模型如果算力不夠,可以遷移到昇騰云上面。

在2024年12月的今天,人工智能的應(yīng)用已經(jīng)深入到了我們生活的方方面面,我們已經(jīng)在主動和被動的大量使用人工智能技術(shù),只是我們并沒有有意的去總結(jié)和察覺。

我認(rèn)為每個人,每個公司都要開始自己的AI轉(zhuǎn)型。

我這里總結(jié)我日常生活會用到的10個人工智能高頻場景(主動或被動),從中可以一窺各行各業(yè)的智能化速度:

1:我開車會使用汽車的自動駕駛,這對應(yīng)的是汽車行業(yè)智能化。

2:給孩子批改作業(yè)和輔導(dǎo)作業(yè),會利用AI技術(shù),如下圖。這對應(yīng)的是教育行業(yè)智能化。

打開網(wǎng)易新聞 查看精彩圖片

3:車牌識別,這背后是政務(wù)智能化和汽車服務(wù)業(yè)智能化。

4:人臉識別,比如我線上辦證,進公司大樓,機場的閘機等。這對應(yīng)的是政務(wù),金融智能化和公司園區(qū)智能化。

5:手機的輸入法,直接語音轉(zhuǎn)化為文本,這對應(yīng)的是手機智能化。

6:每天打開手機,資訊和購物APP會自動推薦感興趣的內(nèi)容,這是屬于被動的使用AI。這對應(yīng)的是互聯(lián)網(wǎng)行業(yè)智能化。

7:每天接到的電話尤其是銀行的電話,不少是AI客服打過來的。這對應(yīng)的是客服場景智能化。

8: 最近幾個月,我很愛在開車的時候聽各種AI生成的歌曲,例如AI模仿孫燕姿的聲音唱各種周杰倫的歌,被廣大網(wǎng)友認(rèn)為是AI的神作。

這和上面使用昇騰云服務(wù)的騰訊音樂一樣,對應(yīng)的是音樂行業(yè)智能化。

9:AI翻譯功能,例如在手機上長按圖片自動翻譯,這對應(yīng)的是翻譯行業(yè)智能化。

10:使用AI助理,有問題問AI。

除了這10個高頻場景外, 我喜歡周末去爬山,看到不認(rèn)識的植物直接拍照就能識別出是什么名字以及詳細(xì)資料。

另外現(xiàn)在各種無人機表演也很多,甚至可以上萬架協(xié)同表演,也是應(yīng)用了人工智能技術(shù),我還特地帶娃去看無人機表演,這對應(yīng)的是無人機智能化。

對中國的千行百業(yè)來講,智能化已經(jīng)是必由之路,而向華為云這樣的算力供應(yīng)商購買算力服務(wù)是個很好的選擇。

在2023年底,中國光是規(guī)模以上工業(yè)企業(yè)都高達50.1萬家,如果所有行業(yè)加起來規(guī)模以上工業(yè)企業(yè)估計超過百萬家。

我個人認(rèn)為這里面99%以上的企業(yè)都需要在外部采購算力服務(wù),能完全靠自建算力滿足自身需求的企業(yè)是極少數(shù)。

并不是每個企業(yè)都要自己建設(shè)大規(guī)模AI算力,像AI芯片硬件迭代速度很快,自建不僅成本高,而且如果你沒有做超節(jié)點和集群的能力,單純只是買AI服務(wù)器硬件,那么過一兩年在性能上可能就落后了;

而且算力中心里面往往是多個代際的硬件在跑,導(dǎo)致資源調(diào)度復(fù)雜度高,如果沒有專業(yè)的廠家來做資源調(diào)度,可能因為歷史代際產(chǎn)品的“木桶短板”效應(yīng),拖累新一代產(chǎn)品性能的充分發(fā)揮,影響大模型訓(xùn)練的能力,不僅如此多代際產(chǎn)品共存還導(dǎo)致運營維護很困難。

另外從基礎(chǔ)大模型這兩年的發(fā)展看,大模型的訓(xùn)練需要越來越多的高質(zhì)量數(shù)據(jù),預(yù)訓(xùn)練數(shù)據(jù)量已經(jīng)進入10萬億tokens量級。

而且大模型參數(shù)量也在持續(xù)增大,帶來的是訓(xùn)練成本升高,這就導(dǎo)致能玩得起大模型訓(xùn)練的廠家在以后會越來越少,大部分企業(yè)未來將會聚焦自身業(yè)務(wù),而去采購業(yè)界巨頭公司訓(xùn)練的大模型。

在這樣一個趨勢下,各大廠商也在不斷的在技術(shù)上升級自己提供的算力服務(wù),以滿足中國千行百業(yè)智能化的需要。

上文我提到過,昇騰云預(yù)計將在明年商用的Cloudmatrix架構(gòu),就踐行了超節(jié)點+集群的理念。

在算力中心里面,一切資源(CPU,NPU,內(nèi)存)可池化,一切可對等連接,一切可進行組合,極大的提升效率,極大的提升可靠性。

這就像一個大公司打破了管理的部門墻,可以任意的讓不同的員工組合成一個優(yōu)秀的團隊。

華為內(nèi)部用盤古大模型做了測試,使用同樣的模型,在CloudMatrix架構(gòu)下稠密模型訓(xùn)練效率可提升20%,而稀疏模型訓(xùn)練效率可提升60%,在推理場景性能也能提高30%,這就彌補了在單顆芯片制程上落后英偉達的不足。

大模型訓(xùn)練時,并不像我們想象的那樣會一直從0%-100%,只需要等待即可,而是會不斷的中斷。

今年7月份,Meta 在一份研究報告中揭示了訓(xùn)練他們的Llama 3 (4050億參數(shù))模型遇到的問題:該系統(tǒng)在包含 16384 個 Nvidia H100 GPU 的集群上運行,在訓(xùn)練期間平均每三個小時就發(fā)生一次故障, 54 天內(nèi)經(jīng)歷了 419 次意外故障。

這充分體現(xiàn)了上萬張訓(xùn)練卡一起運行時的巨大挑戰(zhàn)。

而華為云持續(xù)優(yōu)化昇騰 AI 云服務(wù),目前已經(jīng)實現(xiàn)將萬億參數(shù)模型的訓(xùn)練無中斷時長從 2.8 天提升至 40 天,并將集群故障恢復(fù)時間從 60 分鐘縮短至 10 分鐘,這表明在優(yōu)秀的集群架構(gòu)下,國產(chǎn)算力中心的可靠性完全可以達到甚至超過英偉達的水平。

另外,針對大模型訓(xùn)練的數(shù)據(jù)安全,華為云還采用了數(shù)據(jù)傳輸與存儲加密、數(shù)據(jù)安全清除、數(shù)據(jù)訪問控制、數(shù)據(jù)水印防泄漏等多重技術(shù),確保大模型訓(xùn)練數(shù)據(jù)的全生命周期安全。

AI實際上已經(jīng)滲透到我們生活的各個方面,中國各個行業(yè)都在不斷的引入和使用AI,用來提升效率,并引起經(jīng)濟,軍事和社會變革,而率先變革的國家將對后來者形成巨大優(yōu)勢。

例如自動駕駛的全面普及,將會影響數(shù)百萬出租車司機,滴滴司機,公交車司機,大巴車司機的工作崗位;

個人AI助理逐漸普及,在逐漸沖擊谷歌和百度這樣傳統(tǒng)搜索引擎的份額。

AI如此重要,也無怪乎美國人將此作為主要封鎖點,美國在半導(dǎo)體行業(yè)進行封鎖后,國內(nèi)還有華為昇騰云能提供全棧國產(chǎn)并且效率和可靠性都不錯的算力服務(wù),已經(jīng)實屬難得。

國內(nèi)各行各業(yè)共同將國產(chǎn)的算力生態(tài)不斷壯大,相信未來總有最終徹底沖破封鎖的一天。