DeepSeek爆火至今,有人說,現(xiàn)在華為每年的研發(fā)投入已經(jīng)超過1600億了,為什么卻沒有做出類似于深度求索(DeepSeek)的通用人工智能模型?
客觀地說,這是好問題。但更關(guān)鍵的是,這一現(xiàn)象背后折射出科技巨頭與初創(chuàng)企業(yè)不同的戰(zhàn)略選擇和技術(shù)邏輯。

一、戰(zhàn)略定位
華為的人工智能布局以“業(yè)務(wù)協(xié)同性”為核心,其盤古大模型聚焦礦山、氣象、金融等垂直領(lǐng)域。
例如,礦山場景中通過AI實現(xiàn)井下設(shè)備智能調(diào)度,氣象領(lǐng)域完成全球7天預(yù)報僅需10秒。這種“產(chǎn)業(yè)AI”路徑需要與昇騰芯片、5G基站等硬件深度適配,而非追求通用模型的技術(shù)指標。
相比之下,DeepSeek作為初創(chuàng)企業(yè)選擇通用人工智能(AGI)賽道,通過MoE架構(gòu)等技術(shù)突破快速建立行業(yè)標桿地位。其戰(zhàn)略更類似于OpenAI早期階段,以技術(shù)創(chuàng)新直接沖擊市場認知。
二、技術(shù)路線的差異
在模型架構(gòu)選擇上,華為傾向于“稠密模型”,這類模型參數(shù)規(guī)模相對可控,更適配工業(yè)質(zhì)檢、網(wǎng)絡(luò)優(yōu)化等具體場景的算力條件。例如在手機端側(cè)部署的NPU芯片,就需要輕量化AI模型保障實時響應(yīng)。
而DeepSeek V3采用的“稀疏MoE架構(gòu)”,通過動態(tài)激活神經(jīng)元模塊實現(xiàn)參數(shù)規(guī)模突破,但同時也帶來訓(xùn)練成本指數(shù)級增長(單次訓(xùn)練費用或超千萬美元)。這種技術(shù)路線對資源有限的商業(yè)公司存在較高風(fēng)險。
三、全域作戰(zhàn)vs單點突破
華為的研發(fā)投入分布在“六大核心領(lǐng)域”:芯片(麒麟/昇騰)、操作系統(tǒng)(鴻蒙)、通信技術(shù)(5G/5G-A/6G)、云計算、智能網(wǎng)聯(lián)汽車、人工智能。
2024年僅芯片研發(fā)就耗資超300億元,鴻蒙系統(tǒng)生態(tài)建設(shè)投入超200億元。這種多線作戰(zhàn)模式導(dǎo)致AI研發(fā)投入占比不足總預(yù)算的15%。
而DeepSeek這類初創(chuàng)公司,可將“90%以上資源”集中投入模型創(chuàng)新,甚至通過開源策略(如DeepSeek-R1)快速構(gòu)建開發(fā)者生態(tài)。這種“壓強式投入”使初創(chuàng)企業(yè)在特定技術(shù)點實現(xiàn)突破成為可能。
四、商業(yè)邏輯的差異
華為的AI商業(yè)化路徑依賴“企業(yè)服務(wù)閉環(huán)”,其技術(shù)需滿足運營商、制造業(yè)客戶對穩(wěn)定性、可解釋性的嚴苛要求。例如在智慧城市項目中,AI算法誤報率必須控制在0.01%以下。這種強約束條件限制了前沿技術(shù)的快速應(yīng)用。
DeepSeek則采用“模型即服務(wù)(MaaS)模式”,通過API接口或開源社區(qū)直接觸達開發(fā)者,其技術(shù)優(yōu)勢可快速轉(zhuǎn)化為行業(yè)影響力。這種輕量化商業(yè)路徑更適配技術(shù)驅(qū)動型創(chuàng)新。
五、組織機制的制約
華為的研發(fā)體系具有“強流程管控”特征,從技術(shù)預(yù)研到產(chǎn)品落地需經(jīng)歷超20個評審節(jié)點,單個AI模型的研發(fā)周期普遍在18個月以上。
而DeepSeek等初創(chuàng)公司采用“小步快跑”模式,重要技術(shù)決策可在48小時內(nèi)完成。
這種差異在人才管理層面尤為顯著:華為研發(fā)人員需遵守嚴格的保密制度和流程規(guī)范,而DeepSeek等企業(yè)提供零食區(qū)、彈性工作制等創(chuàng)新友好型環(huán)境。組織機制的靈活性直接影響技術(shù)迭代速度。
六、資源整合下的彎道超車
盡管短期內(nèi)在通用AI模型領(lǐng)域存在差距,但華為的“全棧技術(shù)儲備”具備后發(fā)優(yōu)勢。其昇騰910B芯片算力已達1024 TFLOPS,在建的武漢人工智能計算中心規(guī)劃算力達4000P。
若能將行業(yè)數(shù)據(jù)、硬件算力與工程能力深度整合,華為有望在智能駕駛、工業(yè)互聯(lián)網(wǎng)等特定領(lǐng)域?qū)崿F(xiàn)AI技術(shù)的場景化超越。
熱門跟貼