黃仁勛將在北京時間下周三(3月19日)凌晨1點,在英偉達(dá)GTC2025的舞臺上發(fā)表主題演講。
英偉達(dá)的處境,與前兩年截然不同。2023年與2024年,英偉達(dá)的市值漲勢如破竹,接連跨越萬億和兩萬億里程碑。而如今,已經(jīng)從高點的3.6萬億美元跌至2.9萬億美元,震蕩不前。

市場更需要黃仁勛親自來一場鼓舞士氣的勝利演說,他要讓市場相信,AI重心轉(zhuǎn)向推理和應(yīng)用,數(shù)據(jù)中心的需求仍將高速增長;他要推出繼續(xù)引領(lǐng)的下一代GPU技術(shù)。
但黃仁勛也必須說清楚,越來越強(qiáng)大和數(shù)量眾多的開源小模型只需要一塊GPU就能跑起來,而且越來越多的平替產(chǎn)品在出現(xiàn),市場為什么還需要那么多GPU。有些問題他不便公開談?wù)?,但是更加不確定的地緣政治因素也是明擺著。
下一代GPU
無論是廠,,都在追加對數(shù)據(jù)中心的投資,一方面用于新的前沿模型的訓(xùn)練,一方面用于AI推理的規(guī)模落地。
換言之,AI算力的市場總量仍在增長。這至少不是一個壞消息。EpochAI認(rèn)為,到2030年前,基于算力增長的前沿模型訓(xùn)練的擴(kuò)展定律不會完全終結(jié)。但它給出了四個限制條件,產(chǎn)能、能效、網(wǎng)絡(luò)與數(shù)據(jù),都是基于歷史趨勢的。
前三個與英偉達(dá)息息相關(guān)。去年,Blackwell架構(gòu)芯片就因為設(shè)計問題良率不佳,產(chǎn)能爬坡緩慢,讓英偉達(dá)的投資者吃盡了苦頭。
黃仁勛很可能會在GTC大會上,展望新的加速計算的發(fā)展趨勢,并拿出英偉達(dá)下一代產(chǎn)品,包括Blackwell架構(gòu)的升級版,下一代Rubin架構(gòu)的AI芯片,或許還會稍微暗示下Rubin之后的時間線。英偉達(dá)還有一款代號Vera的服務(wù)器CPU,將要替代已經(jīng)用了4年的Grace。
他要用這些產(chǎn)品讓市場相信,,英偉達(dá)仍然主導(dǎo)算力的擴(kuò)展趨勢。
在英偉達(dá)最近一次財報會議上,黃仁勛已經(jīng)證實,將在今年下半年發(fā)售基于Blackwell Ultra的GB300系列。券商大行的分析師,已經(jīng)從供應(yīng)鏈處打探到,它搭載的HBM內(nèi)存帶寬更大,達(dá)到288GB,整體熱設(shè)計功耗(TDP)也將提升至1.4千瓦。去年至今初版Blackwell架構(gòu)的設(shè)計問題,沒有影響到Blackwell Ultra的進(jìn)展。
更高的內(nèi)存帶寬對推理更為友好,算力指標(biāo)雞肋的H20仍受到中國企業(yè)追捧,很大一個原因,就是它搭載了中國目前尚無法量產(chǎn)的HBM3。同時,伴隨推理需求占比的提升,GB300將繼續(xù)往低精度方向擴(kuò)展,F(xiàn)P4精度下性能比B200提升50%。
幾乎可以確定,全新的Rubin架構(gòu)將得以隆重介紹。它是推動2026年英偉達(dá)業(yè)績增長的關(guān)鍵產(chǎn)品。英偉達(dá)的客戶及投資者,都期盼著聽到關(guān)于它的性能參數(shù)、配置方案及量產(chǎn)時間表。它可能采用臺積電的N3工藝。與其配置在一起的Vera,即下一代ARM架構(gòu)的CPU,很可能也是N3工藝。Rubin架構(gòu)的量產(chǎn)時間可能提前至最快2025年年末,但大規(guī)模發(fā)貨最早也要等到2026年二季度。
黃仁勛在最近一次財報會議上還提到了后Rubin時代。它可能是新的代號,也可能是Rubin Ultra。也許這次會透露一二。
黃仁勛還可能在GTC上印證幾則傳言。有關(guān)英偉達(dá)NVL288機(jī)架的消息已經(jīng)流傳已久。去年10月,市場就開始討論英偉達(dá)將向單個機(jī)柜塞進(jìn)288張GPU。從機(jī)柜間互聯(lián)的超大規(guī)模集群,轉(zhuǎn)向機(jī)柜內(nèi)強(qiáng)互聯(lián)的超節(jié)點(intra-rack),能提升性能及空間效率,被視為英偉達(dá)針對大模型從訓(xùn)練向推理轉(zhuǎn)型的調(diào)整。但單機(jī)架GPU密度的提升,進(jìn)一步提高了對電源與散熱的要求。
機(jī)構(gòu)還關(guān)注英偉達(dá)的CPO(共封裝光學(xué))路線圖。它有助于提高帶寬、降低延遲并減少功耗。但是,摩根大通認(rèn)為它對英偉達(dá)財務(wù)數(shù)據(jù)的影響,至少要等到2027年之后。
講好智能體與機(jī)器人故事
自ChatGPT發(fā)布以來,來自數(shù)據(jù)中心AI芯片的收入,是英偉達(dá)一次次超越市場預(yù)期的主要貢獻(xiàn)者。黃仁勛需要證明,英偉達(dá)數(shù)據(jù)中心業(yè)務(wù)還將繼續(xù)爆發(fā),其他業(yè)務(wù)部門也正處于跨越鴻溝的階段。否則,市場對其業(yè)績的驚喜,即將耗盡。

在CES2025上,黃仁勛已經(jīng)搬出了“救兵”:繼生成式AI之后,智能體AI(Agentic AI)與物理AI(Physical AI)正在到來。
按OpenAI的框架,我們處于的階段。在數(shù)字環(huán)境中持續(xù)自主行動的多模態(tài)的AI智能體將越來越多,最終,成為幫助完成工作的組織者。AI自身是可以通過“智能體”的方式無限增殖的,智能體之間的交互將創(chuàng)造近乎無限的算力需求。
幾個月前,英偉達(dá)發(fā)布了智能體AI相應(yīng)的開發(fā)套裝。這次,黃仁勛需要兌現(xiàn)更多。
這還只是面向數(shù)字世界的算力需求。能在工業(yè)和住宅等現(xiàn)實世界環(huán)境中執(zhí)行各種物理任務(wù)的通用機(jī)器人,將真正通往AGI。
幾個月前,黃仁勛,并發(fā)布了自己的Cosmos世界基礎(chǔ)模型(WFM)系列。此間,市場一直傳言它與臺灣機(jī)器人相關(guān)供應(yīng)鏈往來密切。今年,英偉達(dá)還與卡內(nèi)基梅隆大學(xué)(CMU)合作,拿宇樹科技的G1人形機(jī)器人模仿C羅、科比與詹姆斯的經(jīng)典動作。該公司旗下GEAR實驗室聯(lián)合創(chuàng)始人兼GR00T項目負(fù)責(zé)人Jim Fan戲稱,2030年人形機(jī)器人奧運(yùn)會肯定很精彩。
機(jī)器人仍然需要強(qiáng)大的端側(cè)算力。谷歌最近發(fā)布的,就是因為本地算力不足,蒸餾成Gemini Robotics,但是這個視覺語言動作模型(VLA)的主干,仍然只能部署于云端,本地僅部署了動作解碼器。去年,英偉達(dá)公開了Jetson Thor,這是一款專為機(jī)器人打造的基于Blackwell架構(gòu)的端側(cè)芯片,原定今年上半年上市。自動駕駛也是如此,汽車是裝了四個輪子的機(jī)器人。
還有端側(cè)算力。越來越多開源模型的性能,接近前沿閉源模型水平。最新發(fā)布的谷歌”,目前非推理開源模型第一。類似谷歌這樣能在多種硬件平臺高效運(yùn)行的大模型將越來越多,進(jìn)一步降低開發(fā)者對英偉達(dá)高端GPU的依賴。
隨著Meta的Llama 4、阿里QwQ-Max、DeepSeek的R2開源,端側(cè)算力生態(tài)位的爭奪也將日趨激烈。黃仁勛2個月前發(fā)布的個人桌面超級計算機(jī)Project Digits,已經(jīng)了。前者只能本地運(yùn)行2000億參數(shù)規(guī)模的大模型,后者已經(jīng)可以驅(qū)動6000億參數(shù)大模型了,幾乎就是滿血版R1的體量。
英偉達(dá)平替版涌現(xiàn)
目前,英偉達(dá)的AI芯片仍是全球云巨頭爭搶的對象,尤其是用于訓(xùn)練,除了谷歌自用的TPU外,目前沒有與之匹敵的規(guī)模部署的替代。但未來可不一定。
Meta正在測試第一顆自主研發(fā)的AI訓(xùn)練芯片,也屬于MTIA系列。此前,Meta已經(jīng)推出了。據(jù)路透的消息,這款訓(xùn)練芯片已經(jīng)開始小規(guī)模部署測試,預(yù)計2026年前投入使用。這款芯片很可能是RISC-V構(gòu)架芯片,比英偉達(dá)GPU更節(jié)能,還配備了HBM3或HBM3e內(nèi)存。博通與臺積電是Meta的合作伙伴。
博通已經(jīng)成為平替版的英偉達(dá)。該公司在定制AI芯片領(lǐng)域已經(jīng)擁有三家大客戶,讓其有底氣喊出了至多900億美元的需求市場總量。在最近的財報電話會議上,博通透露可能再增加四家大客戶,其中兩家接近為其帶來收入。市場推測其中一家就是計劃研發(fā)AI服務(wù)器芯片的蘋果。
博通正在擴(kuò)展產(chǎn)能,尤其是先進(jìn)制程的2nm與3.5D封裝技術(shù),以及適配50萬卡級別集群的技術(shù)。目前,博通定制芯片仍然多數(shù)服務(wù)于訓(xùn)練,但該公司稱,隨著推理占比的提升,ASIC和FPGA等可以在特定應(yīng)用場景中找到機(jī)會,自己的市場占有率將進(jìn)一步提升。
英偉達(dá)周圍還有一眾初創(chuàng)芯片企業(yè)追兵。DeepSeek激活了市場對它們“最快”推理芯片的需求。它們也終于可以因此回點血,活下去繼續(xù)競爭了。每次DeepSeek與Qwen開源最新模型,Groq總是最積極部署,主打就是一個快。Cerebras也聲稱在R1發(fā)布后,公司迎來了“有史以來最大的服務(wù)需求高峰之一”。該公司正在沖刺上市,在其招股書中,它宣告自己打破了摩爾定律。

(來源:Cerebras招股書)
競爭可能蠶食部分增量市場。巴克萊(Barclays)分析師估計,未來兩年,用于“前沿人工智能”推理的資本支出,將超過訓(xùn)練支出,從2025年的1226億美元,躍升至2082億美元。
但在AI推理占比大幅提升后,英偉達(dá)不再具備稀缺性的溢價,毛利率將進(jìn)一步承壓。而且,更多的競爭對手涌入,也有可能影響到對CoWoS等上游產(chǎn)能的爭奪,進(jìn)一步提升其成本。最近一個季度,英偉達(dá)毛利率為73%,較上季度下降3個百分點,據(jù)其業(yè)績指引,下季度可能進(jìn)一步收縮至70%。
英偉達(dá)的加速計算還有遠(yuǎn)憂。2月,微軟推出拓?fù)淞孔有酒?;該公司量子硬件副總裁切坦·納亞克(Chetan Nayak)承諾,一臺原型容錯量子計算機(jī)將在“幾年內(nèi),而非幾十年內(nèi)”問世。谷歌CEO桑達(dá)爾·皮查伊(Sundar Pichai)則預(yù)測5到10年內(nèi)人類將獲得“實際有用”的量子計算。
這比黃仁勛在年初預(yù)測的快得多。年初,他回答分析師表示,“量子計算不能解決所有問題。如果說15年后就會出現(xiàn)非常有用的量子計算機(jī),那可能為時尚早?!彼J(rèn)為20年比較讓人信服。但是,量子計算公司D-Wave的CEO艾倫·巴拉茲直言,黃仁勛對量子計算的看法“大錯特錯”。
英偉達(dá)為GTC安排了一個“量子日”,在此期間,它將邀請來自該領(lǐng)域知名公司的高管來“繪制有用的量子應(yīng)用之路”。也許,黃仁勛會繼續(xù)在演講中闡明自己對下一代計算的看法。
塌陷的地緣市場
去年此時,英偉達(dá)就對,及自身業(yè)務(wù)的脆弱性憂心忡忡。DeepSeek的橫空出世震驚了硅谷與華爾街。盡管黃仁勛斷言,這對英偉達(dá)是利好,將推動AI應(yīng)用規(guī)模落地,但英偉達(dá)面對的現(xiàn)實將會更加復(fù)雜。
受制于“芯片禁令”與,它的芯片市場空間在多國受到擠壓,包括中國,也包括東盟或中東等“第二類”國家或經(jīng)濟(jì)體。這短期內(nèi)影響了它的收入規(guī)模,長期內(nèi)有可能逐步退出市場。
市場一直都在流傳美國將禁售H20芯片。目前包括騰訊、阿里巴巴、百度、字節(jié)跳動等中國科技巨頭,都在大幅增加H20的訂單。一方面是出于對DeepSeek帶動的推理算力的需求,阿里巴巴就認(rèn)為“AI爆發(fā)遠(yuǎn)超預(yù)期”,承諾未來三年內(nèi)投入過去十年的資本開支,超過520億美元。另一方面就是在禁令出臺前,多多囤貨。
美國政府相信禁令有效,且會持續(xù)生效。美國知名智庫戰(zhàn)略與國際研究中心(CSIS)最近發(fā)布的一份報告稱,。前拜登政府的AI政策顧問本·布坎南(Ben Buchannan)稱,芯片管控至關(guān)重要,,進(jìn)一步限制DeepSeek的發(fā)展。
黃仁勛心里肯定暗罵這種短視的看法。2023年,芯片戰(zhàn)初起時,黃仁勛就喊話稱,不能低估中國在芯片行業(yè)追趕的能力,擔(dān)心出口禁令會讓中國創(chuàng)造出人工智能軟硬件的獨立生態(tài)。2024年,英偉達(dá)列舉了五個領(lǐng)域的競爭對手,。今年,DeepSeek的出現(xiàn),將進(jìn)一步加劇英偉達(dá)在中國市場的競爭壓力。
目前,DeepSeek針對的。如果進(jìn)一步限制它獲取英偉達(dá)的AI芯片,那么,DeepSeek極限壓榨AI算力的軟硬件優(yōu)化能力,有望向國產(chǎn)算力廠商釋放,。未來,將從中誕生英偉達(dá)不可忽視的競爭對手,甚至出海擠占英偉達(dá)在美國以外的市場。
英偉達(dá)面向全球市場的AI芯片,已經(jīng)從A100歷經(jīng)H100、B100,即將迎來R100;而中國可以合法獲取的,仍停留在H20時代。在英偉達(dá)即將發(fā)布全新Rubin架構(gòu)AI芯片的時候,中國市場還沒有聽到一句有關(guān)上一代的B20的消息。
如果黃仁勛無法給出讓市場信服的回復(fù),無法描繪下一個one more thing,英偉達(dá)的股價將迎來新一輪震蕩。
熱門跟貼