
北京時(shí)間3月19日凌晨,站在圣何塞GTC大會(huì)的舞臺(tái)上,連黃仁勛自己都調(diào)侃:GTC是AI屆的超級(jí)碗。

幾周以來,外界已經(jīng)對(duì)黃仁勛在GTC的演講萬分期待。這個(gè)演講可不好做,在DeepSeek的沖擊之下,英偉達(dá)今年的股價(jià)已經(jīng)下跌了12%。
這不再是發(fā)布新產(chǎn)品,高喊AI就是未來就可以完成任務(wù)的演講,今年,黃仁勛需要回答很多問題。
而這場(chǎng)持續(xù)了兩個(gè)半小時(shí)的演講也的確和往年有很大的不同,黃仁勛在一開始就花了很長(zhǎng)的時(shí)間去解釋為什么推理時(shí)代縮放定律沒有死、為什么英偉達(dá)依然非常重要。
而后,他不僅拿出了Blackwell的超大杯產(chǎn)品,還透露了下一代芯片,甚至下下代架構(gòu),時(shí)間一直蔓延到2028年。壓軸出場(chǎng)的,則和黃仁勛勾畫的AI發(fā)展路線圖中的最后一站“物理AI”相關(guān)。
黃仁勛拯救了英偉達(dá)股價(jià)嗎?至少從當(dāng)日來看,截至收盤英偉達(dá)股價(jià)跌了3.43%,總市值縮水至2.82萬億美元。
到底是市場(chǎng)還需要幾天時(shí)間消化,還是黃仁勛“游說”失敗,還得等等看。
演講要點(diǎn):
1、發(fā)布超大杯Blackwell Ultra,性能提升1.5倍。
2、下一代AI“超級(jí)芯片”Vera Rubin,計(jì)劃2026年底推出,并透露下下代芯片架構(gòu)為Feynman,計(jì)劃2028年推出。
3、AI工廠的操作系統(tǒng)Dynamo,推理框架,資源利用最大化,搭配Blackwell強(qiáng)上加強(qiáng)。
4、推出“AI超級(jí)電腦”DGX Spark、DGX Station,提高本地運(yùn)行大型AI模型的能力。
5、宣布網(wǎng)絡(luò)組件的最新動(dòng)作,推出Spectrum X和Quantum X交換機(jī)。
4、發(fā)布首個(gè)開放式人性機(jī)器人基礎(chǔ)模型Isaac GROOT N1;并宣布與谷歌DeepMind和迪士尼研究院合作開發(fā)Newton開源物理引擎。
01現(xiàn)場(chǎng)“開課”,
黃仁勛:你們真的都搞錯(cuò)了
自從號(hào)稱訓(xùn)練只用了幾百萬美元的DeepSeek推理模型問世,世界就沒有停止對(duì)英偉達(dá)的質(zhì)疑。
起先,黃仁勛不語。然后,他開始發(fā)聲,在采訪中和財(cái)報(bào)會(huì)議上表示推理時(shí)代仍然需要大量計(jì)算,仍然需要英偉達(dá)的力量。
這次,他終于把這點(diǎn)攤開揉碎地說明了一番。
在發(fā)布會(huì)上,老黃拿出例子,讓Llama3.3(LLM的代表)和DeepSeek R1(推理模型的代表)回答同一個(gè)問題:
“在我的婚禮上,需要7個(gè)人圍坐同一桌。我的父母和岳父岳母不能挨著坐。此外,我妻子堅(jiān)稱她在我左手邊的話,拍照更好看。同時(shí),我需要坐在伴郎身邊。我們?cè)趺窗才抛??如果我們邀?qǐng)牧師和我們坐一起呢?”
看完這個(gè)問題,大部分人可能已經(jīng)頭大了。要回答它,不僅要識(shí)別其中包含多少個(gè)不同的需求,還要同時(shí)滿足所有需求。有意思的是,最后又有一個(gè)進(jìn)一步的問題,需要先回答主問題再補(bǔ)充這個(gè)問題的答案。
Llama 3.3非常簡(jiǎn)單粗暴,回答得很快,只用了439個(gè)tokens。但是,它的回答并不正確,未能滿足所有要求。快、省但對(duì)于提問的人來說無用。
DeepSeek R1則反復(fù)思考,嘗試了很多可能,反復(fù)檢驗(yàn)答案,最終消耗了8559個(gè)tokens,才最終給出了答案。時(shí)間久,消耗大,但是給出的答案準(zhǔn)確。

而每一個(gè)token生成的背后,都是整個(gè)模型的加載。推理模型更復(fù)雜,也就需要更多地計(jì)算。DeepSeek R1的參數(shù)規(guī)模達(dá)到6800億,下一代有可能達(dá)到數(shù)萬億參數(shù)規(guī)模。
兩相對(duì)比,DeepSeek R1比Llama 3.3多生成了20倍的tokens,計(jì)算需求高出150倍。
“大模型推理是一種極限計(jì)算。”老黃表示。
通過這個(gè)對(duì)比,老黃很直觀地告訴大家:推理模型也許預(yù)訓(xùn)練的時(shí)候消耗少,但推理起來可是實(shí)打?qū)嵉奈皤F啊。英偉達(dá)GTC的官方博文中,把Tokens視為AI的語言和貨幣。
“去年,關(guān)于擴(kuò)展定律Scaling Law,全世界幾乎都預(yù)測(cè)錯(cuò)了?!崩宵S在臺(tái)上再次強(qiáng)調(diào)。他進(jìn)一步指出,如今擴(kuò)展定律從一個(gè)變成了三個(gè):預(yù)訓(xùn)練、后訓(xùn)練(微調(diào))和推理。

那英偉達(dá)在推理時(shí)代要做什么呢??jī)煞矫妫阂环矫?,讓芯片能在單位時(shí)間內(nèi)處理更多tokens,另一方面,讓單位算力的成本和能耗降低。
黃仁勛此前就在財(cái)報(bào)會(huì)議上表示,Blackwell就是為推理而生的,這次演講中在說清楚推理模型為什么需要更多算力之后,黃仁勛也拿出圖表,展開講了講這一點(diǎn)。
以Blackwell和Hopper做對(duì)比,都是1兆瓦功耗,Hopper數(shù)據(jù)中心每秒生成250萬tokens。Blackwell數(shù)據(jù)中心提高了25倍,如果是推理模型,則比Hopper好40倍。

這讓圖表中出現(xiàn)了一個(gè)向上鼓的曲線,這個(gè)曲線正是黃仁勛想讓各位AI制造商關(guān)注的“賺錢要點(diǎn)”。

黃仁勛稱,成本是AI輸出的token,收益就是用戶獲得的token。如果縱軸是前者,橫軸是后者,橫軸擴(kuò)張更多時(shí)——也就是收益比成本擴(kuò)張更多時(shí)——一個(gè)漂亮的利潤弧線就出現(xiàn)了。

為了強(qiáng)調(diào)Blackwell是為推理而生這一點(diǎn),老黃甚至不惜“拉踩”Hopper,稱:“當(dāng)Blackwell開始大量出貨的時(shí)候,就算你送Hopper,別人基本也不會(huì)要的?!?/p>
以前老黃總說,(英偉達(dá)AI芯片)買得越多越省錢,現(xiàn)在他更進(jìn)一步,告訴大家,買得越多越賺錢。
02 軟硬兼施,
Blackwell超大杯與“AI工廠操作系統(tǒng)”Dynamo
花了40分鐘講明白為什么英偉達(dá)依然能打,為什么說Blackwell是為推理而生之后,黃仁勛當(dāng)然還得說說新產(chǎn)品。
首先是Blackwell Ultra,專為AI推理時(shí)代而打造,Ultra的后綴大家也不陌生了,超大杯。
“我們專為這一刻設(shè)計(jì)了Blackwell Ultra,一個(gè)多功能平臺(tái),(利用它)可以高效地進(jìn)行預(yù)訓(xùn)練、后訓(xùn)練和推理。”
其中GB300 NVL72在一個(gè)機(jī)架規(guī)模設(shè)計(jì)中連接了72個(gè)Blackwell Ultra芯片,并包含36個(gè)基于Arm Neoverse的Grace CPU。較上一代性能提升1.5倍,與Hopper相比收入潛力提高50倍。還是以DeepSeek R1為例,老款Hopper運(yùn)行這個(gè)模型時(shí)每秒只能處理100 tokens,而GB300 NVL72每秒能處理1000 tokens。

這意味著用戶獲得回答的速度大大提高。
而HGX B300 NVL16系統(tǒng)相比于Hopper一代,推理速度提升11倍,計(jì)算能力提升7倍,內(nèi)存大4倍。
英偉達(dá)一直都有軟硬兼施的策略,此前也針對(duì)自家的芯片做了不少優(yōu)化(不過,DeepSeek的開源周展示的一些優(yōu)化甚至比英偉達(dá)還強(qiáng)),這次黃仁勛也同步官宣了開源推理框架Dynamo。
黃仁勛將之稱為“AI工廠的操作系統(tǒng)”。這樣說可能有點(diǎn)抽象,具體來說,Dynamo像一個(gè)交通指揮官,幫助GPU之間實(shí)現(xiàn)更好的通信。對(duì)思考和生成可以進(jìn)行獨(dú)立優(yōu)化,高效利用資源。如此一來,(還是回到演講開頭強(qiáng)調(diào)的token問題上)每秒就能產(chǎn)生更多token了。
不過,黃仁勛也表示,Hopper雖然也可以用Dynamo優(yōu)化,但是效果不會(huì)那么明顯。
為推理而生的Blackwell再加上為推理優(yōu)化而生的Dynamo,就是強(qiáng)上加強(qiáng),DeepSeek R1的吞吐量一下提高30倍。
03 下一代更好
2028年還不夠遠(yuǎn),黃仁勛勾勒AI發(fā)展路徑圖
除了現(xiàn)在,黃仁勛當(dāng)然還得談到未來。
英偉達(dá)下一代AI芯片Vera Rubin首次走到臺(tái)前,黃仁勛介紹,該名稱來源于天文學(xué)家Vera Rubin(以暗物質(zhì)研究著稱)。
其中CPU Vera內(nèi)容容量是前代的4倍多,內(nèi)存帶寬是前代的2倍多,而GPU Rubin講配備299GB的HRM4。
用老黃的話說就是“幾乎所有細(xì)節(jié)都是新的”。

這一代Grace Blackwell(GB)將在今年下半年發(fā)貨,Vera Rubin將在2026年下半年發(fā)貨。
黃仁勛也預(yù)告了Vera Rubin的超大杯,Rubin Ultra,對(duì)比GB300性能提升13倍,預(yù)計(jì)2027年下半年發(fā)貨。
除此之外,連Vera Rubin之后的下一代AI芯片架構(gòu)也被揭露,它被命名為Feynman,這個(gè)名字同樣取自于一位科學(xué)家,對(duì)量子計(jì)算領(lǐng)域有突出和貢獻(xiàn)的Richard Phillips Feynman。黃仁勛預(yù)告,F(xiàn)eynman甲溝將于2028年登場(chǎng)。
此外,值得注意的是,在演講一開始,黃仁勛給出了AI的發(fā)展路線圖,從2012年深度學(xué)習(xí)突破的起點(diǎn)AlexNet開始,經(jīng)歷Perception AI(感知AI,這個(gè)階段AI主要用于理解數(shù)據(jù),如識(shí)別語音、圖片等)、Generative AI(生成式AI,也就是現(xiàn)階段的以ChatGPT為代表的技術(shù))。

接下來,已經(jīng)看到苗頭的是Agentic AI(代理AI),從簡(jiǎn)單的數(shù)據(jù)生成到執(zhí)行任務(wù)。
而最終,AI的終極目標(biāo)是Physical AI(物理AI),實(shí)現(xiàn)從軟件到硬件、從虛擬到現(xiàn)實(shí)的跨越。讓AI具備物理行動(dòng)能力,如機(jī)器人和自動(dòng)駕駛技術(shù)的發(fā)展。
英偉達(dá)作為AI計(jì)算的核心玩家,顯然希望引領(lǐng)這一進(jìn)程。
對(duì)物理AI這部分的具體展開,在黃仁勛的此次演講中占比并不算高,但作為壓軸出現(xiàn),足見其重要程度。
舞臺(tái)上出現(xiàn)了《星球大戰(zhàn)》中的小機(jī)器人Blue,它在舞臺(tái)上走來走去、搖頭晃腦,看起來充滿好奇心,不得不說看起來就非常靈動(dòng)。

這個(gè)機(jī)器人搭載了英偉達(dá)Isaac GR00T N1,號(hào)稱是全球首個(gè)開源且完全可定制的人性機(jī)器人基礎(chǔ)模型。模型包含雙系統(tǒng)架構(gòu),一個(gè)系統(tǒng)負(fù)責(zé)快思考,另一個(gè)負(fù)責(zé)慢思考。據(jù)英偉達(dá)介紹,該模型能輕松掌握抓取、移動(dòng)等復(fù)雜人物。

與此同時(shí),黃仁勛還宣布正在與谷歌DeepMind和迪士尼研究院合作下一代開源仿真物理模型Newton,專為機(jī)器人開發(fā)而生。
“通用性機(jī)器人的時(shí)代已經(jīng)到來?!?/p>
04 老黃委屈,
英偉達(dá)推出好產(chǎn)品還遠(yuǎn)遠(yuǎn)不夠
英偉達(dá)的高速增長(zhǎng)也一直伴隨著“泡沫”擔(dān)憂,很長(zhǎng)的一段時(shí)間,這家公司不斷推出新的產(chǎn)品,但市場(chǎng)波動(dòng)時(shí)有發(fā)生。很多次財(cái)報(bào)發(fā)布時(shí),明明業(yè)績(jī)?nèi)€飄紅,黃仁勛也大表信心,股價(jià)還是會(huì)抖三抖。
“我們發(fā)了新東西,但人們立刻就會(huì)說,好,然后呢?這放在任何公司身上都不是正常都?!?/p>
這次,黃仁勛很少見地在GTC的舞臺(tái)上倒了點(diǎn)苦水:“這不是買個(gè)筆記本電腦”。他表示,這既需要計(jì)劃,也需要資源和人,規(guī)劃是以幾年為計(jì)的。
也許這也解釋了為什么黃仁勛這次演講持續(xù)了兩個(gè)半小時(shí)(去年不到兩小時(shí)),為什么他一口氣掏出這么多成果,為什么AI芯片連2028年的下下代都透底了,為什么在最后拿出了AI發(fā)展路徑的最后一站“物理AI”的最新成果。
老黃這次該講的、能講的都講了,盡力了。
至于人們還會(huì)不會(huì)問“然后呢”,他也管不了了。
歡迎在評(píng)論區(qū)留言~
如需開白請(qǐng)加小編微信:dongfangmark
熱門跟貼