打開(kāi)網(wǎng)易新聞 查看精彩圖片

中國(guó)科技迷口中“AI春晚”的說(shuō)法被黃仁勛蓋了個(gè)章。

今天凌晨,英偉達(dá)年度GPU技術(shù)大會(huì)(以下簡(jiǎn)稱:GTC)上,老黃開(kāi)場(chǎng)時(shí)直言,“去年GTC被稱為AI行業(yè)的‘伍德斯托克搖滾音樂(lè)節(jié)’,今年我們搬進(jìn)了體育場(chǎng)成為AI行業(yè)的‘超級(jí)碗’”。

這個(gè)“喜歡穿皮夾克、把事情重復(fù)三次的人”科技大佬,一口氣講了2個(gè)多小時(shí),介紹了Blackwell GPU、硅光交換機(jī)、機(jī)器人模型等一系列新產(chǎn)品。

他強(qiáng)調(diào),AI的發(fā)展已經(jīng)從生成式AI(Generative AI)邁向智能體AI(Agentic AI),后面將是影響物理世界的Physical AI。重點(diǎn)是,這一過(guò)程對(duì)算力的需求不僅不會(huì)下降,還會(huì)進(jìn)一步增長(zhǎng)。

被他用來(lái)解釋這點(diǎn)的,是一夜間讓英偉達(dá)市值蒸發(fā)3萬(wàn)億美元的DeepSeek。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

算力需求

將輕松超過(guò)現(xiàn)在的100倍

今年春節(jié)前后,橫空出世的DeepSeek就打破了英偉達(dá)引以為傲的“壁壘” 。與動(dòng)輒數(shù)億甚至上百億美元的國(guó)外大模型項(xiàng)目相比,DeepSeek以極低的算力成本完成了開(kāi)發(fā)。整個(gè)科技圈都在發(fā)問(wèn):“我們真的需要這么多GPU嗎?”

為了回答這個(gè)問(wèn)題,老黃刻意把新品發(fā)布的時(shí)間往后推,分享了自己對(duì)AI發(fā)展路徑的看法。

他將近些年和不久將來(lái)的AI進(jìn)化路線分成Perception AI(感知人工智能)、Generative AI(生成式AI)、Agentic AI(智能體)、Physical AI(具身AI)四個(gè)階段。目前,Agentic AI方興未艾。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

生成式AI階段多聚焦于理解,比如讓機(jī)器知道一段文字表達(dá)什么意思,以此來(lái)生成圖片、視頻,而Agentic AI階段更聚焦于推理,強(qiáng)調(diào)的是機(jī)器的自主性與復(fù)雜問(wèn)題解決能力,每一步都需要用到“模型推理”。

而后者對(duì)算力的需求要大很多。

為了解釋這點(diǎn),黃仁勛現(xiàn)場(chǎng)舉了一個(gè)例子:“在我的婚宴上,需要7個(gè)人圍著一張桌子坐,我的父母和岳父岳母不應(yīng)該坐在一起。而且,我媳婦堅(jiān)持說(shuō)她坐在我左邊照相時(shí)會(huì)更好看,但同時(shí)我需要坐在伴郎旁邊。我們這一輪怎么坐?如果我們邀請(qǐng)牧師和我們坐在一起呢?”

把這一段提示詞丟給代表兩種技術(shù)范式的開(kāi)源模型——Llama3.3和DeepSeek-R1,看它們所消耗的tokens(指模型處理文本時(shí)的基本單位)分別是多少?

最后的結(jié)果是:Llama3.3作為上一代大語(yǔ)言模型,用不到500個(gè)tokens快速回答,但安排的客人座位并不滿足要求;R1作為推理模型,用掉8000多個(gè)tokens得出了正確答案。兩者的差別在于,前者的大語(yǔ)言模型只嘗試了一次,后者的推理模型嘗試了所有不同的可能性,然后反思、驗(yàn)證了自己的答案。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

也就是說(shuō),以強(qiáng)化學(xué)習(xí)為主導(dǎo)的推理類應(yīng)用,消耗了更多的tokens、但也讓AI應(yīng)用變得越來(lái)越可靠。當(dāng)AI從生成式AI,邁向Deep Research、Manus這樣的Agentic AI應(yīng)用時(shí),每一層計(jì)算都不同,所需要的tokens比想象的多得多。

黃仁勛認(rèn)為,推理所需算力需求規(guī)模增長(zhǎng)能“輕松超過(guò)現(xiàn)在的100倍”,未來(lái)行業(yè)需要更多、性能更強(qiáng)的AI芯片。根據(jù)他的預(yù)測(cè),數(shù)據(jù)中心的建設(shè)投入到2028年將達(dá)到1萬(wàn)億美元,“相當(dāng)確定很快就會(huì)達(dá)到這個(gè)目標(biāo)”。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

具身智能領(lǐng)域布局初具鋒芒

為了達(dá)到這一目標(biāo),英偉達(dá)發(fā)布了新款DGX Spark和DGX Station個(gè)人AI計(jì)算機(jī),被稱為“AI時(shí)代的超級(jí)計(jì)算機(jī)”,由Grace Blackwell平臺(tái)支持。

其中,DGX Spark搭載GB10 Blackwell芯片,提供第五代Tensor Core和FP4支持,配有128GB統(tǒng)一內(nèi)存和高達(dá)4TB的NVMe SSD存儲(chǔ),AI計(jì)算能力高達(dá)每秒1千萬(wàn)億次運(yùn)算,今日開(kāi)啟預(yù)訂,售價(jià)3000美元起。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

DGX Station可容納GB300 Blackwell Ultra芯片,能提供每秒20千萬(wàn)億次運(yùn)算的AI性能和784GB統(tǒng)一系統(tǒng)內(nèi)存,目前尚未定價(jià)。

為優(yōu)化AI工作流程,英偉達(dá)還推出新的Spectrum-X硅光子以太網(wǎng)交換機(jī),屬于Spectrum-X光子以太網(wǎng)和Quantum-X光子InfiniBand平臺(tái)。該交換機(jī)每端口速度達(dá)1.6太比特每秒,能為AI工廠節(jié)省3.5倍能源,提高10倍彈性。

另外還發(fā)布了一款新型的AI 推理服務(wù)軟件Dynamo。它協(xié)調(diào)和加速數(shù)千個(gè)GPU之間的推理通信,并使用分解服務(wù)將大型語(yǔ)言模型的處理和生成階段分離在不同GPU上。這允許每個(gè)階段根據(jù)其特定需求進(jìn)行獨(dú)立優(yōu)化,并確保最大程度地利用GPU資源。

大會(huì)壓軸則是展示了一系列機(jī)器人技術(shù)成果,其中Isaac GR00T N1是世界首個(gè)開(kāi)放、完全可定制的通用人形推理和技能基礎(chǔ)模型。它采用雙系統(tǒng)架構(gòu),靈感源于人類認(rèn)知原理,在視覺(jué)語(yǔ)言模型支持下可執(zhí)行多種任務(wù),開(kāi)發(fā)人員能從少量人類演示中生成大量合成動(dòng)作數(shù)據(jù),用于機(jī)器人操作訓(xùn)練。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

比如,NVIDIA使用Blueprint的首批組件,在11小時(shí)內(nèi)生成了78萬(wàn)個(gè)合成軌跡,相當(dāng)于6500小時(shí)(約9個(gè)月)的人類演示數(shù)據(jù)。Isaac GR00T N1的相當(dāng)一部分?jǐn)?shù)據(jù)就來(lái)自于此,這些數(shù)據(jù)使得GR00T N1的性能比僅使用真實(shí)數(shù)據(jù)提高了40%。

換句話說(shuō),英偉達(dá)悄悄地完成了在具身智能領(lǐng)域算法(模型)、數(shù)據(jù)和算力的布局和整合。

黃仁勛演講結(jié)束前的經(jīng)典畫(huà)面 圖片來(lái)源:光輪智能創(chuàng)始人&CEO 謝晨
打開(kāi)網(wǎng)易新聞 查看精彩圖片
黃仁勛演講結(jié)束前的經(jīng)典畫(huà)面 圖片來(lái)源:光輪智能創(chuàng)始人&CEO 謝晨

文 | 劉永麗

VIEW MORE

@杭州城北藏著一個(gè)“瘋狂星期四” >>

@當(dāng)阿里不再是“該死的零售商” >>

@華人“芯”事 >>

@浙大先生>>