點擊藍字關(guān)注??公眾號并設(shè)星標(biāo),不錯過最新精彩內(nèi)容
未經(jīng)許可不得轉(zhuǎn)載| 轉(zhuǎn)載必保留本公眾號名片按鈕
Web3天空之城城主:
黃教主今天上午做的演講,全網(wǎng)首發(fā)視頻完整版和圖文完整版。Enjoy!
b站傳送:
https://www.bilibili.com/video/BV17KrmYzEU9/
您對來到拉斯維加斯感到興奮嗎?您喜歡我的夾克嗎?我想我會選擇和蓋瑞·夏皮羅不同的方向。我畢竟在拉斯維加斯。如果這行不通,如果你們所有人都不贊同……好吧,那就習(xí)慣它吧。
我真的覺得你們需要好好消化一下。大概再過一個小時左右,你們就會感覺很好了。歡迎來到英偉達。事實上,您現(xiàn)在身處英偉達的數(shù)字孿生體中。我們將帶您前往英偉達。女士們,先生們,歡迎來到英偉達。您現(xiàn)在位于我們的數(shù)字孿生體中。這里的一切都是由人工智能生成的。

人工智能的歷程非凡,這一年也非凡。這要追溯到1993年。準備好了嗎?開始!使用NV1,我們希望制造出能夠完成普通計算機無法完成任務(wù)的計算機。NV1使得在你的PC中擁有一個游戲主機成為可能。

我們的編程架構(gòu)被稱為UDA。U-D-A。直到稍后一段時間才加上字母C。但是UDA,統(tǒng)一設(shè)備架構(gòu)(Unified Device Architecture)。UDA的第一個開發(fā)者,以及第一個在UDA上運行的應(yīng)用程序,是世嘉的《虛擬戰(zhàn)士》。
六年后,我們在1999年發(fā)明了可編程GPU。它開啟了20多年,20多年來,在這個被稱為GPU的不可思議的處理器上取得了令人難以置信的進步。它使現(xiàn)代計算機圖形成為可能。如今,30年后,世嘉的《虛擬格斗》完全達到了電影級的畫面。這就是即將推出的全新《虛擬格斗》項目。我簡直等不及了。簡直令人難以置信。

六年后,也就是1999年之后,我們發(fā)明了CUDA,從而能夠向豐富的算法集合展現(xiàn)GPU的可編程性。 最初,CUDA難以解釋,這花費了數(shù)年時間,大約六年。

六年后,2012年,Alex Krzyzewski、Ilya Suskevor和Jeff Hinton利用CUDA處理AlexNet,人工智能發(fā)展由此進入新的階段。

從感知型人工智能(理解圖像、文字和聲音)到生成式人工智能(生成圖像、文本和聲音),再到如今能夠感知、推理、規(guī)劃和行動的代理型人工智能,發(fā)展速度驚人。 我們今晚將討論其中一部分——物理人工智能,其發(fā)展始于2012年。

2018年,谷歌發(fā)布Transformer模型BERT,人工智能領(lǐng)域迎來了真正的騰飛。Transformer徹底改變了人工智能領(lǐng)域,甚至整個計算領(lǐng)域的格局。我們認識到,Transformer驅(qū)動的機器學(xué)習(xí)將從根本上改變計算方式,而非僅僅帶來新的商業(yè)機會。
如今,計算的每個層面都發(fā)生了革命性的變化,從手工編寫在CPU上運行的指令到創(chuàng)建人類使用的軟件工具,機器學(xué)習(xí)可以創(chuàng)建和優(yōu)化在GPU上運行的神經(jīng)網(wǎng)絡(luò),從而創(chuàng)造人工智能。技術(shù)棧的每一層都發(fā)生了徹底的改變,僅僅12年就發(fā)生了不可思議的轉(zhuǎn)變。
現(xiàn)在,我們可以理解幾乎任何形式的信息,包括文本、圖像、聲音、氨基酸和物理學(xué)知識,并進行翻譯和生成。應(yīng)用幾乎是無限的,其核心都基于三個基本問題:輸入是什么模態(tài)學(xué)習(xí)的?它翻譯成了什么形式的信息?它正在生成什么形式的信息?
機器學(xué)習(xí)改變了每一個應(yīng)用程序的構(gòu)建方式、計算方式以及超越這些的可能性。GPU、GeForce以及所有與AI相關(guān)的技術(shù),都是AI普及的基礎(chǔ),而如今,AI正回歸GeForce。
有很多事情無法在沒有AI的情況下完成,讓我向您展示其中一些。例如,實時計算機圖形學(xué)。在過去,沒有任何計算機圖形學(xué)研究人員或計算機科學(xué)家能夠?qū)γ總€像素進行光線追蹤,而光線追蹤是對光的模擬。 畫面中幾何體的數(shù)量令人難以置信,沒有人工智能,這是不可能實現(xiàn)的。
我們做了兩件根本性的事情:使用可編程著色和光線追蹤加速生成美麗的像素;然后讓人工智能控制像素生成,大量生成其他像素。AI能夠在空間上生成其他像素,因為它知道顏色應(yīng)該是什么,它已經(jīng)在英偉達的超級計算機上進行了訓(xùn)練,因此在GPU上運行的神經(jīng)網(wǎng)絡(luò)可以推斷和預(yù)測我們沒有渲染的像素。 這就是DLSS技術(shù)。最新一代的DLSS還能生成超出幀數(shù)的畫面,甚至可以預(yù)測未來畫面,為每一幀生成三幀額外的畫面。
您看到的畫面,例如四幀畫面,實際上我們只渲染了一幀,其余三幀由AI生成。以全高清或4K顯示四幀畫面,大約有3300萬像素,而我們只計算了兩百萬像素。通過計算這兩百萬像素,并讓AI預(yù)測其余的3100萬像素,我們實現(xiàn)了極高的渲染性能,這堪稱奇跡。AI的計算量要少得多,當(dāng)然,這需要大量的訓(xùn)練,但一旦訓(xùn)練完成,生成效率非常高。

這就是人工智能令人難以置信的能力之一,它正在徹底改變GeForce。今天,我們宣布推出下一代產(chǎn)品——RTX Blackwell系列。這是我們?nèi)碌腉eForce RTX 50系列Blackwell架構(gòu),這款GPU擁有920億個晶體管,4000個頂點著色器,四千萬億次人工智能浮點運算(比上一代AIDA高出三倍),以及380萬億次光線追蹤浮點運算,還有125個著色器TFlops,以及性能相同的整數(shù)單元,兩個雙著色器(一個用于浮點運算,一個用于整數(shù)運算),來自美光的G7內(nèi)存,帶寬達1.8TB/s,是上一代產(chǎn)品的兩倍。

我們現(xiàn)在能夠混合AI工作負載和計算機圖形工作負載。本代產(chǎn)品最令人驚奇之處在于,可編程著色器現(xiàn)在也能處理神經(jīng)網(wǎng)絡(luò)。著色器能夠承載這些神經(jīng)網(wǎng)絡(luò),從而實現(xiàn)了神經(jīng)紋理壓縮和神經(jīng)材質(zhì)著色,最終獲得令人驚艷的圖像效果,這完全得益于AI對紋理和壓縮算法的學(xué)習(xí)。這就是全新的RTX Blackwell 5090。

即使是機械設(shè)計也令人嘆為觀止,它配備了雙風(fēng)扇,整張顯卡就是一個巨大的散熱器。電壓調(diào)節(jié)器設(shè)計也達到了目前最先進的水平。工程團隊為此付出了巨大的努力。
RTX 4090售價1599美元,許多人都擁有它,這是非常超值的投資,能夠大幅提升價值10000美元的PC性能。它采用液冷散熱,并配備炫酷的燈光效果。

現(xiàn)在,Blackwell家族的RTX 5070售價僅為549美元,卻擁有4090的性能。這得益于四個頂級的、四個萬億次運算的AI張量核心和G7內(nèi)存。
5090的性能是4090的兩倍。我們從一月份開始大規(guī)模生產(chǎn),并成功地將這些強大的GPU應(yīng)用于筆記本電腦中。這款1299美元的5070筆記本電腦擁有4090的性能。
我們能夠?qū)lackwell顯卡縮小并集成到筆記本電腦中,這主要得益于AI技術(shù)。我們利用張量核心生成大部分像素,僅對需要的像素進行光線追蹤,并使用人工智能生成其余像素,從而實現(xiàn)了非凡的能量效率。計算機圖形學(xué)的未來是神經(jīng)渲染。
人工智能與計算機圖形學(xué)的融合令人驚嘆。
這是一場精彩的主題演講,我們將介紹令人驚嘆的全新GPU系列:RTX Blackwell系列。5090甚至可以集成到纖薄的筆記本電腦中,例如厚度僅為14.9毫米的筆記本電腦。此外,還有5080、5070 Ti和5070型號。GeForce將AI帶給大眾,而如今AI正徹底改變著GeForce。

讓我們深入探討人工智能。行業(yè)正競相擴展人工智能的規(guī)模,而規(guī)模法則是一個強大的模型。大量研究人員和業(yè)內(nèi)人士觀察并證明了這一點:數(shù)據(jù)越多、模型越大、計算能力越強,模型就越有效。規(guī)模定律仍在持續(xù)發(fā)揮作用?;ヂ?lián)網(wǎng)每年產(chǎn)生的數(shù)據(jù)量都在翻倍,未來幾年人類產(chǎn)生的數(shù)據(jù)量將超過自人類誕生以來的總和。這些數(shù)據(jù)正變得多模態(tài),包括視頻、圖像和聲音,為AI的基礎(chǔ)知識奠定基礎(chǔ)。

除了原始規(guī)模定律,還有兩個規(guī)模定律出現(xiàn):訓(xùn)練后規(guī)模定律和合成數(shù)據(jù)生成。訓(xùn)練后規(guī)模定律利用強化學(xué)習(xí)和人工反饋等技術(shù),AI根據(jù)人類反饋改進自身技能,類似于人類在學(xué)業(yè)完成后得到導(dǎo)師反饋并改進的過程。合成數(shù)據(jù)生成則類似于自我練習(xí),AI通過不斷嘗試解決可驗證的復(fù)雜問題來改進自身。這些后訓(xùn)練技術(shù)需要大量計算,但最終能產(chǎn)生令人難以置信的模型。
我們現(xiàn)在有了第三個規(guī)模法則,它與測試時縮放有關(guān)。測試時縮放是指AI在使用過程中,能夠靈活分配計算資源,不再僅僅改進參數(shù),而是專注于決定使用多少計算資源來生成答案。推理和長期思考是兩種實現(xiàn)方式,AI系統(tǒng)可能將問題分解成多個步驟,產(chǎn)生多個想法并進行評估,最終選擇最佳方案。測試時縮放已被證明極其有效。
從ChatGPT到O1、O3再到Gemini Pro,這一技術(shù)序列的令人難以置信的成就,展現(xiàn)了所有這些縮放定律的出現(xiàn)。所有這些系統(tǒng)都經(jīng)歷了預(yù)訓(xùn)練、后訓(xùn)練和測試時縮放的過程。這需要大量的計算,我們希望社會能夠擴展計算能力,以產(chǎn)生更優(yōu)越的智能,解決更多挑戰(zhàn)性問題。
規(guī)模定律推動了對英偉達計算,特別是Blackwell芯片的巨大需求。Blackwell目前已全面投產(chǎn),由約15家計算機制造商提供200多種不同配置的系統(tǒng),采用液冷、風(fēng)冷等多種冷卻方式,并支持多種CPU和NVLink配置,以滿足全球數(shù)據(jù)中心的需求。這些系統(tǒng)目前在約45家工廠生產(chǎn),反映了人工智能的普及程度和各行業(yè)對人工智能的轉(zhuǎn)向。
我們?nèi)绱伺Φ赝苿舆@項技術(shù),是因為我們需要更多的計算能力。 這就像……珍妮? 我不知道,我很難說……你永遠不想把手伸到黑暗的地方……好吧。等著瞧。等著瞧。我以為我值得。看來,約尼爾認為我不夠格。好吧。這是我的展示。這是一個展示。

這個NVLink系統(tǒng),GB200,NVLink 72,重達1.5噸,包含60萬個零件,相當(dāng)于20輛汽車,功率為120千瓦。
它有一個背板,連接所有這些GPU,兩英里長的銅纜,5000根電纜。這種產(chǎn)品正在全球45家工廠生產(chǎn)。我們制造它們,用液體冷卻它們,測試它們,拆卸它們,并將它們以部件的形式運送到數(shù)據(jù)中心,因為它們重達一噸半。我們在數(shù)據(jù)中心外部重新組裝并安裝它們。生產(chǎn)規(guī)模令人難以置信。
但這一切的目標(biāo)是,由于規(guī)模定律正在推動計算如此之快,以至于Blackwell與我們上一代相比,這種級別的計算使每瓦性能提高了四倍,每美元性能提高了三倍。這意味著在一代人的時間里,我們將這些模型的訓(xùn)練成本降低了三倍,或者,如果你想將模型的大小增加三倍,成本大致相同。重要的是,這些是我們在使用ChatGPT或Gemini以及將來使用手機時都會使用的生成token,幾乎所有這些應(yīng)用程序都將消耗這些AItoken,而這些AItoken是由這些系統(tǒng)生成的。每個數(shù)據(jù)中心都受到功率的限制,因此,如果Blackwell的每瓦性能是上一代的四倍,那么數(shù)據(jù)中心可以產(chǎn)生的收入、可以產(chǎn)生的業(yè)務(wù)量將增加四倍。所以,這些AI工廠系統(tǒng)如今確實就是工廠。

現(xiàn)在,所有這一切的目標(biāo)就是為了創(chuàng)造一個巨大的芯片。我們需要的計算量確實非常驚人。這基本上就是一個巨大的芯片。如果我們不得不去制造一個芯片……對不起,各位。你們看到了嗎?太酷了。看看這個,這里有迪斯科燈。如果我們必須把它做成一個芯片,很顯然,它會有晶圓那么大,但這還不包括良率的影響,它可能需要三到四倍那么大。但我們這里基本上有72個Blackwell GPU或144個芯片。這個芯片的算力是1.4exaflops。世界上最大、最快的超級計算機,直到最近才……整個房間的這臺超級計算機直到最近才達到1艾弗洛普以上。這是1.4exa flops的AI浮點運算性能。
它有14太字節(jié)的內(nèi)存,內(nèi)存帶寬為每秒1.2 PB。這基本上就是現(xiàn)在整個互聯(lián)網(wǎng)的流量,全世界的互聯(lián)網(wǎng)流量都在這些芯片上處理。我們總共有130萬億個晶體管,2592個CPU核心,以及大量的網(wǎng)絡(luò)設(shè)備。所以這些……我希望我能做到這一點。我想我做不到。所以這些是Blackwells,這些是我們的ConnectX網(wǎng)絡(luò)芯片,這些是NVLink,我們試圖掩蓋NVLink主干的存在,但這不可能。這些都是HBM內(nèi)存,總共14太字節(jié)的HBM內(nèi)存。
這就是我們正在努力實現(xiàn)的目標(biāo),一個奇跡,Blackwell系統(tǒng)的奇跡。Blackwell芯片是目前世界上最大的單芯片。但這并非奇跡的全部,它是Grace Blackwell系統(tǒng)。所有這一切的目標(biāo),是為了讓我們能夠……
謝謝。謝謝。請問有椅子可以讓我坐一會兒嗎?可以給我一杯米勒醇爽啤酒嗎?我們竟然在米勒醇爽啤酒體育場,真是不可思議!這就像來到英偉達卻沒拿到顯卡一樣。
我們需要大量的計算能力,因為我們想要訓(xùn)練越來越大的模型。以往的推理只是一次性的,但未來,人工智能將能夠進行自我對話,進行思考,進行內(nèi)部反思和處理?,F(xiàn)在,token生成速度為每秒20到30個,與人類閱讀速度相當(dāng)。但未來,有了GPT-o1、Gemini Pro和O1、O3等新模型,它們能夠進行自我對話和反思,思考問題。因此,token的攝入速度將大幅提高,我們需要大幅提升token生成速率。同時,我們必須大幅降低成本,才能提供卓越的服務(wù)質(zhì)量,保持客戶成本的持續(xù)低廉,并確保人工智能的持續(xù)擴展。這就是根本目的,也是我們創(chuàng)建NBLink的原因。

在企業(yè)領(lǐng)域,自主式人工智能是最重要的發(fā)展之一。自主式人工智能是測試時擴展的完美例子。它是一個模型系統(tǒng),一部分是理解和與客戶/用戶互動,一部分可能是檢索信息,像抹布一樣的語義AI系統(tǒng)。它可能訪問互聯(lián)網(wǎng),學(xué)習(xí)PDF文件,使用工具、計算器,或使用生成式AI生成圖表等。它會迭代,將問題分解成一步步的步驟,并迭代所有不同的模型。過去,你提出問題,答案就會涌現(xiàn)出來。未來,你提出問題,后臺將有一大堆模型在工作。因此,推理所需的計算量將急劇增加,因為我們追求越來越好的答案。
為了幫助行業(yè)構(gòu)建自主智能體AI,我們的市場策略并非直接面向企業(yè)客戶,而是與IT生態(tài)系統(tǒng)中的軟件開發(fā)者合作,將我們的技術(shù)整合到他們的產(chǎn)品中,從而實現(xiàn)新的功能,就像我們之前與CUDA庫的合作一樣?,F(xiàn)在,我們希望將同樣的方法應(yīng)用于AI庫。
就像過去的計算模型擁有用于計算機圖形學(xué)、線性代數(shù)或流體力學(xué)的API一樣,未來,在CUDA加速庫之上,將會有AI庫。
我們已創(chuàng)建三樣工具來幫助生態(tài)系統(tǒng)構(gòu)建自主智能體AI:NVIDIA NIMS、NVIDIA NEMO和一系列開源藍圖。
NVIDIA NIMS本質(zhì)上是一套打包好的AI微服務(wù),包含CUDA DNN、Cutlass、Tensor RTLM或Triton等復(fù)雜的CUDA軟件,以及經(jīng)過打包和優(yōu)化的模型,可部署到任何地方。這些模型涵蓋視覺、語言理解、語音、動畫、數(shù)字生物學(xué)等領(lǐng)域,并即將推出物理AI模型。由于NVIDIA GPU已廣泛應(yīng)用于各大云平臺和原始設(shè)備制造商(OEM),這些AI模型可在任何地方運行,方便用戶集成到自身軟件中,創(chuàng)建可在Cadence、ServiceNow或SAP等平臺上運行的AI代理。

NVIDIA NEMO是一個數(shù)字員工入職和培訓(xùn)評估系統(tǒng)。未來的AI代理將如同數(shù)字員工隊伍,與人類員工協(xié)同工作。NEMO提供各種庫,幫助AI代理接受針對公司特定語言、業(yè)務(wù)流程和工作方式的培訓(xùn)。通過展示工作成果示例、接收反饋和評估,可以對AI代理進行防護,設(shè)定其行為規(guī)范和信息訪問權(quán)限。
因此,未來很多公司的IT部門將成為AI代理的HR部門,負責(zé)維護、培育、入職和改進大量的數(shù)字代理。
此外,我們還提供大量完全開源的藍圖,涵蓋各種不同類型的代理,供生態(tài)系統(tǒng)使用和修改。
今天,我們將宣布一些令人興奮的新功能。

我們發(fā)布了一個基于 NVIDIA LLAMA Nemotron 語言基礎(chǔ)模型的完整模型家族。LLAMA 3.1 現(xiàn)象級成功,Meta 下載次數(shù)約 65 萬次,并被衍生出約 6 萬個不同的模型,推動了幾乎所有企業(yè)和行業(yè)投入 AI 工作。
我們發(fā)現(xiàn) LLAMA 模型可針對企業(yè)用途進行更好的微調(diào),因此我們利用自身專業(yè)知識和能力對這些模型進行了微調(diào),并將其轉(zhuǎn)變?yōu)?LLAMA Nemotron 開放模型套件。套件中包含一些極其小巧,響應(yīng)速度極快的模型,我們稱之為超級 LLAMA Nemotron 超級模型,它們是主流模型版本。超大型模型則可作為許多其他模型的教師模型,例如獎勵模型、評估器或裁判,為其他模型提供反饋,并通過多種方式進行蒸餾。這個強大而大型的知識蒸餾模型現(xiàn)已上線。
這些模型在聊天排行榜、指令排行榜和檢索排行榜上均排名第一,涵蓋人工智能代理所需的各種功能。我們還與生態(tài)系統(tǒng)合作伙伴緊密合作,將所有 NVIDIA AI 技術(shù)融入 IT 行業(yè)。ServiceNow、SAP 和西門子在工業(yè) AI 領(lǐng)域取得了顯著成果,Cadence 和 Synopsys 也表現(xiàn)出色。我們與 Perplexity 的合作也令人自豪,他們徹底改變了搜索方式。

面向全球軟件工程師的 Codium,將成為下一個大型 AI 應(yīng)用,軟件編碼將是下一個大型 AI 服務(wù)領(lǐng)域。全球有 3000 萬軟件工程師,每個人都將擁有一個編碼助手,否則生產(chǎn)效率和代碼質(zhì)量都會顯著下降。
全球有 10 億知識工作者,AI 智能體很可能成為下一個萬億美元級產(chǎn)業(yè),它將是新的數(shù)字勞動力,為我們工作并與我們一起工作。
AI智能體是一個能夠推理任務(wù)、將其分解成子任務(wù),并檢索數(shù)據(jù)或使用工具來生成高質(zhì)量響應(yīng)的模型系統(tǒng)。英偉達的自主式AI構(gòu)建模塊、NIM預(yù)訓(xùn)練模型和NEMO框架使組織能夠創(chuàng)建和管理他們自己的模型,輕松開發(fā)AI智能體并在任何地方部署它們。我們將像對待員工一樣,對我們的代理勞動力進行入職培訓(xùn)和技能培訓(xùn)。AI代理是特定領(lǐng)域的專家。
以下是一些例子:AI研究助理代理可以幫助數(shù)十億的知識工作者和學(xué)生處理復(fù)雜的文檔(如講座、期刊、財務(wù)結(jié)果),并生成交互式播客以方便學(xué)習(xí);Corda通過結(jié)合U-net回歸模型和擴散模型,將全球天氣預(yù)報的分辨率從25公里降低到2公里;軟件安全AI代理持續(xù)掃描軟件中的漏洞,并提醒開發(fā)人員采取必要措施;虛擬實驗室AI代理幫助研究人員設(shè)計和篩選數(shù)十億種化合物,以更快地找到有希望的候選藥物。
基于NVIDIA Metropolis藍圖構(gòu)建的NVIDIA分析AI代理,包括NVIDIA Cosmos Nematron視覺語言模型、Lama Nematron大型語言模型和NEMO Retriever,分析來自數(shù)十億個攝像機每天生成的10萬PB視頻數(shù)據(jù)。它們支持交互式搜索、摘要和自動化報告,并有助于監(jiān)控交通流量,標(biāo)記擁堵或危險情況;在工業(yè)設(shè)施中,它們監(jiān)控流程并生成改進建議,并在發(fā)生事件時重新分配工人或機器人。
代理式AI的時代已經(jīng)到來,惠及每個組織。AI是在云中創(chuàng)建的,也是為云而創(chuàng)建的,當(dāng)然,在手機上使用AI也同樣完美。很快,我們將擁有一個持續(xù)陪伴您的AI,并且當(dāng)您使用元眼鏡時,可以指向或觀察某物,并詢問任何您想要的信息。因此,人工智能在云端是完美的,在云端創(chuàng)建的東西在云端也運行完美。然而,我們希望能夠?qū)⑷斯ぶ悄軒У饺魏蔚胤?,將其部署到任何云端,公司?nèi)部,甚至個人電腦上。
Windows 95徹底改變了計算機行業(yè),引入了全新的多媒體服務(wù),并永久性地改變了應(yīng)用程序的開發(fā)方式。然而,這種計算模型并非人工智能的理想環(huán)境。
我們希望未來,人工智能能夠成為用戶的AI助手。這需要超越單純的3D、聲音和視頻API,轉(zhuǎn)向生成式API:用于3D、語言、聲音等等。 這需要一個能夠利用云計算巨大投資的系統(tǒng)。 開發(fā)另一種人工智能模型的編程方式是不現(xiàn)實的。
因此,如果能將Windows PC打造成世界一流的AI PC,將意義非凡。答案是Windows WSL 2。WSL 2在一個系統(tǒng)中運行兩個操作系統(tǒng),運行流暢,專為開發(fā)者設(shè)計,并提供對裸機的訪問權(quán)限。它針對云原生應(yīng)用程序和CUDA進行了優(yōu)化,能夠完美支持CUDA。
因此,我們展示的所有內(nèi)容,包括NVIDIA NIMS、NVIDIA NEMO以及將在ai.nvidia.com發(fā)布的藍圖,都可在符合要求的電腦上運行。 我們將提供各種視覺、語言、語音以及數(shù)字人物模型等,用戶只需下載即可運行。
我們的重點是將Windows WSL 2和Windows PC打造成為一流的目標(biāo)平臺,并提供長期支持和維護。這對全球工程師和開發(fā)者來說都將是一件意義重大的事情。
以下是一個例子:生成式AI可以根據(jù)簡單的文本提示合成圖像。但僅靠文字控制圖像構(gòu)成可能存在挑戰(zhàn)。使用NVIDIA NIM微服務(wù),創(chuàng)作者可以使用簡單的3D對象指導(dǎo)AI圖像生成。概念藝術(shù)家可以使用3D資產(chǎn)(手工創(chuàng)建或AI生成)來指導(dǎo)圖像生成NIM(例如Flux),從而創(chuàng)建與3D場景相符的視覺效果。
添加或移動對象以細化構(gòu)圖,更改攝像機角度以拍攝完美的鏡頭,或使用新的提示重新構(gòu)想整個場景。借助生成式AI和NVIDIA NIM,藝術(shù)家可以快速實現(xiàn)他們的創(chuàng)意。用于您PC的NVIDIA AI,已準備好應(yīng)用于全球數(shù)億臺安裝了Windows的PC。我們合作的所有PC原始設(shè)備制造商(OEM),也就是全球所有領(lǐng)先的PC原始設(shè)備制造商,都將為這個堆棧做好他們PC的準備。因此,AI PC即將來到您家附近。

Linux很好。讓我們談?wù)勎锢鞟I。想象一下,您的大型語言模型:將上下文和提示放在左邊,它一次生成一個詞元來產(chǎn)生輸出。這基本上就是它的工作原理。中間的這個模型相當(dāng)龐大,擁有數(shù)十億個參數(shù),上下文長度非常長,因為您可能決定加載一個PDF文件,甚至多個PDF文件后再提出問題。這些PDF文件被轉(zhuǎn)換成詞元。注意力機制,也就是Transformer的基本注意力特性,讓每一個詞元都找到它與其他每個詞元之間的關(guān)系和關(guān)聯(lián)。因此,您可能擁有數(shù)十萬個詞元,計算負載呈二次方增長。它會處理所有參數(shù)、所有輸入序列,將其通過Transformer的每一層,并產(chǎn)生一個詞元。這就是我們需要Blackwell的原因。然后,當(dāng)前令牌處理完成后就會生成下一個令牌。它將當(dāng)前令牌放入輸入序列中,然后利用整個序列生成下一個令牌。它一次只處理一個令牌。這就是Transformer模型,也是它如此高效,同時又如此耗費計算資源的原因。
如果不是PDF,而是您的周圍環(huán)境呢?如果不是提示或問題,而是一個請求呢?例如,“去那邊拿起那個盒子,然后把它拿回來”。而且,它生成的不是文本令牌,而是動作令牌。我剛才描述的,正是機器人未來發(fā)展的一個非常合理的場景。這項技術(shù)即將到來。但我們需要做的,是創(chuàng)建一個有效的、世界模型,與GPT這種語言模型相對。這個世界模型必須理解世界的語言,理解物理動力學(xué)(比如重力、摩擦力和慣性),理解幾何和空間關(guān)系,理解因果關(guān)系(如果你扔下什么東西,它就會落到地上;如果你戳它一下,它就會倒),以及客體永久性(如果你把一個球滾過廚房的柜臺,當(dāng)它滾到另一邊時,球并沒有進入另一個仍然存在的量子宇宙)。
所有類型的直覺理解,都是當(dāng)前大多數(shù)模型難以實現(xiàn)的。因此,我們需要一個世界基礎(chǔ)模型。
今天,我們宣布推出NVIDIA Cosmos,一個旨在理解物理世界的世界基礎(chǔ)模型。其效果,唯有親眼目睹才能真正理解。
NVIDIA Cosmos是一個世界基礎(chǔ)模型開發(fā)平臺,旨在推動物理AI發(fā)展。它包含自回歸世界基礎(chǔ)模型、基于擴散的世界基礎(chǔ)模型、高級分詞器以及NVIDIA CUDA數(shù)據(jù)管道。該模型能夠攝取文本、圖像或視頻提示,并生成虛擬世界狀態(tài)視頻。
Cosmos優(yōu)先考慮AV和機器人用例的獨特需求,例如真實世界環(huán)境、照明和物體持久性。開發(fā)者使用NVIDIA Omniverse構(gòu)建基于物理的、地理空間精確的場景,然后將Omniverse渲染輸出到Cosmos,后者生成逼真的、基于物理的合成數(shù)據(jù),涵蓋不同的物體、環(huán)境以及天氣、時間或極端情況等條件。
開發(fā)者可以使用Cosmos為強化學(xué)習(xí)AI反饋生成世界,用于改進策略模型,或測試和驗證模型性能,甚至跨多傳感器視圖進行測試。Cosmos可以實時生成令牌,為AI模型帶來預(yù)見性和多宇宙模擬能力,生成所有可能的未來以幫助模型選擇正確的路徑。
NVIDIA與全球開發(fā)者生態(tài)系統(tǒng)合作,推動下一波物理AI發(fā)展。NVIDIA Cosmos,全球首個世界基礎(chǔ)模型,利用2000萬小時的視頻進行訓(xùn)練。這些視頻重點關(guān)注物理動態(tài)事物,例如動態(tài)自然主題、人類行走、手部移動、操作物體以及快速攝像機運動場景。

其核心在于教AI理解世界,而非生成創(chuàng)意內(nèi)容,目標(biāo)是讓AI理解物理世界。通過物理AI,我們可以生成合成數(shù)據(jù)來訓(xùn)練模型,對其進行蒸餾,將其轉(zhuǎn)化為機器人模型的種子,并生成多個基于物理、物理上合理的未來場景,模擬“奇異博士”的場景。因為這個模型理解物理世界。
它可以進行字幕制作,拍攝視頻并制作高質(zhì)量字幕,這些字幕和視頻可用于訓(xùn)練大型語言模型,特別是多模態(tài)大型語言模型。 利用這項技術(shù)和基礎(chǔ)模型,可以訓(xùn)練機器人和大型語言模型。這就是英偉達宇宙(NVIDIA Cosmos)。
該平臺包含一個用于實時應(yīng)用的自回歸模型、一個用于生成超高質(zhì)量圖像的擴散模型、一個學(xué)習(xí)了現(xiàn)實世界詞匯的強大標(biāo)記器,以及一個端到端CUDA加速和AI加速的數(shù)據(jù)處理管道,用于處理大規(guī)模數(shù)據(jù)并進行模型訓(xùn)練。這是世界上第一個此類數(shù)據(jù)處理管道,所有這些都是Cosmos平臺的一部分。

今天,我們宣布Cosmos采用開放許可,并在GitHub上開放。我們希望這個包含小型、中型和大型模型(快速模型、主流模型和教師模型,即知識遷移模型)的平臺,能像LLAMA3改變企業(yè)AI一樣,改變機器人和工業(yè)AI領(lǐng)域。

將Cosmos連接到Omniverse后,其魔法便顯現(xiàn)。Omniverse是一個基于算法物理學(xué)、遵循物理原理的仿真系統(tǒng),即模擬器。它為Cosmos提供真實依據(jù),使Cosmos生成的輸出更可靠,這與將大型語言模型連接到檢索增強生成系統(tǒng)(RAG)的理念相同,都是為了使AI生成內(nèi)容建立在真實依據(jù)之上。兩者結(jié)合,形成一個物理模擬的、基于物理的多元宇宙生成器,其應(yīng)用前景非常廣闊,尤其在機器人技術(shù)和工業(yè)應(yīng)用領(lǐng)域。

Cosmos加上Omniverse,再加上Cosmos本身,構(gòu)成了構(gòu)建機器人系統(tǒng)所需的第三臺計算機。每個機器人公司最終都需要三臺計算機:一臺用于訓(xùn)練AI的DGX計算機;一臺用于部署AI的AGX計算機,部署在汽車、機器人、自動移動機器人(AMR)等各種邊緣設(shè)備中,實現(xiàn)自主運行。
連接兩者需要一個數(shù)字孿生,它正是所有模擬的基礎(chǔ)。數(shù)字孿生是訓(xùn)練好的AI進行實踐、改進、合成數(shù)據(jù)生成、強化學(xué)習(xí)和AI反饋等操作的場所,因此它是AI的數(shù)字孿生。這三臺計算機將交互式工作,這套三機系統(tǒng)正是英偉達針對工業(yè)世界的戰(zhàn)略,我們已討論多時。與其說是“三體問題”,不如說是“三體計算機解決方案”,它是機器人領(lǐng)域的英偉達。

讓我舉例說明。首先,我們?nèi)绾螌⑦@些應(yīng)用于工業(yè)數(shù)字化?數(shù)百萬家工廠和數(shù)十萬個倉庫構(gòu)成了50萬億美元制造業(yè)的支柱,所有這些都必須實現(xiàn)軟件定義和自動化,并融入機器人技術(shù)。我們正與全球領(lǐng)先的倉庫自動化解決方案提供商KION以及全球最大的專業(yè)服務(wù)提供商埃森哲合作,他們高度關(guān)注數(shù)字制造,我們正共同努力創(chuàng)造一些特別的東西。我將立即演示。我們的市場策略與其他所有軟件和技術(shù)平臺相同,都是通過開發(fā)者和生態(tài)系統(tǒng)合作伙伴實現(xiàn)的,而與Omniverse連接的生態(tài)系統(tǒng)合作伙伴數(shù)量持續(xù)增長。原因很簡單:每個人都想將產(chǎn)業(yè)的未來數(shù)字化,在全球GDP的50萬億美元中,存在大量浪費和自動化機會。
讓我們看看與凱傲集團(KION)和埃森哲的合作案例。凱傲集團(一家供應(yīng)鏈解決方案公司)、埃森哲(一家全球領(lǐng)先的專業(yè)服務(wù)公司)以及英偉達,正將物理人工智能引入價值一萬億美元的倉庫和配送中心市場。管理高性能倉庫物流需要應(yīng)對復(fù)雜的決策網(wǎng)絡(luò),這些決策受每日和季節(jié)性需求變化、空間限制、勞動力可用性和各種機器人及自動化系統(tǒng)集成的影響。而預(yù)測物理倉庫的運營KPI在今天幾乎是不可能的。
為了應(yīng)對這些挑戰(zhàn),KION正在采用MEGA,這是一個NVIDIA Omniverse藍圖,用于構(gòu)建工業(yè)數(shù)字孿生體以測試和優(yōu)化機器人車隊。KION的倉庫管理解決方案將任務(wù)分配給數(shù)字孿生體中的工業(yè)AI大腦,例如將貨物從緩沖區(qū)位置移動到穿梭式存儲解決方案。機器人的大腦位于物理倉庫的模擬環(huán)境中,使用OpenUSD連接器將其數(shù)字化到Omniverse中,以將CAD、視頻和圖像聚合到3D、激光雷達到點云以及AI生成的數(shù)據(jù)。機器人車隊通過感知和推理其Omniverse數(shù)字孿生環(huán)境來執(zhí)行任務(wù),規(guī)劃其下一個動作并采取行動。
機器人的大腦通過傳感器模擬結(jié)果狀態(tài),并據(jù)此決定下一步動作。MEGA精確追蹤數(shù)字孿生體中所有事物的狀態(tài),并持續(xù)循環(huán)運行?,F(xiàn)在,KION能夠大規(guī)模模擬無限場景,同時測量運營KPI,例如吞吐量、效率和利用率,所有這些都在將更改部署到物理倉庫之前完成。KION、英偉達和埃森哲正攜手重塑工業(yè)自動化。
一切都在模擬中進行。未來,每個工廠都將擁有一個與真實工廠運作方式完全相同的數(shù)字孿生體。事實上,您可以使用Omniverse和Cosmos生成大量未來場景,然后由人工智能選擇對任何KPI最優(yōu)的場景,這將轉(zhuǎn)化為部署到真實工廠中的AI程序或編程約束。

另一個例子是自動駕駛汽車。自動駕駛革命已經(jīng)到來,在Waymo和特斯拉的成功推動下,多年發(fā)展后,自動駕駛汽車的到來已成定局。我們?yōu)樵撔袠I(yè)提供的產(chǎn)品包括三臺計算機:用于訓(xùn)練AI的訓(xùn)練系統(tǒng)、模擬系統(tǒng)和合成數(shù)據(jù)生成系統(tǒng)(Omniverse和Cosmos),以及車內(nèi)計算機。每家汽車公司與我們的合作方式可能有所不同,可能使用一臺、兩臺或三臺計算機。
我們幾乎與全球所有主要的汽車公司都有合作,包括Waymo、Zooks和特斯拉的數(shù)據(jù)中心,比亞迪(全球最大的電動汽車公司),以及即將推出新款配備英偉達技術(shù)的捷豹路虎汽車,梅賽德斯-奔馳今年也將投產(chǎn)配備英偉達技術(shù)的汽車車隊。我很高興地宣布,豐田和英偉達今天將攜手合作,共同打造下一代自動駕駛汽車。還有許多優(yōu)秀公司,例如Lucid、Rivian、小米和沃爾沃等。Wabi正在研發(fā)自動駕駛卡車,我們本周還宣布Aurora將使用英偉達的技術(shù)研發(fā)自動駕駛卡車。
全球每年生產(chǎn)1億輛汽車,道路上行駛的汽車有10億輛,每年行駛里程達萬億英里,所有這些汽車都將實現(xiàn)高度自動駕駛,甚至即將實現(xiàn)完全自動駕駛。這將是一個極其龐大的產(chǎn)業(yè),我預(yù)測這很可能是第一個萬億美元級的機器人產(chǎn)業(yè)。我們的業(yè)務(wù),請注意,僅僅是這些開始投產(chǎn)的汽車中的一部分,規(guī)模就已經(jīng)達到40億美元,今年的運行速度可能約為50億美元。
今天,我們宣布我們下一代汽車處理器——Thor。
這是Thor,一款機器人電腦,它接收并處理來自大量傳感器的信息,包括無數(shù)個高分辨率攝像頭、雷達和激光雷達。該芯片將傳感器數(shù)據(jù)轉(zhuǎn)換成標(biāo)記,放入轉(zhuǎn)換器并預(yù)測下一條路徑。這款自動駕駛電腦現(xiàn)已全面投產(chǎn)。

Thor的處理能力是上一代Orin的20倍,而Orin是目前自動駕駛車輛的行業(yè)標(biāo)準。Thor已全面投產(chǎn),并廣泛應(yīng)用于各種機器人,例如自主移動機器人(AMR),可作為機器人或機械手的大腦。它是一款通用的機器人計算機。

我們DRIVE系統(tǒng)的第二部分,也是我引以為傲的部分,是對安全的專注。DRIVE OS是首個獲得ASIL-D認證的軟件定義的可編程AI計算機,ASIL-D是汽車功能安全領(lǐng)域的最高標(biāo)準。這是大約15000個工程師年努力的結(jié)果,因此CUDA現(xiàn)在是一個功能安全可靠的計算機。
接下來,我想向大家展示如何在自動駕駛汽車的背景下使用Omniverse和Cosmos。我將展示如何利用AI自動重建數(shù)字孿生體,并以此來訓(xùn)練未來的AI模型。

自動駕駛汽車革命已經(jīng)到來。建造自動駕駛汽車需要三臺計算機:NVIDIA DGX用于訓(xùn)練AI模型;Omniverse用于測試駕駛和生成合成數(shù)據(jù);以及車載超級計算機AGX。合成數(shù)據(jù)對于訓(xùn)練至關(guān)重要,因為現(xiàn)實世界的數(shù)據(jù)有限。NVIDIA Omniverse、AI模型和Cosmos共同構(gòu)建自動駕駛車輛數(shù)據(jù)工廠,生成合成駕駛場景,從而大幅提升訓(xùn)練數(shù)據(jù)量。Omnimap融合地圖和地理空間數(shù)據(jù)以構(gòu)建可行駛的3D環(huán)境,駕駛場景變化則可通過回放駕駛?cè)罩净駻I交通生成器生成。
神經(jīng)重建引擎利用自動駕駛汽車傳感器日志創(chuàng)建高保真4D仿真環(huán)境,通過回放3D駕駛過程并生成場景變化來擴充訓(xùn)練數(shù)據(jù)。Edify 3DS自動搜索或生成資產(chǎn),創(chuàng)建可用于仿真的場景。Omniverse場景用于訓(xùn)練Cosmos生成海量逼真數(shù)據(jù),縮小仿真與現(xiàn)實間的差距,并通過文本提示生成幾乎無限的駕駛場景變化。
Cosmos Nemotron VideoSearch整合海量合成數(shù)據(jù)集和記錄的駕駛數(shù)據(jù)來訓(xùn)練模型。NVIDIA的AI數(shù)據(jù)工廠將數(shù)百個驅(qū)動器的數(shù)百萬英里數(shù)據(jù)擴展到數(shù)十億有效英里,為安全和先進的自動駕駛設(shè)定了新標(biāo)準。
我們將數(shù)千次駕駛數(shù)據(jù)轉(zhuǎn)化為數(shù)十億英里,擁有大量的自動駕駛車輛訓(xùn)練數(shù)據(jù),當(dāng)然,這需要持續(xù)的實際道路測試和數(shù)據(jù)收集。利用基于物理的多宇宙能力生成合成數(shù)據(jù),確保訓(xùn)練AI的數(shù)據(jù)具有物理基礎(chǔ)、準確且合理,從而獲得海量訓(xùn)練數(shù)據(jù)。
自動駕駛行業(yè)已經(jīng)到來,未來幾年將見證其飛速發(fā)展。機器人技術(shù)領(lǐng)域,特別是人形機器人和通用機器人技術(shù),即將迎來ChatGPT時刻般的突破。
使能技術(shù)將推動通用機器人技術(shù)在未來幾年取得令人驚訝的快速發(fā)展。通用機器人技術(shù)的重要性在于,它能創(chuàng)造出無需特殊環(huán)境就能適應(yīng)“棕色地帶”的機器人。

這三種機器人是:自主機器人和自主AI(信息工作者);自動駕駛汽車(適應(yīng)已建成的道路和城市);人形機器人。如果我們擁有解決這三項問題的技術(shù),這將是世界上規(guī)模最大的技術(shù)產(chǎn)業(yè)。

因此,我們認為機器人時代即將到來。關(guān)鍵在于如何訓(xùn)練這些機器人,而對于人形機器人而言,模仿信息的收集尤其困難,因為汽車只需駕駛即可收集數(shù)據(jù)。
我們一直在探索人形機器人的運動學(xué)習(xí)。直接模仿人類演示對機器人來說效率低下,因此我們需要一種巧妙的方法,利用少量的人類演示數(shù)據(jù),通過人工智能和Omniverse合成生成海量合成運動數(shù)據(jù),從而讓AI學(xué)習(xí)執(zhí)行任務(wù)。
全球開發(fā)者正致力于構(gòu)建新一代物理形態(tài)的人工智能機器人,即人形機器人。然而,開發(fā)通用型機器人模型需要大量真實世界數(shù)據(jù),而數(shù)據(jù)的采集和整理成本高昂。NVIDIA Isaac Groot應(yīng)運而生,它為開發(fā)者提供了機器人基礎(chǔ)模型、數(shù)據(jù)管道、仿真框架和Thor機器人計算機,以應(yīng)對這些挑戰(zhàn)。
NVIDIA Isaac Groot合成運動生成的藍圖是一個基于模仿學(xué)習(xí)的仿真工作流程,能夠從小數(shù)量的人類演示中生成指數(shù)級的大型數(shù)據(jù)集。首先,Groot Teleop允許操作員使用Apple Vision Pro進入機器人的數(shù)字孿生體,即使沒有物理機器人也能捕獲數(shù)據(jù),并在安全環(huán)境中操作,避免物理損壞。操作員通過少量遙操作演示捕獲運動軌跡,然后使用Groot Mimic將其擴展到更大的數(shù)據(jù)集。接著,他們使用基于Omniverse和Cosmos構(gòu)建的Groot Gen進行領(lǐng)域隨機化和3D到現(xiàn)實的升級,生成指數(shù)級更大的數(shù)據(jù)集。Omniverse和Cosmos多元宇宙模擬引擎提供大規(guī)模數(shù)據(jù)集來訓(xùn)練機器人策略。最后,在將策略部署到真實機器人之前,開發(fā)人員可以在IsaacSim中進行軟件在環(huán)測試和驗證。
通用機器人的時代正在到來,NVIDIA Isaac Groot將為其提供海量數(shù)據(jù)支持,加速通用機器人發(fā)展。它為機器人行業(yè)提供了關(guān)鍵技術(shù)元素。
我還想向大家展示一項技術(shù),如果沒有大約十年前啟動的Digits項目(公司內(nèi)部稱之為深度學(xué)習(xí)GPU智能訓(xùn)練系統(tǒng)),這一切都將不可能實現(xiàn)。在推出之前,我們將其簡化為DGX,并使其與RTX、AGX、OVX以及公司其他X系列產(chǎn)品相協(xié)調(diào)。DGX-1徹底改變了人工智能。
我們研發(fā)這款產(chǎn)品,旨在為研究人員和初創(chuàng)公司提供一款開箱即用的AI超級計算機。過去,超級計算機的構(gòu)建需要自行建造設(shè)施、搭建基礎(chǔ)設(shè)施并進行復(fù)雜的系統(tǒng)設(shè)計。而我們?yōu)檠芯咳藛T和初創(chuàng)公司打造的這款A(yù)I超級計算機,真正實現(xiàn)了開箱即用。2016年,我們向OpenAI公司交付了第一臺DGX-1,埃隆·馬斯克、伊利亞及眾多工程師見證了這一時刻,DGX-1徹底改變了人工智能計算。
如今,人工智能已無處不在,不再局限于研究人員和初創(chuàng)公司的實驗室。正如演講伊始所言,我們希望人工智能成為一種新的計算方式,一種編寫軟件的新方法。每一位軟件工程師、工程師、創(chuàng)意藝術(shù)家,以及所有使用計算機作為工具的人,都需要一臺人工智能超級計算機。因此,我們希望DGX-1能更小巧一些。

女士們,先生們,這就是英偉達最新的AI超級計算機,目前代號為Project Digits項目。如果您有更好的命名建議,歡迎聯(lián)系我們。這款A(yù)I超級計算機運行著完整的NVIDIA AI軟件棧,包括所有NVIDIA軟件和DGX Cloud。它位于……某個地方,并通過無線連接或網(wǎng)絡(luò)連接至您的電腦,甚至可作為工作站使用。您可以像訪問云超級計算機一樣訪問它,并在其上運行NVIDIA的AI。

它基于我們研發(fā)的超級秘密芯片GB110,這是我們生產(chǎn)的最小型的Grace Blackwell芯片。這是其內(nèi)部結(jié)構(gòu),它目前正在量產(chǎn)中。這款絕密芯片是我們在與聯(lián)發(fā)科合作中研發(fā)的Gray CPU,專為英偉達打造,并與全球領(lǐng)先的SoC公司聯(lián)發(fā)科合作完成。他們與我們共同開發(fā)了這款CPU SoC,并通過芯片到芯片的NVLink連接到Blackwell GPU。

這款小巧的設(shè)備目前正在全面生產(chǎn)中,預(yù)計將于五月左右上市。它即將問世,其功能令人難以置信。我一直在思考,究竟是需要更多的手還是更多的口袋?總之,誰不想要這樣一臺機器呢?
如果您使用PC或Mac,它就是一個運行在您桌面的云計算平臺,您可以將其用作Linux工作站。 如果您需要雙位數(shù)性能,只需使用ConnectX連接,它便具備Nickel、GPU Direct等功能,開箱即用,就像一臺超級計算機,所有超級計算堆棧都可用,例如英偉達Digits項目。
我曾提到過,我們正在生產(chǎn)三臺新的Blackwells超級計算機。Grace Blackwell超級計算機,配備NVLink72s,已在全球投入生產(chǎn),我們現(xiàn)在擁有三套新的Blackwell系統(tǒng)。
一個令人驚嘆的AI基礎(chǔ)模型——世界首個物理AI基礎(chǔ)模型現(xiàn)已開放,可用于激活全球機器人等行業(yè)。另有三個機器人致力于自主AI(人類或機器人)和自動駕駛汽車。
這是令人難以置信的一年。感謝你們的合作與光臨。我制作了一個簡短的視頻,回顧過去一年并展望未來,現(xiàn)在播放。祝大家CES順利!新年快樂!謝謝!
熱門跟貼