當(dāng)顯示器價格不斷下探,2K分辨率顯示器使用率的增長速度想到相當(dāng)明顯。在Steam最近的硬件統(tǒng)計中,2560x1440分辨率占比接近30%,同樣也是所有分辨率顯示中增長幅度最大的。2K顯示器開始逐漸取代1920x1080分辨率的同時,GPU算力跟進(jìn)變得順理成章。而這個責(zé)任,現(xiàn)在落到了NVIDIA GeForce RTX 5070身上。

在CES 2025上,NVIDIA給GeForce RTX 5070疊了很多層Buff,在體驗表現(xiàn)上可以比肩上一代旗艦,并且官方建議零售價4599元人民幣,一副性價比爆棚的樣子。雖然部分體驗表現(xiàn)限定在開啟DLSS 4的游戲場景中,但作為未來3A級游戲必然支持的新技術(shù),誘惑力一下子就上來了。

這時候GeForce RTX 5070依然給我們留下了很多懸念,它的基礎(chǔ)光柵性能表現(xiàn)是否也讓人滿意,作為主流級GPU,它可以讓我們的PC具備什么樣的素質(zhì)。隨著評測解禁,現(xiàn)在就讓我們奉上GeForce RTX 5070 Founders Edition首發(fā)評測。

新晉玩家:GB205
GeForce RTX 5070使用了一塊與GeForce RTX 5070 Ti不同的GPU型號,即Blackwell GB205。Blackwell針對AI超算、數(shù)據(jù)中心、服務(wù)器,以及消費(fèi)端制定了多個版本,服務(wù)器和數(shù)據(jù)中心以GB100為開頭,針對游戲和消費(fèi)端優(yōu)化則是我們現(xiàn)在所看到的GB200系列。其中GeForce RTX 5070使用的型號是GB205-300-A1,屬于Blackwell架構(gòu),基于臺積電4N FinFET定制工藝制造,擁有310億個晶體管,芯片面積263mm2。

在設(shè)計理念上,Blackwell架構(gòu)與Ampere和Ada Lovelace架構(gòu)設(shè)計相似,即一個GPU中包含若干個GPC(Graphics Processing Clusters,圖形處理集群),每個GPC下面再包含若干個TPC(Texture Processing Clusters,紋理處理集群),每個TPC下包含2個SM(Streaming Multiprocessors,流式多處理器),同時再搭配顯存控制器等周邊電路。

SM下即為Blackwell微架構(gòu)的主要體現(xiàn),包括128個CUDA Core,1個第四代RT Core,4個第五代Tensor Core,4個紋理單元(Texture Units),1個512KB寄存器文件,128KB L1共享緩存,這些緩存可以根據(jù)圖形和計算工作負(fù)載需求進(jìn)行重新配置。同時,SM還包含兩個FP64,F(xiàn)P64 TFLOP速率是FP32 TFLOP速率的1/64,對于消費(fèi)端而言使用頻率不高,但可以保證FP64代碼可以被正確的執(zhí)行。對應(yīng)的,Tensor Core也包含了少量的FP64 Tensor來確保程序的正確執(zhí)行。

完整的GB205擁有5個GPC,25個TPC,50個SM,以及6個32-bit內(nèi)存控制器,用來控制12GB GDDR7 192-bit顯存。GPU中包含了6400個CUDA Core,50個第四代RT Core,200個第五代Tensor Core,200個紋理單元,以及80個ROP(Raster Operations,光柵化處理單元)。在內(nèi)存子系統(tǒng)上,完整的GB205擁有6.25MB L1緩存,12.8MB寄存器文件,以及48MB L2緩存。

GeForce RTX 5070沒有使用完整的GB205,代號GB205-300-A1 GPU屏蔽了1組TPC,即包括5個GPC,24個TPC,48個SM??偣?144個CUDA Core,80個ROP,192個第五代Tensor Core,48個第四代RT Core,GPU Boost頻率來到2512 MHz。6MB L1緩存,48MB L2緩存。配合12GB 192-bit GDDR7顯存,顯存頻率可以來到28Gbps,帶寬達(dá)到672GB/sec,比RTX 4070提高了33%。
在編解碼能力上,GeForce RTX 5070提供了1個第九代NVENC,1個第六代NVDEC。
這里我們慣例列舉一些重要參數(shù)作為比較:

宛如藝術(shù)品的Founders Edition
如果有機(jī)會,筆者建議在選購時多考慮NVIDIA公版的Founders Edition,原因是太漂亮了。GeForce RTX 5070 Founders Edition同樣如此。
GeForce RTX 5070 Founders Edition的設(shè)計也是從外包裝開始的,簡約低調(diào),提供易開口,撕開腰封的一刻,就能看到“Inspired by Gamers. Enhanced by Al. Built by NVIDIA.”(靈感來自玩家,性能來自AI,制造來自NVIDIA)字樣,格調(diào)拉滿。


盒子內(nèi)襯包含了NVIDIA Logo以及象征著內(nèi)凹散熱格柵設(shè)計的背景。

與此同時,下方型號也驗明GeForce RTX 5070 Founders Edition正身。

白色內(nèi)膽盒包含了GeForce RTX 5070 Founders Edition本體。與RTX 5080設(shè)計一樣,向兩側(cè)拉開外包裝盒就可以將內(nèi)膽取出。


外包裝盒還提示了內(nèi)部包含顯卡本體、轉(zhuǎn)換線纜以及說明書。

轉(zhuǎn)換線纜規(guī)格為12VHPWR 16pin(12+4)轉(zhuǎn)8pin x2電源接口,主要是應(yīng)對老規(guī)范電源使用,12VHPWR本身最高可以支持到600W功耗,GeForce RTX 5070的TGP為250W,應(yīng)對供電沒有壓力。

拉開內(nèi)膽上下紙質(zhì)卡口,就可以輕松打開內(nèi)膽包裝。紙質(zhì)卡口使用的是復(fù)用設(shè)計,所以也能將其輕松復(fù)原。打開包裝后就能看到GeForce RTX 5070 Founders Edition本體了,正面上看,一個風(fēng)扇都沒有,非常簡約,金屬質(zhì)感的X設(shè)計配合圓潤的邊緣,讓顯卡看起來像是一個藝術(shù)品。

由于這一代Founders Edition對PCB進(jìn)行了全新設(shè)計,讓其面積大幅縮減,給雙風(fēng)扇都騰出了流通的空間,從而提升了空氣流通的效率,也進(jìn)而將顯卡體積縮小。


這里奉上一張RTX 5090 PCB作為參考。

這是GeForce RTX 30系列Founders Edition采用異型PCB和單流通設(shè)計之后的全新嘗試,也是有史以來第一款全流通式冷卻架構(gòu)。在實際壓力測試中,GeForce RTX 5070 Founders Edition噪音在49dBA,在機(jī)箱中的噪音幾乎可以忽略。

這時候用紅外線檢測,在室溫20℃環(huán)境中,可以看到GeForce RTX 5070 Founders Edition 最高溫度在40℃左右,電源接口34℃。此時GPU核心溫度在68℃。

由于PCB不再連接到顯卡的IO面板,設(shè)計團(tuán)隊為了保證接口UHBR20 DisplayPort 2.1b 和 HDMI 2.1b性能,專門使用了注入玻璃纖維帶狀線纜作為保障。

因此在接口配置上,GeForce RTX 5070 Founders Edition包含了3個DisplayPort 2.1b接口和1個HDMI 2.1a接口。其中DisplayPort 2.1b支持DSC技術(shù),最高可以實現(xiàn)480Hz條件下實現(xiàn)4K 12-bit HDR。HDMI 2.1a則同樣支持DSC技術(shù),最高支持165Hz條件下8K 12-bit HDR。
不同于RTX 5080 FE,GeForce RTX 5070 Founders Edition接口右側(cè)面板沒有封死,而是繼續(xù)留了通氣口。

不同定位的Founders Edition在導(dǎo)熱材質(zhì)上的選擇也有不同。比如GeForce RTX 5090 Founders Edition使用了液態(tài)金屬作為導(dǎo)熱材質(zhì)。GeForce RTX 5070 Founders Edition使用相對常規(guī)的相變硅脂。
GeForce RTX 5070 Founders Edition小巧的外觀與GeForce RTX 4070 FE相比,在尺寸上變化不大,細(xì)節(jié)是電源接入方式回到了45度的斜插方式,并在外觀上看起來圓潤很多,一體感也更強(qiáng)。



用DLSS 4戰(zhàn)2K
GeForce RTX 5070 Founders Edition強(qiáng)力表現(xiàn)最大的功臣自然要算DLSS 4。DLSS 4是Blackwell提升游戲體驗的重要技術(shù),DLSS 4可以一步到位通過人工智能提升幀率,降低延遲,改善游戲畫質(zhì)。

DLSS 4引入了全新的多幀生成技術(shù)(Multi Frame Generation,MFG),提供更快的性能和更低的內(nèi)存使用,并且由CNN卷積神經(jīng)網(wǎng)絡(luò)模型更換到了Transformer模型,這讓超分辨率(Super Resolution,SR),光線重建(Ray Reconstruction,RR),深度學(xué)習(xí)抗鋸齒(Deep Learning Anti-Aliasing,DLAA)都有了更好的表現(xiàn),在圖像細(xì)節(jié)質(zhì)量和穩(wěn)定上都有所提升。
需要注意,DLSS 4完全體需要GeForce RTX 50系列GPU才能實現(xiàn),因為需要第五代Tensor Core與NVIDIA云端AI共同合力的結(jié)果。

而DLSS 4帶來的效果是立竿見影的。最大的改變就是DLSS 3上的幀生成,變成了DLSS 4上的多幀生成。重點(diǎn)就在一個“多”上。
DLSS 3的幀生成需要依靠Ada Lovelace中的光流加速器,配合游戲運(yùn)動矢量,AI網(wǎng)絡(luò),實現(xiàn)每個傳統(tǒng)渲染幀之外,單獨(dú)多生成一個幀。
而在GeForce RTX 5070 Founders Edition的Blackwell架構(gòu)中,第五代Tensor Core在每個傳統(tǒng)渲染幀之間生成的幀數(shù),從1個提升到了最多3個。這是Blackwell硬件和DLSS軟件共同合作的結(jié)果。

這套運(yùn)算方式讓原本的硬件光流加速器也被高效的AI模型代替,使得光流場的生成速度得到提升,AI模型也顯著降低了生成額外幀的計算成本。因此新幀生成AI模型比之前幀生成方法快40%,使用的顯存減少了30%,并且每個渲染幀只需要運(yùn)行一次即可生成多個幀。

按照慣例,考慮到游戲表現(xiàn)和內(nèi)容創(chuàng)作表現(xiàn),我們準(zhǔn)備了兩套測試平臺。一套是針對游戲的AMD Ryzen 7 9800XD3搭配X870E,內(nèi)容創(chuàng)作上則使用Intel Core i9-14900K搭配Z790作為補(bǔ)充,內(nèi)存為32GB DDR5-7200,電源1250W。同時顯示器使用了ROG XG27UCG 4K與FHD雙模切換顯示器作為體驗和游戲畫質(zhì)參考。

在DLSS 4的基礎(chǔ)測試中,UL 3Dmark DLSS Feature Test項目已經(jīng)給DLSS 4提供了預(yù)覽版的支持,GeForce RTX 5070通過DLSS 4 4X將幀率提升6.4倍,實際表現(xiàn)幾乎是RTX 4070的2倍。并且對比RTX 4090 D DLSS 3表現(xiàn),僅剩一步之遙了。

在實踐上,DLSS 4游戲和應(yīng)用已經(jīng)開始發(fā)力,在近段時間內(nèi),就會有超過75款應(yīng)用和游戲支持DLSS 4。讓筆者體感最為深刻的就是《漫威爭鋒》從首發(fā)宣布支持DLSS 4,需要依靠NVIDIA APP實現(xiàn)2X到4X調(diào)整,現(xiàn)在只需要在游戲里就能完成無縫切換,無需重啟游戲的功能。
在實際游戲體驗中,GeForce RTX 5070表現(xiàn)可以做到RTX 4070的2.5倍。

《龍騰世紀(jì)4:影障守護(hù)者》中,GeForce RTX 5070表現(xiàn)可以做到RTX 4070的2.1倍。

另外《龍騰世紀(jì)4:影障守護(hù)者》獲得了NVIDIA APP的支持,即在游戲啟動之前,找到DLSS Override選項,就可以可以直接對分辨率超采樣,幀生成進(jìn)行調(diào)整。

重點(diǎn)是DLSS 4帶來的畫質(zhì)體驗效果也非常不錯。在2K分辨率最高畫質(zhì)下,GeForce RTX 5070通過DLSS 4 4X在光影上獲得了更多穩(wěn)定表現(xiàn),畫質(zhì)在體感上有進(jìn)一步提升。


事實上,由于DLSS 4上幀數(shù)增加而導(dǎo)致的變動明顯,從而導(dǎo)致整體流暢性受影響。為了解決多幀生成帶來的不確定性,Blackwell使用了增強(qiáng)版的幀翻轉(zhuǎn)計量(Flip Metering)作為解決方案,它將幀節(jié)奏邏輯轉(zhuǎn)移到顯示引擎上,讓GPU可以更精確的管理顯示時序。
因此前面檢測的1% Low FPS均使用FrameView利用MsBetweenDisplayChange來計算檢測,原因是常規(guī)的檢測方式依靠CPU將幀傳遞給GPU傳遞的時差進(jìn)行判斷,由于Blackwell使用了多幀生成技術(shù),利用Flip Metering而非CPU的幀速率作為判斷,因此這套方式并不準(zhǔn)確。通過GPU原生的翻轉(zhuǎn)計量,這可以更為精確的抓到結(jié)果。

回到游戲上?!痘舾裎执闹z》同樣加入了對DLSS 4的支持,2K分辨率最高畫質(zhì)且開啟光線追蹤的前提下,GeForce RTX 5070通過DLSS 4 4X實現(xiàn)了將近300FPS的表現(xiàn),相當(dāng)于RTX 4070的2倍。

同樣在畫質(zhì)上,DLSS 4 4X的畫質(zhì)效果更為銳利。


《心靈殺手2》更注重游戲的氛圍感,在開啟DLSS 4 4X后,諸如鐵絲網(wǎng)的細(xì)節(jié)遠(yuǎn)比DLSS 3穩(wěn)定很多,不再出現(xiàn)抖動的情況,甚至表現(xiàn)比原畫質(zhì)還要好上不少。


這里GeForce RTX 5070通過DLSS 4 4X實現(xiàn)了122FPS的表現(xiàn),是RTX 4070的1.5倍。

《賽博朋克2077》表現(xiàn)更為突出一些,GeForce RTX 5070加持DLSS 4 4X后是RTX 4070 DLSS 3的3.5倍幀率表現(xiàn)。

對應(yīng)的畫質(zhì)也顯著提升,特別是風(fēng)扇與網(wǎng)格之間猶豫運(yùn)動產(chǎn)生的偽影不見了。


最后是《星球大戰(zhàn):亡命之徒》,游戲中已經(jīng)內(nèi)置了幀生成Frame Generation和光線重建Ray Reconstruction兩個選項,其中幀生成Frame Generation可以提供2X幀生成和3X和4X的多幀生成。

實際表現(xiàn)中,GeForce RTX 5070搭配DLSS 4 4X可以做到189FPS平均值,是RTX 4070 DLSS 3的2倍。

然后是基礎(chǔ)光柵性能測試。慣例選用DirectX 11和DirectX 12性能的3DMark Time Spy,3DMark Time Spy Extreme,3DMark Fire Strike Extreme,3DMark Fire Strike Ultra,Port Royal作為參考。
GeForce RTX 5070的表現(xiàn)略遜于RTX 4070 Ti SUPER,但相對RTX 4070,提升幅度可以達(dá)到30%到40%。

因此在2K游戲的實戰(zhàn)環(huán)節(jié)。DLSS 3游戲中,GeForce RTX 5070表現(xiàn)與RTX 4070 Ti SUPER是持平的,部分場景相對RTX 4070 Ti SUPER略好一些,但在同一個水平。而如果相對RTX 4070,提升幅度還是非常明顯的,可以做到30%到40%左右的提升。


在DLSS 2的游戲中,GeForce RTX 5070表現(xiàn)也與RTX 4070 Ti SUPER相當(dāng),并且相對RTX 4070提升大概在20%到40%左右。


AI依然帶勁
在AI環(huán)節(jié),這里先通過UL Procyon FLUX.1 AI Image Generation Demo for NVIDIA進(jìn)行測試。FLUX.1是一個基于FP4模型,擁有120億個圖像生成模型參數(shù),因此對顯存要求也非常高,必須要在16GB顯存以上才能完成。
Blackwell開始從硬件層面引入對FP4數(shù)據(jù)格式支持,則可以很好的解決這個問題。原因是FP4提供了一種較低的量化方式,類似于文件壓縮,能夠減少模型的大小。相對大多數(shù)模型默認(rèn)使用的FP16精度相比,F(xiàn)P4所需的內(nèi)存是FP16的不到一半,并且GeForce RTX 50系列可以提供相比上一代2倍以上的性能,F(xiàn)P4可以通過NVIDIA TensorRT模型優(yōu)化器的量化方式,確保質(zhì)量不會有太多損失。

GeForce RTX 5070原生支持FP4,對GeForce RTX 4070差距有3.6倍。


另外在Procyon的Stable Diffusion 1.5 FP16,以及Stable Diffusion XL FP16的測試中,RTX 5070相對RTX 4070提升在16%到21%。

同樣是UL Procyon AI的文本生成基準(zhǔn)測試中,選取了多個大語言模型LLMs作為AI性能評估,包括Phi-3.5-mini-3.8B,Mistral-7B-v0.2 7B,Llama -3.1 8B,Llama-2 13B。RTX 5070與RTX 4070 Ti SUPER表現(xiàn)相當(dāng),且相對于RTX 4070提升在10%到140%,差距是很明顯的。


MLPerf-Client v0.5是由MLCommons聯(lián)盟開發(fā)的機(jī)器學(xué)習(xí)基準(zhǔn)測試,成員來自哈佛大學(xué)、斯坦福大學(xué)、NVIDIA、谷歌的工程師和研究人員,旨在不同平臺下探討GPU的AI性能釋放,LLMs大語言模型正好是其中之一。這里MLPerf-client使用Meta的Llama2-7B模型進(jìn)行。
同樣,RTX 5070與RTX 4070 Ti SUPER表現(xiàn)相當(dāng),且相對于RTX 4070提升在10%到20%。


順帶一提,DLSS 4也已經(jīng)在D5渲染器中得到了應(yīng)用,已經(jīng)可以在軟件菜單中找到Super Resolution,Ray Reconstruction和Frame Generation選項。另外DLSS 4 4X多幀生成還可以通過NVIDIA APP設(shè)置來實現(xiàn)。

實際幀率中,RTX 5070和RTX 4070 Ti SUPER相當(dāng),通過對DLSS 4的支持,表現(xiàn)是RTX 4070 DLSS 3將近一倍的幀率。

在視頻編輯測試中,我們能夠看到GeForce RTX 5070在創(chuàng)作力上的表現(xiàn)。其配備了1個第九代NVENC編碼器和1個第六代NVDEC解碼器,并且在硬件上提供對YUV 4:2:2支持。在拍攝、編輯、色彩校正的過程中,YUV 4:2:2是目前獲取更多顏色信息、減少文件大小,滿足帶寬需求的合理選擇。在YUV 4:2:2視頻中,完整的亮度值被保留,同時保留了一半的原始色度信息,YUV 4:2:2壓縮視頻幀僅占YUV 4:4:4的三分之二,同時提供了YUV 4:2:0兩倍的顏色分辨率。
YUV 4:2:2相當(dāng)于YUV 4:4:4與YUV 4:2:0之間的新選擇,并且已經(jīng)成為高端用戶和專業(yè)視頻攝像機(jī)提供的選擇,當(dāng)然這也意味著原本以來CPU處理的方式會導(dǎo)致效率低下,用戶體驗不足。

在DaVinci Resolve 19的輸出選項中,可以看到GeForce RTX 5070能夠順利開啟4:2:2 10bit輸出。

這里我們輸出一段由索尼A7拍攝的H.265 59.94fps 4:2:2 30秒左右的視頻素材,GeForce RTX 5070花費(fèi)時間大概在19秒左右的時間。

如果你是視頻編輯的基礎(chǔ)用戶,GeForce RTX 5070已經(jīng)比擁有32線程的Core i9-14900K更能打,當(dāng)然相對于擁有更多編解碼器的RTX 5090 D而言,差距也是明顯的。

另外在V-Ray 6 Benchmark GPU RTX性能測試中,GeForce RTX 5070相對GeForce RTX 4070提升47%。


外Blender Benchmark 4.3.0引入的Moster、Junkshop、Classroom三個參考場景作為參考。GeForce RTX 5070相對GeForce RTX 4070提升幅度在4%到18%。

最后是SPECviewperf用來考驗OpenGL和Direct X API的3D圖形性能,測試場景包括3dsmax、Catia、Creo、Energy、Maya、Medical、SNX、Solidworks。GeForce RTX 5070相對RTX 4070提升有20%到40%。

寫在最后:2K游戲好手
NVIDIA GeForce RTX 5070 Founders Edition令人印象深刻的地方在于,以4599元的定價,獲得與RTX 4070 Ti SUPER的光柵性能,而后者目前市場價格將近7000元,性價比一下子就得以體現(xiàn)。而一旦獲得DLSS 4加持,畫風(fēng)就完全不一樣了,RTX 5070可以在2K分辨率下輕松應(yīng)對所有3A大作光線追蹤最高畫質(zhì),實際游戲幀率是RTX 4070的2倍以上,這是以前這個價位不敢想象的。

游戲之外的AI與創(chuàng)作領(lǐng)域,GeForce RTX 5070表現(xiàn)也同樣出色。得益于對FP4原生支持,未來AIGC效率將會變得更高,即便是對比更高階的RTX 4070 Ti SUPER,表現(xiàn)也可圈可點(diǎn)。依靠NVIDIA在行業(yè)內(nèi)的影響力,更多專業(yè)軟件和AI應(yīng)用也會加入到針對GeForce RTX 50系列GPU的優(yōu)化中,很快我們就能看到GeForce RTX 5070越來越強(qiáng)。

如果有機(jī)會選擇,筆者更建議大伙考慮GeForce RTX 5070 Founders Edition版本,這一代的Founders Edition使用了更前沿的設(shè)計理念,在滿足散熱效果的同時,也將顯卡尺寸做得更小,更容易裝進(jìn)小型主機(jī)中,對于主流玩家而言,體驗相當(dāng)友好。

顯然,如果你在等待一款主流定位的GPU,并且在未來一段時間內(nèi)獲得2K最高畫質(zhì)流暢體驗,以及AIGC和內(nèi)容創(chuàng)作的酸爽,在這個價位段下,競爭對手興許會在部分領(lǐng)域給予更高的性價比,但如果想獲得至始至終的流暢體驗,一定是非GeForce RTX 5070莫屬的。

熱門跟貼