在GeForce RTX 30和RTX 40時代,4K分辨率,最高畫質(zhì),外加光線追蹤以超過100FPS的效率運行3A級游戲大作,是旗艦級GPU才能完成的工作。按照GeForce RTX 3070和RTX 4070的定位,4K最高畫質(zhì)通常只能達(dá)到及格線水平,玩家們通常會退而求其次選擇2K分辨率進(jìn)行游戲。

有意思的是,4K高刷游戲顯示器定價不斷下探,2K顯示器與4K顯示器之間的價差已經(jīng)不大,一款能夠面向中高端主流,能完全開啟4K最高畫質(zhì)3A游戲大作的GPU勢在必行,在這個時間節(jié)點上,NVIDIA GeForce RTX 5070 Ti就顯得格外重要了。

打開網(wǎng)易新聞 查看精彩圖片

簡單的說,NVIDIA GeForce RTX 5070 Ti是一款令人印象深刻的顯卡,它首次讓70系GPU在4K最高畫質(zhì)且開啟光線追蹤的前提下,以輕松超過100FPS甚至更高的游戲幀率進(jìn)行。不僅如此,GeForce RTX 5070 Ti還配備了2個第九代NVENC視頻編碼器,1個第六代NVDEC視頻解碼器,配合NVIDIA Studio在行業(yè)中的影響力,同樣可以很好的勝任內(nèi)容創(chuàng)作工作。而針對FP4的原生支持,也讓GeForce RTX 5070 Ti在AI創(chuàng)作領(lǐng)域有不錯的戰(zhàn)斗力。

這款官方定價6299元(MSRP)的GeForce RTX 5070 Ti無疑有很多值得期待的地方,趁著評測解禁,不妨跟著我們一起看看這款GPU的真正實力,GeForce RTX 5070 Ti首發(fā)評測就此奉上。由于這個版本GPU目前沒有Founders Edition版本,這里我們使用影馳 GeForce RTX 5070 Ti刃作為參考。

打開網(wǎng)易新聞 查看精彩圖片

與RTX 5080同源

GeForce RTX 5070 Ti使用的是與GeForce RTX 5080同源的Blackwell GB203,通過限定GPC(Graphics Processing Clusters,圖形處理集群)和TPC(Texture Processing Clusters,紋理處理集群)數(shù)量,來實現(xiàn)定位上的差別。

Blackwell GB203沿用了此前Ampere和Ada Lovelace架構(gòu)設(shè)計理念,包含第五代Tensor Core,第四代RT Core,神經(jīng)網(wǎng)絡(luò)著色器等新硬件,以支持包含DLSS 4,RTX Mega Geometry在內(nèi)的大量新技術(shù)。芯片基于臺積電4NP定制工藝制造,面積378 mm2且包含456億個晶體管。

打開網(wǎng)易新聞 查看精彩圖片

因此一個Blackwell GB203中包含若干個GPC,每個GPC下面再包含若干個TPC,每個TPC下包含若干個SM(Streaming Multiprocessors,流式多處理器),同時再搭配顯存控制器等周邊電路。

完整的GB203已經(jīng)用到了GeForce RTX 5080上,核心型號GB203-400-A1。包含了7個GPC,每個GPC包含6個TPC,以及對應(yīng)的1組光柵引擎(Raster Engine),2組ROP集群(Raster Operations,光柵操作)。

打開網(wǎng)易新聞 查看精彩圖片

對應(yīng)的,GeForce RTX 5070 Ti使用的核心型號為GB203-200-A1,采用了6個GPC,35個TPC,意味著其中一個GPC還屏蔽了1個TPC。因此總共包含70個SM,每個SM包含128個CUDA Core,因此總共包含8960個CUDA Core。

此外每個SM包含4個第五代Tensor Core和1個第四代RT Core。GeForce RTX 5070 Ti總共包含280個第五代Tensor Core和70個第四代RT Core,GPU Boost頻率達(dá)到2452 MHz。

打開網(wǎng)易新聞 查看精彩圖片

在顯存上,GeForce RTX 5070 Ti搭配了16GB GDDR7 256-bit顯存,顯存頻率28 Gbps,顯存帶寬896 GB/s,對比RTX 4070 Ti的12GB GDDR6X 192-bit 21Gbps有顯著提升。

因此在整體功耗上,GeForce RTX 5070 Ti可以控制在300W。電源接口則保持使用12VHPWR接口,并提供16pin(12+4)轉(zhuǎn)接8pin x3電源線,以兼容舊規(guī)格電源。

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

這里我們慣例列舉一些重要參數(shù)作為比較:

打開網(wǎng)易新聞 查看精彩圖片

影馳GeForce RTX 5070 Ti刃

幫助GB203-400-A1核心散熱需要一套合理的散熱結(jié)構(gòu)設(shè)計。影馳GeForce RTX 5070 Ti刃系列引入了神話故事作為靈感,在顯卡裝甲中融入刃式裝甲與符咒元素,配合硬朗的顯卡線條設(shè)計,為其增添了不少力量感和神秘感。

打開網(wǎng)易新聞 查看精彩圖片

影馳GeForce RTX 5070 Ti刃(BLADE)系列一共提供了黑色和白色兩個版本,其中白色稱為影馳GeForce RTX 5070 Ti圣刃。

打開網(wǎng)易新聞 查看精彩圖片

黑色則為本次評測的版本,稱為影馳GeForce RTX 5070 Ti魔刃。兩款產(chǎn)品都配備了刃式散熱裝甲。并使用3個90mm直徑的霜環(huán)風(fēng)扇,支持靜音啟停。在壓力測試下,影馳GeForce RTX 5070 Ti刃的風(fēng)噪可以保持在46.6dBA。

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

散熱裝甲下則使用了鍍鎳熱管、均熱板與散熱片結(jié)合,配合優(yōu)化后的風(fēng)道設(shè)計,確保了GeForce RTX 5070 Ti的散熱性能。同樣在壓力測試下,室溫20℃環(huán)境中,表面最高溫度38℃不到,GPU核心溫度63℃。

打開網(wǎng)易新聞 查看精彩圖片

GALAX Aurora RGB信仰Logo燈效在這一代也沒有落下,并且使用了磁吸設(shè)計,可以根據(jù)喜好放在顯卡的正上方,或者側(cè)方。移動位置的方式非常簡單,在任何時候?qū)⑵淇巯拢诺搅硪贿?,靠近后通過磁吸即可固定點亮,非常方便。

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

影馳GeForce RTX 5070 Ti刃的設(shè)計非常緊湊,符合SFF-Ready標(biāo)準(zhǔn),也使得這張顯卡可以輕松放進(jìn)ITX機(jī)箱中。

打開網(wǎng)易新聞 查看精彩圖片

而在接口方面,影馳GeForce RTX 5070 Ti刃與公版看齊,包括3個DisplayPort 2.1b接口和1個HDMI 2.1a接口。其中DisplayPort 2.1b支持DSC技術(shù),最高可以實現(xiàn)480Hz條件下實現(xiàn)4K 12-bit HDR。如果使用并聯(lián)兩個DisplayPort 2.1b搭配的形式,則可以達(dá)到100Hz條件下8K HDR效果。HDMI 2.1a則同樣支持DSC技術(shù),最高支持165Hz條件下8K 12-bit HDR。

打開網(wǎng)易新聞 查看精彩圖片

目標(biāo):4K最高畫質(zhì)

現(xiàn)在我們知道CES 2025上,黃仁勛特別強(qiáng)調(diào)GeForce RTX 5070性能優(yōu)于RTX 4090是特指在DLSS 4運行的AI前提下實現(xiàn)。DLSS 4可以一步到位通過人工智能提升幀率,降低延遲,改善游戲畫質(zhì)。特別是引入了全新的多幀生成技術(shù)(Multi Frame Generation,MFG),提供更快的性能和更低的內(nèi)存使用,并且由CNN卷積神經(jīng)網(wǎng)絡(luò)模型更換到了Transformer模型,超分辨率(Super Resolution,SR),光線重建(Ray Reconstruction,RR),深度學(xué)習(xí)抗鋸齒(Deep Learning Anti-Aliasing,DLAA)均獲得了新的進(jìn)展,圖像質(zhì)量和穩(wěn)定性有所提升。

打開網(wǎng)易新聞 查看精彩圖片

DLSS 4取消DLSS 3上配合的光流加速器,改用第五代Tensor Core與Transformer模型配合判斷游戲幀的空間、時間關(guān)系。同時, NVIDIA云端AI不斷提供優(yōu)化。

打開網(wǎng)易新聞 查看精彩圖片

DLSS 4中能讓GeForce RTX 5070 Ti具備輕松超過4K 100FPS表現(xiàn)的技術(shù)即是多幀生成(DLSS 4 Multi Frame Generation)。原本在DLSS 3上,幀生成占據(jù)1/8的內(nèi)容,到了DLSS 4,則硬件渲染實際上只占據(jù)1/16,也就是在DLSS 4游戲中,每16幀游戲畫面中,實際上有15幀是由AI加速完成的。這意味著即使硬件性能變化不大的前提下,實際游戲幀率仍然可以有質(zhì)的提升。再加上DLSS本身對場景中的陰影、反射和遮擋有了很好的理解,實際生成效果也遠(yuǎn)比純靠硬件生成的效果好很多。這意味著,在傳統(tǒng)渲染的基礎(chǔ)上,通過AI在每幀之間多生成三幀的額外幀,并且與其他的DLSS技術(shù)套件協(xié)同工作。

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

這里測試平臺我們使用了Z790搭配Core i9-14900K作為平臺,并配備32GB DDR5-7200,1250W電源作為參考。顯示器使用了4K雙模的ROG XG27UCG。

在UL 3DMark DLSS Feature Test中,可以看到開啟DLSS 4 4X的模式下,GeForce RTX 5070 Ti甚至可以優(yōu)于RTX 4090 D。

打開網(wǎng)易新聞 查看精彩圖片

NVIDIA也表示,DLSS 4游戲和應(yīng)用將會很快實裝,在近段時間內(nèi)就會有75款應(yīng)用和游戲支持DLSS 4。這里我們主要與RTX 4070 Ti SUPER進(jìn)行比較。這里先用《心靈殺手2》作為對比,開啟DLSS 4 4X之后,GeForce RTX 5070 Ti表現(xiàn)是RTX 4070 Ti SUPER的2倍。

打開網(wǎng)易新聞 查看精彩圖片

同時游戲畫面中諸如鐵絲網(wǎng)的細(xì)節(jié)不再出現(xiàn)迷之抖動,DLSS 4 4X的穩(wěn)定性比DLSS 3要好很多,甚至比原畫質(zhì)也好上不少。

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

同樣,《霍格沃茨之遺》也是在4K分辨率最高畫質(zhì)下進(jìn)行,DLSS 4 4X加持下的GeForce RTX 5070 Ti表現(xiàn)是RTX 4070 Ti SUPER的1.84倍。游戲場景中的壁畫細(xì)節(jié)在DLSS 4 4X下會更為清晰。

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

《賽博朋克2077》已經(jīng)在正式版中對Transformer模型和DLSS 4提供了支持。在設(shè)置中就能找到DLSS Super Resolution的選項。開啟DLSS 4 4X后,GeForce RTX 5070 Ti表現(xiàn)是RTX 4070 Ti SUPER的2.5倍。

打開網(wǎng)易新聞 查看精彩圖片

這里不妨讓我們也進(jìn)行一下畫質(zhì)對比,風(fēng)扇在鐵絲網(wǎng)后的旋轉(zhuǎn)導(dǎo)致的復(fù)雜光影,在DLSS 4下表現(xiàn)的更為穩(wěn)定。

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

《星球大戰(zhàn):亡命之徒》開啟DLSS 4 4X后,GeForce RTX 5070 Ti表現(xiàn)是RTX 4070 Ti SUPER的1.91倍。

打開網(wǎng)易新聞 查看精彩圖片

同樣游戲中也獲得了更多的陰影細(xì)節(jié),例如植物葉片邊緣不再有陰影抖動。

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

喜聞樂見的DND游戲《龍騰世紀(jì)4:影障守護(hù)者》在光影效果呈現(xiàn)上也能得到很好的展示。在開啟DLSS 4 4X之后,游戲細(xì)節(jié)獲得了明顯提升,陰影也不再抖動了。開啟DLSS 4 4X后,GeForce RTX 5070 Ti表現(xiàn)是RTX 4070 Ti SUPER的2倍。

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

《漫威爭鋒》開啟DLSS 4 4X后,GeForce RTX 5070 Ti表現(xiàn)是RTX 4070 Ti SUPER的2.1倍。

打開網(wǎng)易新聞 查看精彩圖片

順帶一提,目前NVIDIA APP已經(jīng)可以通過DLSS優(yōu)設(shè)(Override)來調(diào)整《漫威爭鋒》和《龍騰世紀(jì)4:影障守護(hù)者》表現(xiàn),即在游戲之外就可以完成對游戲的畫質(zhì)與DLSS設(shè)置,在很大程度上省略了很多的麻煩。

同時我們也能看到開啟DLSS 4之后,系統(tǒng)延遲并沒有因此會有大幅變化。NVIDIA甚至為了解決多幀生成帶來的不確定性,Blackwell使用了增強(qiáng)版的幀翻轉(zhuǎn)計量(Flip Metering)作為解決方案,它將幀節(jié)奏邏輯轉(zhuǎn)移到顯示引擎上,讓GPU可以更精確的管理顯示時序。

打開網(wǎng)易新聞 查看精彩圖片

除了游戲,諸如D5渲染器這樣的專業(yè)應(yīng)用也已經(jīng)引入了對DLSS 4的支持。例如在軟件菜單中,可以看到Super Resolution,Ray Reconstruction和Frame Generation選項。

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

在同一個場景中,GeForce RTX 5070 Ti表現(xiàn)是RTX 4070 Ti SUPER的3.2倍,同時也是RTX 4090 D的1.8倍,實際使用體驗中非常接近RTX 5080了。

打開網(wǎng)易新聞 查看精彩圖片

基礎(chǔ)性能進(jìn)階

RTX 50系列光柵基礎(chǔ)性能也是大伙最關(guān)心的測試之一。這里慣例引用DirectX 11和DirectX 12性能的3DMark Time Spy,3DMark Time Spy Extreme,3DMark Fire Strike Extreme,3DMark Fire Strike Ultra,Port Royal。

打開網(wǎng)易新聞 查看精彩圖片

從綜合來看,GeForce RTX 5070 Ti表現(xiàn)可以與RTX 4080打得有來有回。如果對比GeForce RTX 5070 Ti與RTX 4070 Ti SUPER,提升幅度平均在7%到20%之間。

打開網(wǎng)易新聞 查看精彩圖片

游戲?qū)崙?zhàn)部分,我們使用2K分辨率最高畫質(zhì),且開啟光線追蹤進(jìn)行。在DLSS 3游戲中,GeForce RTX 5070 Ti相對RTX 4070 Ti SUPER提升25%到50%,變化還是非常大的。

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

如果是時間更早的DLSS 2游戲,GeForce RTX 5070 Ti相對RTX 4070 Ti SUPER提升也有在25%到30%之間。

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

值得說明《鳴潮》PC版也很快加入對DLSS 3的支持,作為橫跨多端的游戲,在GeForce RTX 5070 Ti上通過開啟光追、DLSS 3,在4K分辨率下可以輕松獲得超過150FPS表現(xiàn)。這里我們在部分場景中開啟式和關(guān)閉光線追蹤進(jìn)行對比,例如下圖墻壁光影和人物攀爬時候的倒影清晰可見。

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

開啟光追后,草原景色變得更為生動。

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

溪流光影也變得更為自然。

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

AI創(chuàng)作能打

文章開頭我們提到GeForce RTX 5070 Ti配備了2個第九代NVENC編碼器和1個第六代NVDEC解碼器,并且在硬件上提供對YUV 4:2:2支持。YUV 4:2:2是目前獲取更多顏色信息、減少文件大小,滿足帶寬需求的合理選擇。在YUV 4:2:2視頻中,完整的亮度值被保留,同時保留了一半的原始色度信息,YUV 4:2:2壓縮視頻幀僅占YUV 4:4:4的三分之二,同時提供了YUV 4:2:0兩倍的顏色分辨率。

打開網(wǎng)易新聞 查看精彩圖片

這里我們通過DaVinci Resolve 19編輯4:2:2視頻素材進(jìn)行了嘗試,在輸出選項中,可以看到H265 422 10bit編碼選項,這里我們輸出一段由索尼A7拍攝的H.265 59.94fps 4:2:2 30秒左右的視頻素材。

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

這里能夠看到GeForce RTX 5070 Ti只需要花費10秒時間,就能完成一段由索尼A7拍攝的H.265 59.94fps 4:2:2 30秒左右的視頻素材。對應(yīng)的,Core i9-14900K需要56秒才能實現(xiàn)。

打開網(wǎng)易新聞 查看精彩圖片

在渲染測試中,我們選擇了V-Ray 6 Benchmark和Blender Benchmark 4.3.0。

這里可以看到GeForce RTX 5070 Ti在V-Ray 6 Benchmark中的表現(xiàn)高于RTX 4080 SUPER。同時GeForce RTX 5070 Ti表現(xiàn)是RTX 4070 Ti SUPER的2.5倍。

打開網(wǎng)易新聞 查看精彩圖片

Blender Benchmark 4.3.0中,GeForce RTX 5070 Ti相對RTX 4070 Ti SUPER提升5%。

打開網(wǎng)易新聞 查看精彩圖片

SPECviewperf用來考驗OpenGL和Direct X API的3D圖形性能,測試場景包括3dsmax、Catia、Creo、Energy、Maya、Medical、SNX、Solidworks。這里GeForce RTX 5070 Ti相對RTX 4070 Ti SUPER提升1%到20%不等。

打開網(wǎng)易新聞 查看精彩圖片

最后是喜聞樂見的AI表現(xiàn)。Blackwell開始從硬件層面引入對FP4數(shù)據(jù)格式支持,則可以很好的解決這個問題。原因是FP4提供了一種較低的量化方式,類似于文件壓縮,能夠減少模型的大小。

打開網(wǎng)易新聞 查看精彩圖片

相對大多數(shù)模型默認(rèn)使用的FP16精度相比,F(xiàn)P4所需的內(nèi)存是FP16的不到一半,并且GeForce RTX 50系列可以提供相比上一代2倍以上的性能,F(xiàn)P4可以通過NVIDIA TensorRT模型優(yōu)化器的量化方式,確保質(zhì)量不會有太多損失。

這里先通過UL Procyon FLUX.1 AI Image Generation Demo for NVIDIA進(jìn)行測試。FLUX.1是一個基于FP4模型,擁有120億個圖像生成模型參數(shù)??梢钥吹紾eForce RTX 5070 Ti表現(xiàn)與GeForce RTX 5080相近,并且由于對FP4的原生支持,GeForce RTX 5070 Ti的速度是RTX 4080 SUPER的3倍,GeForce RTX 4070 Ti SUPER會差的更遠(yuǎn)。

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

UL Procyon 的Stable Diffusion 1.5 FP16以及Stable Diffusion XL FP16的測試中,也可以看到明顯差距。GeForce RTX 5070 Ti表現(xiàn)與RTX 4080 SUPER有來有回,相對RTX 4070 Ti SUPER則是提升幅度明顯。

打開網(wǎng)易新聞 查看精彩圖片

UL Procyon AI文本生成基準(zhǔn)測試包含了多個大語言模型LLMs作為AI性能評估,包括Phi-3.5-mini-3.8B,Mistral-7B-v0.2 7B,Llama -3.1 8B,Llama-2 13B。也可以看到GeForce RTX 5070 Ti相對RTX 4070 Ti SUPER提升在20%左右。

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

最后是由MLCommons聯(lián)盟開發(fā)的機(jī)器學(xué)習(xí)基準(zhǔn)測試MLPerf,MLCommons聯(lián)盟來自哈佛大學(xué)、斯坦福大學(xué)、NVIDIA、谷歌的工程師和研究人員。這里MLPerf-client使用Meta的Llama2-7B模型進(jìn)行。GeForce RTX 5070 Ti相對RTX 4070 Ti SUPER提升在12%到17%之間。

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

寫在最后:4K游戲利器

NVIDIA GeForce RTX 5070 Ti給人印象不錯,DLSS 4 4X加持后可以輕松讓3A級游戲在4K最高畫質(zhì)且開啟最高光追效果的前提下,輕松將幀率拉升至140FPS甚至200FPS以上,放在以前主流級GPU而言是不敢想象的。

打開網(wǎng)易新聞 查看精彩圖片

重點是DLSS 4的支持速度遠(yuǎn)比我們迅速得多,接下來包括《黑神話:悟空》在內(nèi)的75款游戲和應(yīng)用會陸續(xù)對DLSS 4提供支持,而未來的3A級游戲大作,通過DLSS 4獲得4倍的幀率提升,獲得流暢的4K最高畫質(zhì)游戲體驗也將成為基本盤。

打開網(wǎng)易新聞 查看精彩圖片

不僅如此,得益于原生支持FP4以及新一代的編解碼器,GeForce RTX 5070 Ti的AI性能和內(nèi)容創(chuàng)作實際表現(xiàn)也已經(jīng)遠(yuǎn)超上一代旗艦級顯卡。哪怕是在基礎(chǔ)光柵性能上,GeForce RTX 5070 Ti的表現(xiàn)已經(jīng)大致上與RTX 4080 SUPER相當(dāng),后者定價已經(jīng)來到近萬元,對比之下,6299元GeForce RTX 5070 Ti得以彰顯。

打開網(wǎng)易新聞 查看精彩圖片

另外影馳GeForce RTX 5070 Ti刃在實際體驗過程可圈可點,扎實的做工和優(yōu)秀的散熱表現(xiàn),讓GeForce RTX 5070 Ti性能得以很好的釋放。對于大多數(shù)玩家而言,購買非OC款GPU已經(jīng)能夠獲得很好的體驗。

如果你是RTX 4070 Ti或者RTX 3070以前的用戶,不要猶豫,在第一時間入手GeForce RTX 5070 Ti,發(fā)揮4K高刷顯示器展現(xiàn)出真正的實力,無疑是最酸爽的。

打開網(wǎng)易新聞 查看精彩圖片