果然強(qiáng)者的唯一定律是突破自我——NVIDIA于9月1日發(fā)布的最新GeForce RTX 30系列顯卡,采用全新NVIDIA Ampere架構(gòu)GPU核心,在上一代Turing架構(gòu)GeForce RTX 20系列顯卡的基礎(chǔ)上更進(jìn)一步,而性能甚至超過(guò)了GeForce RTX 2080Ti的RTX 3080,售價(jià)僅為5000多元,幾乎是前者的一半。
在上一篇“安培的力量——深入解析NVIDIA GeForce RTX 3000系列顯卡”中,我們剖析了基于NVIDIA Ampere架構(gòu)的新一代顯卡從架構(gòu)上有哪些重要革新,包括重新設(shè)計(jì)的著色器、第三代Tensor Core和第二代RT Core,以及最新的GDDR6X顯存,RTX I/O等技術(shù)。
得益于NVIDIA和三星定制的8nm制程工藝,采用GA102核心的GeForce RTX 3080擁有283億個(gè)晶體管,其CUDA核心數(shù)量達(dá)到了驚人的8704個(gè),要知道上一代RTX 2080 Super也僅僅只有3072個(gè),而RTX 2080Ti作為旗艦卡CUDA核心數(shù)量也只達(dá)到4352個(gè)。
這種碾壓性的晶體管數(shù)量的超越,為RTX 3080帶來(lái)的恐怖的性能,也在核心設(shè)計(jì)上為GPU內(nèi)部的著色器設(shè)計(jì)帶來(lái)了巨大的改善——其每一個(gè)SM(流式多處理器)的分區(qū)在每個(gè)時(shí)鐘周期能夠執(zhí)行32次FP32(32位浮點(diǎn)運(yùn)算)操作,這就使得SM中的全部4個(gè)分區(qū)加在一起每個(gè)時(shí)鐘周期可以進(jìn)行128次FP32操作——吞吐量翻倍。對(duì)于圖形渲染,著色器的工作和計(jì)算都是直接受益于FP32運(yùn)算速度,而光線追蹤等最新的技術(shù)也會(huì)被FP32進(jìn)一步加持。
下面讓我們來(lái)看看在實(shí)際測(cè)試中GeForce RTX 3080的表現(xiàn)。
主要測(cè)試環(huán)境:
CPU:AMD Ryzen 7 3700X ——主流高端CPU平臺(tái)(CPU天梯排名與Intel i7-10700K,i9-9820X相當(dāng))
內(nèi)存:8GB×4 = 32GB 海盜船DDR4-3600——主流內(nèi)存搭配平臺(tái)實(shí)現(xiàn)四通道,內(nèi)存容量符合主流玩家配置
GPU:NVIDIA RTX 2080Super(作為對(duì)比顯卡)、NVIDIA RTX 3080(測(cè)試卡)
磁盤:三星 860Pro 512GB NVMe SSD——平均2000MB的讀寫帶寬,沒有存儲(chǔ)瓶頸
測(cè)試內(nèi)容主要為基準(zhǔn)性能跑分測(cè)試和游戲測(cè)試,內(nèi)容為:
RTX 3080顯卡的標(biāo)準(zhǔn)跑分:
3DMark Fire Strike ——詮釋DirectX 11對(duì)照上代卡的提升
3DMark Time Spy ——DirectX 12 基準(zhǔn)測(cè)試
3DMark Port Royal —— 顯卡的光線追蹤基準(zhǔn)測(cè)試
3DMark DLSS ——深度學(xué)習(xí)超采樣測(cè)試
游戲測(cè)試:
奇點(diǎn)灰燼:擴(kuò)展版(Ashes of the Singularity: Escalation)——沒有人真正玩過(guò)這個(gè)游戲,都是用它來(lái)做DX12跑分Benchmark
刺客信條:奧德賽(Assassin's Creed Odyssey)——眾生平等的基準(zhǔn)測(cè)試
堡壘之夜(Fortnite)——支持光線追蹤的網(wǎng)游
控制(Control)——支持DLSS 2.0的游戲
德軍總部:新血脈(Wolfenstein: Youngblood)——光線追蹤和DLSS測(cè)試
邊境(跑分測(cè)試)(Boundary Benchmark)——國(guó)產(chǎn)游戲大作,支持光線追蹤
光明記憶:無(wú)限(Bright Memory: Infinity)——國(guó)內(nèi)知名大作,虛幻4.9引擎打造,光線追蹤+DLSS測(cè)試
地鐵:離去(Metro Exodus)——早期支持光線追蹤和DLSS的游戲,標(biāo)桿
我的世界(光追版)(MineCraft(RTX))——不用多說(shuō)了吧
TensorFlow ——深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練
CPU-Z和GPU-Z是老牌的CPU和GPU信息查看工具,可以最大限度的讀取硬件信息,詳細(xì)到緩存大小、制程工藝以及電壓、功耗等。
圖:CPU-Z顯示的AMD Ryzen 7 3700X的數(shù)據(jù)
圖:GPU-Z更新到2.34版本,識(shí)別出RTX 3080顯卡的全部信息
AIDA64自帶的基礎(chǔ)測(cè)試可以反映GPU和CPU讀寫內(nèi)存的基本性能和一些算數(shù)性能——可以看出CPU對(duì)于內(nèi)存讀寫擁有絕對(duì)優(yōu)勢(shì),而在單精度計(jì)算方面,RTX 3080比R7 3700X快了30倍,雙精度計(jì)算方面兩者不相上下,在24位、32位和64位整數(shù)操作方面,GPU大大勝出。超多的CUDA核心也幫助RTX 3080在AES-256和SHA-1 Hash加密計(jì)算方面完勝。
下面我們進(jìn)入重點(diǎn)的性能測(cè)試和游戲測(cè)試環(huán)節(jié):
3DMark Fire Strike
3DMark Fire Strike是一項(xiàng)適用于高性能游戲電腦和超頻系統(tǒng)的 DirectX 11 基準(zhǔn)測(cè)試。即使對(duì)于最新的顯卡而言,F(xiàn)ire Strike 測(cè)試也非常嚴(yán)苛。我們用這個(gè)測(cè)試來(lái)對(duì)比經(jīng)典的3A游戲在上一代RTX 2080 Super上的成績(jī)以及如今RTX 3080的成績(jī)——可以刨除RT Core和 Tensor Core來(lái)公平的看待可編程著色器的提升。
測(cè)試內(nèi)容:
1.顯卡測(cè)試1:具有大量曲面細(xì)分和體積照明。
2.顯卡測(cè)試2:使用 GPU 上的計(jì)算著色器和動(dòng)態(tài)顆粒照明產(chǎn)生復(fù)雜的煙霧模擬。
3.物理測(cè)試:物理測(cè)試在 CPU 上并列運(yùn)行 32 項(xiàng)柔體和剛體模擬。
4.綜合測(cè)試:包括在 GPU 上運(yùn)行曲面細(xì)分、照明、煙霧模擬和顆粒及后處理效果,同時(shí) CPU 則在運(yùn)行 32 個(gè)并行物理模擬。
可以看出,在DirectX 11的跑分中,RTX 3080顯卡性能是上一代主流RTX 2080 Super顯卡的1.5倍,甚至在4K、5K乃至8K分辨率的測(cè)試中,差距會(huì)逐漸拉大——8K分辨率下性能差距近2倍。新的可編程著色器確實(shí)有著效能上的巨大提升。
3DMark Time Spy ——DirectX 12 基準(zhǔn)測(cè)試
Time Spy是第一個(gè)針對(duì)DirectX 12的獨(dú)立第三方基準(zhǔn)測(cè)試工具,整個(gè)引擎完全基于DX12設(shè)計(jì),可充分壓榨顯卡的DX12性能,測(cè)試負(fù)載也遠(yuǎn)遠(yuǎn)高于此前的DirectX 11 Fire Strike。值得一提的是,測(cè)試中可以開啟或者關(guān)閉異步計(jì)算(Async Compute),因?yàn)椴皇敲恳环NGPU架構(gòu)都支持該特性——NVIDIA的顯卡從Pascal架構(gòu)開始支持這一特性。
測(cè)試內(nèi)容:
1.顯卡測(cè)試1:具有許多透明的內(nèi)容,顆粒陰影和曲面細(xì)分。
2.顯卡測(cè)試2:利用數(shù)百個(gè)光源和大量微小顆粒來(lái)實(shí)現(xiàn)光線追蹤體積照明。
3.CPU測(cè)試:CPU測(cè)試使用物理運(yùn)算和定制模擬的嚴(yán)格組合來(lái)測(cè)量處理器性能。
測(cè)試DirectX 12我們決定從2K分辨率開始測(cè)試,拋棄已經(jīng)逐漸被淘汰的1080P??梢钥闯觯?K分辨率下,RTX 3080一騎絕塵的領(lǐng)先RTX 2080 Super顯卡1.5倍以上,而在4K和5K分辨率下則領(lǐng)先了1.65倍,到了8K分辨率這一優(yōu)勢(shì)進(jìn)一步擴(kuò)大到了近1.7倍。
3DMark Port Royal —— 顯卡的光線追蹤基準(zhǔn)測(cè)試
Port Royal 是用于測(cè)試實(shí)時(shí)光線追蹤性能的顯卡基準(zhǔn)測(cè)試。在GeForce RTX 2080系列顯卡剛推出的時(shí)候,是當(dāng)時(shí)市面上唯一的光線追蹤第三方測(cè)試工具。該測(cè)試結(jié)合了實(shí)時(shí)光線追蹤和傳統(tǒng)渲染技術(shù)來(lái)測(cè)量顯卡性能。場(chǎng)景具有光線追蹤反射,陰影(光線追蹤和陰影映射),具有光線追蹤反射的玻璃表面,體積照明,粒子和后處理效果。
實(shí)測(cè)性能很“哇塞”,光線追蹤在RTX 2080 Super這一代上可以說(shuō)是初出茅廬,當(dāng)時(shí)廣受玩家質(zhì)疑,游戲少,旗艦卡才能帶得動(dòng),幀率一般。而到了這一代NVIDIA Ampere架構(gòu)打造的RTX 3080顯卡,Port Royal在2K分辨率下都能達(dá)到52幀,超過(guò)1萬(wàn)分的成績(jī),相比RTX 2080 Super提升了1.6倍,而4K下的成績(jī)則提升了近1.7倍。
3DMark DLSS ——基于深度學(xué)習(xí)的超采樣測(cè)試
深度學(xué)習(xí)超級(jí)采樣(DLSS) 是一種 NVIDIA RTX 系列顯卡擁有的獨(dú)特技術(shù),它利用深度學(xué)習(xí)和 AI 的強(qiáng)大能力來(lái)提高游戲性能,同時(shí)保持視覺質(zhì)量,相比TAA這類全屏抗鋸齒,AI自動(dòng)“腦補(bǔ)”的平滑畫面和銳利的細(xì)節(jié)得到了完美平衡。
3DMark DLSS功能測(cè)試會(huì)運(yùn)行 Port Royal 基準(zhǔn)測(cè)試兩次,以測(cè)試 DLSS 性能和圖像質(zhì)量。第一次運(yùn)行 Port Royal 時(shí),會(huì)以輸出分辨率渲染,并停用 DLSS 以測(cè)量基線性能。第二輪以較低的分辨率渲染 Port Royal,然后使用 DLSS 處理以達(dá)到輸出分辨率所需的幀。在結(jié)果屏幕會(huì)報(bào)告每次運(yùn)行的幀率。
在DLSS測(cè)試中,開啟了DLSS功能之后,可以明顯看到幀率的上升——Tensor Core分擔(dān)了原來(lái)由著色器負(fù)責(zé)的抗鋸齒功能,釋放了大量的計(jì)算力。2K分辨率下,RTX 3080開啟DLSS之后幀率達(dá)到72.8幀,是關(guān)閉DLSS功能時(shí)52幀的1.4倍。而相比同樣開啟了DLSS的RTX 2080 Super的45幀,RTX 3080的幀率提升了1.6倍以上。其他分辨率場(chǎng)景下也有著類似的提升。
總結(jié)一下,在作為基準(zhǔn)性能測(cè)試的3DMark評(píng)測(cè)中,可以看出RTX 3080不管是在傳統(tǒng)DirectX 11還是DirectX 12 乃至壓軸的光線追蹤和DLSS測(cè)試中均表現(xiàn)出了1.5倍以上的性能提升。我們還觀察到分辨率越高,這種性能提升就越明顯——新的著色器,Tensor Core和RT Core相比上一代RTX 20系列有著名副其實(shí)的提升。
下面是游戲測(cè)試:
奇點(diǎn)灰燼:擴(kuò)展版(Ashes of the Singularity: Escalation)
有個(gè)傳說(shuō),奇點(diǎn)灰燼這個(gè)游戲沒人真正的好好玩過(guò),都是用它來(lái)做DirectX 12的跑分Benchmark。這可能說(shuō)的夸張了,但是事實(shí)是用奇點(diǎn)灰燼來(lái)做基準(zhǔn)衡量顯卡的差異還是很有代表性的。
總結(jié)一下游戲的跑分如下表:
在2K分辨率下,RTX 3080 相比RTX 2080 Super有著1.2倍的幀率提升,而在4K分辨率下,則有著近1.4倍的幀率提升——可見這個(gè)游戲因?yàn)楸容^古老,因而只有在高分辨率下才會(huì)吃顯卡資源,顯示出新顯卡的優(yōu)勢(shì)。
刺客信條:奧德賽(Assassin's Creed Odyssey)
又是一款老游戲,我們?cè)u(píng)測(cè)游戲有一個(gè)特色,就是喜歡把“古代游戲”拿出來(lái)遛一遛,原因在于可以方便玩家對(duì)比當(dāng)年同平臺(tái)測(cè)試這款游戲的數(shù)據(jù),也可以實(shí)際拷問一下新一代顯卡的GPU自身效率是否提升——拋開光線追蹤等等這些新特性,著色器的效率提升有多大,可以用經(jīng)典的老游戲測(cè)試出來(lái)。
奧德賽DirectX 11游戲的作為基準(zhǔn)測(cè)試,可以看出來(lái)拋開很多“先進(jìn)”的技術(shù),只從著色器角度來(lái)比較,RTX 3080相比上一代顯卡也有著很大的進(jìn)步——有著1.4倍以上的提升。而相對(duì)來(lái)說(shuō)1080P這樣沒什么負(fù)擔(dān)的“低分辨率”設(shè)定,就讓顯卡有點(diǎn)吃不飽,因此拉不開差距。
堡壘之夜(Fortnite)
9月15號(hào)EPIC正式宣布了《堡壘之夜》更新并將于9月17日加入光線追蹤和DLSS特性,在更新游戲版本后,玩家可以體驗(yàn)到游戲中的圖像質(zhì)量顯著提升后的效果,包括光線追蹤反射、陰影、全局光照和環(huán)境光遮蔽等特效。同時(shí),英偉達(dá)的 DLSS 技術(shù)將為游戲在提高幀率的同時(shí),兼顧清晰的畫面。此外,Reflex 技術(shù)還將為游戲降低延遲。
為了凸顯光線追蹤效果,堡壘之夜還將新增一個(gè)名為 “RTX Treasure Run”的特殊創(chuàng)造性模式地圖,在該地圖中,玩家將處于博物館入口,面臨尋寶游戲的挑戰(zhàn),可以體現(xiàn)不同的光線追蹤效果。
我們提前拿到了帶有光線追蹤和DLSS 2.0特性的堡壘之夜,相關(guān)測(cè)試如下:
只要是DLSS 2.0就會(huì)支持三種模式:質(zhì)量、平衡和性能模式,如果算上關(guān)閉,就是四種狀態(tài)。從上圖可以看出,在關(guān)閉光線追蹤時(shí),無(wú)論是2K還是4K分辨率下,開啟DLSS都可以大幅度提高幀率——4K分辨率時(shí),RTX 2080 Super只有51幀,而RTX 3080可以達(dá)到82幀,但是一旦開啟DLSS,質(zhì)量模式兩者可以同時(shí)提升至79幀以及125幀,提升幅度超過(guò)50%,而DLSS性能模式下,兩者分別提升到107幀和163幀——提升了2倍以上。
2K分辨率下也有類似的情況,可以說(shuō)這才是堡壘之夜這款電競(jìng)游戲應(yīng)該具有的幀率。
那么開啟光線追蹤以后呢?堡壘之夜這種美漫風(fēng)格的FPS游戲,內(nèi)部光影和穿著皮衣皮褲的人物都帶來(lái)了海量的光線反射、折——如果不打開DLSS,即便是2K分辨率下,RTX 3080也只能到33幀,而4K分辨率下則只有16幀——相對(duì)的RTX 2080 Super則可憐的只有18幀和9幀。那么打開了DLSS之后,2K分辨率的性能模式下,RTX 3080的幀數(shù)可以達(dá)到93幀,而4K分辨率下則能擁有48幀,提升幅度達(dá)到3倍左右。RTX 2080 Super也分別可以提升到55幀和44幀。
可見DLSS對(duì)于開啟光線追蹤之后的游戲幀率,可以用“大補(bǔ)仙丹”的效果來(lái)形容,讓光線追蹤特性幾乎不會(huì)額外對(duì)顯卡產(chǎn)生消耗,彌補(bǔ)了光線追蹤海量計(jì)算帶來(lái)的性能下降。而RTX 3080顯卡相對(duì)RTX 2080 Super有著1.7倍左右的優(yōu)勢(shì)。
控制(Control)
《控制》是一款去年8月發(fā)布的第三人稱動(dòng)作冒險(xiǎn)游戲,畫風(fēng)看上去與同門作品《量子破碎》頗有幾分相似,兩者還都主打超能力元素。玩家要在超自然的空間中,利用各項(xiàng)超能力、武器和環(huán)境要素,打敗邪惡力量。
游戲里可以選擇開啟光線追蹤的哪些細(xì)節(jié)選項(xiàng),以及高、中、關(guān)掉三種光線追蹤選項(xiàng)。
上圖里開啟和關(guān)閉光線追蹤可以看到地磚反射的光線完全不同,開啟之后更加真實(shí)。此外,這款游戲也是支持光線追蹤和DLSS 2.0特性的,可以為玩家提供身臨其境的視效體驗(yàn)。
和之前測(cè)試的堡壘之夜類似,支持DLSS 2.0的《控制》也是擁有一大堆排列組合的測(cè)試結(jié)果——明顯的趨勢(shì)是4K分辨率下RTX 3080顯卡更能發(fā)揮出優(yōu)勢(shì), 要比RTX 2080 Super幀率提升的多。例如開啟光線追蹤之后,RTX 3080的幀率從62幀掉到40幀,仍然可玩;而RTX 2080 Super則直接從40幀掉到了16幀,變成了幻燈片。
在打開DLSS之后,4K分辨率的性能模式下,RTX 3080的幀率達(dá)到了102幀,RTX 2080 Super也攀上了60幀。在2K分辨率下,同時(shí)打開光線追蹤和DLSS性能模式,兩者則各自能達(dá)到160幀和104幀,幀率提升幅度震撼。
經(jīng)過(guò)這幾個(gè)測(cè)試,我們強(qiáng)烈建議,無(wú)論是否打開光線追蹤,都建議各位玩家打開DLSS,這種做法都可以極大地提升游戲幀率——可以說(shuō)是電競(jìng)玩家的一針興奮劑。
德軍總部:新血脈(Wolfenstein: Youngblood)
《德軍總部:新血脈》是德軍總部系列游戲重啟之后的第四部外傳性質(zhì)的作品,游戲口碑一般,但是用來(lái)做測(cè)試是再好不過(guò)——這款2019年的游戲支持光線追蹤和DLSS。讓我們來(lái)看一下在2K分辨率和4K分辨率模式下的跑分狀況:
圖:2K分辨率下RTX 3080 vs RTX 2080 Super
圖:4K分辨率下RTX 3080 vs RTX 2080 Super
對(duì)比2K和4K分辨率分別只打開RT光線追蹤,以及同時(shí)打開光線追蹤+DLSS的成績(jī),可以看出來(lái)在2K分辨率時(shí),同時(shí)打開光線追蹤+DLSS可以極大的提升平均幀率,讓游戲更加流暢,這其中,RTX 3080在只打開光線追蹤時(shí)的幀率(147幀)是RTX 2080 Super(90幀)的1.6倍,而同時(shí)打開光線追蹤+DLSS,RTX 3080的幀率(191幀)是上代顯卡(122幀)的1.56倍。
但是在4K分辨率時(shí),情況就不一樣了,首先是RTX 2080 Super,可能是因?yàn)橛?jì)算力不足,同時(shí)打開光線追蹤+DLSS,幀率反而有了下降(從50幀降到33幀),而RTX 3080則從84幀上升到120幀——這應(yīng)該和第三代Tensor Core有著密不可分的聯(lián)系。4K分辨率下,RTX 3080在只打開光線追蹤時(shí)的幀率(84幀)是RTX 2080 Super(50幀)的1.68倍,而打開了光線追蹤+DLSS之后,RTX 3080(120幀)是RTX 2080 Super(33幀)的3.6倍,大幅的碾壓了上代顯卡。
可以說(shuō)這個(gè)測(cè)試體現(xiàn)了RTX 3080已經(jīng)在4K分辨率下做好了全面支持光線追蹤+DLSS的準(zhǔn)備,而DLSS也確實(shí)可以通過(guò)人工智能解放GPU的算力,在保證畫面的同時(shí),大大提升光線追蹤開啟后的游戲幀率。
邊境(跑分測(cè)試)(Boundary Benchmark)
《邊境》這個(gè)游戲是國(guó)內(nèi)知名的柳葉刀工作室今年的重磅FPS游戲作品,雖然還沒有正式發(fā)售,但是這兩天放出了支持光線追蹤的基準(zhǔn)測(cè)試軟件(Raytracing Benchmark),基于《邊境》舞臺(tái)背景的測(cè)試程序,以全程實(shí)時(shí)光線追蹤還原出一個(gè)更加真實(shí)的《邊境》世界。在本月稍晚時(shí),玩家們也能夠下載程序并親自體驗(yàn)。
邊境這個(gè)基準(zhǔn)測(cè)試最能說(shuō)明的問題就是在全部打開光線追蹤的前提下,DLSS 2.0的4個(gè)模式分別有什么作用——明顯關(guān)閉了DLSS之后,光線追蹤的壓力將游戲幀率壓得很低。2K分辨率下,RTX 3080只有41.8幀,而RTX 2080 Super更是只有23.6幀,堪堪不是幻燈片。而4K分辨率下,不論是RTX 3080還是RTX 2080 Super都變成了幻燈片,幀率分別為19.6幀和9.07幀。
而性能模式的DLSS可以極大的發(fā)揮作用,用已經(jīng)訓(xùn)練好的AI模型利用Tensor Core做推理,進(jìn)而釋放著色器和RT Core的計(jì)算量,幀率在2K分辨率時(shí),分別達(dá)到了99.9幀(RTX 3080)和59.6幀(RTX 2080 Super)。在4K分辨率時(shí),幀率提升到48.8幀(RTX 3080) 和23.1幀(RTX 2080 Super)。
當(dāng)切換到DLSS質(zhì)量模式時(shí),畫面比性能模式更精細(xì),但是幀率在2K分辨率時(shí)也下降到了69.9幀(RTX 3080) 和41.1幀(RTX 2080 Super),而4K分辨率下幀率則只有34.2幀(RTX 3080) 和18.8幀(RTX 2080 Super)。
DLSS平衡模式介于性能模式和質(zhì)量模式之間,幀率也介于兩者之間,這里就不在贅述。值得一提的是,我們注意到在選擇DLSS性能模式時(shí),游戲?qū)︼@卡的顯存占用率并不大,而在選擇DLSS質(zhì)量時(shí)最大——我們推測(cè)是DLSS所選用的AI模型的精度導(dǎo)致了占用的緩存的大小,越精細(xì)的訓(xùn)練模型占用空間越大,而性能模式用了較小的AI模型,所以也能兼顧一部分幀率。
光明記憶:無(wú)限(Bright Memory: Infinity)
《光明記憶:無(wú)限》是即將發(fā)售的國(guó)內(nèi)知名的FPS游戲,由飛燕群島工作室基于虛幻4.9引擎打造。游戲雖然是FPS第一人稱射擊類型,但是擺脫了傳統(tǒng)的戰(zhàn)斗類型并融合了ACT動(dòng)作元素。雖然游戲沒有發(fā)售,但是我們?cè)谄浠鶞?zhǔn)測(cè)試中可以測(cè)試大量的光線追蹤特效,這個(gè)測(cè)試有兩種模式:能測(cè)試模式,在每次運(yùn)行完后顯示幀率和幀數(shù)統(tǒng)計(jì)信息;演示模式,循環(huán)播放直至用戶退出。四級(jí)畫質(zhì)模式供選擇:低、中、高、最高。
據(jù)官方介紹,在光明記憶:無(wú)限中使用到了非常多的光追特效:
• 光追焦散(ray traced caustics)
• 光追折射(ray traced refractions)
• 光追反射(透明及不透明表面)(ray traced reflections on translucent & opaque surface)
• 光追陰影(ray traced shadows)
• 光追環(huán)境光遮蔽(ray traced ambient occlusion)
• 光追多層透明(ray traced order-independent transparency, OIT)
這個(gè)基準(zhǔn)測(cè)試擁有相當(dāng)多的組合,可以看到RT的光線追蹤特性可以選擇:極高品質(zhì)、高品質(zhì)、普通品質(zhì)和低品質(zhì),而DLSS也可以選擇性能模式、質(zhì)量模式和關(guān)閉。排列組合一下,2K和4K分辨率分別能有12個(gè)成績(jī)。
可以看出,在2K模式下,選擇極高品質(zhì)光線追蹤時(shí),關(guān)閉DLSS之后,RTX 3080的成績(jī)只有36幀,而RTX 2080 Super更是只能達(dá)到25幀的幀率。而開啟DLSS之后幀率最高可以提升到99幀和56幀,可見DLSS對(duì)于光線追蹤的助力相當(dāng)大。
而在4K分辨率下,極高品質(zhì)的光線追蹤,在關(guān)閉DLSS時(shí)RTX 3080只能有16幀,而RTX 2080 Super只有區(qū)區(qū)14幀,測(cè)試這個(gè)項(xiàng)目的時(shí)候基本上是在看幻燈片。而在打開DLSS之后,性能模式下RTX 3080可以達(dá)到50幀,RTX 2080 Super可以達(dá)到27幀,畫面雖然不卡頓,但是作為FPS游戲,不到60幀談不上流暢,而實(shí)際上應(yīng)該在120幀以上才能達(dá)到競(jìng)技的標(biāo)準(zhǔn)。不過(guò)我們認(rèn)為實(shí)際游戲上市時(shí)應(yīng)該會(huì)做更多優(yōu)化,放低一些身段。
地鐵:離去(Metro Exodus)
《地鐵:離去》是一款由4A Games開發(fā)、Deep Silver發(fā)行的第一人稱射擊游戲,本作是地鐵系列的第三作,作為2019年早期發(fā)布的游戲,地鐵這款游戲是很早就支持光線追蹤和DLSS特效的大作,可以看到如下圖,開啟了光線追蹤以后,游戲場(chǎng)景變得更加自然,光照呈現(xiàn)了物理世界應(yīng)有的漫反射,而并不假。
對(duì)比兩個(gè)顯卡的成績(jī),可以發(fā)現(xiàn),在關(guān)閉了DLSS的情況下,4K分辨率下,打開光線追蹤的RTX 2080 Super只有11.25幀的成績(jī),而RTX 3080則可以擁有33.85的幀率,是前者的近3倍。如果再打開DLSS,RTX 2080 Super的成績(jī)可以來(lái)到31.51幀,而RTX 3080則可以達(dá)到47.74幀的成績(jī)——DLSS就像催化劑一樣將幀率提升了一大截。
有意思的是,如果關(guān)閉光線追蹤,只開啟DLSS來(lái)抗鋸齒,幀率仍然會(huì)大幅上升——RTX 2080 Super從21.95幀上升到40.28幀,而RTX 3080則從34.08幀上升到57.64幀。可見用DLSS來(lái)取代傳統(tǒng)TAA可以極大的釋放可編程著色器的計(jì)算力,進(jìn)而影響幀率。
我的世界(光追版)(MineCraft(RTX))
自從4月份NVIDIA和微軟聯(lián)合宣布《我的世界》RTX光追版以來(lái),玩家們紛紛感嘆這與之前相比完全是兩個(gè)游戲——“路徑追蹤”光線追蹤技術(shù),可模擬光線在整個(gè)場(chǎng)景中的傳輸方式,為眾多不同類型的效果提供統(tǒng)一的光照計(jì)算模型,是傳統(tǒng)光柵化或混合渲染器難以實(shí)現(xiàn)的,其中包括:
- 來(lái)自太陽(yáng)、天空和各種光源的直射光照
- 逼真的清晰陰影和柔和陰影
- 來(lái)自發(fā)光石和熔巖等發(fā)射面的光線
- 全局照明
- 水和金屬表面的精確反射
- 可反射、折射和散射的透明材質(zhì),如彩色玻璃、水、冰
- 體積霧和光軸
可以明顯看出有了光線追蹤之后,我的世界里的一草一木一磚一瓦,雖然仍是像素級(jí)游戲風(fēng)格,但是已經(jīng)充滿了真實(shí)的光追特效——巖漿仿佛都能感受到溫度。
除了光線追蹤,我的世界里還加入了DLSS,從測(cè)試中可以看到,在4K分辨率下,即便是RTX 3080的強(qiáng)大能力,在開啟了光線追蹤而關(guān)閉了DLSS之后,幀率也只能達(dá)到31.6幀,RTX 2080 Super更是只有18.7幀。而一旦同時(shí)開啟了DLSS,RTX 3080的幀率會(huì)飆升到92.2幀,而RTX 2080 Super的幀率也可以達(dá)到56.4幀——和之前的游戲一樣,DLSS會(huì)極大的釋放著色器的工作負(fù)荷,從而提升幀率。
相比之下,2K分辨率下的成績(jī)更有意思,尤其是同時(shí)開啟光線追蹤和DLSS的時(shí)候,RTX 3080異軍突起的成績(jī)直達(dá)148.6幀,而RTX 2080 Super只有90.9幀——這應(yīng)該是得益于全新RT Core和第三代Tensor Core的共同發(fā)力,再加上新設(shè)計(jì)的著色器,在2K分辨率這個(gè)甜點(diǎn)上可以充分的配合,發(fā)揮全部性能。
TensorFlow
作為彩蛋,我們還測(cè)試了知名的TensorFlow深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練。要知道很多人,尤其是學(xué)生和中小公司,買不起計(jì)算卡來(lái)做訓(xùn)練,往往就會(huì)去買GeForce系列的顯卡來(lái)做CUDA計(jì)算——2017年A.I取得突破性的發(fā)展之后,這種趨勢(shì)更加明顯。
可以看到RTX 3080相比RTX 2080 Super的長(zhǎng)足進(jìn)步,在深度學(xué)習(xí)的訓(xùn)練上有至少37%的提升,VSG11模型的訓(xùn)練能達(dá)到75%以上的性能提升——我們推測(cè)這是8704個(gè)CUDA核心vs 3072個(gè)CUDA核心的優(yōu)勢(shì)。
那么為什么不是兩倍以上的提升呢??jī)蓚€(gè)原因:1.我們只有Windows版最初的驅(qū)動(dòng),這里面肯定還有很多優(yōu)化空間,而真實(shí)的訓(xùn)練場(chǎng)景用的是Linux環(huán)境。2.對(duì)于新的GPU來(lái)說(shuō),原來(lái)的這些訓(xùn)練框架有不少值得優(yōu)化的地方,未來(lái)可以釋放更多硬件的潛力。
總結(jié)一下,基于NVIDIA Ampere架構(gòu)的GeForce RTX 3080顯卡在我們的測(cè)試中確實(shí)達(dá)到了發(fā)布會(huì)上的性能,在幾乎所有的游戲和基礎(chǔ)測(cè)試中碾壓了RTX 2080 Super。有網(wǎng)友可能會(huì)疑惑為什么我們不拿RTX 2080Ti來(lái)做對(duì)比測(cè)試,有三個(gè)原因:
1、RTX 3080的售價(jià)是5499元人民幣,理應(yīng)和同價(jià)位區(qū)間的顯卡做對(duì)比,而RTX 2080Ti售價(jià)超過(guò)1萬(wàn)。
2、發(fā)布會(huì)上發(fā)布的RTX 3090雖然對(duì)應(yīng)的是之前的Titan系列顯卡,主要為專業(yè)人士使用,但是超過(guò)萬(wàn)元的售價(jià)似乎更適合于RTX 2080Ti對(duì)標(biāo)。
3、我們認(rèn)為NVIDIA也許保留了RTX 3080Ti在未來(lái)的某個(gè)時(shí)候發(fā)布,因而應(yīng)該把和RTX 2080Ti的對(duì)比測(cè)試留到那時(shí)候。
2018年底我們?cè)谏疃冉馕龅谝淮С止饩€追蹤的GeForce RTX 2080Ti顯卡時(shí)曾經(jīng)感嘆,RT Core和Tensor Core這兩種核心將徹底改變計(jì)算機(jī)圖形領(lǐng)域和整個(gè)游戲產(chǎn)業(yè),時(shí)間證明了這個(gè)趨勢(shì),而NVIDIA用自己的Ampere架構(gòu)進(jìn)一步夯實(shí)了光線追蹤+DLSS的未來(lái)——RTX 3080用親民的價(jià)格,強(qiáng)大的性能,將光線追蹤和第二代DLSS全面帶入4K時(shí)代,黃教主又一次證明了自己的遠(yuǎn)見卓識(shí)。
好文章,需要你的鼓勵(lì)
這項(xiàng)研究提出了"高效探測(cè)"方法,解決了掩碼圖像建模AI難以有效評(píng)估的問題。通過(guò)創(chuàng)新的多查詢交叉注意力機(jī)制,該方法在減少90%參數(shù)的同時(shí)實(shí)現(xiàn)10倍速度提升,在七個(gè)基準(zhǔn)測(cè)試中均超越傳統(tǒng)方法。研究還發(fā)現(xiàn)注意力質(zhì)量與分類性能的強(qiáng)相關(guān)性,生成可解釋的注意力圖譜,展現(xiàn)出優(yōu)異的跨域適應(yīng)性。團(tuán)隊(duì)承諾開源全部代碼,推動(dòng)技術(shù)普及應(yīng)用。
伊利諾伊大學(xué)研究團(tuán)隊(duì)開發(fā)了CLAIMSPECT系統(tǒng),通過(guò)層次化分解復(fù)雜爭(zhēng)議、智能檢索相關(guān)文獻(xiàn)、多角度收集觀點(diǎn)的方法,將傳統(tǒng)的"真假"判斷轉(zhuǎn)變?yōu)槎嗑S度分析。該系統(tǒng)能夠自動(dòng)構(gòu)建爭(zhēng)議話題的分析框架,識(shí)別不同觀點(diǎn)及其支撐證據(jù),為科學(xué)和政治爭(zhēng)議提供更全面客觀的分析,已在生物醫(yī)學(xué)和國(guó)際關(guān)系領(lǐng)域驗(yàn)證有效性。
清華大學(xué)研究團(tuán)隊(duì)首次提出情感認(rèn)知融合網(wǎng)絡(luò)(ECFN),讓AI能像人類一樣理解和表達(dá)情感。該系統(tǒng)通過(guò)多層次情感處理架構(gòu),在情感識(shí)別準(zhǔn)確率上比現(xiàn)有最佳系統(tǒng)提升32%,情感表達(dá)自然度提升45%。研究突破了傳統(tǒng)AI情感理解的局限,實(shí)現(xiàn)了跨模態(tài)情感融合、動(dòng)態(tài)情感追蹤和個(gè)性化情感建模,為醫(yī)療、教育、客服等領(lǐng)域帶來(lái)革命性應(yīng)用前景。
哈佛大學(xué)研究團(tuán)隊(duì)通過(guò)創(chuàng)新的多智能體強(qiáng)化學(xué)習(xí)方法,讓AI在戰(zhàn)略游戲中學(xué)會(huì)復(fù)雜推理。研究發(fā)現(xiàn)AI通過(guò)游戲競(jìng)爭(zhēng)能發(fā)展出類人思維能力,在邏輯推理、創(chuàng)造性解決問題等方面表現(xiàn)顯著提升。這項(xiàng)突破性成果為未來(lái)AI在醫(yī)療、教育、城市管理等領(lǐng)域的應(yīng)用奠定基礎(chǔ),展現(xiàn)了通過(guò)模擬人類學(xué)習(xí)過(guò)程培養(yǎng)真正智能AI的新路徑。