這是顯卡測試的評測文,但是畫風(fēng)沒有那么“專業(yè)”,因為評書界的行話“只說不評,叫跑梁子”,所以我要評一評,噴一噴,自帶彈幕的感慨“槽點”。
1個月前,英偉達(dá)(NVIDIA)頂著逆行的股價,在 CES2019 上發(fā)布 GeForce RTX 2060 的時候,最打動人的有兩點:1.定價在 349 美金的“甜點”,瞄準(zhǔn)大眾市場;2.最具性價比的光線追蹤和 DLSS 特性。
這一個月里很多測試都顯示了 RTX 2060 在性能方面,撐起 2K 分辨率的光追游戲沒有問題,4K 分辨率的話還是燒燒香,中獎買 2080Ti 合適。
然后突然之間 EA 就出了爆款游戲——APEX 英雄,發(fā)布 8 小時后,玩家數(shù)達(dá)到 100 萬;24 小時后,玩家數(shù)達(dá)到 250 萬;72 小時內(nèi),玩家數(shù)達(dá)到 1000 萬,一周內(nèi)達(dá)到 2500 萬玩家,同時在線玩家數(shù)突破了 200 萬。
所以測試一下這個游戲,外加 3D Mark – Port Royal 剛剛更新了 DLSS 的測試支持,當(dāng)然有必要“后發(fā)先至”的來個最全數(shù)據(jù)。
NVIDIA GeForce RTX 2060的數(shù)據(jù)如 GPU-Z 所示,圖靈核心的“TU106-200”,相比 GTX 1060,核心規(guī)模大了一倍多,108 億晶體管組成了 1920 個 CUDA Cores,240 個 Tensor Cores,還有 30 個負(fù)責(zé)光追的 RT Cores。
基準(zhǔn)測試
按照顯卡跑分的套路,我們跑了一下春計算性能的 GPGPU,看看單精度和雙精度浮點的計算能力。這次測試沒有使用 NVIDIA 的最新驅(qū)動,而是使用了 417.71 版本,之后的游戲測試都是此版。
很明顯,RTX 2060的單精度能力非常強悍,但是雙精度浮點計算敗給了雙路至強 CPU——這臺測試機器實際上是我的工作站。AIDA64 的 GPGPU 計算中間沒有測試半精度的指標(biāo),而熟悉深度學(xué)習(xí)測試的朋友都會知道,在半精度的計算上 GPU 會有更多優(yōu)勢。
以上兩張圖是 CNIBENCH R15 的成績,算是給這臺測試機評了個分,CPU 超過消費級的頂尖產(chǎn)品兩倍多,RTX 2060 也把 OpenGL 的性能推到了 106 幀。
令人矚目的 3DMark 分?jǐn)?shù)——有不少玩家和媒體都拿 3DMark 做基準(zhǔn)分。3D Mark的新版本 Port Royal 為光線追蹤而定制,可以輕松測試 NVIDIA 的所有 RTX 顯卡。這里的標(biāo)準(zhǔn)分是 2K 分辨率下的成績——3744分是 RTX 2060 的最好成績。取得這一成績需要做兩件事——保證顯卡散熱和環(huán)境溫度。4K 分辨率的成績有點慘不忍睹,原因在于光纖追蹤隨著分辨率的增加,難度會以指數(shù)級上升——在有限的 RT Cores 的幫助下,2K 的主流電競分辨率是目前很多玩家的選擇。
但是這里也有個問題,如果你想使用高刷新率的 G-SYNC 顯示器,那么 RTX 2060 能保證在 1080P 的分辨率下讓你享受光追特效。如果上到2K,那么在很多游戲里幀率會跑不滿144Hz——G-SYNC 顯示器的意義也就難以滿足了。
以上基準(zhǔn)測試的成績均可重現(xiàn),未對顯卡或平臺做任何超頻。其中 3DMark 的測試成績已提交留存,作為對比,也放了Time Sky 和 Fire Strike 的測試結(jié)果,分別體現(xiàn)的是顯卡在 DX12 和 DX11 下的理論性能。RTX 2060 在分?jǐn)?shù)上的表現(xiàn)和上一代 GTX 1070 相似。
游戲測試
我選了有代表性的幾個主流游戲來壓榨 RTX 2060 的性能:孤島驚魂5(FarCry 5)、古墓麗影:暗影(Shadow of the Tomb Raider)、刺客信條:奧德賽(Assassin's Creed Odyssey)、刺客信條:起源(Assassin's Creed Origins)、全面戰(zhàn)爭:戰(zhàn)錘2(Total War: Warhammer II)、戰(zhàn)地5(Battlefield Ⅴ)、APEX英雄(Apex Legends)。
解釋一下為什么要測試這些游戲:孤島驚魂是老牌硬件榨汁機游戲,總是壓榨性能到極致——發(fā)展到 FarZCry 5 已經(jīng)成了評測必選。古墓麗影系列經(jīng)久不衰,最新的“暗影”更是第一批支持光線追蹤特性的游戲,刺客信條系列選了兩個,原因在于用 2017 年的“起源”來作為“老游戲”的衡量標(biāo)準(zhǔn),而 2018 年的“奧德賽”則可以在同類游戲中看到游戲引擎自身的進(jìn)步,全面戰(zhàn)爭系列擁有悠久的歷史,各種不同的資料片,這類型的游戲在大地圖上展開戰(zhàn)斗的時候非常考驗顯卡。
值得說的是戰(zhàn)地5和 APEX 英雄,這是這次測試延期的原因——為了等戰(zhàn)地5的 DLSS 特性開啟,也因為APEX 吃雞的大熱而增加了這個項目。
RTX 2060在孤島驚魂5中的表現(xiàn)很經(jīng)驗,即便是極高畫質(zhì),也能在 2K 分辨率下保持 69 幀的幀率——如果是 4K 分辨率,極高畫質(zhì)也有 40 幀左右的幀率。 要知道這時一個 2900 元的顯卡——以往想取得這個成績,顯卡至少要在 5000 元上下。
可以看到,RTX 2060在 2K 分辨率下可以滿足“孤島驚魂5”的硬件需求,即便是極高畫質(zhì)也能在 69 幀以上流暢運行。
刺客信條的兩代游戲之間有了很大的改進(jìn),可以看到“奧德賽”普遍幀率不如“起源”,游戲引擎是一方面原因,另一方面是場景和游戲自身測試程序的原因——如下圖所示:
在 2K 分辨率下,刺客信條:奧德賽有 2060 加持,極高畫質(zhì)下能達(dá)到 42 幀的幀率,可以算是流暢運行,但是到了 4K 分辨率的時候,幀率就只有 28 幀了。所以對于這個級別的游戲來說,RTX 2060在 2K 分辨率的表現(xiàn)可以滿意,但是如果想要流暢玩耍,還是用“很高”的設(shè)置更合適,“極高”的畫質(zhì)在某些場景會拉低平均幀率。
古墓麗影:暗影,是第一批宣布支持光線追蹤的游戲之一。但是直到現(xiàn)在,游戲更新也沒有帶來“開啟光線追蹤”的設(shè)置。個人認(rèn)為可能是光線追蹤在古墓麗影上仍然非常“吃資源”,導(dǎo)致沒法面試。
在上圖的幀率測試中,分別測試了 6 次,在中等畫質(zhì)、高畫質(zhì)、最高畫質(zhì)的設(shè)置下,分別嘗試了 DX12 和 DX11的區(qū)別。可以看到,DX12 相比 DX11 在低分辨率時可以帶來很大的幀率提升——4K 分辨率時可能也可以帶來提升,但是受限于其它因素,幀率只在 40 左右徘徊。
RTX 2060在 2K 分辨率時的表現(xiàn)足以支撐最高畫質(zhì)的設(shè)置,強烈建議大家啟用 DX12 來做游戲圖形接口。
全面戰(zhàn)爭:戰(zhàn)錘2作為一款 2017 年中出來的“老游戲”,因為自身游戲的場景龐大,多兵種單位和同時進(jìn)行的戰(zhàn)爭場面,仍然可以作為評測工具。
戰(zhàn)錘2擁有兩個測試模式——Battle 模式和 Campaign 模式,其中 Battle 模式的測試時戰(zhàn)斗場景的渲染——多是爆炸特效等等。而 Campaign 偏向宏大場景和細(xì)解的構(gòu)建。RTX 2060 在這個測試中的平均幀率在1080P分辨率時最高可以到85幀(戰(zhàn)斗場景),最低頁游 49 幀(Campaign 模式)。
而在2K 分辨率時,Battle 和 Campaign 模式的平均幀率在50幀左右,RTX 2060 可以流暢支持游戲——但是到了 4K 分辨率, 平均幀率掉到了 30 幀以下,可以說是會有卡頓。
測試戰(zhàn)地V 非常麻煩,但是也很值得——春節(jié)之后的 2 月 12 日,EA 終于更新了戰(zhàn)地 V 的新補丁,并帶來了 DLSS 的支持。這就使得戰(zhàn)地V 成為了唯一一款同時支持光線追蹤和 DLSS 深度學(xué)習(xí)抗鋸齒的游戲。
測試戰(zhàn)地V 可以說是 RTX 系列所有顯卡的必經(jīng)之路,在測試中特意找了很多場景,來完成 3 種狀態(tài)的測試——
1、同時關(guān)閉光線追蹤和 DLSS 抗鋸齒
2、開啟光線追蹤,保持 DLSS 關(guān)閉
3、開啟光線追蹤,開啟 DLSS
——不存在這樣一種狀態(tài):開啟 DLSS,關(guān)閉光追。游戲里如果要開啟 DLSS,光追是必須開啟的。
下面來看看測試成績—— 特意挑選了 4 個有代表性的場景。
首先,每一個場景我都測試了 3 種分辨率——1080P,2K和4K,每種分辨率測試了上面說的 3 個模式——光追和 DLSS 全關(guān),只開光追,光追和 DLSS 全開。開頭的截圖是油桶爆炸場景和冰面反光場景的游戲截圖。
簡單分析分析性能——RTX 2060 總體來說沒有令我失望,在全部開啟光線追蹤和 DLSS 抗鋸齒的情況下,2K 分辨率下的幀率可以普遍達(dá)到 55 幀左右——這里面 DLSS 的抗鋸齒立下了汗馬功勞——如果不開啟 DLSS,那么光線追蹤的能力就只有30——40 幀左右,取決于場景。
DLSS 基于深度學(xué)習(xí),在游戲中可以“腦補”出原來需要實時計算和追蹤的部分,對于戰(zhàn)地V 和 RTX 2060 來說,在維持同樣畫質(zhì)的前提下,可以節(jié)省更多的計算資源——自然就可以提高幀率。
但是和前面的游戲一樣,4K 分辨率下,開啟光追和 DLSS 的性能依然很勉強——考慮到 RTX 2060 的定位,2K分辨率下, 光追游戲應(yīng)該可以拍胸脯的通吃了。
最后是“甜點”—— EA的大作APEX:英雄,這個游戲火爆程度讓所有玩過的人連呼中毒,甚至癡迷。
測試選擇了兩個場景——山景和瀑布場景,取幀率平均值。RTX 2060 即使在 4K 分辨率下,依然能有 45 幀的幀率——游戲流暢,但是想要吃雞的話——回到2K,甚至 1080P 是個明智的選擇——FPS 游戲畢竟還是強調(diào)幀率和擁有 G-SYNC 的顯示器配合,據(jù)說段位能提升兩個級別以上。
總結(jié)一下,在 2900 元價位上,RTX 2060 可以肯定的說,2K 分辨率下能夠通殺所有目前的主流游戲和光追游戲——如果想要更高的幀率,可以用1080P 來享受超級流暢帶來的平順感。而對于 4K 游戲有追求的發(fā)燒玩家來說,RTX 2060的 定位并不是這個——請移步到 RTX 2070 ,RTX 2080,甚至旗艦級的 RTX 2080Ti。
好文章,需要你的鼓勵
浙江大學(xué)團隊提出動態(tài)專家搜索方法,讓AI能根據(jù)不同問題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率,且不增加計算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置,為AI推理優(yōu)化開辟新路徑。
清華大學(xué)研究團隊提出SIRI方法,通過"壓縮-擴張"交替訓(xùn)練策略,成功解決了大型推理模型"話多且準(zhǔn)確率低"的問題。實驗顯示,該方法在數(shù)學(xué)競賽題上將模型準(zhǔn)確率提升43.2%的同時,輸出長度減少46.9%,真正實現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學(xué)與騰訊聯(lián)合研究團隊開發(fā)出Rolling Forcing技術(shù),實現(xiàn)AI視頻實時流式生成的重大突破。該技術(shù)通過滾動窗口聯(lián)合去噪、注意力錨點機制和高效訓(xùn)練算法三項創(chuàng)新,解決了長視頻生成中的錯誤累積問題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開辟新可能。
華中科技大學(xué)研究團隊發(fā)現(xiàn),通過讓AI模型學(xué)習(xí)解決幾何問題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個幾何題目的Euclid30K數(shù)據(jù)集,使用強化學(xué)習(xí)方法訓(xùn)練多個AI模型。實驗結(jié)果顯示,幾何訓(xùn)練在四個空間智能測試基準(zhǔn)上都帶來顯著提升,其中最佳模型達(dá)到49.6%準(zhǔn)確率,超越此前最好成績。這項研究揭示了基礎(chǔ)幾何知識對培養(yǎng)AI空間智能的重要價值。