久久精品卡通在线|一级片视频免费观看|91AⅤ在线爱插射在线|无码a片网站中欧美在线精品|国产亚洲99久久精品|欧洲久久精品日本无码高清片|国产主播高清福利在线|国产一极小视频观看|国产十免费十无码十在线|国产一级视频在线观看免费

您當(dāng)前的位置:鋼材 > 型鋼 > 市場(chǎng)分析

技嘉z790雪鷹,技嘉3070ti雪鷹參數(shù)

來(lái)源:頭條 作者: chanong
分享到
關(guān)注德勤鋼鐵網(wǎng)在線:
在線咨詢:
  • 掃描或點(diǎn)擊關(guān)注德勤鋼鐵網(wǎng)在線客服

目前,DIY用戶最喜歡白色的機(jī)器,從白色的主板到顯卡、機(jī)箱。今天我要給大家?guī)?lái)一款白色顯卡——技嘉GeForce RTX 4070 Snow Eagle的評(píng)測(cè)。

NVIDIA給RTX 4070顯卡的官方定位是,在開啟光線追蹤和DLSS的情況下,3A游戲可以達(dá)到2K 100幀以上。初步測(cè)試結(jié)果顯示,其性能比RTX 3070 Ti提升約20%,與RTX 3080持平,在光追和DLSS方面優(yōu)于RTX 30系列顯卡。

RTX 4070依然以不少原價(jià)卡在EC上銷售,使其成為RTX 40系列中性價(jià)比相對(duì)較高的產(chǎn)品,不過(guò)首先我們來(lái)看看這款技嘉RTX 4070 Snow Eagle的外觀。

1GB GeForce RTX 4070 Snow Eagle 概述

這款技嘉RTX 4070 Snow Eagle的包裝非常簡(jiǎn)潔,除了NVIDIA標(biāo)準(zhǔn)型號(hào)部分外,采用了全白色的基調(diào),左側(cè)是系列名稱AERO,并且采用了比較時(shí)尚的字體。

配件方面,技嘉RTX 4070雪鷹依然采用單16針供電,因此包裝內(nèi)附贈(zèng)了一根8針*2電源轉(zhuǎn)接線。不過(guò)這款RTX 4070的功耗并不大,很多AIC都在推出8針單供電版本。

技嘉RTX 4070 Snow Eagle顯卡整體尺寸為300 x 130 x 57.6毫米,卡體為純白色,正面導(dǎo)流罩和覆蓋風(fēng)扇區(qū)域的拉絲金屬外殼。雖然它們是兩種完全不同的材料,但它們的顏色和紋理卻出奇的和諧。

技嘉RTX 4070 Snow Eagle的風(fēng)扇正上方印有“CREATIVITY STARTS HERE”字樣,意思是“創(chuàng)意從這里開始”。顯卡采用Wind Power散熱系統(tǒng),包含3個(gè)9cm風(fēng)扇,支持智能啟停,正反轉(zhuǎn)設(shè)計(jì)。

內(nèi)部采用了與GPU直接接觸的銅板,配合8根復(fù)合熱管,實(shí)現(xiàn)更高的傳熱效率。

技嘉RTX 4070 Snow Eagle的背板完全由裸金屬制成,背面有一個(gè)巨大的鏤空進(jìn)氣格柵,露出的PCB僅占整個(gè)顯卡的一半左右。

這款技嘉RTX 4070 Snow Eagle卡在使用1個(gè)16針輔助電源時(shí)整體功耗為215W。

請(qǐng)注意,目前適用于RTX 30 系列的12 針接口和電源適配器與RTX 40 系列顯卡不兼容。

視頻輸出接口繼續(xù)采用HDMI 2.1 + DP 1.4a*3的4接口設(shè)計(jì)。 HDMI 2.1可支持4K 120Hz HDR和8K 60Hz HDR。

2 NVIDIA GeForce RTX 4070架構(gòu)分析

此次發(fā)布的GeForce RTX 40系列顯卡基于全新NVIDIA Ada Lovelace架構(gòu)打造,采用臺(tái)積電4N NVIDIA定制工藝,旗艦核心AD102擁有驚人的760億個(gè)晶體管,相比之下,RTX 30有280億個(gè)晶體管。系列顯卡。

與上一代NVIDIA Ampere 相比,NVIDIA Ada Lovelace 在相同功耗下可提供兩倍以上的性能,著色器數(shù)據(jù)吞吐量高達(dá)90 TFLOPS。

新推出的RTX 4070共有5888個(gè)CUDA核心,提供29 TFLOPS計(jì)算能力,46個(gè)第三代Ada RT核心,提供67 RT-TFLOPS,184個(gè)第四代Ada RT核心,提供67 RT-TFLOPS。第一代Tensor核心提供466張量-TFLOPS 的計(jì)算能力。

其實(shí)如果只對(duì)比傳統(tǒng)的光柵性能,RTX 4070的進(jìn)步并沒(méi)有那么大,但是隨著人工智能逐漸發(fā)展的今天,需要很多邏輯推理運(yùn)算,對(duì)比Tensor 30就可以看出。該系列的計(jì)算能力幾乎提高了2.7 倍。

完整的AD102核心

RTX 4070 Ti使用的AD104核心

RTX 4070使用的AD104核心

這次RTX 4070采用AD104芯片,并使用4組GPC。其中一個(gè)缺少TPC 裝置,但有兩個(gè)NVENC 單元。

另外,我們可以看到RTX 40系列顯卡現(xiàn)在擁有比較大的二級(jí)緩存,這其實(shí)是故意的。

這款RTX 4070擁有36MB二級(jí)緩存,相比上一代RTX 3070 Ti的4MB,相差9倍。增加二級(jí)緩存的大小可以提高性能、減少延遲并延長(zhǎng)電池壽命。數(shù)據(jù)訪問(wèn)可以在GPU上完成(否則GPU會(huì)頻繁地從顯存讀取數(shù)據(jù),過(guò)度依賴顯存帶寬)。因此,這也是RTX 40系列顯卡的位寬和帶寬普遍較小的原因。

事實(shí)上,從完整的架構(gòu)圖來(lái)看,Ada架構(gòu)的整體結(jié)構(gòu)變化并不大。這一點(diǎn)從SM單元也能清楚地看出。相同的FP32 CUDA 核心、相同的FP32/INT32 混合CUDA 核心、相同的L1 級(jí)緩存等。當(dāng)然,每個(gè)SM單元內(nèi)的Tensor Core已經(jīng)升級(jí)到了第四代。

不過(guò),最顯著的變化是第三代光線追蹤核心。我們?cè)賮?lái)看看第二代架構(gòu)。第二代光追蹤核心包括用于邊界相交測(cè)試的盒子相交引擎和用于三角形相交測(cè)試的三角形相交引擎。

第三代光追蹤核心增加了兩個(gè)新引擎:Opacity Micro-Map Engine (OMM) 和Displaced Micro-Mesh Engine (DMM) 這兩個(gè)新的硬件單元使光追蹤顯著提升。 (稍后會(huì)詳細(xì)介紹)。

此時(shí),每2個(gè)SM單元組成一個(gè)TPC單元,每6組TPC單元組成一個(gè)完整的GPC頂級(jí)單元(對(duì)于某些核心,5組TPC組成一個(gè)GPC單元)。

每個(gè)GPC單元配備獨(dú)立的光柵引擎和兩組ROP分區(qū)(每組包含8個(gè)ROP單元)。

由于整體架構(gòu)分析會(huì)很冗長(zhǎng),因此此處不會(huì)介紹NVIDIA Ada 架構(gòu)的其他新功能。它們?cè)谖恼履┪惨愿戒浀男问竭M(jìn)行了解釋。感興趣的用戶請(qǐng)讀到最后。

3 測(cè)試平臺(tái)概述

首先介紹一下測(cè)試平臺(tái),為了保證技嘉RTX 4070 Snow Eagle的性能,平臺(tái)也進(jìn)行了全面更新。

我們看一下最新版本GPU-Z的信息,RTX 4070采用AD104核心,擁有5888個(gè)CUDA,而我們之前測(cè)試的RTX 4070 Ti擁有7680個(gè)CUDA,同樣,不同顯卡的實(shí)際CUDA數(shù)量是不同的因此,如果你做一些簡(jiǎn)單的計(jì)算,RTX 4070 的性能相當(dāng)于RTX 4070 Ti 的77% 左右。

技嘉RTX 4070 Snow Eagle的升壓頻率為2565MHz,公版RTX 4070的升壓頻率為2475MHz。

它采用12GB GDDR6X顯存,位寬為192位,顯存帶寬為504GB/s,光柵和紋理單元為64和184。

該測(cè)試平臺(tái)中的處理器是英特爾最新的第13代i9-13900K,它提供了非常強(qiáng)大的性能,并且在功耗和顯示方面都有顯著的升級(jí)。

4 理論性能測(cè)試

下面是用來(lái)衡量顯卡DX11理論性能的3DMARKFS套件:FS、FSE、FSU分別對(duì)應(yīng)顯卡在1080P、2K、4K下的理論性能馬蘇。以下是顯卡的實(shí)際測(cè)試成績(jī):

在顯卡DX11性能的3DMARKFS封裝測(cè)試中,技嘉RTX 4070 Snow Eagle主要與上一代RTX 3070 Ti進(jìn)行對(duì)比,F(xiàn)S多了25%,F(xiàn)SE多了20%,F(xiàn)SU多了11%。 RTX 3070 Ti 的性能高出約18%。

與剛剛發(fā)布的RTX 4070 Ti相比,整體得分相差約20%。

在DX12環(huán)境下的Time Spy和Time Spy Extreme測(cè)試中,技嘉RTX 4070 Snow Eagle相對(duì)于RTX 3070 Ti的提升是TS多了27%,TSE多了21%,總共提升了約24%。

PortRoyal是專門針對(duì)3DMARK光跡性能的測(cè)試項(xiàng)目,與RTX 3070 Ti相比,技嘉RTX 4070 Snow Eagle取得了約30%的提升。

總體而言,技嘉RTX 4070 Snow Eagle 的理論性能比RTX 3070 Ti 高出約24%。

Speed Way測(cè)試是3DMARK最新更新的顯卡基準(zhǔn)測(cè)試,用于測(cè)試DirectX12 Ultimate性能。要運(yùn)行此測(cè)試,您的顯卡必須支持DirectX 12 Ultimate 并且至少具有6GB 視頻內(nèi)存。

該測(cè)試將實(shí)時(shí)光線追蹤與傳統(tǒng)渲染技術(shù)相結(jié)合,以測(cè)量顯卡的性能。場(chǎng)景包括光線追蹤反射、實(shí)時(shí)全局照明、網(wǎng)格著色器、體積照明、粒子和后處理效果。而且有趣的是,Speed Way 測(cè)試支持自由探索場(chǎng)景,看看燈光和相機(jī)設(shè)置的變化如何影響視覺(jué)效果。

相比RTX 3070 Ti顯卡,從1080p分辨率到4K的提升分別為30%/25%/30%。

此外,我們還使用3DMARK剛剛更新的DLSS 3進(jìn)行了相關(guān)性能測(cè)試。另外,由于RTX 3070 Ti無(wú)法開機(jī),因此不會(huì)參與測(cè)試,只會(huì)與RTX 4070 Ti進(jìn)行比較。

5 一般游戲性能測(cè)試

此次RTX 40系列新增了DLSS 3技術(shù),因此我們稍后會(huì)單獨(dú)進(jìn)行測(cè)試,不過(guò)目前我們選擇了一些主流3A大作來(lái)對(duì)比它們的游戲性能。

《極限競(jìng)速:地平線5》 添加了DLSS 3。稍后將進(jìn)行相關(guān)測(cè)試。我們?cè)谶@里僅進(jìn)行一般比較。

《光明記憶:無(wú)限》的光線追蹤測(cè)試軟件是一款獨(dú)立于游戲的測(cè)試工具,它使用了比游戲更多的光線追蹤技術(shù),測(cè)試條件為“RTX最高品質(zhì)/DLSS品質(zhì)”。因此,我們測(cè)試中的幀率相對(duì)較低,但實(shí)際游戲配置非?捎。

另一款國(guó)產(chǎn)游戲基準(zhǔn)軟件《邊境》與《光明記憶:無(wú)限》的情況基本相同,所有測(cè)試條件均為“RTX最高畫質(zhì)/DLSS畫質(zhì)”。

《賽博朋克2077》,游戲分為兩個(gè)最高畫質(zhì):超級(jí)和追光超級(jí)。

對(duì)于傳統(tǒng)3A游戲來(lái)說(shuō),RTX 4070的整體提升沒(méi)有光線追蹤游戲那么大,所以NVIDIA多年來(lái)研究的光線追蹤和DLSS仍然會(huì)非常有用。

6 DLSS 3 性能測(cè)試

目前,已有超過(guò)290款游戲和應(yīng)用程序支持DLSS,其中超過(guò)30款游戲已經(jīng)支持最新的DLSS 3。

《逆水寒》,《微軟模擬飛行》,《毀滅全人類2:重新探測(cè)》,《瘟疫傳說(shuō):安魂曲》,《光明記憶:無(wú)限》,《暗影火炬城》,《F1 22》, 333 60010-3 0000、《生死輪回》、《漫威蜘蛛俠:重制版》、《超級(jí)人類》、《極限競(jìng)速:地平線5》、010至30000、010 至30000、010 至30000 等

讓我們測(cè)試一下使用新的DLSS 3 游戲可以達(dá)到什么樣的幀速率。

這次DLSS 3的測(cè)試圖更加復(fù)雜,增加了1%低FPS和延遲測(cè)試。

首先,F(xiàn)PS 通常由游戲基準(zhǔn)測(cè)試,是指游戲在一段時(shí)間內(nèi)的平均幀數(shù)。 1% Low FPS 將一段時(shí)間內(nèi)的幀數(shù)從大到小排序,取最低的1%,并對(duì)1% 的數(shù)字進(jìn)行平均。

其實(shí)簡(jiǎn)單來(lái)說(shuō),這兩個(gè)值都不能代表游戲過(guò)程中某個(gè)特定時(shí)刻的情緒,但FPS更注重整體情況,而FPS降低1%意味著平均代表最差的情況。要更加小心。

了解了1% Low FPS 之后,我們?cè)倏匆幌逻@張圖。軸左邊是延遲(越低越好),軸右邊是幀數(shù)(也包括正負(fù)坐標(biāo),所以每邊的值可能不同)。

《賽博朋克2077》,DLSS 3的表現(xiàn)非?捎^,因?yàn)檫@類模擬經(jīng)營(yíng)游戲的特點(diǎn)是同屏顯示的單元較多,消耗的CPU資源較多,而DLSS 3可以生成突破CPU瓶頸的幀。

然而,幀生成并非沒(méi)有缺點(diǎn),因此在該測(cè)試中添加了延遲。當(dāng)您打開DLSS 3 時(shí),捆綁包中的NVIDIA Reflex 也會(huì)打開。不過(guò),與大多數(shù)非競(jìng)技類游戲相比,25 毫秒的延遲在現(xiàn)實(shí)體驗(yàn)中并不算大。

《紅霞島》反映的數(shù)據(jù)比較真實(shí),顯示在最好的DLSS光線追蹤下,即使是技嘉RTX 4070 Snow Eagle顯卡也只有41幀,延遲106.3毫秒,我理解。

開啟DLSS 3后,幀數(shù)為105幀,增長(zhǎng)156%。延遲比DLSS 2長(zhǎng)約14ms,但仍保持在較低水平。

《暗黑破壞神4》是添加了DLSS 3的最新游戲?梢钥吹,即使開啟DLSS 2,幀數(shù)也會(huì)受到CPU 瓶頸的限制。這與DLSS 打開和關(guān)閉時(shí)的幀數(shù)大致相同。開啟DLSS 3后,幀率躍升至162幀,提升了27%。

《侏羅紀(jì)世界:進(jìn)化2》 打開光跟蹤會(huì)顯著提高性能要求。其中,DLSS 3的幀率較DLSS水平提升了80%,DLSS 2的提升率達(dá)到了57%。

不過(guò),《侏羅紀(jì)世界:進(jìn)化2》的幀率較剛發(fā)布時(shí)明顯下降了1%,而且在實(shí)際游戲中,你可以感受到與正常情況明顯不同的突然滯后……看來(lái)。這是因?yàn)橛螒虬姹疽呀?jīng)更新,優(yōu)化尚未完成。

UE5提供的測(cè)試游戲方便的提供了DLSS的簡(jiǎn)單測(cè)試,分為DLSS Level(超分辨率級(jí)別+幀生成級(jí)別+反射級(jí)別)和DLSS 2(超分辨率性能+幀生成級(jí)別+反射級(jí)別)。 DLSS 3 的3 種速度測(cè)試(超分辨率性能+ 幀生成打開+ 反射打開)。

此外,由于Lyra 幀是靜態(tài)拍攝的,因此《1% Low》的得分高于其他游戲。

7 穩(wěn)定擴(kuò)散AI繪畫測(cè)試

除了游戲之外,AI也是目前的熱門領(lǐng)域,尤其是穩(wěn)定擴(kuò)散。目前,人工智能生成的許多圖像完全是假的,也可能是真的。我們也測(cè)試一下RTX 4070在這方面的表現(xiàn)。

雖然穩(wěn)定擴(kuò)散幾乎沒(méi)有?*,但辩R夭渴鸕母叢有勻瞇磯嚶沒(méi)床。少t嘉僮鶻緱媯沒(méi)Э梢愿葑約合胍傻惱掌諶堇捶岣還丶省?

我們根據(jù)NVIDIA提供的關(guān)鍵詞生成了10批共20張照片,并選擇了兩張細(xì)節(jié)比較合理的照片顯示在上面。

RTX 4070的計(jì)算時(shí)間為2分24.79秒,即每張照片約7.2秒。

RTX 3070 Ti 的計(jì)算時(shí)間為2m54.34 秒,每張圖像大約需要8.7 秒。

Stable Diffusion對(duì)顯卡的要求比較高,需要強(qiáng)大的Tensor計(jì)算能力。

對(duì)顯存的要求也很高,所以有條件的話一定要選擇顯存量大的顯卡。

當(dāng)我們比較相同設(shè)置下RTX 4070和RTX 3070 Ti的計(jì)算時(shí)間時(shí),我們發(fā)現(xiàn)兩款顯卡在生成20張圖像時(shí)的時(shí)間相差30秒,這仍然是一個(gè)相當(dāng)顯著的差異。

我還測(cè)試了使用CPU 生成具有相同設(shè)置的圖像,保守估計(jì)大約需要3 小時(shí)30 分鐘,如圖所示。

另外,使用CPU渲染時(shí),經(jīng)常出現(xiàn)內(nèi)存不足的提示,但測(cè)試平臺(tái)是旗艦i9-13900K,內(nèi)存是D5 7200MHz 32G(16G*2),還不錯(cuò),可以查看顯卡?ㄆ瑢(duì)于跟上潮流也非常重要。

PS:AMD顯卡目前無(wú)法使用Stable Diffusion來(lái)生成圖像。我們只能期待未來(lái)的優(yōu)化。

8 AV1編碼測(cè)試

這次AV1編碼測(cè)試,我選擇了編輯專業(yè)版,雖然我作為一個(gè)有一些基本編輯知識(shí)的人可能低估了它,但總體感覺(jué)它對(duì)于測(cè)試來(lái)說(shuō)非常好用。

日常編輯使用PR、AE等Adobe軟件,最大的感受是編輯更加智能,預(yù)設(shè)更適合發(fā)布,智能字幕識(shí)別等,是一個(gè)很好用的工具。

打個(gè)比方,編輯和PR就像漂亮的照片或PS,而Adobe的優(yōu)勢(shì)就是有很大的編輯空間。不過(guò)日常使用來(lái)說(shuō),剪輯等軟件沒(méi)有任何問(wèn)題,而且很好用。

Cut Movie 的專業(yè)版現(xiàn)在帶有AV1 編碼輸出,在我們的實(shí)際測(cè)試中,我們導(dǎo)出了大約2 分鐘的視頻?梢钥吹絻蓚(gè)文件的大小相差124MB。

由于AV1 編碼的性質(zhì),生成的文件將具有較低的比特率,但視頻分辨率將完全相同。因此,如果生成相同比特率和容量的文件,AV1 會(huì)更清晰。

使用NVIDIA ICAT 比較兩個(gè)視頻的圖像。圖像的左側(cè)是AV1編碼,右側(cè)是H264編碼。無(wú)論如何,通過(guò)200%的細(xì)節(jié)放大,差別不大。

9 RTX VSR(RTX視頻超分辨率)測(cè)試

RTX VSR(RTX 視頻超分辨率)目前正在某些瀏覽器中進(jìn)行測(cè)試。首先,玩家必須更新到最新的NVIDIA 驅(qū)動(dòng)程序。在NVIDIA 控件中的調(diào)整視頻圖像設(shè)置下查看超分辨率中最新的RTX 視頻增強(qiáng)功能。這是一個(gè)面板。

RTX VSR是AI圖像處理領(lǐng)域的突破性技術(shù),超越傳統(tǒng)的邊緣檢測(cè)和特征銳化技術(shù),可顯著提高直播視頻內(nèi)容的質(zhì)量。

開啟RTX VSR不僅需要最新的驅(qū)動(dòng)程序,還需要使用RTX 40或30系列GPU。它還適用于Google Chrome 和Microsoft Edge 瀏覽器中的幾乎所有視頻內(nèi)容(瀏覽器還必須更新到最新的驅(qū)動(dòng)程序)。最新版本)。

目前已知開啟后,打開YouTube 或Bilibili 即可享受RTX VSR 效果的加成。

如果您不確定,如果您在全屏播放視頻時(shí)打開任務(wù)管理器并看到GPU 負(fù)載增加,則表示您的GPU 已成功打開。

(點(diǎn)擊可放大查看原圖)

打開YouTube自由觀看視頻,可以明顯看到,開啟RTX VSR后,水下珊瑚的畫質(zhì)好多了,邊緣更銳利,失真明顯減少,我明白了。

10 溫度和功耗測(cè)試

功耗測(cè)試方面,我們選擇了FurMark軟件進(jìn)行拷貝測(cè)試,GPU-Z進(jìn)行溫度檢測(cè),功耗僅在顯卡本身上進(jìn)行計(jì)算。

你會(huì)發(fā)現(xiàn)技嘉RTX 4070 Snow Eagle顯卡的溫度控制非常好。經(jīng)評(píng)估,室溫控制在26C左右。經(jīng)過(guò)20分鐘的拷機(jī)測(cè)試,TDP達(dá)到100%,板載功耗215W,溫度恒定,控制在63左右,熱點(diǎn)溫度77左右。

有趣的是,顯卡的顯存溫度通常都比較高,但技嘉RTX 4070 Snow Eagle的顯存溫度僅為50。

游戲動(dòng)態(tài)功耗測(cè)試

值得注意的是,在本次抄襲測(cè)試中,最大板載功耗約為215W,TDP達(dá)到了100%。不過(guò)在真實(shí)游戲測(cè)試中,大部分3A游戲都能達(dá)到180-190W左右,而一些性能非常密集的3A游戲則能達(dá)到200W左右,這比額定功耗還遠(yuǎn)低于。

因此,在實(shí)際使用過(guò)程中,由于游戲負(fù)載的差異,GPU的實(shí)際功耗會(huì)隨著時(shí)間的推移而動(dòng)態(tài)變化,類似于FPS,使得RTX 40系列不太可能撞上功耗墻。

技嘉RTX 4070雪鷹3A游戲平均功耗200W

RTX 3070 Ti 3A游戲平均功耗為288W

真實(shí)的游戲功耗測(cè)試,我們?cè)谧约旱幕鶞?zhǔn)測(cè)試中選擇了《賽博朋克2077》,將屏幕設(shè)置為光線追蹤超級(jí)和4K分辨率,強(qiáng)制執(zhí)行兩塊顯卡的性能限制,然后測(cè)試了功耗。

雖然兩款顯卡都是70級(jí)別,但剛剛發(fā)布的RTX 4070的平均功耗為202W,而RTX 3070 Ti為288W,低了約80W,這確實(shí)是一個(gè)令人驚訝的結(jié)果。

11種不同的白色金屬紋理

近年來(lái),白色產(chǎn)品成為廠商和用戶的首選,大多數(shù)白色顯卡都選擇更加均勻的材質(zhì),以達(dá)到更加“純粹”的質(zhì)感。整個(gè)技嘉RTX 4070雪鷹卡由兩種材質(zhì)制成,尤其是正面導(dǎo)風(fēng)板,覆蓋了大面積的金屬面板。兩種看似不相容的材料結(jié)合在一起會(huì)產(chǎn)生意想不到的和諧。

此外,雖然Snow Eagle 的卡不會(huì)過(guò)分強(qiáng)調(diào)RGB 燈光效果,而且白色是一種非常通用的中性色,但過(guò)分強(qiáng)調(diào)燈光效果可能會(huì)破壞兩種材料之間的平衡,否則這兩種材料會(huì)很好地結(jié)合在一起。Masu。

隨著RTX 4070的發(fā)布,RTX 40系列顯卡的價(jià)格首次跌破5000元。這對(duì)于等待數(shù)年購(gòu)買機(jī)器的獨(dú)立游戲玩家來(lái)說(shuō)絕對(duì)是個(gè)好消息。

性能方面,RTX 4070在2K分辨率的3A游戲中可以達(dá)到100幀,我們測(cè)試的所有游戲圖形都在平均水平以上。至于4K,目前大多數(shù)獨(dú)立游戲和網(wǎng)絡(luò)游戲都可以。

我認(rèn)為RTX 40系列顯卡最有意義的升級(jí)就是功耗的降低。如今,大多數(shù)AIC 顯卡都使用單個(gè)8 針電源。 GPU升級(jí)的意義在于,相比同類產(chǎn)品,功耗降低100W,整體性能提升約20%。

此外,RTX 40系列顯卡最初也是為多領(lǐng)域使用而設(shè)計(jì)的,而不僅僅局限于游戲。因此,盡管RTX 4070 的目標(biāo)用戶是游戲玩家,但它作為生產(chǎn)力工具的角色仍然存在。

至于價(jià)格方面,這款A(yù)ERO雪鷹是超頻版,所以目前高達(dá)5299元,風(fēng)魔等技嘉部分標(biāo)頻顯卡也在4799元左右。

12 附錄1 - NVIDIA Ada Lovelace 架構(gòu)分析

著色器執(zhí)行順序更改(SER) 著色器執(zhí)行順序更改

SER的主要功能是提高著色器性能,允許低效工作負(fù)載動(dòng)態(tài)重組為更高效的工作負(fù)載。主要是光線追蹤的性能提升是巨大的。

簡(jiǎn)而言之,GPU 在執(zhí)行類似任務(wù)時(shí)效率最高。然而,隨著光追蹤效果變得越來(lái)越強(qiáng)大,我們發(fā)現(xiàn)每個(gè)場(chǎng)景中可能有數(shù)百萬(wàn)個(gè)燈光照亮不同的材質(zhì),并且不同的材質(zhì)具有不同的反射率和反射效果。因此,這給著色器帶來(lái)了巨大的、分布式的、低效的工作負(fù)載。

SER可以對(duì)這些繁瑣的指令進(jìn)行重新分類,并動(dòng)態(tài)地將它們重新組織成更高效的工作負(fù)載。據(jù)NVIDIA 稱,SER 將著色器性能提高了2 倍,并將游戲幀速率提高了25%。

舉個(gè)簡(jiǎn)單的例子,當(dāng)光第一次從出射端傳播到撞擊端時(shí),它是一條非常規(guī)則的光線,但光在第二次撞擊物體后留下的痕跡,就出現(xiàn)了大量的發(fā)散和漫反射。這對(duì)于燈光來(lái)說(shuō)非常重要,跟蹤負(fù)載非常高。正如您所看到的,SER 可以對(duì)這些指令進(jìn)行兩次排序,以最大限度地提高著色器性能。

幸運(yùn)的是,這些實(shí)用的功能在RTX 40 系列上并未獲得專利,目前游戲開發(fā)者需要將其集成到他們的游戲中,因?yàn)樗且粋(gè)易于集成的SDK。另外,由于它是通用邏輯,未來(lái)可以直接集成到Windows API中,讓游戲開發(fā)者可以直接調(diào)用系統(tǒng)API,而不需要專門引用它。

SER對(duì)于擁有RTX 20系列或更新版本(可以開啟光線追蹤)的N卡用戶來(lái)說(shuō)可以說(shuō)是一個(gè)巨大的福音。畢竟,誰(shuí)不喜歡免費(fèi)且改進(jìn)的光跡性能呢?

第三代RT核心

RT Core 負(fù)責(zé)加速光線追蹤計(jì)算能力,雖然使用RTX 30 系列顯卡享受4K 高幀率游戲可能會(huì)有些困難,但使用RTX 40 系列顯卡就可以輕松解決。

GeForce RTX 4090顯卡的處理能力達(dá)到了191 RT-TFLOPs,而RTX 30系列顯卡最快的處理能力為78 RT-TFLOPs,整整2.4倍。另外,根據(jù)NVIDIA官方的說(shuō)法,第三代RT核心的峰值RT-TFLOP相比上一代提升了2.8倍。這只是表明這個(gè)4090 并不是Ada Lovelace 架構(gòu)的最終版本。

不透明度微圖引擎

第三代RT 內(nèi)核中引入了兩個(gè)重要的硬件單元。第一個(gè)是Opacity Micro-Map Engine,可以理解為微圖透明度引擎。其主要功能是優(yōu)化光線追蹤渲染。著色器工作負(fù)載。

例如,對(duì)于葉子這樣的復(fù)雜物體,光線追蹤變得計(jì)算密集型,因?yàn)椴粌H不同的光線會(huì)影響性能狀態(tài),還會(huì)影響葉子之間的光線反射。

不過(guò),不透明微貼圖引擎可以將光線追蹤特性烘焙到不透明蒙版中,從而可以更快、更準(zhǔn)確地渲染不規(guī)則形狀和半透明物體,從而顯著減少著色器工作量。

位移式微網(wǎng)格引擎(DMM)

Displaced Micromesh Engine 可以理解為微網(wǎng)格置換引擎,其構(gòu)建光線追蹤BVH(邊界體積層次結(jié)構(gòu))的速度提高了10 倍。視頻內(nèi)存使用量減少了20 倍。

DMM 由第三代RT 核心進(jìn)行本地處理,僅使用基本三角形即可渲染復(fù)雜的幾何圖形,與前幾代相比,顯著降低了存儲(chǔ)和處理要求。

具體工作原理從圖片中已經(jīng)很清楚了,但是雖然新的DMM可以簡(jiǎn)化具有多個(gè)面的復(fù)雜圖形并創(chuàng)建更簡(jiǎn)單的模型,但整體光線追蹤效果不會(huì)改變。

通過(guò)一些模型數(shù)據(jù),我們可以具體看到新的DMM對(duì)模型的簡(jiǎn)化程度有多大。包含1100 萬(wàn)個(gè)三角形的原始模型簡(jiǎn)化為僅約150,000 個(gè)微網(wǎng)格,使BVH 構(gòu)建速度提高了8.5 倍,體積縮小了6.5 倍。

這并不夸張;模型越復(fù)雜,優(yōu)化效果越高;在官方公布的對(duì)比例子中,最快可以實(shí)現(xiàn)15倍以上的加速比,容量簡(jiǎn)化如下,可換算為20次。

第四代Tensor Core

除了光學(xué)追蹤單元升級(jí)之外,第4代張量核心的升級(jí)更加恐怖。使用新的FP8 張量引擎,旗艦型號(hào)RTX 4090 顯卡可提供1.32 Tensor petaflops 的吞吐量,提升了5 倍。

現(xiàn)在請(qǐng)注意單位——petaFLOP。以前,TFLOP 是萬(wàn)億次浮點(diǎn)運(yùn)算,而千萬(wàn)億次浮點(diǎn)運(yùn)算是萬(wàn)億次浮點(diǎn)運(yùn)算。

中端RTX 4070 還達(dá)到了令人印象深刻的466 Tensor-TFLOPS,比上一代RTX 3070 Ti 高出約2.7 倍。

DLSS3

新推出的DLSS 3也是RTX 40系列的一大賣點(diǎn),可以看出從DLSS 2.3到DLSS 3版本升級(jí)的幅度。 DLSS 3也被NVIDIA正式稱為神經(jīng)網(wǎng)絡(luò)渲染的新時(shí)代。

新的DLSS 3在原始DLSS超分辨率的基礎(chǔ)上添加了光學(xué)多幀生成技術(shù),以生成全新的幀,而不像原來(lái)只能生成像素。

DLSS 3 結(jié)合了DLSS 超分辨率、DLSS 幀生成和可重建八分之七像素的NVIDIA Reflex 三大關(guān)鍵技術(shù),顯著提升性能。

對(duì)于2K 分辨率和更高分辨率等GPU 密集型游戲,DLSS 2 可以將幀速率提高2 倍,DLSS 3 可以將幀速率提高4 倍。

此次DLSS 3跨越各大版本,在思路和原理上再次升級(jí),是一種完全“猜猜”的一幀技術(shù),解釋起來(lái)很容易,但實(shí)現(xiàn)起來(lái)需要大量的推理和計(jì)算。以及一個(gè)完全先進(jìn)的想法。

但“憑空”產(chǎn)生的一幀延遲明顯高于DLSS 2。因此,這個(gè)完整的DLSS 3 與NVIDIA Reflex 捆綁在一起,可以有效幫助減少延遲。

它名副其實(shí),名副其實(shí)。

個(gè)“神經(jīng)網(wǎng)絡(luò)渲染新時(shí)代”的名號(hào)?v觀目前市面上的XeSS、FSR技術(shù),DLSS絕對(duì)稱得上“巨人的肩膀”。當(dāng)然,連年的創(chuàng)新,苦的是手持上一代顯卡的玩家,想體驗(yàn)DLSS 3的幀生成,目前唯一的辦法就是購(gòu)入一張RTX 40系顯卡。 New Optical Flow Accelerator New Optical Flow Accelerator光流加速器是在第四代Tensor Cores中最新引入的,這也是為何DLSS 3中的幀生成為RTX 40系顯卡獨(dú)享。 光流加速器在原本DLSS 2的基礎(chǔ)上,還可以計(jì)算兩個(gè)連續(xù)幀內(nèi)的光流場(chǎng),能夠捕捉游戲畫面從第1幀到第2幀的方向和速度,從中捕捉粒子、反射和光照等像素信息。并分別計(jì)算運(yùn)動(dòng)矢量和光流來(lái)獲得精準(zhǔn)的陰影重建效果。 以《賽博朋克2077》為例,在第一幀,光流加速器會(huì)捕捉到每一個(gè)像素中的粒子、反射和光照等信息。并在第二幀中查找匹配的像素區(qū)域,計(jì)算幀之間的差值。 如果說(shuō)原來(lái)DLSS 2能夠“猜”出一張圖剩下的像素,那么DLSS 3除了這些,還能夠“猜”出下一幀的畫面。 另外由于DLSS 3的幀生成是在GPU中處理和運(yùn)行的,所以即使遇到CPU瓶頸的游戲,AI同樣能夠提升幀率。這也是為什么在此次發(fā)布會(huì)中說(shuō)到,DLSS 3能夠突破CPU的限制來(lái)提升幀數(shù)。 AV1編碼器 本次升級(jí)的第八代NVENC編碼器可以說(shuō)是直播、視頻、后期工作者的極大福音。它首次加入了對(duì)AV1編碼的支持,最顯而易見(jiàn)的效果就是直播。 相比傳統(tǒng)的H.264編碼,AV1編碼的效率平均提升了40%,在同碼率下AV1編碼的畫質(zhì)將更好。目前大部分直播的分辨率和清晰度,均受限于平臺(tái)規(guī)定的最大比特率。以Twitch限制的8Mbps為例,可以看到在同等帶寬下,同為2K 60幀的畫面,采用AV1編碼的清晰度明顯比H.264更高。 說(shuō)起直播,OBS相信大家都不陌生,在10月份即將發(fā)布的補(bǔ)丁中,OBS就加入了對(duì)NVENC的AV1編碼支持 當(dāng)然,直播只是我們更容易見(jiàn)到的AV1優(yōu)勢(shì),在視頻工作的所有環(huán)節(jié),AV1編碼都可以帶來(lái)極大提升。 所以,如圖所見(jiàn)。NVIDIA已經(jīng)為廣大用戶鋪好了一條完整的生態(tài)鏈,從編碼API、軟件、平臺(tái)到播放器,將全面支持AV1編碼。 另外再說(shuō)一下NVIDIA一直強(qiáng)調(diào)的在RTX 4070 Ti及以上型號(hào)配置的雙AV1編碼。顧名思義,即部分顯卡內(nèi)搭載了兩個(gè)編碼器,它所帶來(lái)的效果也是顯而易見(jiàn)的。 首先,根據(jù)官方宣傳的,在4K H.265的導(dǎo)出速度上,RTX 4090是RTX 3090 Ti的2.2倍;在8K H.265的導(dǎo)出速度上更是達(dá)到了2.5倍。這部分的提升,大家常用的剪映同樣適用,感興趣的用戶不妨親自體驗(yàn)一下。 除了導(dǎo)出速度,8K 60幀的視頻錄制在以前簡(jiǎn)直難以想象,而雙編碼器的好處就是可以將圖像一分為二,兩個(gè)編碼器分別處理7680×2160的圖像信息,最后拼合完整。 關(guān)于編碼部分,可能大部分用戶的感受不深,但當(dāng)有一天,你想錄屏的時(shí)候,卻發(fā)現(xiàn)顯卡不支持,才會(huì)發(fā)覺(jué)它的重要性…… 隨著圖像逐漸進(jìn)入到超清時(shí)代,硬件編碼和渲染幾乎已經(jīng)成為不可或缺的幫手。雖然論質(zhì)量,硬件編碼仍不及CPU軟編,但軟編做到了極限畫質(zhì),也要承受時(shí)間的無(wú)窮長(zhǎng)。甚至在一張8K渲染圖中,兩種編碼方式的時(shí)間差距就已經(jīng)達(dá)到了幾個(gè)小時(shí),遑論一段10秒的CG動(dòng)畫。在不斷進(jìn)步的硬件編碼中,質(zhì)量和時(shí)間也在不斷地被挑戰(zhàn)和刷新。 13 附錄2-Ada Lovelace是誰(shuí)? Ada Lovelace(1815-1852)是英國(guó)數(shù)學(xué)家、計(jì)算機(jī)程序創(chuàng)始人,建立了循環(huán)和子程序概念,被稱為世界上第一位程序員。 Ada從小對(duì)數(shù)學(xué)有極高天賦,其父稱她為“平行四邊形公主”,后來(lái)的合作伙伴Charles Babbage稱她為“數(shù)字女巫”。在19歲時(shí)Ada嫁給了自己曾經(jīng)的科學(xué)家庭教師,婚后的她對(duì)數(shù)學(xué)熱情不減。 1842年到1843年花了9個(gè)月時(shí)間翻譯了Babbage的《分析機(jī)概論》的備忘錄,寫了很多注記,其中給出了用計(jì)算機(jī)進(jìn)行Bernoulli數(shù)求解的詳細(xì)說(shuō)明。由此,Ada被廣泛認(rèn)為是世界上第一個(gè)程序員。 而以她名字命名的語(yǔ)言——ada語(yǔ)言,已經(jīng)成為了美國(guó)軍方開發(fā)戰(zhàn)斗機(jī)等尖端武器的語(yǔ)言。 從幾行簡(jiǎn)短的生平簡(jiǎn)介中,不難看出Ada的生命雖然只經(jīng)歷了短暫的37個(gè)春秋,但卻足以被后人銘記。 這也是為什么此次NVIDIA RTX 40的先行宣傳中,用到了“以未來(lái)敬傳奇”的slogan。 (8176517)
責(zé)任編輯:德勤鋼鐵網(wǎng) 標(biāo)簽:

熱門搜索

相關(guān)文章

廣告
德勤鋼鐵網(wǎng) |市場(chǎng)分析

技嘉z790雪鷹,技嘉3070ti雪鷹參數(shù)

chanong

|

目前,DIY用戶最喜歡白色的機(jī)器,從白色的主板到顯卡、機(jī)箱。今天我要給大家?guī)?lái)一款白色顯卡——技嘉GeForce RTX 4070 Snow Eagle的評(píng)測(cè)。

NVIDIA給RTX 4070顯卡的官方定位是,在開啟光線追蹤和DLSS的情況下,3A游戲可以達(dá)到2K 100幀以上。初步測(cè)試結(jié)果顯示,其性能比RTX 3070 Ti提升約20%,與RTX 3080持平,在光追和DLSS方面優(yōu)于RTX 30系列顯卡。

RTX 4070依然以不少原價(jià)卡在EC上銷售,使其成為RTX 40系列中性價(jià)比相對(duì)較高的產(chǎn)品,不過(guò)首先我們來(lái)看看這款技嘉RTX 4070 Snow Eagle的外觀。

1GB GeForce RTX 4070 Snow Eagle 概述

這款技嘉RTX 4070 Snow Eagle的包裝非常簡(jiǎn)潔,除了NVIDIA標(biāo)準(zhǔn)型號(hào)部分外,采用了全白色的基調(diào),左側(cè)是系列名稱AERO,并且采用了比較時(shí)尚的字體。

配件方面,技嘉RTX 4070雪鷹依然采用單16針供電,因此包裝內(nèi)附贈(zèng)了一根8針*2電源轉(zhuǎn)接線。不過(guò)這款RTX 4070的功耗并不大,很多AIC都在推出8針單供電版本。

技嘉RTX 4070 Snow Eagle顯卡整體尺寸為300 x 130 x 57.6毫米,卡體為純白色,正面導(dǎo)流罩和覆蓋風(fēng)扇區(qū)域的拉絲金屬外殼。雖然它們是兩種完全不同的材料,但它們的顏色和紋理卻出奇的和諧。

技嘉RTX 4070 Snow Eagle的風(fēng)扇正上方印有“CREATIVITY STARTS HERE”字樣,意思是“創(chuàng)意從這里開始”。顯卡采用Wind Power散熱系統(tǒng),包含3個(gè)9cm風(fēng)扇,支持智能啟停,正反轉(zhuǎn)設(shè)計(jì)。

內(nèi)部采用了與GPU直接接觸的銅板,配合8根復(fù)合熱管,實(shí)現(xiàn)更高的傳熱效率。

技嘉RTX 4070 Snow Eagle的背板完全由裸金屬制成,背面有一個(gè)巨大的鏤空進(jìn)氣格柵,露出的PCB僅占整個(gè)顯卡的一半左右。

這款技嘉RTX 4070 Snow Eagle卡在使用1個(gè)16針輔助電源時(shí)整體功耗為215W。

請(qǐng)注意,目前適用于RTX 30 系列的12 針接口和電源適配器與RTX 40 系列顯卡不兼容。

視頻輸出接口繼續(xù)采用HDMI 2.1 + DP 1.4a*3的4接口設(shè)計(jì)。 HDMI 2.1可支持4K 120Hz HDR和8K 60Hz HDR。

2 NVIDIA GeForce RTX 4070架構(gòu)分析

此次發(fā)布的GeForce RTX 40系列顯卡基于全新NVIDIA Ada Lovelace架構(gòu)打造,采用臺(tái)積電4N NVIDIA定制工藝,旗艦核心AD102擁有驚人的760億個(gè)晶體管,相比之下,RTX 30有280億個(gè)晶體管。系列顯卡。

與上一代NVIDIA Ampere 相比,NVIDIA Ada Lovelace 在相同功耗下可提供兩倍以上的性能,著色器數(shù)據(jù)吞吐量高達(dá)90 TFLOPS。

新推出的RTX 4070共有5888個(gè)CUDA核心,提供29 TFLOPS計(jì)算能力,46個(gè)第三代Ada RT核心,提供67 RT-TFLOPS,184個(gè)第四代Ada RT核心,提供67 RT-TFLOPS。第一代Tensor核心提供466張量-TFLOPS 的計(jì)算能力。

其實(shí)如果只對(duì)比傳統(tǒng)的光柵性能,RTX 4070的進(jìn)步并沒(méi)有那么大,但是隨著人工智能逐漸發(fā)展的今天,需要很多邏輯推理運(yùn)算,對(duì)比Tensor 30就可以看出。該系列的計(jì)算能力幾乎提高了2.7 倍。

完整的AD102核心

RTX 4070 Ti使用的AD104核心

RTX 4070使用的AD104核心

這次RTX 4070采用AD104芯片,并使用4組GPC。其中一個(gè)缺少TPC 裝置,但有兩個(gè)NVENC 單元。

另外,我們可以看到RTX 40系列顯卡現(xiàn)在擁有比較大的二級(jí)緩存,這其實(shí)是故意的。

這款RTX 4070擁有36MB二級(jí)緩存,相比上一代RTX 3070 Ti的4MB,相差9倍。增加二級(jí)緩存的大小可以提高性能、減少延遲并延長(zhǎng)電池壽命。數(shù)據(jù)訪問(wèn)可以在GPU上完成(否則GPU會(huì)頻繁地從顯存讀取數(shù)據(jù),過(guò)度依賴顯存帶寬)。因此,這也是RTX 40系列顯卡的位寬和帶寬普遍較小的原因。

事實(shí)上,從完整的架構(gòu)圖來(lái)看,Ada架構(gòu)的整體結(jié)構(gòu)變化并不大。這一點(diǎn)從SM單元也能清楚地看出。相同的FP32 CUDA 核心、相同的FP32/INT32 混合CUDA 核心、相同的L1 級(jí)緩存等。當(dāng)然,每個(gè)SM單元內(nèi)的Tensor Core已經(jīng)升級(jí)到了第四代。

不過(guò),最顯著的變化是第三代光線追蹤核心。我們?cè)賮?lái)看看第二代架構(gòu)。第二代光追蹤核心包括用于邊界相交測(cè)試的盒子相交引擎和用于三角形相交測(cè)試的三角形相交引擎。

第三代光追蹤核心增加了兩個(gè)新引擎:Opacity Micro-Map Engine (OMM) 和Displaced Micro-Mesh Engine (DMM) 這兩個(gè)新的硬件單元使光追蹤顯著提升。 (稍后會(huì)詳細(xì)介紹)。

此時(shí),每2個(gè)SM單元組成一個(gè)TPC單元,每6組TPC單元組成一個(gè)完整的GPC頂級(jí)單元(對(duì)于某些核心,5組TPC組成一個(gè)GPC單元)。

每個(gè)GPC單元配備獨(dú)立的光柵引擎和兩組ROP分區(qū)(每組包含8個(gè)ROP單元)。

由于整體架構(gòu)分析會(huì)很冗長(zhǎng),因此此處不會(huì)介紹NVIDIA Ada 架構(gòu)的其他新功能。它們?cè)谖恼履┪惨愿戒浀男问竭M(jìn)行了解釋。感興趣的用戶請(qǐng)讀到最后。

3 測(cè)試平臺(tái)概述

首先介紹一下測(cè)試平臺(tái),為了保證技嘉RTX 4070 Snow Eagle的性能,平臺(tái)也進(jìn)行了全面更新。

我們看一下最新版本GPU-Z的信息,RTX 4070采用AD104核心,擁有5888個(gè)CUDA,而我們之前測(cè)試的RTX 4070 Ti擁有7680個(gè)CUDA,同樣,不同顯卡的實(shí)際CUDA數(shù)量是不同的因此,如果你做一些簡(jiǎn)單的計(jì)算,RTX 4070 的性能相當(dāng)于RTX 4070 Ti 的77% 左右。

技嘉RTX 4070 Snow Eagle的升壓頻率為2565MHz,公版RTX 4070的升壓頻率為2475MHz。

它采用12GB GDDR6X顯存,位寬為192位,顯存帶寬為504GB/s,光柵和紋理單元為64和184。

該測(cè)試平臺(tái)中的處理器是英特爾最新的第13代i9-13900K,它提供了非常強(qiáng)大的性能,并且在功耗和顯示方面都有顯著的升級(jí)。

4 理論性能測(cè)試

下面是用來(lái)衡量顯卡DX11理論性能的3DMARKFS套件:FS、FSE、FSU分別對(duì)應(yīng)顯卡在1080P、2K、4K下的理論性能馬蘇。以下是顯卡的實(shí)際測(cè)試成績(jī):

在顯卡DX11性能的3DMARKFS封裝測(cè)試中,技嘉RTX 4070 Snow Eagle主要與上一代RTX 3070 Ti進(jìn)行對(duì)比,F(xiàn)S多了25%,F(xiàn)SE多了20%,F(xiàn)SU多了11%。 RTX 3070 Ti 的性能高出約18%。

與剛剛發(fā)布的RTX 4070 Ti相比,整體得分相差約20%。

在DX12環(huán)境下的Time Spy和Time Spy Extreme測(cè)試中,技嘉RTX 4070 Snow Eagle相對(duì)于RTX 3070 Ti的提升是TS多了27%,TSE多了21%,總共提升了約24%。

PortRoyal是專門針對(duì)3DMARK光跡性能的測(cè)試項(xiàng)目,與RTX 3070 Ti相比,技嘉RTX 4070 Snow Eagle取得了約30%的提升。

總體而言,技嘉RTX 4070 Snow Eagle 的理論性能比RTX 3070 Ti 高出約24%。

Speed Way測(cè)試是3DMARK最新更新的顯卡基準(zhǔn)測(cè)試,用于測(cè)試DirectX12 Ultimate性能。要運(yùn)行此測(cè)試,您的顯卡必須支持DirectX 12 Ultimate 并且至少具有6GB 視頻內(nèi)存。

該測(cè)試將實(shí)時(shí)光線追蹤與傳統(tǒng)渲染技術(shù)相結(jié)合,以測(cè)量顯卡的性能。場(chǎng)景包括光線追蹤反射、實(shí)時(shí)全局照明、網(wǎng)格著色器、體積照明、粒子和后處理效果。而且有趣的是,Speed Way 測(cè)試支持自由探索場(chǎng)景,看看燈光和相機(jī)設(shè)置的變化如何影響視覺(jué)效果。

相比RTX 3070 Ti顯卡,從1080p分辨率到4K的提升分別為30%/25%/30%。

此外,我們還使用3DMARK剛剛更新的DLSS 3進(jìn)行了相關(guān)性能測(cè)試。另外,由于RTX 3070 Ti無(wú)法開機(jī),因此不會(huì)參與測(cè)試,只會(huì)與RTX 4070 Ti進(jìn)行比較。

5 一般游戲性能測(cè)試

此次RTX 40系列新增了DLSS 3技術(shù),因此我們稍后會(huì)單獨(dú)進(jìn)行測(cè)試,不過(guò)目前我們選擇了一些主流3A大作來(lái)對(duì)比它們的游戲性能。

《極限競(jìng)速:地平線5》 添加了DLSS 3。稍后將進(jìn)行相關(guān)測(cè)試。我們?cè)谶@里僅進(jìn)行一般比較。

《光明記憶:無(wú)限》的光線追蹤測(cè)試軟件是一款獨(dú)立于游戲的測(cè)試工具,它使用了比游戲更多的光線追蹤技術(shù),測(cè)試條件為“RTX最高品質(zhì)/DLSS品質(zhì)”。因此,我們測(cè)試中的幀率相對(duì)較低,但實(shí)際游戲配置非?捎谩

另一款國(guó)產(chǎn)游戲基準(zhǔn)軟件《邊境》與《光明記憶:無(wú)限》的情況基本相同,所有測(cè)試條件均為“RTX最高畫質(zhì)/DLSS畫質(zhì)”。

《賽博朋克2077》,游戲分為兩個(gè)最高畫質(zhì):超級(jí)和追光超級(jí)。

對(duì)于傳統(tǒng)3A游戲來(lái)說(shuō),RTX 4070的整體提升沒(méi)有光線追蹤游戲那么大,所以NVIDIA多年來(lái)研究的光線追蹤和DLSS仍然會(huì)非常有用。

6 DLSS 3 性能測(cè)試

目前,已有超過(guò)290款游戲和應(yīng)用程序支持DLSS,其中超過(guò)30款游戲已經(jīng)支持最新的DLSS 3。

《逆水寒》,《微軟模擬飛行》,《毀滅全人類2:重新探測(cè)》,《瘟疫傳說(shuō):安魂曲》,《光明記憶:無(wú)限》,《暗影火炬城》,《F1 22》, 333 60010-3 0000、《生死輪回》、《漫威蜘蛛俠:重制版》、《超級(jí)人類》、《極限競(jìng)速:地平線5》、010至30000、010 至30000、010 至30000 等

讓我們測(cè)試一下使用新的DLSS 3 游戲可以達(dá)到什么樣的幀速率。

這次DLSS 3的測(cè)試圖更加復(fù)雜,增加了1%低FPS和延遲測(cè)試。

首先,F(xiàn)PS 通常由游戲基準(zhǔn)測(cè)試,是指游戲在一段時(shí)間內(nèi)的平均幀數(shù)。 1% Low FPS 將一段時(shí)間內(nèi)的幀數(shù)從大到小排序,取最低的1%,并對(duì)1% 的數(shù)字進(jìn)行平均。

其實(shí)簡(jiǎn)單來(lái)說(shuō),這兩個(gè)值都不能代表游戲過(guò)程中某個(gè)特定時(shí)刻的情緒,但FPS更注重整體情況,而FPS降低1%意味著平均代表最差的情況。要更加小心。

了解了1% Low FPS 之后,我們?cè)倏匆幌逻@張圖。軸左邊是延遲(越低越好),軸右邊是幀數(shù)(也包括正負(fù)坐標(biāo),所以每邊的值可能不同)。

《賽博朋克2077》,DLSS 3的表現(xiàn)非常可觀,因?yàn)檫@類模擬經(jīng)營(yíng)游戲的特點(diǎn)是同屏顯示的單元較多,消耗的CPU資源較多,而DLSS 3可以生成突破CPU瓶頸的幀。

然而,幀生成并非沒(méi)有缺點(diǎn),因此在該測(cè)試中添加了延遲。當(dāng)您打開DLSS 3 時(shí),捆綁包中的NVIDIA Reflex 也會(huì)打開。不過(guò),與大多數(shù)非競(jìng)技類游戲相比,25 毫秒的延遲在現(xiàn)實(shí)體驗(yàn)中并不算大。

《紅霞島》反映的數(shù)據(jù)比較真實(shí),顯示在最好的DLSS光線追蹤下,即使是技嘉RTX 4070 Snow Eagle顯卡也只有41幀,延遲106.3毫秒,我理解。

開啟DLSS 3后,幀數(shù)為105幀,增長(zhǎng)156%。延遲比DLSS 2長(zhǎng)約14ms,但仍保持在較低水平。

《暗黑破壞神4》是添加了DLSS 3的最新游戲。可以看到,即使開啟DLSS 2,幀數(shù)也會(huì)受到CPU 瓶頸的限制。這與DLSS 打開和關(guān)閉時(shí)的幀數(shù)大致相同。開啟DLSS 3后,幀率躍升至162幀,提升了27%。

《侏羅紀(jì)世界:進(jìn)化2》 打開光跟蹤會(huì)顯著提高性能要求。其中,DLSS 3的幀率較DLSS水平提升了80%,DLSS 2的提升率達(dá)到了57%。

不過(guò),《侏羅紀(jì)世界:進(jìn)化2》的幀率較剛發(fā)布時(shí)明顯下降了1%,而且在實(shí)際游戲中,你可以感受到與正常情況明顯不同的突然滯后……看來(lái)。這是因?yàn)橛螒虬姹疽呀?jīng)更新,優(yōu)化尚未完成。

UE5提供的測(cè)試游戲方便的提供了DLSS的簡(jiǎn)單測(cè)試,分為DLSS Level(超分辨率級(jí)別+幀生成級(jí)別+反射級(jí)別)和DLSS 2(超分辨率性能+幀生成級(jí)別+反射級(jí)別)。 DLSS 3 的3 種速度測(cè)試(超分辨率性能+ 幀生成打開+ 反射打開)。

此外,由于Lyra 幀是靜態(tài)拍攝的,因此《1% Low》的得分高于其他游戲。

7 穩(wěn)定擴(kuò)散AI繪畫測(cè)試

除了游戲之外,AI也是目前的熱門領(lǐng)域,尤其是穩(wěn)定擴(kuò)散。目前,人工智能生成的許多圖像完全是假的,也可能是真的。我們也測(cè)試一下RTX 4070在這方面的表現(xiàn)。

雖然穩(wěn)定擴(kuò)散幾乎沒(méi)有?*,但辩R夭渴鸕母叢有勻瞇磯嚶沒(méi)床健I賢嘉僮鶻緱媯沒(méi)Э梢愿葑約合胍傻惱掌諶堇捶岣還丶省?

我們根據(jù)NVIDIA提供的關(guān)鍵詞生成了10批共20張照片,并選擇了兩張細(xì)節(jié)比較合理的照片顯示在上面。

RTX 4070的計(jì)算時(shí)間為2分24.79秒,即每張照片約7.2秒。

RTX 3070 Ti 的計(jì)算時(shí)間為2m54.34 秒,每張圖像大約需要8.7 秒。

Stable Diffusion對(duì)顯卡的要求比較高,需要強(qiáng)大的Tensor計(jì)算能力。

對(duì)顯存的要求也很高,所以有條件的話一定要選擇顯存量大的顯卡。

當(dāng)我們比較相同設(shè)置下RTX 4070和RTX 3070 Ti的計(jì)算時(shí)間時(shí),我們發(fā)現(xiàn)兩款顯卡在生成20張圖像時(shí)的時(shí)間相差30秒,這仍然是一個(gè)相當(dāng)顯著的差異。

我還測(cè)試了使用CPU 生成具有相同設(shè)置的圖像,保守估計(jì)大約需要3 小時(shí)30 分鐘,如圖所示。

另外,使用CPU渲染時(shí),經(jīng)常出現(xiàn)內(nèi)存不足的提示,但測(cè)試平臺(tái)是旗艦i9-13900K,內(nèi)存是D5 7200MHz 32G(16G*2),還不錯(cuò),可以查看顯卡?ㄆ瑢(duì)于跟上潮流也非常重要。

PS:AMD顯卡目前無(wú)法使用Stable Diffusion來(lái)生成圖像。我們只能期待未來(lái)的優(yōu)化。

8 AV1編碼測(cè)試

這次AV1編碼測(cè)試,我選擇了編輯專業(yè)版,雖然我作為一個(gè)有一些基本編輯知識(shí)的人可能低估了它,但總體感覺(jué)它對(duì)于測(cè)試來(lái)說(shuō)非常好用。

日常編輯使用PR、AE等Adobe軟件,最大的感受是編輯更加智能,預(yù)設(shè)更適合發(fā)布,智能字幕識(shí)別等,是一個(gè)很好用的工具。

打個(gè)比方,編輯和PR就像漂亮的照片或PS,而Adobe的優(yōu)勢(shì)就是有很大的編輯空間。不過(guò)日常使用來(lái)說(shuō),剪輯等軟件沒(méi)有任何問(wèn)題,而且很好用。

Cut Movie 的專業(yè)版現(xiàn)在帶有AV1 編碼輸出,在我們的實(shí)際測(cè)試中,我們導(dǎo)出了大約2 分鐘的視頻?梢钥吹絻蓚(gè)文件的大小相差124MB。

由于AV1 編碼的性質(zhì),生成的文件將具有較低的比特率,但視頻分辨率將完全相同。因此,如果生成相同比特率和容量的文件,AV1 會(huì)更清晰。

使用NVIDIA ICAT 比較兩個(gè)視頻的圖像。圖像的左側(cè)是AV1編碼,右側(cè)是H264編碼。無(wú)論如何,通過(guò)200%的細(xì)節(jié)放大,差別不大。

9 RTX VSR(RTX視頻超分辨率)測(cè)試

RTX VSR(RTX 視頻超分辨率)目前正在某些瀏覽器中進(jìn)行測(cè)試。首先,玩家必須更新到最新的NVIDIA 驅(qū)動(dòng)程序。在NVIDIA 控件中的調(diào)整視頻圖像設(shè)置下查看超分辨率中最新的RTX 視頻增強(qiáng)功能。這是一個(gè)面板。

RTX VSR是AI圖像處理領(lǐng)域的突破性技術(shù),超越傳統(tǒng)的邊緣檢測(cè)和特征銳化技術(shù),可顯著提高直播視頻內(nèi)容的質(zhì)量。

開啟RTX VSR不僅需要最新的驅(qū)動(dòng)程序,還需要使用RTX 40或30系列GPU。它還適用于Google Chrome 和Microsoft Edge 瀏覽器中的幾乎所有視頻內(nèi)容(瀏覽器還必須更新到最新的驅(qū)動(dòng)程序)。最新版本)。

目前已知開啟后,打開YouTube 或Bilibili 即可享受RTX VSR 效果的加成。

如果您不確定,如果您在全屏播放視頻時(shí)打開任務(wù)管理器并看到GPU 負(fù)載增加,則表示您的GPU 已成功打開。

(點(diǎn)擊可放大查看原圖)

打開YouTube自由觀看視頻,可以明顯看到,開啟RTX VSR后,水下珊瑚的畫質(zhì)好多了,邊緣更銳利,失真明顯減少,我明白了。

10 溫度和功耗測(cè)試

功耗測(cè)試方面,我們選擇了FurMark軟件進(jìn)行拷貝測(cè)試,GPU-Z進(jìn)行溫度檢測(cè),功耗僅在顯卡本身上進(jìn)行計(jì)算。

你會(huì)發(fā)現(xiàn)技嘉RTX 4070 Snow Eagle顯卡的溫度控制非常好。經(jīng)評(píng)估,室溫控制在26C左右。經(jīng)過(guò)20分鐘的拷機(jī)測(cè)試,TDP達(dá)到100%,板載功耗215W,溫度恒定,控制在63左右,熱點(diǎn)溫度77左右。

有趣的是,顯卡的顯存溫度通常都比較高,但技嘉RTX 4070 Snow Eagle的顯存溫度僅為50。

游戲動(dòng)態(tài)功耗測(cè)試

值得注意的是,在本次抄襲測(cè)試中,最大板載功耗約為215W,TDP達(dá)到了100%。不過(guò)在真實(shí)游戲測(cè)試中,大部分3A游戲都能達(dá)到180-190W左右,而一些性能非常密集的3A游戲則能達(dá)到200W左右,這比額定功耗還遠(yuǎn)低于。

因此,在實(shí)際使用過(guò)程中,由于游戲負(fù)載的差異,GPU的實(shí)際功耗會(huì)隨著時(shí)間的推移而動(dòng)態(tài)變化,類似于FPS,使得RTX 40系列不太可能撞上功耗墻。

技嘉RTX 4070雪鷹3A游戲平均功耗200W

RTX 3070 Ti 3A游戲平均功耗為288W

真實(shí)的游戲功耗測(cè)試,我們?cè)谧约旱幕鶞?zhǔn)測(cè)試中選擇了《賽博朋克2077》,將屏幕設(shè)置為光線追蹤超級(jí)和4K分辨率,強(qiáng)制執(zhí)行兩塊顯卡的性能限制,然后測(cè)試了功耗。

雖然兩款顯卡都是70級(jí)別,但剛剛發(fā)布的RTX 4070的平均功耗為202W,而RTX 3070 Ti為288W,低了約80W,這確實(shí)是一個(gè)令人驚訝的結(jié)果。

11種不同的白色金屬紋理

近年來(lái),白色產(chǎn)品成為廠商和用戶的首選,大多數(shù)白色顯卡都選擇更加均勻的材質(zhì),以達(dá)到更加“純粹”的質(zhì)感。整個(gè)技嘉RTX 4070雪鷹卡由兩種材質(zhì)制成,尤其是正面導(dǎo)風(fēng)板,覆蓋了大面積的金屬面板。兩種看似不相容的材料結(jié)合在一起會(huì)產(chǎn)生意想不到的和諧。

此外,雖然Snow Eagle 的卡不會(huì)過(guò)分強(qiáng)調(diào)RGB 燈光效果,而且白色是一種非常通用的中性色,但過(guò)分強(qiáng)調(diào)燈光效果可能會(huì)破壞兩種材料之間的平衡,否則這兩種材料會(huì)很好地結(jié)合在一起。Masu。

隨著RTX 4070的發(fā)布,RTX 40系列顯卡的價(jià)格首次跌破5000元。這對(duì)于等待數(shù)年購(gòu)買機(jī)器的獨(dú)立游戲玩家來(lái)說(shuō)絕對(duì)是個(gè)好消息。

性能方面,RTX 4070在2K分辨率的3A游戲中可以達(dá)到100幀,我們測(cè)試的所有游戲圖形都在平均水平以上。至于4K,目前大多數(shù)獨(dú)立游戲和網(wǎng)絡(luò)游戲都可以。

我認(rèn)為RTX 40系列顯卡最有意義的升級(jí)就是功耗的降低。如今,大多數(shù)AIC 顯卡都使用單個(gè)8 針電源。 GPU升級(jí)的意義在于,相比同類產(chǎn)品,功耗降低100W,整體性能提升約20%。

此外,RTX 40系列顯卡最初也是為多領(lǐng)域使用而設(shè)計(jì)的,而不僅僅局限于游戲。因此,盡管RTX 4070 的目標(biāo)用戶是游戲玩家,但它作為生產(chǎn)力工具的角色仍然存在。

至于價(jià)格方面,這款A(yù)ERO雪鷹是超頻版,所以目前高達(dá)5299元,風(fēng)魔等技嘉部分標(biāo)頻顯卡也在4799元左右。

12 附錄1 - NVIDIA Ada Lovelace 架構(gòu)分析

著色器執(zhí)行順序更改(SER) 著色器執(zhí)行順序更改

SER的主要功能是提高著色器性能,允許低效工作負(fù)載動(dòng)態(tài)重組為更高效的工作負(fù)載。主要是光線追蹤的性能提升是巨大的。

簡(jiǎn)而言之,GPU 在執(zhí)行類似任務(wù)時(shí)效率最高。然而,隨著光追蹤效果變得越來(lái)越強(qiáng)大,我們發(fā)現(xiàn)每個(gè)場(chǎng)景中可能有數(shù)百萬(wàn)個(gè)燈光照亮不同的材質(zhì),并且不同的材質(zhì)具有不同的反射率和反射效果。因此,這給著色器帶來(lái)了巨大的、分布式的、低效的工作負(fù)載。

SER可以對(duì)這些繁瑣的指令進(jìn)行重新分類,并動(dòng)態(tài)地將它們重新組織成更高效的工作負(fù)載。據(jù)NVIDIA 稱,SER 將著色器性能提高了2 倍,并將游戲幀速率提高了25%。

舉個(gè)簡(jiǎn)單的例子,當(dāng)光第一次從出射端傳播到撞擊端時(shí),它是一條非常規(guī)則的光線,但光在第二次撞擊物體后留下的痕跡,就出現(xiàn)了大量的發(fā)散和漫反射。這對(duì)于燈光來(lái)說(shuō)非常重要,跟蹤負(fù)載非常高。正如您所看到的,SER 可以對(duì)這些指令進(jìn)行兩次排序,以最大限度地提高著色器性能。

幸運(yùn)的是,這些實(shí)用的功能在RTX 40 系列上并未獲得專利,目前游戲開發(fā)者需要將其集成到他們的游戲中,因?yàn)樗且粋(gè)易于集成的SDK。另外,由于它是通用邏輯,未來(lái)可以直接集成到Windows API中,讓游戲開發(fā)者可以直接調(diào)用系統(tǒng)API,而不需要專門引用它。

SER對(duì)于擁有RTX 20系列或更新版本(可以開啟光線追蹤)的N卡用戶來(lái)說(shuō)可以說(shuō)是一個(gè)巨大的福音。畢竟,誰(shuí)不喜歡免費(fèi)且改進(jìn)的光跡性能呢?

第三代RT核心

RT Core 負(fù)責(zé)加速光線追蹤計(jì)算能力,雖然使用RTX 30 系列顯卡享受4K 高幀率游戲可能會(huì)有些困難,但使用RTX 40 系列顯卡就可以輕松解決。

GeForce RTX 4090顯卡的處理能力達(dá)到了191 RT-TFLOPs,而RTX 30系列顯卡最快的處理能力為78 RT-TFLOPs,整整2.4倍。另外,根據(jù)NVIDIA官方的說(shuō)法,第三代RT核心的峰值RT-TFLOP相比上一代提升了2.8倍。這只是表明這個(gè)4090 并不是Ada Lovelace 架構(gòu)的最終版本。

不透明度微圖引擎

第三代RT 內(nèi)核中引入了兩個(gè)重要的硬件單元。第一個(gè)是Opacity Micro-Map Engine,可以理解為微圖透明度引擎。其主要功能是優(yōu)化光線追蹤渲染。著色器工作負(fù)載。

例如,對(duì)于葉子這樣的復(fù)雜物體,光線追蹤變得計(jì)算密集型,因?yàn)椴粌H不同的光線會(huì)影響性能狀態(tài),還會(huì)影響葉子之間的光線反射。

不過(guò),不透明微貼圖引擎可以將光線追蹤特性烘焙到不透明蒙版中,從而可以更快、更準(zhǔn)確地渲染不規(guī)則形狀和半透明物體,從而顯著減少著色器工作量。

位移式微網(wǎng)格引擎(DMM)

Displaced Micromesh Engine 可以理解為微網(wǎng)格置換引擎,其構(gòu)建光線追蹤BVH(邊界體積層次結(jié)構(gòu))的速度提高了10 倍。視頻內(nèi)存使用量減少了20 倍。

DMM 由第三代RT 核心進(jìn)行本地處理,僅使用基本三角形即可渲染復(fù)雜的幾何圖形,與前幾代相比,顯著降低了存儲(chǔ)和處理要求。

具體工作原理從圖片中已經(jīng)很清楚了,但是雖然新的DMM可以簡(jiǎn)化具有多個(gè)面的復(fù)雜圖形并創(chuàng)建更簡(jiǎn)單的模型,但整體光線追蹤效果不會(huì)改變。

通過(guò)一些模型數(shù)據(jù),我們可以具體看到新的DMM對(duì)模型的簡(jiǎn)化程度有多大。包含1100 萬(wàn)個(gè)三角形的原始模型簡(jiǎn)化為僅約150,000 個(gè)微網(wǎng)格,使BVH 構(gòu)建速度提高了8.5 倍,體積縮小了6.5 倍。

這并不夸張;模型越復(fù)雜,優(yōu)化效果越高;在官方公布的對(duì)比例子中,最快可以實(shí)現(xiàn)15倍以上的加速比,容量簡(jiǎn)化如下,可換算為20次。

第四代Tensor Core

除了光學(xué)追蹤單元升級(jí)之外,第4代張量核心的升級(jí)更加恐怖。使用新的FP8 張量引擎,旗艦型號(hào)RTX 4090 顯卡可提供1.32 Tensor petaflops 的吞吐量,提升了5 倍。

現(xiàn)在請(qǐng)注意單位——petaFLOP。以前,TFLOP 是萬(wàn)億次浮點(diǎn)運(yùn)算,而千萬(wàn)億次浮點(diǎn)運(yùn)算是萬(wàn)億次浮點(diǎn)運(yùn)算。

中端RTX 4070 還達(dá)到了令人印象深刻的466 Tensor-TFLOPS,比上一代RTX 3070 Ti 高出約2.7 倍。

DLSS3

新推出的DLSS 3也是RTX 40系列的一大賣點(diǎn),可以看出從DLSS 2.3到DLSS 3版本升級(jí)的幅度。 DLSS 3也被NVIDIA正式稱為神經(jīng)網(wǎng)絡(luò)渲染的新時(shí)代。

新的DLSS 3在原始DLSS超分辨率的基礎(chǔ)上添加了光學(xué)多幀生成技術(shù),以生成全新的幀,而不像原來(lái)只能生成像素。

DLSS 3 結(jié)合了DLSS 超分辨率、DLSS 幀生成和可重建八分之七像素的NVIDIA Reflex 三大關(guān)鍵技術(shù),顯著提升性能。

對(duì)于2K 分辨率和更高分辨率等GPU 密集型游戲,DLSS 2 可以將幀速率提高2 倍,DLSS 3 可以將幀速率提高4 倍。

此次DLSS 3跨越各大版本,在思路和原理上再次升級(jí),是一種完全“猜猜”的一幀技術(shù),解釋起來(lái)很容易,但實(shí)現(xiàn)起來(lái)需要大量的推理和計(jì)算。以及一個(gè)完全先進(jìn)的想法。

但“憑空”產(chǎn)生的一幀延遲明顯高于DLSS 2。因此,這個(gè)完整的DLSS 3 與NVIDIA Reflex 捆綁在一起,可以有效幫助減少延遲。

它名副其實(shí),名副其實(shí)。

個(gè)“神經(jīng)網(wǎng)絡(luò)渲染新時(shí)代”的名號(hào)?v觀目前市面上的XeSS、FSR技術(shù),DLSS絕對(duì)稱得上“巨人的肩膀”。當(dāng)然,連年的創(chuàng)新,苦的是手持上一代顯卡的玩家,想體驗(yàn)DLSS 3的幀生成,目前唯一的辦法就是購(gòu)入一張RTX 40系顯卡。 New Optical Flow Accelerator New Optical Flow Accelerator光流加速器是在第四代Tensor Cores中最新引入的,這也是為何DLSS 3中的幀生成為RTX 40系顯卡獨(dú)享。 光流加速器在原本DLSS 2的基礎(chǔ)上,還可以計(jì)算兩個(gè)連續(xù)幀內(nèi)的光流場(chǎng),能夠捕捉游戲畫面從第1幀到第2幀的方向和速度,從中捕捉粒子、反射和光照等像素信息。并分別計(jì)算運(yùn)動(dòng)矢量和光流來(lái)獲得精準(zhǔn)的陰影重建效果。 以《賽博朋克2077》為例,在第一幀,光流加速器會(huì)捕捉到每一個(gè)像素中的粒子、反射和光照等信息。并在第二幀中查找匹配的像素區(qū)域,計(jì)算幀之間的差值。 如果說(shuō)原來(lái)DLSS 2能夠“猜”出一張圖剩下的像素,那么DLSS 3除了這些,還能夠“猜”出下一幀的畫面。 另外由于DLSS 3的幀生成是在GPU中處理和運(yùn)行的,所以即使遇到CPU瓶頸的游戲,AI同樣能夠提升幀率。這也是為什么在此次發(fā)布會(huì)中說(shuō)到,DLSS 3能夠突破CPU的限制來(lái)提升幀數(shù)。 AV1編碼器 本次升級(jí)的第八代NVENC編碼器可以說(shuō)是直播、視頻、后期工作者的極大福音。它首次加入了對(duì)AV1編碼的支持,最顯而易見(jiàn)的效果就是直播。 相比傳統(tǒng)的H.264編碼,AV1編碼的效率平均提升了40%,在同碼率下AV1編碼的畫質(zhì)將更好。目前大部分直播的分辨率和清晰度,均受限于平臺(tái)規(guī)定的最大比特率。以Twitch限制的8Mbps為例,可以看到在同等帶寬下,同為2K 60幀的畫面,采用AV1編碼的清晰度明顯比H.264更高。 說(shuō)起直播,OBS相信大家都不陌生,在10月份即將發(fā)布的補(bǔ)丁中,OBS就加入了對(duì)NVENC的AV1編碼支持 當(dāng)然,直播只是我們更容易見(jiàn)到的AV1優(yōu)勢(shì),在視頻工作的所有環(huán)節(jié),AV1編碼都可以帶來(lái)極大提升。 所以,如圖所見(jiàn)。NVIDIA已經(jīng)為廣大用戶鋪好了一條完整的生態(tài)鏈,從編碼API、軟件、平臺(tái)到播放器,將全面支持AV1編碼。 另外再說(shuō)一下NVIDIA一直強(qiáng)調(diào)的在RTX 4070 Ti及以上型號(hào)配置的雙AV1編碼。顧名思義,即部分顯卡內(nèi)搭載了兩個(gè)編碼器,它所帶來(lái)的效果也是顯而易見(jiàn)的。 首先,根據(jù)官方宣傳的,在4K H.265的導(dǎo)出速度上,RTX 4090是RTX 3090 Ti的2.2倍;在8K H.265的導(dǎo)出速度上更是達(dá)到了2.5倍。這部分的提升,大家常用的剪映同樣適用,感興趣的用戶不妨親自體驗(yàn)一下。 除了導(dǎo)出速度,8K 60幀的視頻錄制在以前簡(jiǎn)直難以想象,而雙編碼器的好處就是可以將圖像一分為二,兩個(gè)編碼器分別處理7680×2160的圖像信息,最后拼合完整。 關(guān)于編碼部分,可能大部分用戶的感受不深,但當(dāng)有一天,你想錄屏的時(shí)候,卻發(fā)現(xiàn)顯卡不支持,才會(huì)發(fā)覺(jué)它的重要性…… 隨著圖像逐漸進(jìn)入到超清時(shí)代,硬件編碼和渲染幾乎已經(jīng)成為不可或缺的幫手。雖然論質(zhì)量,硬件編碼仍不及CPU軟編,但軟編做到了極限畫質(zhì),也要承受時(shí)間的無(wú)窮長(zhǎng)。甚至在一張8K渲染圖中,兩種編碼方式的時(shí)間差距就已經(jīng)達(dá)到了幾個(gè)小時(shí),遑論一段10秒的CG動(dòng)畫。在不斷進(jìn)步的硬件編碼中,質(zhì)量和時(shí)間也在不斷地被挑戰(zhàn)和刷新。 13 附錄2-Ada Lovelace是誰(shuí)? Ada Lovelace(1815-1852)是英國(guó)數(shù)學(xué)家、計(jì)算機(jī)程序創(chuàng)始人,建立了循環(huán)和子程序概念,被稱為世界上第一位程序員。 Ada從小對(duì)數(shù)學(xué)有極高天賦,其父稱她為“平行四邊形公主”,后來(lái)的合作伙伴Charles Babbage稱她為“數(shù)字女巫”。在19歲時(shí)Ada嫁給了自己曾經(jīng)的科學(xué)家庭教師,婚后的她對(duì)數(shù)學(xué)熱情不減。 1842年到1843年花了9個(gè)月時(shí)間翻譯了Babbage的《分析機(jī)概論》的備忘錄,寫了很多注記,其中給出了用計(jì)算機(jī)進(jìn)行Bernoulli數(shù)求解的詳細(xì)說(shuō)明。由此,Ada被廣泛認(rèn)為是世界上第一個(gè)程序員。 而以她名字命名的語(yǔ)言——ada語(yǔ)言,已經(jīng)成為了美國(guó)軍方開發(fā)戰(zhàn)斗機(jī)等尖端武器的語(yǔ)言。 從幾行簡(jiǎn)短的生平簡(jiǎn)介中,不難看出Ada的生命雖然只經(jīng)歷了短暫的37個(gè)春秋,但卻足以被后人銘記。 這也是為什么此次NVIDIA RTX 40的先行宣傳中,用到了“以未來(lái)敬傳奇”的slogan。 (8176517)

市場(chǎng)分析