您當(dāng)前的位置：鋼材 > 型鋼 > 市場(chǎng)分析

技嘉z790雪鷹，技嘉3070ti雪鷹參數(shù)

來(lái)源:頭條作者: chanong

分享到

關(guān)注德勤鋼鐵網(wǎng)在線：

掃描二維碼
關(guān)注√
德勤鋼鐵網(wǎng)微信

在線咨詢：

掃描或點(diǎn)擊關(guān)注德勤鋼鐵網(wǎng)在線客服

目前，DIY用戶最喜歡白色的機(jī)器，從白色的主板到顯卡、機(jī)箱。今天我要給大家?guī)?lái)一款白色顯卡——技嘉GeForce RTX 4070 Snow Eagle的評(píng)測(cè)。

NVIDIA給RTX 4070顯卡的官方定位是，在開啟光線追蹤和DLSS的情況下，3A游戲可以達(dá)到2K 100幀以上。初步測(cè)試結(jié)果顯示，其性能比RTX 3070 Ti提升約20%，與RTX 3080持平，在光追和DLSS方面優(yōu)于RTX 30系列顯卡。

RTX 4070依然以不少原價(jià)卡在EC上銷售，使其成為RTX 40系列中性價(jià)比相對(duì)較高的產(chǎn)品，不過(guò)首先我們來(lái)看看這款技嘉RTX 4070 Snow Eagle的外觀。

1GB GeForce RTX 4070 Snow Eagle 概述

這款技嘉RTX 4070 Snow Eagle的包裝非常簡(jiǎn)潔，除了NVIDIA標(biāo)準(zhǔn)型號(hào)部分外，采用了全白色的基調(diào)，左側(cè)是系列名稱AERO，并且采用了比較時(shí)尚的字體。

配件方面，技嘉RTX 4070雪鷹依然采用單16針供電，因此包裝內(nèi)附贈(zèng)了一根8針*2電源轉(zhuǎn)接線。不過(guò)這款RTX 4070的功耗并不大，很多AIC都在推出8針單供電版本。

技嘉RTX 4070 Snow Eagle顯卡整體尺寸為300 x 130 x 57.6毫米，卡體為純白色，正面導(dǎo)流罩和覆蓋風(fēng)扇區(qū)域的拉絲金屬外殼。雖然它們是兩種完全不同的材料，但它們的顏色和紋理卻出奇的和諧。

技嘉RTX 4070 Snow Eagle的風(fēng)扇正上方印有“CREATIVITY STARTS HERE”字樣，意思是“創(chuàng)意從這里開始”。顯卡采用Wind Power散熱系統(tǒng)，包含3個(gè)9cm風(fēng)扇，支持智能啟停，正反轉(zhuǎn)設(shè)計(jì)。

內(nèi)部采用了與GPU直接接觸的銅板，配合8根復(fù)合熱管，實(shí)現(xiàn)更高的傳熱效率。

技嘉RTX 4070 Snow Eagle的背板完全由裸金屬制成，背面有一個(gè)巨大的鏤空進(jìn)氣格柵，露出的PCB僅占整個(gè)顯卡的一半左右。

這款技嘉RTX 4070 Snow Eagle卡在使用1個(gè)16針輔助電源時(shí)整體功耗為215W。

請(qǐng)注意，目前適用于RTX 30 系列的12 針接口和電源適配器與RTX 40 系列顯卡不兼容。

視頻輸出接口繼續(xù)采用HDMI 2.1 + DP 1.4a*3的4接口設(shè)計(jì)。 HDMI 2.1可支持4K 120Hz HDR和8K 60Hz HDR。

2 NVIDIA GeForce RTX 4070架構(gòu)分析

此次發(fā)布的GeForce RTX 40系列顯卡基于全新NVIDIA Ada Lovelace架構(gòu)打造，采用臺(tái)積電4N NVIDIA定制工藝，旗艦核心AD102擁有驚人的760億個(gè)晶體管，相比之下，RTX 30有280億個(gè)晶體管。系列顯卡。

與上一代NVIDIA Ampere 相比，NVIDIA Ada Lovelace 在相同功耗下可提供兩倍以上的性能，著色器數(shù)據(jù)吞吐量高達(dá)90 TFLOPS。

新推出的RTX 4070共有5888個(gè)CUDA核心，提供29 TFLOPS計(jì)算能力，46個(gè)第三代Ada RT核心，提供67 RT-TFLOPS，184個(gè)第四代Ada RT核心，提供67 RT-TFLOPS。第一代Tensor核心提供466張量-TFLOPS 的計(jì)算能力。

其實(shí)如果只對(duì)比傳統(tǒng)的光柵性能，RTX 4070的進(jìn)步并沒(méi)有那么大，但是隨著人工智能逐漸發(fā)展的今天，需要很多邏輯推理運(yùn)算，對(duì)比Tensor 30就可以看出。該系列的計(jì)算能力幾乎提高了2.7 倍。

完整的AD102核心

RTX 4070 Ti使用的AD104核心

RTX 4070使用的AD104核心

這次RTX 4070采用AD104芯片，并使用4組GPC。其中一個(gè)缺少TPC 裝置，但有兩個(gè)NVENC 單元。

另外，我們可以看到RTX 40系列顯卡現(xiàn)在擁有比較大的二級(jí)緩存，這其實(shí)是故意的。

這款RTX 4070擁有36MB二級(jí)緩存，相比上一代RTX 3070 Ti的4MB，相差9倍。增加二級(jí)緩存的大小可以提高性能、減少延遲并延長(zhǎng)電池壽命。數(shù)據(jù)訪問(wèn)可以在GPU上完成（否則GPU會(huì)頻繁地從顯存讀取數(shù)據(jù)，過(guò)度依賴顯存帶寬）。因此，這也是RTX 40系列顯卡的位寬和帶寬普遍較小的原因。

事實(shí)上，從完整的架構(gòu)圖來(lái)看，Ada架構(gòu)的整體結(jié)構(gòu)變化并不大。這一點(diǎn)從SM單元也能清楚地看出。相同的FP32 CUDA 核心、相同的FP32/INT32 混合CUDA 核心、相同的L1 級(jí)緩存等。當(dāng)然，每個(gè)SM單元內(nèi)的Tensor Core已經(jīng)升級(jí)到了第四代。

不過(guò)，最顯著的變化是第三代光線追蹤核心。我們?cè)賮?lái)看看第二代架構(gòu)。第二代光追蹤核心包括用于邊界相交測(cè)試的盒子相交引擎和用于三角形相交測(cè)試的三角形相交引擎。

第三代光追蹤核心增加了兩個(gè)新引擎：Opacity Micro-Map Engine (OMM) 和Displaced Micro-Mesh Engine (DMM) 這兩個(gè)新的硬件單元使光追蹤顯著提升。（稍后會(huì)詳細(xì)介紹）。

此時(shí)，每2個(gè)SM單元組成一個(gè)TPC單元，每6組TPC單元組成一個(gè)完整的GPC頂級(jí)單元（對(duì)于某些核心，5組TPC組成一個(gè)GPC單元）。

每個(gè)GPC單元配備獨(dú)立的光柵引擎和兩組ROP分區(qū)（每組包含8個(gè)ROP單元）。

由于整體架構(gòu)分析會(huì)很冗長(zhǎng)，因此此處不會(huì)介紹NVIDIA Ada 架構(gòu)的其他新功能。它們?cè)谖恼履┪惨愿戒浀男问竭M(jìn)行了解釋。感興趣的用戶請(qǐng)讀到最后。

3 測(cè)試平臺(tái)概述

首先介紹一下測(cè)試平臺(tái)，為了保證技嘉RTX 4070 Snow Eagle的性能，平臺(tái)也進(jìn)行了全面更新。

我們看一下最新版本GPU-Z的信息，RTX 4070采用AD104核心，擁有5888個(gè)CUDA，而我們之前測(cè)試的RTX 4070 Ti擁有7680個(gè)CUDA，同樣，不同顯卡的實(shí)際CUDA數(shù)量是不同的因此，如果你做一些簡(jiǎn)單的計(jì)算，RTX 4070 的性能相當(dāng)于RTX 4070 Ti 的77% 左右。

技嘉RTX 4070 Snow Eagle的升壓頻率為2565MHz，公版RTX 4070的升壓頻率為2475MHz。

它采用12GB GDDR6X顯存，位寬為192位，顯存帶寬為504GB/s，光柵和紋理單元為64和184。

該測(cè)試平臺(tái)中的處理器是英特爾最新的第13代i9-13900K，它提供了非常強(qiáng)大的性能，并且在功耗和顯示方面都有顯著的升級(jí)。

4 理論性能測(cè)試

下面是用來(lái)衡量顯卡DX11理論性能的3DMARKFS套件：FS、FSE、FSU分別對(duì)應(yīng)顯卡在1080P、2K、4K下的理論性能馬蘇。以下是顯卡的實(shí)際測(cè)試成績(jī)：

在顯卡DX11性能的3DMARKFS封裝測(cè)試中，技嘉RTX 4070 Snow Eagle主要與上一代RTX 3070 Ti進(jìn)行對(duì)比，F(xiàn)S多了25%，F(xiàn)SE多了20%，F(xiàn)SU多了11%。 RTX 3070 Ti 的性能高出約18%。

與剛剛發(fā)布的RTX 4070 Ti相比，整體得分相差約20%。

在DX12環(huán)境下的Time Spy和Time Spy Extreme測(cè)試中，技嘉RTX 4070 Snow Eagle相對(duì)于RTX 3070 Ti的提升是TS多了27%，TSE多了21%，總共提升了約24%。

PortRoyal是專門針對(duì)3DMARK光跡性能的測(cè)試項(xiàng)目，與RTX 3070 Ti相比，技嘉RTX 4070 Snow Eagle取得了約30%的提升。

總體而言，技嘉RTX 4070 Snow Eagle 的理論性能比RTX 3070 Ti 高出約24%。

Speed Way測(cè)試是3DMARK最新更新的顯卡基準(zhǔn)測(cè)試，用于測(cè)試DirectX12 Ultimate性能。要運(yùn)行此測(cè)試，您的顯卡必須支持DirectX 12 Ultimate 并且至少具有6GB 視頻內(nèi)存。

該測(cè)試將實(shí)時(shí)光線追蹤與傳統(tǒng)渲染技術(shù)相結(jié)合，以測(cè)量顯卡的性能。場(chǎng)景包括光線追蹤反射、實(shí)時(shí)全局照明、網(wǎng)格著色器、體積照明、粒子和后處理效果。而且有趣的是，Speed Way 測(cè)試支持自由探索場(chǎng)景，看看燈光和相機(jī)設(shè)置的變化如何影響視覺(jué)效果。

相比RTX 3070 Ti顯卡，從1080p分辨率到4K的提升分別為30%/25%/30%。

此外，我們還使用3DMARK剛剛更新的DLSS 3進(jìn)行了相關(guān)性能測(cè)試。另外，由于RTX 3070 Ti無(wú)法開機(jī)，因此不會(huì)參與測(cè)試，只會(huì)與RTX 4070 Ti進(jìn)行比較。

5 一般游戲性能測(cè)試

此次RTX 40系列新增了DLSS 3技術(shù)，因此我們稍后會(huì)單獨(dú)進(jìn)行測(cè)試，不過(guò)目前我們選擇了一些主流3A大作來(lái)對(duì)比它們的游戲性能。

《極限競(jìng)速：地平線5》添加了DLSS 3。稍后將進(jìn)行相關(guān)測(cè)試。我們?cè)谶@里僅進(jìn)行一般比較。

《光明記憶：無(wú)限》的光線追蹤測(cè)試軟件是一款獨(dú)立于游戲的測(cè)試工具，它使用了比游戲更多的光線追蹤技術(shù)，測(cè)試條件為“RTX最高品質(zhì)/DLSS品質(zhì)”。因此，我們測(cè)試中的幀率相對(duì)較低，但實(shí)際游戲配置非�？捎�。

另一款國(guó)產(chǎn)游戲基準(zhǔn)軟件《邊境》與《光明記憶：無(wú)限》的情況基本相同，所有測(cè)試條件均為“RTX最高畫質(zhì)/DLSS畫質(zhì)”。

《賽博朋克2077》，游戲分為兩個(gè)最高畫質(zhì)：超級(jí)和追光超級(jí)。

對(duì)于傳統(tǒng)3A游戲來(lái)說(shuō)，RTX 4070的整體提升沒(méi)有光線追蹤游戲那么大，所以NVIDIA多年來(lái)研究的光線追蹤和DLSS仍然會(huì)非常有用。

6 DLSS 3 性能測(cè)試

目前，已有超過(guò)290款游戲和應(yīng)用程序支持DLSS，其中超過(guò)30款游戲已經(jīng)支持最新的DLSS 3。

《逆水寒》,《微軟模擬飛行》,《毀滅全人類2：重新探測(cè)》,《瘟疫傳說(shuō)：安魂曲》,《光明記憶：無(wú)限》,《暗影火炬城》,《F1 22》, 333 60010-3 0000、《生死輪回》、《漫威蜘蛛俠：重制版》、《超級(jí)人類》、《極限競(jìng)速：地平線5》、010至30000、010 至30000、010 至30000 等

讓我們測(cè)試一下使用新的DLSS 3 游戲可以達(dá)到什么樣的幀速率。

這次DLSS 3的測(cè)試圖更加復(fù)雜，增加了1%低FPS和延遲測(cè)試。

首先，F(xiàn)PS 通常由游戲基準(zhǔn)測(cè)試，是指游戲在一段時(shí)間內(nèi)的平均幀數(shù)。 1% Low FPS 將一段時(shí)間內(nèi)的幀數(shù)從大到小排序，取最低的1%，并對(duì)1% 的數(shù)字進(jìn)行平均。

其實(shí)簡(jiǎn)單來(lái)說(shuō)，這兩個(gè)值都不能代表游戲過(guò)程中某個(gè)特定時(shí)刻的情緒，但FPS更注重整體情況，而FPS降低1%意味著平均代表最差的情況。要更加小心。

了解了1% Low FPS 之后，我們?cè)倏匆幌逻@張圖。軸左邊是延遲（越低越好），軸右邊是幀數(shù)（也包括正負(fù)坐標(biāo)，所以每邊的值可能不同）。

《賽博朋克2077》，DLSS 3的表現(xiàn)非�？捎^，因?yàn)檫@類模擬經(jīng)營(yíng)游戲的特點(diǎn)是同屏顯示的單元較多，消耗的CPU資源較多，而DLSS 3可以生成突破CPU瓶頸的幀。

然而，幀生成并非沒(méi)有缺點(diǎn)，因此在該測(cè)試中添加了延遲。當(dāng)您打開DLSS 3 時(shí)，捆綁包中的NVIDIA Reflex 也會(huì)打開。不過(guò)，與大多數(shù)非競(jìng)技類游戲相比，25 毫秒的延遲在現(xiàn)實(shí)體驗(yàn)中并不算大。

《紅霞島》反映的數(shù)據(jù)比較真實(shí)，顯示在最好的DLSS光線追蹤下，即使是技嘉RTX 4070 Snow Eagle顯卡也只有41幀，延遲106.3毫秒，我理解。

開啟DLSS 3后，幀數(shù)為105幀，增長(zhǎng)156%。延遲比DLSS 2長(zhǎng)約14ms，但仍保持在較低水平。

《暗黑破壞神4》是添加了DLSS 3的最新游戲�？梢钥吹�，即使開啟DLSS 2，幀數(shù)也會(huì)受到CPU 瓶頸的限制。這與DLSS 打開和關(guān)閉時(shí)的幀數(shù)大致相同。開啟DLSS 3后，幀率躍升至162幀，提升了27%。

《侏羅紀(jì)世界：進(jìn)化2》打開光跟蹤會(huì)顯著提高性能要求。其中，DLSS 3的幀率較DLSS水平提升了80%，DLSS 2的提升率達(dá)到了57%。

不過(guò)，《侏羅紀(jì)世界：進(jìn)化2》的幀率較剛發(fā)布時(shí)明顯下降了1%，而且在實(shí)際游戲中，你可以感受到與正常情況明顯不同的突然滯后……看來(lái)。這是因?yàn)橛螒虬姹疽呀?jīng)更新，優(yōu)化尚未完成。

UE5提供的測(cè)試游戲方便的提供了DLSS的簡(jiǎn)單測(cè)試，分為DLSS Level（超分辨率級(jí)別+幀生成級(jí)別+反射級(jí)別）和DLSS 2（超分辨率性能+幀生成級(jí)別+反射級(jí)別）。 DLSS 3 的3 種速度測(cè)試（超分辨率性能+ 幀生成打開+ 反射打開）。

此外，由于Lyra 幀是靜態(tài)拍攝的，因此《1% Low》的得分高于其他游戲。

7 穩(wěn)定擴(kuò)散AI繪畫測(cè)試

除了游戲之外，AI也是目前的熱門領(lǐng)域，尤其是穩(wěn)定擴(kuò)散。目前，人工智能生成的許多圖像完全是假的，也可能是真的。我們也測(cè)試一下RTX 4070在這方面的表現(xiàn)。

雖然穩(wěn)定擴(kuò)散幾乎沒(méi)有?*�，但辩R夭渴鸕母叢有勻瞇磯嚶沒(méi)床�。少t嘉僮鶻緱媯沒(méi)Э梢愿葑約合胍傻惱掌諶堇捶岣還丶省?

我們根據(jù)NVIDIA提供的關(guān)鍵詞生成了10批共20張照片，并選擇了兩張細(xì)節(jié)比較合理的照片顯示在上面。

RTX 4070的計(jì)算時(shí)間為2分24.79秒，即每張照片約7.2秒。

RTX 3070 Ti 的計(jì)算時(shí)間為2m54.34 秒，每張圖像大約需要8.7 秒。

Stable Diffusion對(duì)顯卡的要求比較高，需要強(qiáng)大的Tensor計(jì)算能力。

對(duì)顯存的要求也很高，所以有條件的話一定要選擇顯存量大的顯卡。

當(dāng)我們比較相同設(shè)置下RTX 4070和RTX 3070 Ti的計(jì)算時(shí)間時(shí)，我們發(fā)現(xiàn)兩款顯卡在生成20張圖像時(shí)的時(shí)間相差30秒，這仍然是一個(gè)相當(dāng)顯著的差異。

我還測(cè)試了使用CPU 生成具有相同設(shè)置的圖像，保守估計(jì)大約需要3 小時(shí)30 分鐘，如圖所示。

另外，使用CPU渲染時(shí)，經(jīng)常出現(xiàn)內(nèi)存不足的提示，但測(cè)試平臺(tái)是旗艦i9-13900K，內(nèi)存是D5 7200MHz 32G（16G*2），還不錯(cuò)，可以查看顯卡�？ㄆ瑢�(duì)于跟上潮流也非常重要。

PS：AMD顯卡目前無(wú)法使用Stable Diffusion來(lái)生成圖像。我們只能期待未來(lái)的優(yōu)化。

8 AV1編碼測(cè)試

這次AV1編碼測(cè)試，我選擇了編輯專業(yè)版，雖然我作為一個(gè)有一些基本編輯知識(shí)的人可能低估了它，但總體感覺(jué)它對(duì)于測(cè)試來(lái)說(shuō)非常好用。

日常編輯使用PR、AE等Adobe軟件，最大的感受是編輯更加智能，預(yù)設(shè)更適合發(fā)布，智能字幕識(shí)別等，是一個(gè)很好用的工具。

打個(gè)比方，編輯和PR就像漂亮的照片或PS，而Adobe的優(yōu)勢(shì)就是有很大的編輯空間。不過(guò)日常使用來(lái)說(shuō)，剪輯等軟件沒(méi)有任何問(wèn)題，而且很好用。

Cut Movie 的專業(yè)版現(xiàn)在帶有AV1 編碼輸出，在我們的實(shí)際測(cè)試中，我們導(dǎo)出了大約2 分鐘的視頻�？梢钥吹絻蓚€(gè)文件的大小相差124MB。

由于AV1 編碼的性質(zhì)，生成的文件將具有較低的比特率，但視頻分辨率將完全相同。因此，如果生成相同比特率和容量的文件，AV1 會(huì)更清晰。

使用NVIDIA ICAT 比較兩個(gè)視頻的圖像。圖像的左側(cè)是AV1編碼，右側(cè)是H264編碼。無(wú)論如何，通過(guò)200%的細(xì)節(jié)放大，差別不大。

9 RTX VSR（RTX視頻超分辨率）測(cè)試

RTX VSR（RTX 視頻超分辨率）目前正在某些瀏覽器中進(jìn)行測(cè)試。首先，玩家必須更新到最新的NVIDIA 驅(qū)動(dòng)程序。在NVIDIA 控件中的調(diào)整視頻圖像設(shè)置下查看超分辨率中最新的RTX 視頻增強(qiáng)功能。這是一個(gè)面板。

RTX VSR是AI圖像處理領(lǐng)域的突破性技術(shù)，超越傳統(tǒng)的邊緣檢測(cè)和特征銳化技術(shù)，可顯著提高直播視頻內(nèi)容的質(zhì)量。

開啟RTX VSR不僅需要最新的驅(qū)動(dòng)程序，還需要使用RTX 40或30系列GPU。它還適用于Google Chrome 和Microsoft Edge 瀏覽器中的幾乎所有視頻內(nèi)容（瀏覽器還必須更新到最新的驅(qū)動(dòng)程序）。最新版本）。

目前已知開啟后，打開YouTube 或Bilibili 即可享受RTX VSR 效果的加成。

如果您不確定，如果您在全屏播放視頻時(shí)打開任務(wù)管理器并看到GPU 負(fù)載增加，則表示您的GPU 已成功打開。

（點(diǎn)擊可放大查看原圖）

打開YouTube自由觀看視頻，可以明顯看到，開啟RTX VSR后，水下珊瑚的畫質(zhì)好多了，邊緣更銳利，失真明顯減少，我明白了。

10 溫度和功耗測(cè)試

功耗測(cè)試方面，我們選擇了FurMark軟件進(jìn)行拷貝測(cè)試，GPU-Z進(jìn)行溫度檢測(cè)，功耗僅在顯卡本身上進(jìn)行計(jì)算。

你會(huì)發(fā)現(xiàn)技嘉RTX 4070 Snow Eagle顯卡的溫度控制非常好。經(jīng)評(píng)估，室溫控制在26C左右。經(jīng)過(guò)20分鐘的拷機(jī)測(cè)試，TDP達(dá)到100%，板載功耗215W，溫度恒定，控制在63左右，熱點(diǎn)溫度77左右。

有趣的是，顯卡的顯存溫度通常都比較高，但技嘉RTX 4070 Snow Eagle的顯存溫度僅為50。

游戲動(dòng)態(tài)功耗測(cè)試

值得注意的是，在本次抄襲測(cè)試中，最大板載功耗約為215W，TDP達(dá)到了100%。不過(guò)在真實(shí)游戲測(cè)試中，大部分3A游戲都能達(dá)到180-190W左右，而一些性能非常密集的3A游戲則能達(dá)到200W左右，這比額定功耗還遠(yuǎn)低于。

因此，在實(shí)際使用過(guò)程中，由于游戲負(fù)載的差異，GPU的實(shí)際功耗會(huì)隨著時(shí)間的推移而動(dòng)態(tài)變化，類似于FPS，使得RTX 40系列不太可能撞上功耗墻。

技嘉RTX 4070雪鷹3A游戲平均功耗200W

RTX 3070 Ti 3A游戲平均功耗為288W

真實(shí)的游戲功耗測(cè)試，我們?cè)谧约旱幕鶞?zhǔn)測(cè)試中選擇了《賽博朋克2077》，將屏幕設(shè)置為光線追蹤超級(jí)和4K分辨率，強(qiáng)制執(zhí)行兩塊顯卡的性能限制，然后測(cè)試了功耗。

雖然兩款顯卡都是70級(jí)別，但剛剛發(fā)布的RTX 4070的平均功耗為202W，而RTX 3070 Ti為288W，低了約80W，這確實(shí)是一個(gè)令人驚訝的結(jié)果。

11種不同的白色金屬紋理

近年來(lái)，白色產(chǎn)品成為廠商和用戶的首選，大多數(shù)白色顯卡都選擇更加均勻的材質(zhì)，以達(dá)到更加“純粹”的質(zhì)感。整個(gè)技嘉RTX 4070雪鷹卡由兩種材質(zhì)制成，尤其是正面導(dǎo)風(fēng)板，覆蓋了大面積的金屬面板。兩種看似不相容的材料結(jié)合在一起會(huì)產(chǎn)生意想不到的和諧。

此外，雖然Snow Eagle 的卡不會(huì)過(guò)分強(qiáng)調(diào)RGB 燈光效果，而且白色是一種非常通用的中性色，但過(guò)分強(qiáng)調(diào)燈光效果可能會(huì)破壞兩種材料之間的平衡，否則這兩種材料會(huì)很好地結(jié)合在一起。Masu。

隨著RTX 4070的發(fā)布，RTX 40系列顯卡的價(jià)格首次跌破5000元。這對(duì)于等待數(shù)年購(gòu)買機(jī)器的獨(dú)立游戲玩家來(lái)說(shuō)絕對(duì)是個(gè)好消息。

性能方面，RTX 4070在2K分辨率的3A游戲中可以達(dá)到100幀，我們測(cè)試的所有游戲圖形都在平均水平以上。至于4K，目前大多數(shù)獨(dú)立游戲和網(wǎng)絡(luò)游戲都可以。

我認(rèn)為RTX 40系列顯卡最有意義的升級(jí)就是功耗的降低。如今，大多數(shù)AIC 顯卡都使用單個(gè)8 針電源。 GPU升級(jí)的意義在于，相比同類產(chǎn)品，功耗降低100W，整體性能提升約20%。

此外，RTX 40系列顯卡最初也是為多領(lǐng)域使用而設(shè)計(jì)的，而不僅僅局限于游戲。因此，盡管RTX 4070 的目標(biāo)用戶是游戲玩家，但它作為生產(chǎn)力工具的角色仍然存在。

至于價(jià)格方面，這款A(yù)ERO雪鷹是超頻版，所以目前高達(dá)5299元，風(fēng)魔等技嘉部分標(biāo)頻顯卡也在4799元左右。

12 附錄1 - NVIDIA Ada Lovelace 架構(gòu)分析

著色器執(zhí)行順序更改(SER) 著色器執(zhí)行順序更改

SER的主要功能是提高著色器性能，允許低效工作負(fù)載動(dòng)態(tài)重組為更高效的工作負(fù)載。主要是光線追蹤的性能提升是巨大的。

簡(jiǎn)而言之，GPU 在執(zhí)行類似任務(wù)時(shí)效率最高。然而，隨著光追蹤效果變得越來(lái)越強(qiáng)大，我們發(fā)現(xiàn)每個(gè)場(chǎng)景中可能有數(shù)百萬(wàn)個(gè)燈光照亮不同的材質(zhì)，并且不同的材質(zhì)具有不同的反射率和反射效果。因此，這給著色器帶來(lái)了巨大的、分布式的、低效的工作負(fù)載。

SER可以對(duì)這些繁瑣的指令進(jìn)行重新分類，并動(dòng)態(tài)地將它們重新組織成更高效的工作負(fù)載。據(jù)NVIDIA 稱，SER 將著色器性能提高了2 倍，并將游戲幀速率提高了25%。

舉個(gè)簡(jiǎn)單的例子，當(dāng)光第一次從出射端傳播到撞擊端時(shí)，它是一條非常規(guī)則的光線，但光在第二次撞擊物體后留下的痕跡，就出現(xiàn)了大量的發(fā)散和漫反射。這對(duì)于燈光來(lái)說(shuō)非常重要，跟蹤負(fù)載非常高。正如您所看到的，SER 可以對(duì)這些指令進(jìn)行兩次排序，以最大限度地提高著色器性能。

幸運(yùn)的是，這些實(shí)用的功能在RTX 40 系列上并未獲得專利，目前游戲開發(fā)者需要將其集成到他們的游戲中，因?yàn)樗且粋€(gè)易于集成的SDK。另外，由于它是通用邏輯，未來(lái)可以直接集成到Windows API中，讓游戲開發(fā)者可以直接調(diào)用系統(tǒng)API，而不需要專門引用它。

SER對(duì)于擁有RTX 20系列或更新版本（可以開啟光線追蹤）的N卡用戶來(lái)說(shuō)可以說(shuō)是一個(gè)巨大的福音。畢竟，誰(shuí)不喜歡免費(fèi)且改進(jìn)的光跡性能呢？

第三代RT核心

RT Core 負(fù)責(zé)加速光線追蹤計(jì)算能力，雖然使用RTX 30 系列顯卡享受4K 高幀率游戲可能會(huì)有些困難，但使用RTX 40 系列顯卡就可以輕松解決。

GeForce RTX 4090顯卡的處理能力達(dá)到了191 RT-TFLOPs，而RTX 30系列顯卡最快的處理能力為78 RT-TFLOPs，整整2.4倍。另外，根據(jù)NVIDIA官方的說(shuō)法，第三代RT核心的峰值RT-TFLOP相比上一代提升了2.8倍。這只是表明這個(gè)4090 并不是Ada Lovelace 架構(gòu)的最終版本。

不透明度微圖引擎

第三代RT 內(nèi)核中引入了兩個(gè)重要的硬件單元。第一個(gè)是Opacity Micro-Map Engine，可以理解為微圖透明度引擎。其主要功能是優(yōu)化光線追蹤渲染。著色器工作負(fù)載。

例如，對(duì)于葉子這樣的復(fù)雜物體，光線追蹤變得計(jì)算密集型，因?yàn)椴粌H不同的光線會(huì)影響性能狀態(tài)，還會(huì)影響葉子之間的光線反射。

不過(guò)，不透明微貼圖引擎可以將光線追蹤特性烘焙到不透明蒙版中，從而可以更快、更準(zhǔn)確地渲染不規(guī)則形狀和半透明物體，從而顯著減少著色器工作量。

位移式微網(wǎng)格引擎(DMM)

Displaced Micromesh Engine 可以理解為微網(wǎng)格置換引擎，其構(gòu)建光線追蹤BVH（邊界體積層次結(jié)構(gòu)）的速度提高了10 倍。視頻內(nèi)存使用量減少了20 倍。

DMM 由第三代RT 核心進(jìn)行本地處理，僅使用基本三角形即可渲染復(fù)雜的幾何圖形，與前幾代相比，顯著降低了存儲(chǔ)和處理要求。

具體工作原理從圖片中已經(jīng)很清楚了，但是雖然新的DMM可以簡(jiǎn)化具有多個(gè)面的復(fù)雜圖形并創(chuàng)建更簡(jiǎn)單的模型，但整體光線追蹤效果不會(huì)改變。

通過(guò)一些模型數(shù)據(jù)，我們可以具體看到新的DMM對(duì)模型的簡(jiǎn)化程度有多大。包含1100 萬(wàn)個(gè)三角形的原始模型簡(jiǎn)化為僅約150,000 個(gè)微網(wǎng)格，使BVH 構(gòu)建速度提高了8.5 倍，體積縮小了6.5 倍。

這并不夸張；模型越復(fù)雜，優(yōu)化效果越高；在官方公布的對(duì)比例子中，最快可以實(shí)現(xiàn)15倍以上的加速比，容量簡(jiǎn)化如下，可換算為20次。

第四代Tensor Core

除了光學(xué)追蹤單元升級(jí)之外，第4代張量核心的升級(jí)更加恐怖。使用新的FP8 張量引擎，旗艦型號(hào)RTX 4090 顯卡可提供1.32 Tensor petaflops 的吞吐量，提升了5 倍。

現(xiàn)在請(qǐng)注意單位——petaFLOP。以前，TFLOP 是萬(wàn)億次浮點(diǎn)運(yùn)算，而千萬(wàn)億次浮點(diǎn)運(yùn)算是萬(wàn)億次浮點(diǎn)運(yùn)算。

中端RTX 4070 還達(dá)到了令人印象深刻的466 Tensor-TFLOPS，比上一代RTX 3070 Ti 高出約2.7 倍。

DLSS3

新推出的DLSS 3也是RTX 40系列的一大賣點(diǎn)，可以看出從DLSS 2.3到DLSS 3版本升級(jí)的幅度。 DLSS 3也被NVIDIA正式稱為神經(jīng)網(wǎng)絡(luò)渲染的新時(shí)代。

新的DLSS 3在原始DLSS超分辨率的基礎(chǔ)上添加了光學(xué)多幀生成技術(shù)，以生成全新的幀，而不像原來(lái)只能生成像素。

DLSS 3 結(jié)合了DLSS 超分辨率、DLSS 幀生成和可重建八分之七像素的NVIDIA Reflex 三大關(guān)鍵技術(shù)，顯著提升性能。

對(duì)于2K 分辨率和更高分辨率等GPU 密集型游戲，DLSS 2 可以將幀速率提高2 倍，DLSS 3 可以將幀速率提高4 倍。

此次DLSS 3跨越各大版本，在思路和原理上再次升級(jí)，是一種完全“猜猜”的一幀技術(shù)，解釋起來(lái)很容易，但實(shí)現(xiàn)起來(lái)需要大量的推理和計(jì)算。以及一個(gè)完全先進(jìn)的想法。

但“憑空”產(chǎn)生的一幀延遲明顯高于DLSS 2。因此，這個(gè)完整的DLSS 3 與NVIDIA Reflex 捆綁在一起，可以有效幫助減少延遲。

它名副其實(shí)，名副其實(shí)。

個(gè)“神經(jīng)網(wǎng)絡(luò)渲染新時(shí)代”的名號(hào)�？v觀目前市面上的XeSS、FSR技術(shù)，DLSS絕對(duì)稱得上“巨人的肩膀”。當(dāng)然，連年的創(chuàng)新，苦的是手持上一代顯卡的玩家，想體驗(yàn)DLSS 3的幀生成，目前唯一的辦法就是購(gòu)入一張RTX 40系顯卡。 New Optical Flow Accelerator New Optical Flow Accelerator光流加速器是在第四代Tensor Cores中最新引入的，這也是為何DLSS 3中的幀生成為RTX 40系顯卡獨(dú)享。光流加速器在原本DLSS 2的基礎(chǔ)上，還可以計(jì)算兩個(gè)連續(xù)幀內(nèi)的光流場(chǎng)，能夠捕捉游戲畫面從第1幀到第2幀的方向和速度，從中捕捉粒子、反射和光照等像素信息。并分別計(jì)算運(yùn)動(dòng)矢量和光流來(lái)獲得精準(zhǔn)的陰影重建效果。以《賽博朋克2077》為例，在第一幀，光流加速器會(huì)捕捉到每一個(gè)像素中的粒子、反射和光照等信息。并在第二幀中查找匹配的像素區(qū)域，計(jì)算幀之間的差值。如果說(shuō)原來(lái)DLSS 2能夠“猜”出一張圖剩下的像素，那么DLSS 3除了這些，還能夠“猜”出下一幀的畫面。另外由于DLSS 3的幀生成是在GPU中處理和運(yùn)行的，所以即使遇到CPU瓶頸的游戲，AI同樣能夠提升幀率。這也是為什么在此次發(fā)布會(huì)中說(shuō)到，DLSS 3能夠突破CPU的限制來(lái)提升幀數(shù)。 AV1編碼器本次升級(jí)的第八代NVENC編碼器可以說(shuō)是直播、視頻、后期工作者的極大福音。它首次加入了對(duì)AV1編碼的支持，最顯而易見(jiàn)的效果就是直播。相比傳統(tǒng)的H.264編碼，AV1編碼的效率平均提升了40%，在同碼率下AV1編碼的畫質(zhì)將更好。目前大部分直播的分辨率和清晰度，均受限于平臺(tái)規(guī)定的最大比特率。以Twitch限制的8Mbps為例，可以看到在同等帶寬下，同為2K 60幀的畫面，采用AV1編碼的清晰度明顯比H.264更高。說(shuō)起直播，OBS相信大家都不陌生，在10月份即將發(fā)布的補(bǔ)丁中，OBS就加入了對(duì)NVENC的AV1編碼支持當(dāng)然，直播只是我們更容易見(jiàn)到的AV1優(yōu)勢(shì)，在視頻工作的所有環(huán)節(jié)，AV1編碼都可以帶來(lái)極大提升。所以，如圖所見(jiàn)。NVIDIA已經(jīng)為廣大用戶鋪好了一條完整的生態(tài)鏈，從編碼API、軟件、平臺(tái)到播放器，將全面支持AV1編碼。另外再說(shuō)一下NVIDIA一直強(qiáng)調(diào)的在RTX 4070 Ti及以上型號(hào)配置的雙AV1編碼。顧名思義，即部分顯卡內(nèi)搭載了兩個(gè)編碼器，它所帶來(lái)的效果也是顯而易見(jiàn)的。首先，根據(jù)官方宣傳的，在4K H.265的導(dǎo)出速度上，RTX 4090是RTX 3090 Ti的2.2倍；在8K H.265的導(dǎo)出速度上更是達(dá)到了2.5倍。這部分的提升，大家常用的剪映同樣適用，感興趣的用戶不妨親自體驗(yàn)一下。除了導(dǎo)出速度，8K 60幀的視頻錄制在以前簡(jiǎn)直難以想象，而雙編碼器的好處就是可以將圖像一分為二，兩個(gè)編碼器分別處理7680×2160的圖像信息，最后拼合完整。關(guān)于編碼部分，可能大部分用戶的感受不深，但當(dāng)有一天，你想錄屏的時(shí)候，卻發(fā)現(xiàn)顯卡不支持，才會(huì)發(fā)覺(jué)它的重要性…… 隨著圖像逐漸進(jìn)入到超清時(shí)代，硬件編碼和渲染幾乎已經(jīng)成為不可或缺的幫手。雖然論質(zhì)量，硬件編碼仍不及CPU軟編，但軟編做到了極限畫質(zhì)，也要承受時(shí)間的無(wú)窮長(zhǎng)。甚至在一張8K渲染圖中，兩種編碼方式的時(shí)間差距就已經(jīng)達(dá)到了幾個(gè)小時(shí)，遑論一段10秒的CG動(dòng)畫。在不斷進(jìn)步的硬件編碼中，質(zhì)量和時(shí)間也在不斷地被挑戰(zhàn)和刷新。 13 附錄2-Ada Lovelace是誰(shuí)？ Ada Lovelace（1815-1852）是英國(guó)數(shù)學(xué)家、計(jì)算機(jī)程序創(chuàng)始人，建立了循環(huán)和子程序概念，被稱為世界上第一位程序員。 Ada從小對(duì)數(shù)學(xué)有極高天賦，其父稱她為“平行四邊形公主”，后來(lái)的合作伙伴Charles Babbage稱她為“數(shù)字女巫”。在19歲時(shí)Ada嫁給了自己曾經(jīng)的科學(xué)家庭教師，婚后的她對(duì)數(shù)學(xué)熱情不減。 1842年到1843年花了9個(gè)月時(shí)間翻譯了Babbage的《分析機(jī)概論》的備忘錄，寫了很多注記，其中給出了用計(jì)算機(jī)進(jìn)行Bernoulli數(shù)求解的詳細(xì)說(shuō)明。由此，Ada被廣泛認(rèn)為是世界上第一個(gè)程序員。而以她名字命名的語(yǔ)言——ada語(yǔ)言，已經(jīng)成為了美國(guó)軍方開發(fā)戰(zhàn)斗機(jī)等尖端武器的語(yǔ)言。從幾行簡(jiǎn)短的生平簡(jiǎn)介中，不難看出Ada的生命雖然只經(jīng)歷了短暫的37個(gè)春秋，但卻足以被后人銘記。這也是為什么此次NVIDIA RTX 40的先行宣傳中，用到了“以未來(lái)敬傳奇”的slogan。 (8176517)

責(zé)任編輯：德勤鋼鐵網(wǎng) 標(biāo)簽：

技嘉z790雪鷹，技嘉3070ti雪鷹參數(shù)

chanong

1GB GeForce RTX 4070 Snow Eagle 概述

內(nèi)部采用了與GPU直接接觸的銅板，配合8根復(fù)合熱管，實(shí)現(xiàn)更高的傳熱效率。

技嘉RTX 4070 Snow Eagle的背板完全由裸金屬制成，背面有一個(gè)巨大的鏤空進(jìn)氣格柵，露出的PCB僅占整個(gè)顯卡的一半左右。

這款技嘉RTX 4070 Snow Eagle卡在使用1個(gè)16針輔助電源時(shí)整體功耗為215W。

請(qǐng)注意，目前適用于RTX 30 系列的12 針接口和電源適配器與RTX 40 系列顯卡不兼容。

視頻輸出接口繼續(xù)采用HDMI 2.1 + DP 1.4a*3的4接口設(shè)計(jì)。 HDMI 2.1可支持4K 120Hz HDR和8K 60Hz HDR。

2 NVIDIA GeForce RTX 4070架構(gòu)分析

與上一代NVIDIA Ampere 相比，NVIDIA Ada Lovelace 在相同功耗下可提供兩倍以上的性能，著色器數(shù)據(jù)吞吐量高達(dá)90 TFLOPS。

完整的AD102核心

RTX 4070 Ti使用的AD104核心

RTX 4070使用的AD104核心

這次RTX 4070采用AD104芯片，并使用4組GPC。其中一個(gè)缺少TPC 裝置，但有兩個(gè)NVENC 單元。

另外，我們可以看到RTX 40系列顯卡現(xiàn)在擁有比較大的二級(jí)緩存，這其實(shí)是故意的。

此時(shí)，每2個(gè)SM單元組成一個(gè)TPC單元，每6組TPC單元組成一個(gè)完整的GPC頂級(jí)單元（對(duì)于某些核心，5組TPC組成一個(gè)GPC單元）。

每個(gè)GPC單元配備獨(dú)立的光柵引擎和兩組ROP分區(qū)（每組包含8個(gè)ROP單元）。

3 測(cè)試平臺(tái)概述

首先介紹一下測(cè)試平臺(tái)，為了保證技嘉RTX 4070 Snow Eagle的性能，平臺(tái)也進(jìn)行了全面更新。

技嘉RTX 4070 Snow Eagle的升壓頻率為2565MHz，公版RTX 4070的升壓頻率為2475MHz。

它采用12GB GDDR6X顯存，位寬為192位，顯存帶寬為504GB/s，光柵和紋理單元為64和184。

該測(cè)試平臺(tái)中的處理器是英特爾最新的第13代i9-13900K，它提供了非常強(qiáng)大的性能，并且在功耗和顯示方面都有顯著的升級(jí)。

4 理論性能測(cè)試

與剛剛發(fā)布的RTX 4070 Ti相比，整體得分相差約20%。

在DX12環(huán)境下的Time Spy和Time Spy Extreme測(cè)試中，技嘉RTX 4070 Snow Eagle相對(duì)于RTX 3070 Ti的提升是TS多了27%，TSE多了21%，總共提升了約24%。

PortRoyal是專門針對(duì)3DMARK光跡性能的測(cè)試項(xiàng)目，與RTX 3070 Ti相比，技嘉RTX 4070 Snow Eagle取得了約30%的提升。

總體而言，技嘉RTX 4070 Snow Eagle 的理論性能比RTX 3070 Ti 高出約24%。

相比RTX 3070 Ti顯卡，從1080p分辨率到4K的提升分別為30%/25%/30%。

5 一般游戲性能測(cè)試

《極限競(jìng)速：地平線5》添加了DLSS 3。稍后將進(jìn)行相關(guān)測(cè)試。我們?cè)谶@里僅進(jìn)行一般比較。

《光明記憶：無(wú)限》的光線追蹤測(cè)試軟件是一款獨(dú)立于游戲的測(cè)試工具，它使用了比游戲更多的光線追蹤技術(shù)，測(cè)試條件為“RTX最高品質(zhì)/DLSS品質(zhì)”。因此，我們測(cè)試中的幀率相對(duì)較低，但實(shí)際游戲配置非�？捎谩�

《賽博朋克2077》，游戲分為兩個(gè)最高畫質(zhì)：超級(jí)和追光超級(jí)。

6 DLSS 3 性能測(cè)試

目前，已有超過(guò)290款游戲和應(yīng)用程序支持DLSS，其中超過(guò)30款游戲已經(jīng)支持最新的DLSS 3。

讓我們測(cè)試一下使用新的DLSS 3 游戲可以達(dá)到什么樣的幀速率。

這次DLSS 3的測(cè)試圖更加復(fù)雜，增加了1%低FPS和延遲測(cè)試。

了解了1% Low FPS 之后，我們?cè)倏匆幌逻@張圖。軸左邊是延遲（越低越好），軸右邊是幀數(shù)（也包括正負(fù)坐標(biāo)，所以每邊的值可能不同）。

《賽博朋克2077》，DLSS 3的表現(xiàn)非常可觀，因?yàn)檫@類模擬經(jīng)營(yíng)游戲的特點(diǎn)是同屏顯示的單元較多，消耗的CPU資源較多，而DLSS 3可以生成突破CPU瓶頸的幀。

《紅霞島》反映的數(shù)據(jù)比較真實(shí)，顯示在最好的DLSS光線追蹤下，即使是技嘉RTX 4070 Snow Eagle顯卡也只有41幀，延遲106.3毫秒，我理解。

開啟DLSS 3后，幀數(shù)為105幀，增長(zhǎng)156%。延遲比DLSS 2長(zhǎng)約14ms，但仍保持在較低水平。

《暗黑破壞神4》是添加了DLSS 3的最新游戲。可以看到，即使開啟DLSS 2，幀數(shù)也會(huì)受到CPU 瓶頸的限制。這與DLSS 打開和關(guān)閉時(shí)的幀數(shù)大致相同。開啟DLSS 3后，幀率躍升至162幀，提升了27%。

《侏羅紀(jì)世界：進(jìn)化2》打開光跟蹤會(huì)顯著提高性能要求。其中，DLSS 3的幀率較DLSS水平提升了80%，DLSS 2的提升率達(dá)到了57%。

此外，由于Lyra 幀是靜態(tài)拍攝的，因此《1% Low》的得分高于其他游戲。

7 穩(wěn)定擴(kuò)散AI繪畫測(cè)試

雖然穩(wěn)定擴(kuò)散幾乎沒(méi)有?*�，但辩R夭渴鸕母叢有勻瞇磯嚶沒(méi)床健Ｉ賢嘉僮鶻緱媯沒(méi)Э梢愿葑約合胍傻惱掌諶堇捶岣還丶省?

我們根據(jù)NVIDIA提供的關(guān)鍵詞生成了10批共20張照片，并選擇了兩張細(xì)節(jié)比較合理的照片顯示在上面。

RTX 4070的計(jì)算時(shí)間為2分24.79秒，即每張照片約7.2秒。

RTX 3070 Ti 的計(jì)算時(shí)間為2m54.34 秒，每張圖像大約需要8.7 秒。

Stable Diffusion對(duì)顯卡的要求比較高，需要強(qiáng)大的Tensor計(jì)算能力。

對(duì)顯存的要求也很高，所以有條件的話一定要選擇顯存量大的顯卡。

我還測(cè)試了使用CPU 生成具有相同設(shè)置的圖像，保守估計(jì)大約需要3 小時(shí)30 分鐘，如圖所示。

PS：AMD顯卡目前無(wú)法使用Stable Diffusion來(lái)生成圖像。我們只能期待未來(lái)的優(yōu)化。

8 AV1編碼測(cè)試

日常編輯使用PR、AE等Adobe軟件，最大的感受是編輯更加智能，預(yù)設(shè)更適合發(fā)布，智能字幕識(shí)別等，是一個(gè)很好用的工具。

由于AV1 編碼的性質(zhì)，生成的文件將具有較低的比特率，但視頻分辨率將完全相同。因此，如果生成相同比特率和容量的文件，AV1 會(huì)更清晰。

使用NVIDIA ICAT 比較兩個(gè)視頻的圖像。圖像的左側(cè)是AV1編碼，右側(cè)是H264編碼。無(wú)論如何，通過(guò)200%的細(xì)節(jié)放大，差別不大。

9 RTX VSR（RTX視頻超分辨率）測(cè)試

RTX VSR是AI圖像處理領(lǐng)域的突破性技術(shù)，超越傳統(tǒng)的邊緣檢測(cè)和特征銳化技術(shù)，可顯著提高直播視頻內(nèi)容的質(zhì)量。

目前已知開啟后，打開YouTube 或Bilibili 即可享受RTX VSR 效果的加成。

如果您不確定，如果您在全屏播放視頻時(shí)打開任務(wù)管理器并看到GPU 負(fù)載增加，則表示您的GPU 已成功打開。

（點(diǎn)擊可放大查看原圖）

打開YouTube自由觀看視頻，可以明顯看到，開啟RTX VSR后，水下珊瑚的畫質(zhì)好多了，邊緣更銳利，失真明顯減少，我明白了。

10 溫度和功耗測(cè)試

功耗測(cè)試方面，我們選擇了FurMark軟件進(jìn)行拷貝測(cè)試，GPU-Z進(jìn)行溫度檢測(cè)，功耗僅在顯卡本身上進(jìn)行計(jì)算。

有趣的是，顯卡的顯存溫度通常都比較高，但技嘉RTX 4070 Snow Eagle的顯存溫度僅為50。

游戲動(dòng)態(tài)功耗測(cè)試

技嘉RTX 4070雪鷹3A游戲平均功耗200W

RTX 3070 Ti 3A游戲平均功耗為288W

雖然兩款顯卡都是70級(jí)別，但剛剛發(fā)布的RTX 4070的平均功耗為202W，而RTX 3070 Ti為288W，低了約80W，這確實(shí)是一個(gè)令人驚訝的結(jié)果。

11種不同的白色金屬紋理

至于價(jià)格方面，這款A(yù)ERO雪鷹是超頻版，所以目前高達(dá)5299元，風(fēng)魔等技嘉部分標(biāo)頻顯卡也在4799元左右。

12 附錄1 - NVIDIA Ada Lovelace 架構(gòu)分析

著色器執(zhí)行順序更改(SER) 著色器執(zhí)行順序更改

SER的主要功能是提高著色器性能，允許低效工作負(fù)載動(dòng)態(tài)重組為更高效的工作負(fù)載。主要是光線追蹤的性能提升是巨大的。

第三代RT核心

RT Core 負(fù)責(zé)加速光線追蹤計(jì)算能力，雖然使用RTX 30 系列顯卡享受4K 高幀率游戲可能會(huì)有些困難，但使用RTX 40 系列顯卡就可以輕松解決。

不透明度微圖引擎

位移式微網(wǎng)格引擎(DMM)

DMM 由第三代RT 核心進(jìn)行本地處理，僅使用基本三角形即可渲染復(fù)雜的幾何圖形，與前幾代相比，顯著降低了存儲(chǔ)和處理要求。

第四代Tensor Core

中端RTX 4070 還達(dá)到了令人印象深刻的466 Tensor-TFLOPS，比上一代RTX 3070 Ti 高出約2.7 倍。

DLSS3

新的DLSS 3在原始DLSS超分辨率的基礎(chǔ)上添加了光學(xué)多幀生成技術(shù)，以生成全新的幀，而不像原來(lái)只能生成像素。

DLSS 3 結(jié)合了DLSS 超分辨率、DLSS 幀生成和可重建八分之七像素的NVIDIA Reflex 三大關(guān)鍵技術(shù)，顯著提升性能。

對(duì)于2K 分辨率和更高分辨率等GPU 密集型游戲，DLSS 2 可以將幀速率提高2 倍，DLSS 3 可以將幀速率提高4 倍。

但“憑空”產(chǎn)生的一幀延遲明顯高于DLSS 2。因此，這個(gè)完整的DLSS 3 與NVIDIA Reflex 捆綁在一起，可以有效幫助減少延遲。

它名副其實(shí)，名副其實(shí)。

市場(chǎng)分析

技嘉z790雪鷹，技嘉3070ti雪鷹參數(shù)

熱門搜索

相關(guān)文章

技嘉z790雪鷹，技嘉3070ti雪鷹參數(shù)

三級(jí)螺紋鋼有哪些型號(hào)規(guī)格？怎么挑

三級(jí)螺紋鋼和三級(jí)抗震的區(qū)別是什么

x四代土影黑土腿中間

廢文網(wǎng)李鬼分站的安安靜靜備胎計(jì)劃

一級(jí)二級(jí)三級(jí)螺紋鋼用途有什么區(qū)別

2023年新電費(fèi)收費(fèi)標(biāo)準(zhǔn)？公布2023年

技嘉z790雪鷹，技嘉3070ti雪鷹參數(shù)

熱門搜索

相關(guān)文章

三級(jí)螺紋鋼有哪些型號(hào)規(guī)格？怎么挑

三級(jí)螺紋鋼和三級(jí)抗震的區(qū)別是什么

x四代土影黑土腿中間

廢文網(wǎng)李鬼分站的安安靜靜備胎計(jì)劃

一級(jí)二級(jí)三級(jí)螺紋鋼用途有什么區(qū)別

2023年新電費(fèi)收費(fèi)標(biāo)準(zhǔn)？公布2023年

技嘉z790雪鷹，技嘉3070ti雪鷹參數(shù)

三級(jí)螺紋鋼有哪些型號(hào)規(guī)格？怎么挑

2023年新電費(fèi)收費(fèi)標(biāo)準(zhǔn)？公布2023年