萬元頂級旗艦降臨!RTX 3090首發(fā)評測:沒想到這么能超
前言:安培頂級旗艦降臨 價格達1.2萬
本文引用地址:http://cafeforensic.com/article/202009/418814.htm或許很多同學對于這一次RTX 3080/3090在流處理器數(shù)量上翻倍的提升感到不可思議。畢竟從2013年的GTX 780 Ti到2019年的Titan RTX,流處理器數(shù)量僅僅只是從2880個提升到了4608個。也就是整整6年的時間,流處理器數(shù)量僅僅只是增加了60%而已。
而此次完整的GA102核心竟然有10752個流處理器,相當于 Titan RTX的2.33倍,如此巨大的提升的確是很多年沒有出現(xiàn)過了!
PS:上一次N卡大幅提升流處理器是8年前的GTX 680,1536個流處理器數(shù)量是GTX 580的三倍,性能則提升了30%!
相較上一代圖靈構架的RTX 20系列顯卡,安培構架主要帶來的如下改進:
1、8nm制程工藝:
圖靈構架使用的三星12FFN工藝,在754mm2的面積內集成了186億只晶體管。安培構架使用的是三星8N工藝,在628mm2的芯片內部集成了280億只晶體管。算下來晶體管密度提升了83%之多。
2、整合INT32與FP32單元:
圖靈的INT32單元只能做整數(shù)運算,閑置率很高。為了解決這個問題,提升INT32單元的利用率,NVIDIA改進了INT32單元,使之不僅可以運行整數(shù)運算,也能進行單精度浮點運算,相當于整合了INT32和FP32單元,因而使得以FP32單元計數(shù)的GPU流處理器數(shù)量直接翻倍,單精度浮點性能也同樣翻倍。
3、將ROP單元從內存控制器中分離:
傳統(tǒng)的ROP單元被集成在內存控制器中,閹割GPU位寬會降低ROP單元數(shù)量。而安培構架將ROP單元變成了GPC的一部分,每個GPC含有16個ROP單元,只要GPC數(shù)量不被閹割,ROP單元數(shù)量就不會減少。
比如即將發(fā)布的RTX 3070與RTX 3080一樣都有6組GPC,ROP單元數(shù)量同樣都是96個。
4、第二代RT Core:
NVIDIA通過提升插值算法,提升了光線追蹤技術在動態(tài)模糊效果下的精確度,使得安培構架的光追性能得到了翻倍提升。第一代RT Core可以提供10Giga Rays/s的性能,第二代RT Core可以達到20Giga Rays/s。
5、第三代Tensor Core:
第三代Tensor Core的效率是第二代的4倍,即便安培構架將每個SM中的Tensor Core減半,它依然能達到圖靈2倍的效能。
6、RTX IO技術:
這項技術可以讓游戲在加載時完全規(guī)避CPU,直接將游戲數(shù)據(jù)包從SSD寫入到GPU的顯存中,由GPU替代CPU進行數(shù)據(jù)解包。GPU的整數(shù)/浮點性能數(shù)十倍于CPU,可以瞬間完成數(shù)據(jù)的解包工作。
不過這項技術需要微軟DirectStorage API的支持,預計2022年會正式開始應用。
除了以上技術之外,安培構架還支持PCIe 4.0、NVIDIA Reflex等技術,就不再一一敘述了。
9月初,NVIDIA一共發(fā)布了3款GA10X核心的顯卡型號,此前已經(jīng)解禁了RTX 3080,今天我們將向大家展示位于頂端的RTX 3090的詳盡性能評測。
RTX 3090基于GA102-300-A1核心,擁有7組GPC,82組SM單元共計10496個流處理器、112個ROP、328個紋理單元、328個第三代Tensor Cores、82個第二代RT Cores。搭配24GB GDDR6X顯存,顯存頻率19.5GHz、位寬384Bit、帶寬936GB/s。
由于此次NVIDIA并未提供公版的RTX 3090 Founder Edition,我們拿規(guī)格與之完全一致的影馳RTX 3090金屬大師來進行測試。
RTX 3090的詳細規(guī)格如下:
對比RTX 3080,RTX 3090的流處理器數(shù)量、Tensor Core、 ROP單元、顯存帶寬、紋理單元都提升了20%左右。
TDP也從RTX 3080的320W進一步提高到了350W,這恐怖是有史以來TDP最高的單芯片N卡。
評論