萬元頂級旗艦降臨！RTX 3090首發(fā)評測：沒想到這么能超

作者：時間：2020-09-26 來源：快科技

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

前言：安培頂級旗艦降臨價格達1.2萬

本文引用地址：http://cafeforensic.com/article/202009/418814.htm

或許很多同學對于這一次RTX 3080/3090在流處理器數(shù)量上翻倍的提升感到不可思議。畢竟從2013年的GTX 780 Ti到2019年的Titan RTX，流處理器數(shù)量僅僅只是從2880個提升到了4608個。也就是整整6年的時間，流處理器數(shù)量僅僅只是增加了60%而已。

而此次完整的GA102核心竟然有10752個流處理器，相當于 Titan RTX的2.33倍，如此巨大的提升的確是很多年沒有出現(xiàn)過了！

PS：上一次N卡大幅提升流處理器是8年前的GTX 680，1536個流處理器數(shù)量是GTX 580的三倍，性能則提升了30%！

相較上一代圖靈構架的RTX 20系列顯卡，安培構架主要帶來的如下改進：

1、8nm制程工藝：

圖靈構架使用的三星12FFN工藝，在754mm2的面積內集成了186億只晶體管。安培構架使用的是三星8N工藝，在628mm2的芯片內部集成了280億只晶體管。算下來晶體管密度提升了83%之多。

2、整合INT32與FP32單元：

圖靈的INT32單元只能做整數(shù)運算，閑置率很高。為了解決這個問題，提升INT32單元的利用率，NVIDIA改進了INT32單元，使之不僅可以運行整數(shù)運算，也能進行單精度浮點運算，相當于整合了INT32和FP32單元，因而使得以FP32單元計數(shù)的GPU流處理器數(shù)量直接翻倍，單精度浮點性能也同樣翻倍。

3、將ROP單元從內存控制器中分離：

傳統(tǒng)的ROP單元被集成在內存控制器中，閹割GPU位寬會降低ROP單元數(shù)量。而安培構架將ROP單元變成了GPC的一部分，每個GPC含有16個ROP單元，只要GPC數(shù)量不被閹割，ROP單元數(shù)量就不會減少。

比如即將發(fā)布的RTX 3070與RTX 3080一樣都有6組GPC，ROP單元數(shù)量同樣都是96個。

4、第二代RT Core：

NVIDIA通過提升插值算法，提升了光線追蹤技術在動態(tài)模糊效果下的精確度，使得安培構架的光追性能得到了翻倍提升。第一代RT Core可以提供10Giga Rays/s的性能，第二代RT Core可以達到20Giga Rays/s。

5、第三代Tensor Core：

第三代Tensor Core的效率是第二代的4倍，即便安培構架將每個SM中的Tensor Core減半，它依然能達到圖靈2倍的效能。

萬元頂級旗艦降臨！RTX 3090首發(fā)評測：沒想到這么能超

6、RTX IO技術：

這項技術可以讓游戲在加載時完全規(guī)避CPU，直接將游戲數(shù)據(jù)包從SSD寫入到GPU的顯存中，由GPU替代CPU進行數(shù)據(jù)解包。GPU的整數(shù)/浮點性能數(shù)十倍于CPU，可以瞬間完成數(shù)據(jù)的解包工作。

不過這項技術需要微軟DirectStorage API的支持，預計2022年會正式開始應用。

除了以上技術之外，安培構架還支持PCIe 4.0、NVIDIA Reflex等技術，就不再一一敘述了。

9月初，NVIDIA一共發(fā)布了3款GA10X核心的顯卡型號，此前已經(jīng)解禁了RTX 3080，今天我們將向大家展示位于頂端的RTX 3090的詳盡性能評測。

萬元頂級旗艦降臨！RTX 3090首發(fā)評測：沒想到這么能超

RTX 3090基于GA102-300-A1核心，擁有7組GPC，82組SM單元共計10496個流處理器、112個ROP、328個紋理單元、328個第三代Tensor Cores、82個第二代RT Cores。搭配24GB GDDR6X顯存，顯存頻率19.5GHz、位寬384Bit、帶寬936GB/s。

由于此次NVIDIA并未提供公版的RTX 3090 Founder Edition，我們拿規(guī)格與之完全一致的影馳RTX 3090金屬大師來進行測試。

萬元頂級旗艦降臨！RTX 3090首發(fā)評測：沒想到這么能超
影馳RTX 3090金屬大師GPU-Z截圖