一、前言:比想象中性能更强的RTX 4070显卡
GeForce RTX 4070解禁发布之前,不少人对它有点迷惑。
首先,它的CUDA核心(流处理器)与上代RTX 3070完全相同,都是5888个。另外一点就是它的显存位宽只有192Bit,RTX 3070则是256Bit。
有鉴于此,很多玩家预测RTX 4070的性能不会比RTX 3070强多少,大概也就是RTX 3070 Ti的水准。
RTX 4070真的如此不堪吗?当然不是!
RTX 4070使用了与RTX 4070 Ti相同的AD104核心,完整的AD104核心共有7680个CUDA核心(分为5组GPC/30组TPC/60组SM)、240个第四代Tensor Core张量核心、60个第三代RT Core光追核心、240个纹理单元、80个ROP单元、3MB一级缓存、48MB二级缓存。
完整的AD104核心
AD104-250核心(RTX 4070)
RTX 4070做了部分精简,拥有4组GPC共5888个流处理器、184个Tensor Core、46个RT Core和5888个流处理器单元、64个ROP单元、36MB二级缓存。
这其中很多参数与RTX 3070相同,比如流处理器、Tensor Core、RT Core,2款显卡一模一样,而ROP单元数量和显存位宽甚至还不如RTX 3070。
不过不要忘了,RTX 4070采用的是第四代Tensor Core和第三代RT Core,相比RTX 3070都领先了一代。
另外在台积电4N制程工艺加持下,RTX 4070的加速频率高达2475MHz,实际游戏频率更是高达2800MHz,相比RTX 3070提升了接近50%。
如此巨大的频率自然也会带来更强的游戏性能。
AD104的晶体管数量2倍于GA104,而流处理器数量却并没有翻倍,这是因为大量的晶体管用在了二级缓存上。
RTX 4070二级缓存容量高达36MB,9倍于RTX 3070,更大容量的二级缓存可以降低GPU对于显存带宽的需求。
另外,虽然显存位宽只有192Bit,但是由于采用了频率高达21Gbps的GDDR6x显存,位宽达到了504GB/s,而256Bit的RTX 3070位宽只有448GB/s。
更大容量的二级缓存再加上更高的显存带宽,RTX 4070的性能到底会比RTX 3070强多少呢?