架构解析:192bit第一次出现在70
在测试之前,按例先了解显卡的芯片架构。就像上文中所提到的,RTX 4070 Ti的GPU确实来自RTX 40系的第三款原生芯片AD104,本身不满血的RTX 4080(AD103-300)似乎没有再削减的空间,于是NVIDIA在RTX 4070 Ti使用了AD104的顶头型号,即AD104-400,它是一个满血的GPU。
AD104-400内建5个完整的GPC,我们知道每个GPU有12个SM簇,即1536个FP32单元,所以它一共有7680个流处理器。关于ADA架构的SM构成,从上一代安培架构就定型,资深玩家想必耳熟能详了,于是它一共有60个第三代RT核心和240个第四代Tensor核心。
需要注意的是,AD104-400只有6个显存通道,每个通道位宽32bit,因此它的总显存位宽为192bit,原生就是如此,并无阉割。这也是192bit这个位宽第一次出现在“70”显卡上,即使搭配速率为21Gbps的GDDR6X显存,显存总带宽也只有504GB/s,不免让人怀疑它是否能支撑起这个定位的算力,会不会拖累核心性能。这里笔者还是愿意相信NVIDIA的研发工程师会比我们考虑的周到,就让实测数据说明问题吧。
AD104也是采用同系列的TSMC 4N工艺制程,整合358亿晶体管,比RTX 3090 Ti的280亿多了不少,核心面积却缩小到不到300mm²,官方核心boost频率高达2610MHz,功耗甚至比RTX 3070 Ti还低。
RTX 4070Ti规格参数细节见下表: