XXX
升华4D模式 Tahiti芯片架构介绍
每当显卡行业有新品发布,在芯片架构和计算性能方面的升级进步都是最为人关注的话题,这方面AMD一直以有条不紊的步伐前进,大刀阔斧式的改变是比较罕见的。下面将HD7970芯片架构与上一代HD6970做对比。
从AMD官方给出的架构图来看,各部件的功能和组成结构基本沿用上一代HD6900系列的模式,28nm工艺可以让AMD在相同的DIE面积内整合更多的晶体管,换言之主要变化就是扩大了性能规模。
HD7970 Tahiti芯片架构示意图
就以HD7000系列的旗舰芯片“Tahiti”为例,它共有512个流处理单元,每个单元采用VLIW4的结构,共计2048个逻辑线程,比上一代旗舰HD6970的“Cayman”多出了512个。
这512个流处理单元(非逻辑线程)的排列分布方式与上一代Cayman芯片相同,每16个为一个工作组,每组配备四个纹理单元,这样便有32个工作组,共128个纹理单元。在这次Tahiti芯片上,AMD给这种工作组起了个新的名字:GCN。
但是像素输出端口方面HD7970的Tahiti做出了重大改进,它将ROPs处理器重新编排,不再为每两组ROPs配备独立的L2缓存,而是共同连接到一个共享L2缓存,这样能使缓存利用率得到优化,从某种程度上讲是借鉴了NVIDIA的做法。
此外,共享L2缓存的做法可以使显存接口不必再与ROPs处理器一一对应,于是Tahiti核心整合了12个显存端口,每个端口位宽64bit,总位宽由256bit增加到384bit。单从位宽数据上已与NVIDIA的Fermi架构平起平坐了,不过AMD显存控制器可以使GDDR5显存运行在更高的频率上,就显存理论性能而言,或许竞争对手暂时只能望尘莫及。
HD6970 Cayman芯片架构示意图
Tahiti继续沿用从HD6000系列开始加入的双几何引擎设计,每个几何引擎内有一个Tessellater,确保曲面细分的性能。
关于流处理器内部微架构,VLIW5到VLIW4的转变是AMD近些年的一个重大改进,这个改进从HD6900系列开始,它将原本略显臃肿复杂的内核工作模式变得迅捷简单,降低了流处理器对程序指令调度的依赖,同时缩减了每个流处理器的体积,使芯片内能够整合更多的流处理器。
HD7970的Tahiti核心算是AMD的第二代VLIW4产品,第一代则是HD6900系列的Cayman核心,关于从VLIW5改变到VLIW4的细节,下面笔者将为读者重述。
网友评论