XXX
只少了256个线程 旗舰规格大部分保持
HD7970和HD7950的GPU芯片由同一款“Tahiti”衍生而来,只是两者的流处理器开设情况略有不同,在介绍HD7950的芯片规格之前,先让我们回顾一下在HD7970首测中介绍的“Tahiti”芯片架构模式。
每当显卡行业有新品发布,在芯片架构和计算性能方面的升级进步都是最为人关注的话题,这方面AMD一直以有条不紊的步伐前进,大刀阔斧式的改变是比较罕见的。下面将HD7970芯片架构与上一代HD6970做对比。
从AMD官方给出的架构图来看,各部件的功能和组成结构基本沿用上一代HD6900系列的模式,28nm工艺可以让AMD在相同的DIE面积内整合更多的晶体管,换言之主要变化就是扩大了性能规模。
HD7970 Tahiti芯片架构示意图
就以HD7000系列的旗舰芯片“Tahiti”为例,它共有512个流处理单元,每个单元采用VLIW4的结构,共计2048个逻辑线程,比上一代旗舰HD6970的“Cayman”多出了512个。
HD6970 Cayman芯片架构示意图
这512个流处理单元(非逻辑线程)的排列分布方式与上一代Cayman芯片相同,每16个为一个工作组,每组配备四个纹理单元,这样便有32个工作组,共128个纹理单元。在这次Tahiti芯片上,AMD给这种工作组起了个新的名字:GCN。
但是像素输出端口方面HD7970的Tahiti做出了重大改进,它将ROPs处理器重新编排,不再为每两组ROPs配备独立的L2缓存,而是共同连接到一个共享L2缓存,这样能使缓存利用率得到优化,从某种程度上讲是借鉴了NVIDIA的做法。
此外,共享L2缓存的做法可以使显存接口不必再与ROPs处理器一一对应,于是Tahiti核心整合了12个显存端口,每个端口位宽64bit,总位宽由256bit增加到384bit。单从位宽数据上已与NVIDIA的Fermi架构平起平坐了,不过AMD显存控制器可以使GDDR5显存运行在更高的频率上,就显存理论性能而言,或许竞争对手暂时只能望尘莫及。
● HD7950只是关闭了少量流处理器单元,其它芯片组件并无变化
HD7950 Tahiti芯片架构示意图
HD7950的Tahiti芯片只是关闭其中一组四个GCN,削减了64个流处理器单元,计256个逻辑线程,以及所属的16个纹理单元。这样HD7950共有448个流处理器单元,共1792个逻辑线程,其它方面规格则与HD7970完全相同,仍有32个ROPs和384bit的显存位宽,充分保证了流处理器的性能发挥。
关于Tahiti架构是如何从Cayman架构衍生出来,所采用的4D SIMD矢量架构和4D+1D SIMD矢量架构的渊源等问题,可查阅1月9日笔者撰写的《AMD HD7970首测》文章,这里不再重复描述。
网友评论