XX
简化SP增加其数量 AMD初尝NV式甜头
● AMD:1D+4D架构繁琐又低效,VLIW4诞生
从HD6970开始,AMD在Cayman核心上终于放弃了坚持许久的VILW5流处理器结构,取而代之的是VILW4,即由1D+4D变成了4D。它们最明显的区别就是去掉了体积最大、可同时处理普通整数/浮点操作和超越操作的第五个逻辑流处理器:特殊功能T单元(SFU)。这样每个流处理器单元中可以一次性处理的普通整数/浮点操作数从五个减少到四个,原本SFU负责的指令(如超越指令)可由其中三个流处理器合并起来代替。
从RV600到Tahiti,AMD流处理器单元结构变化
事实上AMD新架构是将流处理器简化了,其中四个指令槽性质相同,编译器不需要考虑它们和SFU的差别,令资源调度更加简单,对图形程序的适应性增强,提高了效能。
HD6970 Cayman核心的流处理器单元结构
以上改进的好处不止于流处理器单元内部,从宏观上看,取消了SFU指令槽之后每个流处理器单元的体积缩小,这样原本占用的芯片面积可以用于集成更多的流处理器单元。HD5870的Cypress有320个流处理器单元,而HD6900的Cayman增加到了384个,核心面积只提高了59mm²,晶体管数量为26.4亿,随之可并行执行的线程数量、纹理单元数量等都相应提高。
网友评论