XX
殊途同归?开普勒放弃分频CUDA暴增
● 小芯片多内核,开普勒一切遵循实际
Kepler可以说是通过在Fermi架构探究中不断总结,不断优化得出的结晶。NVIDIA发现八个几何引擎已经能够完全满足实际游戏中曲面细分的需求,即便是理论测试也一样。因为曲面细分的几何结构最后需要做像素渲染,这样便需要更大量的流处理器,末端输出的性能也不只是由几何引擎决定的。
Kepler GK104芯片架构图
于是最后以GF104的组成形式为蓝本,Kepler架构中同样有8个SM,这里称为SMX。从G80开始NVIDIA便让流处理器的工作频率与ROPs以一定的比例运行,这个比例最初由BIOS内的设定控制,最后在Fermi架构固定为2赔。现在,每个SM中的流处理器数量扩充到了惊人的192个,整个芯片拥有1536个CUDA核,频率与ROPs频率同步运行。与GTX580相比,CUDA频率只降低了三分之一,但CUDA数量却是原来的三倍,这无疑是提升性能的更好方式。
GK104的SMX组构成
每一个SM单元中包含16个纹理单元和一个Polymorph2.0引擎以及四个Warp调度器。Warp调度器的配置效仿GF104的设计,下辖两个指令分派单元。这样有足够的数据通道调度192个流处理器。这些流处理器又以六个为一列,每列有专属的LD/ST单元和SFU指令单元。
网友评论