XX
芯片架构解析 欲知开普勒先回访费米
● 欲知开普勒先回访费米
Kepler架构虽然是NVIDIA的新生代产物,在设计思路上颠覆了许多Fermi的元素,但不能说它们没有联系。Fermi是NVIDIA为了支持DX11全新设计的产品,它摒弃了GT200的模式,结构变化非常大。在Fermi中,NVIDIA提出GPC和SM的结构概念,以此将GPU分成若干平级并行的工作组,每一个SM有32个CUDA核心,而每一个GPC则有4个SM。重点在于为了尽可能地满足DX11曲面细分计算需求,NVIDIA为每一个SM组配置了独立的几何引擎,并且拥有独立的纹理单元。相较之下,AMD当时的做法只是沿用了RV770的设计模式,扩充了流处理器,在工作网路上加入一个单一的几何引擎来获得对DX11的支持。
NVIDIA GF100/GF110芯片架构
AMD Cypress芯片架构(HD5800)
这两种截然不同的做法导致的结果是,针对曲面细分的理论测试项目中,面对巨大的工作压力,Fermi架构表现优异,AMD不堪重负,以至于NVIDIA一度不愿意承认竞争对手产品也算是真正的DX11显卡。可是实际应用中,游戏开发者为了权衡DX游戏的硬件适应范围,曲面细分量不会设置太多,通常只用在一些特定的效果表现上,因此Fermi的优势很难找到用武之地。
GF100/GF110与GF104的SM组构成
NVIDIA无法不正视这个问题,于是在随后推出的中高端芯片上做出了改进的尝试,GF104/GF114将SM内的CUDA数量增加到48个,但SM只有八个。因为SM少,与其对应的几何引擎“Polymorph”数量也减少,相当于调整了曲面细分器和流处理器之间的配比,实际应用中的结果令人相当满意。
网友评论