千元级霸主 HD7700系列推荐
也许大家还沉浸在开普勒Geforce GTX680带来的惊艳体验,但我们从架构以及蛛丝马迹中发现出一些与费米不太相同的地方。当然,要取得质的飞跃,进行大刀阔斧的架构优化和改进也是必然的做法。
制程的提升只能改变核心面积以及功耗,但晶体管该需要多少还是需要多少,为什么费米的CUDA数量以及纹理单元暴增了数倍,晶体管反而仅仅增加5亿?难道缩减的光栅单元和显存控制器如此耗费晶体管数目么?为什么同样是200MB的显卡驱动,新版为什么只能兼容Geforce GTX680而改变以往一款驱动可以兼容全系列的情况呢?
在Kepler发布之前有小道消息传出代号为GF104的Geforce GTX680会采用SIMD矢量架构运算模式,以全能的CUDA内核改为包含仅擅长游戏处理的顶点以及着色功能的部分,在正式发布之后也没有明确证实这一点,仅仅是告诉了大家在游戏性能方面会给大家一个惊喜,并且不屑的称对手Tahiti只是纸老虎,事实证明了Kepler不管做了什么样的改变,的确至少在游戏方面大获全胜。
通用计算实际上是指开放性利用可编程语言和接口通过调用GPU来完成本应CPU来完成的部分或全部任务,那么这就需要通用计算处理器本身的体积是比较庞大的。由于游戏的处理和通用计算是不沾边的,那么Kepler完全就没有保留通用计算的必要——Tesla足以,那么在削去CUDA本身的构成是正常的了。
Fermi的工作组(SM)以及CUDA单元的构成示意图
先了解一个数字,Geforce GTX680相对Geforce GTX580在单元上的变化:CUDA单元3倍,纹理单元2倍,显存控制器和光栅单元2/3倍。
特别是我们知道单从数量上看,试猜想CUDA本身体积得到削减,那么再借助28nm的制程,将面积控制的反而比GeforceGTX580还要小很多是很正常的,另外晶体管数量仅仅多出了5亿,没有因为增多删少而在数量上多出许多。因此可以确定:CUDA还叫CUDA,只是构成和Fermi不一样了。
网友评论