XX
CUDA数量暴翻 NVIDIA连这也跟了AMD?
● NVIDIA:CUDA数量暴增不再高频,它还是不是1D MIMD?
如果说AMD将流处理器单元简化并增加数量是借鉴了NVIDIA的CUDA架构,那NVIDIA做了什么呢?从下列图片中我们可以看到,从Fermi架构最初型号GF100到GF104,SM工作组内的CUDA内核以及其它单元配比发生了变化:流处理器更多,指令分派单元更多,纹理单元更多。
虽然GF104只是中高端显卡芯片,可显然NVIDIA在设计它时对原本的Fermi结构做了改进。整个原生芯片只有8个SM,相对应地Polymorph多形体引擎数量也减少一半,但每个SM中包含的ALU和相关组件数量增多。最后理论测试和实践测试都证明,无论是性能发挥还是功耗控制,新的模式更加出色,这便成为后来Kepler架构的雏形。
GTX480和GTX460的SM工作组
即便我们从GF104的成功中预感到什么,但当Kepler揭开面纱时,结果仍然令人吃惊。
GTX680的SMX工作组
Kepler架构的首款芯片——GK104,乍一看结构与GF104几乎一模一样,有8组SM和8个Polymorph引擎。不过这一次,尝到甜头的NVIDIA如同打了鸡血一样,竟然在一个SM中集成了192个流处理器,纹理单元数量也激增到16个,并将这种爆炸式的SM称为SMX。
如此一来,GK104的流处理器总数达到了1536个,这一数字竟然与AMD Cayman核心流处理器的指令槽总数相当(注意是指令槽不是流处理器),是上一代旗舰GTX580的三倍,而纹理单元的数量也一反常态,与HD7970同为128个,是GTX580的双倍。接下来更令人吃惊的是,此架构放弃了从G80时代开始的分频设定,流处理器和其它单元以相同的频率运行。
不知是否有人注意到,以上大刀阔斧的改革中还隐藏着令人困惑的谜团。
首先,GTX580的512个流处理器已将它的功耗和发热逼到了40nm制程的极限,即便GK104采用28nm制程,但无论如何也不至于能在面积减小五分之二的前提下还能将流处理器数量提升至原来的三倍。
其次,谁都知道原生芯片的流处理器数量只和晶体管数目成正比,工艺制程的进步并不能让原有规模的晶体管实现更多相同的流处理器。GK104的晶体管数量只比GF110多了1/6,增加的1000多个流处理器从何而来?
Fermi和Kepler的流处理器单元本质不同,这恐怕是目前唯一合乎逻辑的解释。回想之前提到的NVIDIA和AMD互有借鉴的现象,不禁让人想到NVIDIA是否连SIMD的矢量设计都吸纳了?关于这个问题,只有Kepler的工程师才能给予准确解答,但至今我们未得到这方面的详细资料,似乎官方在回避这一话题。
网友评论