架构的艺术 性能功耗双丰收
●空前科学的架构配比
性能强大功耗就一定高么?答案是不一定的。计算架构不同,能耗表现就不同,GTX750系列使用的是NVIDIA最新Maxwell架构,对上代Kepler的处理器群组经过了二次优化配比,R7 260X使用的是HD7000的扩展架构,前者MIMD,后者为SIMD。
Kepler架构中的GK104即便只具备8组Polymorph以及256BIT的位宽也能够大幅超越Fermi时代的所有单芯产品,也就是说NVIDIA不再偏执的追求曲面细分和末端输出。保证庞大的着色和顶点运算能力的支撑才是游戏最本质和核心的需求。
但是在一些特殊的指令或处理需求,在SMX庞大流式运算体系中并不是最完美的被计算出来,我们猜测在此期间可能会存在一些延迟和等待,或是刚从Fermi演化到Kepler直接扩张成极致流处理器群组(SMX)的火候太过了些,从Maxwell开始,SMX就又进行了中和式的改进。
GM107中的流处理器群组被称作SMM,是以Maxwell的架构而辅助命名,当然核心部分的架构并未变动,最大的变动就是将创建缓存单元,Warp调度单元,路径指派等等搭载32个CUDA,8个LD/ST以及8个SFU和后端的L1以及纹理单元打包成了一组小的SM,总体来说仍然是每组SMM包含128CUDA以及对应的运算单元,但分配调度更加灵活简单。可以通俗的认为支持四条逻辑线程在灵活计算,当然架构图中并没有标出双精度单元DPU具备几个,但我们猜测NVIDIA并没有完全关闭或取消它们,毕竟部分应用还是会用到。
由于结构的重新编排配比,加上一些细微的改进和优化,使得CUDA的单位效率提升了35%,同样的性能输出下能耗下降50%。
●低功耗可给我们带来什么好处?
GM107实现了单个CUDA超越Kepler逾35%的性能总成,以及2倍的性能瓦特比(即能耗比),是Fermi同级产品(GeForce GTX 550Ti)的4倍,也是NVIDIA近年来首款不需要独立供电的中端产品,改变了以往X50至少需要6PIN的历史,直接将TDP控制在60W以下,也就是说只要是非大幅超频的产品,主板PCI-E供电即可满足其需求,完全适用于任何平台下,包括标配主流300W PSU电源供应器的OEM品牌机,还是各种PIO亦或ITX主机中,精巧的供电、显存以及走线也完全可以按照需求来布局在半高甚至更矮的显卡PCB上。
卓越的能耗比可以带来前所未有的改变,玩同样的游戏,不再忍受噪音和发热的煎熬,亦不必担心主机的PSU会有需求上的问题。在性能上充分满足剑灵、龙剑、激战2、逆战、坦克世界、WOW、LOL等网游巨制的情况下,越节能也就越适合商业电费昂贵的网吧市场。
●GTX750与R7 260X功耗PK
我们使用功率测试仪对两卡进行待机和满载的功耗对比,X79平台无法使用核显这是必须安装独显来读取待机功耗的原因,那么根据常理待机时的功耗仅数瓦,GeForce GTX 750以及本次所用的降频版R7 260X的待机功耗不相上下,后者略高3W。
使用Furmark 1.9.2压榨测试软件将GPU充分满载测得平台功耗分别是224、222.5、275瓦,其中同为GM107的两款显卡即便是相差一组SMM,功耗表现也极其相近,而R7 260X则高出53W的功耗。
按照实际功率来计算,显然该降频版R7 260X比GTX750的功耗要高出60%~70%,而游戏性能低20%左右。
网友评论