揭真相:从功耗变化看AMD显卡架构效率

PChome | 编辑: 夏阳 2012-03-08 05:00:00 一键看全文

功耗和帧数成正比

AMD和NVIDIA在激烈的竞争中造就了一代又一代出色卓越的桌面级显卡,两家无论是在架构还是在特色上也不尽相同,况且性能定位层叠交错,形成一代压过一代,一代取代一代之势。在业界一分钱一分货的道理人人皆知,在A和N之间纠结的原因恐怕更多的是两者架构和特点不同。从上期关于显卡的揭真相中我们发现了两者架构与功耗和帧数有着密不可分的联系,那么谁的架构更适合玩游戏呢?

一山可容二虎 搭A显存技嘉GT430小测

架构对帧数和功耗的影响

从统一渲染架构开始,NVIDIA便一直在坚持标量设计,以多指令流多数据流MultipleInstructionStreamMultipleDataStream,简称MIMD的方式完成对3D模型的渲染,每颗MIMD处理器(CUDA处理器)均能完成一个独立的渲染着色任务。以Fermi架构为例,NVIDIA将若干个这样的流处理器与处理能力对应的ALU,SFU,TMU等其他运算单元打包设计成一个独立的流式处理器群SM,SM简单的来说是一个高度并行的多处理器群,可以与其他SM同时并行执行48个Warp。

一山可容二虎 搭A显存技嘉GT430小测

Fermi完整版架构示意图(GTX580)

当然每组SM均配备与之对应的Raster引擎那就稍显浪费和多余,在NVIDIA多次试验之后发现每四组SM配备一个Raster是效率最佳的状态,因此按照再大的层面上来说,16组SM每四个SM再打包成一颗GPC,Fermi最高拥有4组GPC(图形处理器群)。每组GPC均可独立运行显卡所必须的任何操作,可以看成GTX580/GTX570就是一颗“四核”的显卡,“核心”与“核心”之间完全并行,将内部因素的牵制和影响降到最低。

AMD一直在坚持矢量运算架构,即SIMD(Single Instruction Multiple Data,单指令多数据流)能够复制多个操作数,即便是HD7000有了小幅的改进,并将其架构名称改为GCN,事实上SIMD的运算模式更适合多媒体以及游戏方面,但AMD显卡并没有将其潜能完全发挥。

一山可容二虎 搭A显存技嘉GT430小测

SIMD架构下,简单来说不像MIMD那样由每颗流处理器完成XYZW顶点的处理,而是分别由四颗逻辑流处理器各自负责X,Y,Z,W的顶点生成,再加上另外一颗着色处理器,这才完成了一个完整的像素渲染,并称之为4D+1D。

当然上述架构是AMD设计之初的架构体系,在HD6900时代为了更高的优化内核单元以及适应新应用,将架构更改为4D的架构,也就是四颗逻辑流处理器完成一个独立的工作。

以HD7900架构为例,在单元配比方面,共拥有512个物理流处理器,2048个逻辑线程,每4个TMU个64个逻辑线程构成一个工作组CU(类似NVIDIA的SM),共有32个工作组,比NVIDIA的SM设计高出了一倍,在大量而并行的工作组设计中,并没有采取独立“自治”的资源指派能力,而是统一依赖仅有两颗指令指派器,在大量而复杂的运算中,工作组群的利用效率不容乐观。

提示:试试键盘 “← →” 可以实现快速翻页 

总共 2 页12
一键看全文

本文导航

相关阅读

网友评论

每日精选

首页 手机 数码相机 笔记本 游戏 DIY硬件 硬件外设 办公中心 数字家电 平板电脑