在几乎所有的显卡评测中,Nvidia在DOOM3中的优势已是不争的事实。这些测试结果很快被掺入了商业广告的成分,它们正逐渐改变人们选择显卡的倾向。GeForce 6800系列在DOOM3中保持着20-25%的优势,测试资料显示,NV40在DOOM3中处理能力比R420高出50%!
NV40在DOOM3中ROP的使用率
NV40: 在DOOM3中ROP使用效率更高
在阴影渲染过程中,上面的论述是非常适用的,也就是说,ATI强大Z-buffer预判机制在光源计算中无法发挥威力。但在颜色渲染过程中,ATI的Z-buffer预判算法就不受约束了,可惜的是,这时预判速度的快慢已经并不重要了,对像素着色的时间占据了主导。打个比方,如果对一个像素进行着色需要花费16个频率周期,如果Nvidia的显卡在预判速度上落后四倍甚至更多,那最多也就多花1-4个频率周期,这种差别是很小的。不要忘了NV40在每个时钟频率的处理效率比R420/R423更高,这弥补了NV40在预判算法上的不足。
高处理效率弥补了NV40在预判算法上的不足
在阴影渲染中的Z/Stencil过程则正好相反,这些过程本身很快,但剔除无效像素是瓶颈所在,如果对算法进行优化,Z/Stencil单元的处理能力将会有较大的提升。
顺便一提的是,Nvidia曾传出消息,由于NV30/NV35的Z/Stencil能力不足,它们只能在每个时钟频率渲染4个像素。为了在开启全屏抗锯齿时不至于导致性能大幅下降,Nvidia为这些芯片每条流水线配备了两个ROP单元,在8个ROP单元的帮助下,NV30/35每个时钟频率能实现8组Z/Stencil计算。
但这些在Radeon 9700身上同样实现了,它内建了8条流水线管,每条线管也配备了2个ROP单元,但第二个ROP单元只有在全屏抗锯齿下才被起用。理论上,这会让R3XX系列的全屏抗锯齿性能更强,但实际上,Radeon在DOOM3中AA性能不佳。可能在着色渲染上,Radeon花费了更多的时间,这抵消了ROP的优势。
NV40拥有16个ROP单元,以每条2×2像素流水线为单位分为4组。在需要的情况下,NV40的ROP单元还能实现alpha混合和附加的Z/Stencil功能,这让它可以每个时钟频率处理32个Z/Stencil运算。而R420/R423只有在开启全屏抗锯齿下才能达到这个水准。尽管在DOOM3中,Z/Stencil可能会让ROP有较长时间的闲置,但高效的ROP让NV40速度优势更加明显。
网友评论