G70 ROP架构分析
经历了从NV30的ROP引擎确立到NV40 ROP(Rasterizing OPeration)引擎的发展,7800 GTX的ROP数量保持了和NV40相同的16单位上,并没有随着Pixel Shader的增加而增加。从下图截取自NV40和G70核心的ROP单元结构图可见,两者ROP单元内部并没有在功能以及构造上的区别。实际上,ROP单元是一组从Pixel Shader分离出来,主要用于对从Pixel Shader引擎中输出的速降进行抗锯齿以及处理Z轴、色彩压缩的POST Shader处理单元,在7800 GTX的核心结构上,随着Pixel Shader和vs管线数量和G70核心速度的提高,单周期内 Pixel Shader 内部的处理越来越花时间,每一个像素在Pixel Shader中需要的处理周期都随着日后游戏以及相关软件的发展而大幅增加,在单周期内不一定会有待处理像素下降到ROP单元,也就是说,每周期的Pixel Shader的像素输出/ROP需要处理的数据有减少的趋势。于是,考虑到Pixel Shader-ROP负载的平衡性、核心制造工艺以及整卡的成本问题,7800 GTX没有再在16单元上添加更多的ROP单元,着重改善了FP处理算法以及增加TAA模式下的超级采样和多重采样。
在NV40时代开始,nVIDIA就将三角形生成率以及像素填充率作为重要的性能指标,随着显卡图形处理的重点逐渐移到Shader单元,以往的关于制程、速度等性能指标都变得无甚重要,玩家更加看重的是Shader的性能,可惜的是现在还没有确立关于Shader性能的测试标准。因此在衡量一个GPU运行/运算能力的时候,可以采用判定CPU性能的一些关键指标,如Operations (Instructions) / sec和FLOPS(Floating Operations per Second)。
网友评论