SP单元:也叫流处理器单元是NVIDIA对其统一架构GPU内通用标量着色器的称谓。 是继Pixel Pipelines和Vertex Pipelines之后新一代的显卡渲染技术指标,Stream Processor既可以完成Vertex Shader运算,也可以完成Pixel Shader运算,而且可以根据需要组成任意VS/PS比例,从而给开发者更广阔的发挥空间。由于流处理器负责了3D图形渲染中的像素着色、顶点着色和几何着色三大负荷最重的工作,因此对于显示性能的影响最明显,SP单元个数越多,则处理能力越强,一般成正比关系。通过我们之前的诸多测试来看,超频流处理器获得的性能提升要远大于超频核心或者是显存,因此流处理器超频已被越来越多的N卡玩家所认可。
目前千元左右最火的产品,莫过于如日中天的9600GT,和改头换面的9600GSO,虽然都顶着GF9系列门派的头衔,但是骨子里却完全两样,9600GSO 是8800GS的换名版,依旧沿用G92的强大核心,而9600GT只是G92的缩水版G94核心,与9600GT相比,9600GSO的优势在于核心拥有96个流处理器(+32),但是显存位宽只有192Bit(-64),此外,纹理处理部分,TMU和TAU的数目9600GT也比9600GSO稍少一些,也就是说9600GSO的核心渲染能力强,但是显存带宽偏低。由此可以说9600GSO在偏重于Shader游戏中会有更好的表现,但是开启抗锯齿能力会差一些。、
GeForce 8时代之后,统一渲染架构的出现让像素单元和顶点单元成为历史,诞生了全新的流处理器单元(Streaming Processor),流处理器负责处理以往的像素、顶点以及DX10新加入的几何着色,其重要性不言而喻!新的架构非常特殊,内部采用了分频设计,流处理器的频率达到了核心频率(纹理、光栅、缓存、控制模块等)的两倍以上,而且流处理器与核心之间并没有固定的比率,因此其频率不能不让人重视。究竟是流处理器数量多的96GSO好,还是显存位宽高的96GT强,一时之间在各大论坛纷争四起,众说纷纭。
纵观市场上,目前能买到的最强的9600GSO莫属耕升的9600GSO 768M大乔版,而在9600GT上的选择则大多数人钟情于公版, 现在就让我们用9600GSO大乔版与同等价位的公版9600GT做进一步的比较,从而证实谁才是中端千元王者。
耕昇9600GSO大乔版是目前市场上能买到的最强规格的768MB显存的9600GSO,价格与公版9600GT差不多,采用非公版8层PCB,搭配大口径全覆盖散热风扇,显存和供电模块都覆盖散热横条或者散热片。显卡采用了正反6颗一共12颗奇梦达1.0ns显存组成了768M/192bit的规格,公版 GeForce 9600GSO的默认频率为580/1450/1400MHz,而耕昇的9600GSO大乔规格比公版更高,均为600/1500/1800MHz。采用了核心独立三相供电,外接6pin电源接口,为整卡的稳定运行以及更好的超频提供强有力的条件基础。
公版9600GT采用P545设计 ,沿用了CoolerMaster的TM62单卡座散热器,虽然控制了显卡的体积,但散热成了不小的难题。显卡使用了正面8颗1.0ns的三星显存,组成512MB/256bit的规格,核心/流处理器/显存频率为550/1375/1600MHz。采用了核心独立两相供电,外接6pin电源接口。
耕升9600GSO 768M大乔版与公版9600GT 512M的成绩对比测试:
9600GSO大乔 VS 9600GT 公版 | ||||
游戏 |
分辨率 |
模式 |
768MB |
512MB |
9600GSO |
9600GT | |||
核心频率 |
600 |
650 | ||
流处理器频率 |
1500 |
1625 | ||
显存频率 |
1800 |
1800 | ||
3DMark06 |
1680×1050 |
noAAnoAF |
8526 |
8611 |
4AA16AF |
5874 |
6298 | ||
3DMark Vantage |
1024×768 |
Score |
10547 |
10011 |
GPU Score |
16792 |
14778 | ||
GPU1 |
41.5 |
34.5 | ||
GPU2 |
56.6 |
52.4 | ||
失落星球 |
1680×1050 |
DX10 Snow |
31.3 |
34.3 |
DX10 Cave |
42 |
44.3 | ||
冲突世界 |
1680×1050 |
DX10 H |
30 |
29 |
生化奇兵 |
1680×1050 |
DX10 H |
39 |
38 |
孤岛危机 |
1280X720 |
DX10 H |
34.4 |
32.9 |
英雄连 |
1680×1050 |
DX10 H |
42.3 |
35 |
战争机器 |
1680×1050 |
DX10 H |
46 |
44 |
极品飞车 |
1680×1050 |
4AA16AF |
35 |
34 |
帝国时代3 |
1680×1050 |
4AA16AF |
82 |
78 |
使命召唤4 |
1680×1050 |
4AA16AF |
32 |
35 |
半条命2 |
1680×1050 |
4AA16AF |
67.5 |
76.3 |
从测试结果中我们可以清晰地看到,9600GSO大乔版在核心频率,流处理频率(显存频率相同)都低于对手公版9600GT的情况下,流处理器数量所带来的性能优势非同小可.
在基准测试中, 3DMARK 06在没开启AA效果下,两款产品基本得分相同。而在开启AA效果下,9600GT与9600GSO拉开差距,可见显存位宽对于AA特效来讲,十分重要。而在最新的3DMARK Vantage中,9600GSO遥遥领先于对手,可见新测试软件对于流处理器的数量及频率依赖较高,这也是DX10的通病。9600GSO得益于96个流处理器在同频率下也大幅度超越对手9600GT,看来3DMark Vantage对于GPU Shader的压力特别重,相比之下显存带宽的影响稍小些,相信这也是未来应用的发展趋势。在DX10游戏测试中,同样形成了一面倒的趋势,9600GSO依旧凭借着流处理器的数量在游戏性能上超越9600GT,由此可见,即使核心显存频率都低于对手,流处理器数量优势也能弥补过来,反败为胜。在DX9开AA的情况下,情况和估计的一样,在这个环节9600GT两胜两负的成绩,基本属于正常范围,9600GSO的192bit位宽限制其DX9下AA的性能,但在高分辨率下768MB显存发挥了一些优势,所以成绩互有胜负。因此可看出9600GSO 768MB默认频率并不输给9600GT,再加上显存容量优势,性能总体很强,而Shader负载较重的DX10游戏(如3DMarkVantage Crysis等)的优势会更大一些。
G94芯片的9600GT流处理器数量架构图
测试告诉我们在新一代的游戏中,9600GSO相比9600GT有着流处理器数量先天的优势,上面的架构图也充分的反映了,G92相对于G94流处理器的执行效率要高。为了让读者可以更通俗易懂,我们可以把256bit显存位宽形象的比作是4车道的高速公路,那么192bit的就是3车道的一级公路。在同样的时间,256bit可以提高1/4倍的车流量。同等换算的话,流处理器数量可比作为车的数量,流处理器频率比作车的速度,在同样的时间和速度下, 96SP行驶的车的数量可以比64SP要多1/3倍。由此可见,路是宽了,可车的数量不够的话,根本无法发挥路宽的优势,还不如加大流量,充分发挥路宽的极限要实际的多。
耕升自主开发的超频工具ExperTool,操作方便简洁,可以单独超频流处理器频率
通过耕升自主研发的超频工具ExperTool,我们可以轻易进行超频测试,其特点是操作方便简洁,而且可以兼容除耕升以外的品牌显卡。ExperTool可以单独超频流处理器频率,只要将“Link clocks”一项取消即可,更改频率后点击“Test”测试通过后点击“应用”即可。当对两款型号的shader频率进行同等提升的测试下,96SP相比64SP所提升的性能快了1/3左右,这就意味着超的越多,9600GSO相比96OOGT提升越明显。这就好比在车道(显存带宽)无法改变的情况下,提高车辆的行驶速度(流处理器频率),对于拥有多数量车(流处理数量)的情况而言,优势更加明显。
总结:
总体看来9600GSO大乔版768MB在性能上略强于公版9600GT 512MB,当然这还是在核心显存都落后的情况下,如果超频至相同频率,相信9600GSO大乔版有更好的表现。相对于之前的8800GS虽说只是刷BIOS换成的9600GSO,但是新的驱动支持带来了新的功能,并支持GF9系列才有的双流解码加速功能以及一些9系特有功能,所以说88GS并不是名义上变成了96GSO,而是集成9系列全部属性,虽然意义不是很大,但是我相信消费者还是很乐意买账的。
相信在将来新一代游戏中,流处理器数量及频率主导显卡性能的时代已经来临,虽然显卡核心和显存频率仍然会对显卡的速度起着重要的影响,但已不是重要的决定性因素。随着新规格的逐渐细化,显卡内置流处理器数量的增多,流处理器频率对显卡速度的影响会越来越直接、越来越明显,哪一家芯片能够抢占流处理器数量及频率速度的领先地位,哪一家产品就可以保持对其他对手巨大的性能优势。
网友评论