NVIDIA在2004年推出了SLi双显卡加速方案,到目前除了家用游戏卡,NVIDIA还有Quadro专业卡的SLi方式,至于在家用卡方面,SLi方案已经渗透到从高端到中低端,让用户有丰富的选择余地;SLi已经经过数万小时的内部测试,也通过了市场的考验,稳定性方面没有任何问题,针对市面几乎所有游戏进行优化,而很多游戏公司也在游戏中集成了双卡优化设置;SLi有最得力的平台支持,nForce4/5 SLi芯片组性能强大,市场认可度极高。
『大部分图形公司都有多卡解决方案,但是SLi最为普及』
在今年夏初NVIDIA正式宣布推出GeForce 7950 GX2显卡,7950 GX2是业界第一款采用双核心和双PCB的单显卡解决方案,他可以看作是SLi技术不断进化的结果。从7950 GX2的命名上可以看出来“7950>7900”,也就是说NVIDIA认为其性能也在7900之上,可以说7950 GX2是今年其产品线上性能最强的单卡解决方案。
『可以说GeForce 7950 GX2是目前设计最复杂的游戏单卡』
实际上NVIDIA完全可以将GeForce 7900GTX所使用的G71核心进一步优化,再提频,但是这样做不但会带来更大的发热量,带来更难以解决的散热问题,同时在架构不变的情况下,性能提升也是相当有限的。因此NVIDIA才选择了双核心、双PCB单显卡的7950 GX2解决方案来进一步提升性能。
我们此前已经进行过GeForce 7950 GX2的相关测试,但此篇文章我们将选择目前ATi刚刚发布的高端产品来通7950 GX2进行王者较量。不过在正式测试开始之前我们还是先来全面了解7950 GX2的工作原理。
GeForce 7950GX2原理解析
相对于传统的单核心显卡与SLi或者CrossFire双显卡解决方案不同,GeForce 7950 GX2的工作模式与前几者都不一样。7950 GX2单卡则采用双芯片、双PCB解决方案,每块核心都集成在相应的PCB上,具备完整的板载显存和供电电路,也具备完整的独立处理流程,两个PCB上的显示核心通过一颗PCI-E传输芯片来完成数据交换,同时,两块7950 GX2的独立PCB上只有一块有PCI-E插槽和输出接头,这样也就组成了传统的单卡的工作模式。
下面,我们就通过GeForce 7950GX2的实物来看看其工作时的原理。
和技嘉华硕早前推出的单PCB双核心的显卡不同,7950 GX2则拥有完整的SLi电路,它将相关元件全部集成到了一片显卡的PCB上,数据的分配不再依靠主板,因此与主板的芯片组不再有任何关系。下面我们就从硬件角度来看一下7950 GX2的工作流程。
『从PCB上的走线就能看出数据的走向』
从显卡接口传输而来的数据会首先进入具备PCI-E接口的那片显卡,这片也是集成BR-03芯片(另一片显卡没有集成此芯片)的显卡,数据会先行进入BR-03芯片。BR-03芯片是7950 GX2中最重要的附加芯片,它就是整个SLi的控制电路,NVIDIA表示BR-03的数据带宽相当于48x的PCI-E,也就是24GB/s,分为三部分,包括连接对外的PCI-E接口和连接两颗GPU,各自占据8GB/s的数据带宽。
『BR-03芯片具备24GB/s的数据带宽』
数据进入BR-03芯片以后,显卡的驱动程序会根据事先设置的算法将数据分派至所负责GPU,其中之一会通过本地电路直接进入GPU,而另一部分则会通过下图所示的电路进入另一块PCB上的GPU。
『第二块GPU的数据通过上图所示电路从BR-03芯片传输过来』
『第二块PCB上的电路接口,数据直接进入第二块GPU』
数据在两块GPU之间的传输全部采用电子电路,速度没有任何问题,再加上BR-03芯片的超大带恚荽湟膊淮嬖谌魏纹烤保?950 GX2的双卡组合方案是没有任何延迟的,性能丝毫不逊于两块显卡SLi,甚至还要更快,因为普通显卡的SLi还要受限于芯片组的数据分配。
GeForce 7950GX2原理解析(二)
虽然7950 GX2的双GPU原理和双显示卡SLi运算基本相同,但是用户只安装一张7950 GX2显卡,在驱动程序并不会显示任何SLi选项,就像一片显卡一样,这和NVIDIA的初衷完全一样,7950 GX2显卡就是目前最强的图形“单卡”。
而如果使用两片7950 GX2显卡达成Quad SLi模式,玩家就必须采用支持SLi的主板,因为两块7950 GX2的连接和数据传输需要主板芯片组的支持。NVIDIA曾经表示只会让nForce4 SLi 16x支持Quad SLi,也就是双16x的主板支持Quad SLi,但是最新的消息表明,NVIDIA已经不对此进行限制,因为毕竟双16x和双8x只是数据带宽的区别,不会对Quad SLi有任何技术上的影响。
上面就是Quad SLi的逻辑架构图,结合本节的图片,读者可以了解各种芯片和显存之间的数据交换方式,因为7950 GX2之间两块GPU的传输完全是直接进行的,因此完全不会影响PCI-E的带宽。
『早先的7900 GX2与7950 GX2的区别之一,少了一个SLi金手指』
『7900GTX对比7950 GX2和Quad SLi 7950 GX2』
Quad SLi之间的传输则通过SLi金手指,NVIDIA指出这个SLi金手指的带宽达到10GB/s,因此只需要一个就可以了,这是7950 GX2与早先NVIDIA展示的7900 GX2之间Quad SLi的最大区别之一。
GeForce 7950GX2产品赏析
七彩虹作为NVIDIA紧密合作伙伴,第一时间推出了天行7950GX2 CH版 1GB DDR3产品,我们看到此款7950GX2已经全面更换了新的包装,采用了深蓝色银卡纸高档包装,复杂的压纹与UV工艺设计,尽显尊贵典雅。
作为全球第一张采用1G显存的双GPU显卡,它几乎集成了一切领先的特性,90nm新工艺制程,采用两颗NVIDIA 7950 GPU,1G /512bit显存,每个核心分享512M 256Bit显存容量/位宽。默认频率为500/1200MHz,内部具有24X2=48条渲染管线,支持CineFX4.0着色架构,具有更高性能的色彩压缩。同时支持DX9.0C,SM3.0优化引擎与HDR高范围动态渲染特效。
七彩虹天行7950GX2采用了P502 8层PCB公板设计,两片单卡之间通过一片SLI桥连接,并通过底部一张卡上的SLI桥接芯片实现两片卡之间数据交换,两片卡通过一个PCIEX16接口对外连接。
在高清视频支持方面,七彩虹天行7950GX2 CH版1GB DDR3支持PureVideo技术 与H.264高清硬件加速,支持HDCP数字内容保护的解码技术,HDCP是High-bandwidth Digital Content Protection的缩写,中文就是HDCP数字内容保护,它是英特尔开发的为HDMI提供高带宽数字内容保护的解码技术。支持HDCP解码技术就不会受到信号加密的限制,可以接受全部格式的高清信号。HDCP类似于防止数字内容盗版的加密技术,如果软件和硬件其中之一不支持HDCP,那么我们就无法读取数字内容。七彩虹天行7950GX2显卡中加入Store Keys的ROM,就能透过现有的DVI-I输出端子支持HDCP输出,完美支持高清视频输出。
显存方面,采用了三星1.4ns GDDR3显存,每片卡上八颗136pin 封装的16*32显存颗粒,默认频率为1200MHz,512M 256bit 规格,双卡组成1G 512bit,足以轻松应对任何大型数据吞吐量的3D游戏。
在供电部分,七彩虹天行7950GX2采用开关式分离供电设计,并采用固态电容、封闭式电感来分别为核心与显存提供稳定的电源支持,来保障这个超级显卡的长时间稳定运行,不过NVIDIA在7950GX2功耗方面设计的比较出色,所以对电源要求没那么恐怖,基本350W电源就能满足其稳定运行。
采用了双DVI+HDTV全接口输出,配合NVIDIA 的PureVideo及H.264硬件加速技术,以及HDCP解码技术,为高清视频玩家提供了比较完美的解决方案,适合于宽频游戏及高清输出应用。
作为首款1GB显存/双GPU骨灰级显卡,价格方面大家也是十分关心,七彩虹天行7950GX2 CH版1GB DDR3并不像我们想象出那么昂贵,报价也仅5999元,作为顶级的双GPU显卡,这种价位还是相当令人期待的。 | |
| 测试平台与说明
○ 测试平台
系统测试环境 |
处 理 器 |
AMD Athlon64 FX62(2.8GHz) |
主 板 |
华硕A8N SLi豪华版(nForce4 SLi片组) 精英KA3MAP(RD580芯片组) |
内 存 |
威刚 1024MB DDR800 (512MBx2) |
硬 盘 |
希捷酷鱼7200.7 160GB P-ATA |
显 示 卡 |
ATi Radeon X1950 XTX | 650/2000 nVIDIA GeForce 7950GX2 | 500/1200 |
显 示 器 |
CTX 9100M2 |
电 源 |
鑫谷宙斯盾850 |
软件测试环境 |
操 作 系 统 |
Windows XP Professional+sp1+DX9c |
主 板 驱 动 |
nForce Forceware 6.66 WHQL |
显 卡 驱 动 |
ATi 催化剂6.8 WHQL nVIDIA Forceware 91.45 版驱动 |
○ 测试平台Athlon 64必然之选择
目前所公认的最佳游戏平台就是AMD K8,测试中我们也当仁不让的选择了Athlon 64处理器。测试所使用的AMD Athlon 64 FX62性能强大,同时我们为系统搭配了1GB内存。
参与测试的显卡包括GeForce 7900 GTX、ATi Radeon X1900XT 512MB版本。
○2款合成类测试软件+5款实际游戏
测试采用“基准软件测试”+“实际游戏测试”相结合的方式来考察显卡的3D图形性能。测试中,3DMark05以及3DMark06作为基准测试项目,另外还选择了目前主流的3D游戏,D3D游戏全部基于DirectX9.0,其中FarCry1.3、Need for Speed 9、FEAR、古墓丽影7等都支持SM3.0+HDR。
测试分辨率选择了1600x1200和2048x1536两个,而舍去了以往常常采用的更低的分辨率,因为这样更有利于减少测试中才处理器上产生的瓶颈。同时在每2048x1536分辨率下还有4xAA、8xAF成绩。其实对于高端显卡来讲,开启特效和1600x1200分辨率是不二的选择。
注:由于部分游戏不能够支持2048x1536分辨率,因此将降为1600x1200的4xAA、8xAF测试。
○ 关于HDR+AA的特别说明
测试中在Farcry1.3等游戏中,开启AA+AF测试时间,我们不得不关闭HDR效果。这两个SM3.0+HDR的游戏目前还不能支持同时开启HDR+AA。虽然Farcry1.4的补丁可以支持HDR+AA,但目前仍不是正式版,所以以后推出正式版本后我们会对其再进行测试。
其他几个HDR游戏,由于他们都采用了INT10/16的实现方法,因此其可以同时开启HDR+AA,Need for Speed 9、Call of Duty 2等都是在开启HDR效果时进行的AA+AF测试。
图形性能测试——3DMark05 Pro Ver1.2.0
/3DMark05 图形特点/:
Futuremark再接再厉推出的3DMark05成为新一代显卡的测试标准,由于整个测试全部采用DirectX9编写,因此这一代测试软件不再适用于老一代DirectX 8.1显卡。通过三个包括太空、自然、户外不同游戏场景的运行,可以全方位的考察显卡在光线、动态渲染、水面渲染、岩石表面的渲染等等方面的能力。
/3DMark05 测试设置/:
- 测试软件:3Dmark05 Pro 1.20
- 支持 API:DirectX9.0c
- 测试场景:GT1/2/3
虽然X1950XTX的显存频率几乎达到7950 GX2的两倍,但是双PCB的显存容量和显存带宽7950 GX2均胜出,所以即便分辨率提升,7950 GX2仍然保持全胜,领先幅度15%左右。
图形性能测试——3DMark06 Pro Ver1.02
/3DMark06图形特点/:
对于刚刚发布的3DMark06我们肯定不能错过。相对来说3DMark06是在05版本上的一个加强,前两个测试项目不变,只是增加了新的HDR测试场景。同时在图形处理负荷量上相对前一个版本来说3DMark06更大。
此次3DMark06不再是仅仅考察图形性能,处理器性能也将直接影响到3DMark06的总得分。
/3DMark06测试设置/:
- 测试软件:3Dmark06 Pro 1.02
- 支持 API:DirectX9.0c
- 测试场景:GT1/GT2/HDR1/HDR2
3DMark06中7950 GX2的表现更好,领先幅度达到了25%以上,SM2.0的反锯齿场景领先更达到了50%还要多。
图形性能测试——DOOM3/毁灭战士3
/DOOM3图形特点/:
游戏3D API:OpenGL
id software的每一款游戏都会受到FPS玩家的强烈吹捧,《DOOM3》也不例外。不过相对于其它游戏来说,《DOOM3》更像是一本教科书、一个未来游戏发展方向的风向标,对于《DOOM3》测试的也能反映在OpenGL接口游戏的性能,因为相信未来很多游戏都会采用《DOOM3》的引擎。
/DOOM3测试设置/:
图形选项的总体设置为“Ultra High”,所有高级特效开启。nVIDIA和ATi显卡不存在设置的区别,反锯齿和各向异性过滤采用驱动打开。
/DOOM3测试方法/:
利用游戏自带的测试命令及demo1,得出成绩。
OpenGL本身就是NV显卡的强项,7950GX2借助双芯和大显存的优势,在《DOOM3》中大幅度领先X1950XTX,领先成绩接近50%。 | |
| 图形性能测试——Far Cry1.3/孤岛惊魂
/FarCry图形特点/:
由育碧出品的《FarCry》完全可以在今年发售的游戏大作中占有了一席之地,其惊人的技术表现已经受到众多玩家的强烈关注。游戏采用的图形引擎名为“X岛”,该引擎在表现一些充满各种植物的热带丛林岛屿方面效果惊人,该引擎还支持一种叫作“polybump”的特效,利用该特效即使在物体多边形数不是很多的情况下也能给人一种十分逼真的感觉。在一些动态光源的情况下能够展现逼真的光影效果。
Farcry对系统的要求极其苛刻,显卡方面,目前的中端显卡在高画质下运行此游戏也比较困难。游戏的采用了多边形贴图,比凹凸贴图更加具有质感。室外场景的渲染让人感觉惊艳,特别是游戏对水的渲染几近真实,在水下可以清晰看到水面上的景物,水面的倒影和浪花的效果也非常的棒。
/FarCry测试设置/:
图形所有设置选择最高,nVIDIA和ATi显卡不存在设置的区别,在1280x1024和1600x1200分辨率测试下开启HDR。但在AA+AF测试中,外面还得关闭HDR,因为这样才能打开反锯齿,反锯齿和各向异性过滤全部采用驱动程序控制打开。
/FarCry测试方法/:
采用Fraps软件辅助记录成绩,测试模式为LAN TMD模式,mp_monkeybay场景,自录Demo进行测试,并且使用游戏自带平均帧统计功能。
这个成绩很有特色,反锯齿和各向异性过滤开启,虽然分辨率极高,但成绩还是接近了CPU发挥的极限,因此两块显卡的差距很小。HDR是非常消耗显卡资源的特效,开启以后两者的差距开始明显,达到了40%,从未来游戏的发展趋势来看,7950 GX2在HDR的表现是非常值得期待的。
图形性能测试——Prey/掠食
/Prey图形特点/:
游戏3D API:OpenGL
《Prey》采用了改进的Doom 3引擎,是年度最值得期待的游戏之一,在光影效果上达到了很高的水准,画面和游戏性也有望成为年度最佳。有着新颖的创意,优秀的画面以及火爆的战斗,《Prey》还是很值得期待的。
/Prey测试设置/:
图形选项的总体设置为“Ultra High”,所有高级特效开启。nVIDIA和ATi显卡不存在设置的区别,反锯齿和各向异性过滤采用驱动打开。
/Prey测试方法/:
利用专门的测试软件得出成绩。
另一款OpenGL游戏,7950GX2优势依然,领先幅度非常明显,平均40%左右。 | |
| 图形性能测试——Need for Speed 9/极品9
《极品飞车9》让非法赛手重见天日,游戏的图形引擎方面也同步进行了改进,因为太阳的出现让光线和阴影的渲染成为必需。整个游戏笼罩在一种偏执的铬黄色和棕褐色的氛围下,这和场景中充满了工业化的设施不无关系。新的图形技术是游戏最大的亮点之一。赛车的模型细节有了进一步的提升,游戏中大量采用了Bloom效果,让游戏的光线渲染达到了一个极至。
游戏的阴影效果也非常出色,如果将特效开到最高,你就会发现动态阴影无处不在。赛车通过林荫大道的时候,阳光会穿过树叶撒向车身,并在车身上快速滑过。如果停下车来你还会看见,树叶的阴影会投射到树干上,并随着微风晃动。在快速行进时游戏大量使用了动态模糊效果,这使游戏产生了一种强烈的速度感。
/Need for Speed 9测试设置/:
图形所有设置选择最高,nVIDIA和ATi显卡不存在设置的区别,HDR开启(程序自动选择运算模式),反锯齿和各向异性过滤全部采用游戏打开。
/Need for Speed 9测试方法/:
采用Fraps软件辅助记录成绩,测试赛道为Clubhouse & Hollis,赛车为保时捷改装版,关闭“道路车辆”,特效全部最高(反锯齿利用驱动程序打开)
限于处理器和整个系统的速度,最高画质下60fps几乎是《极品飞车9》的极限,可以看出,打开反锯齿和各向异性过滤,7950GX2的成绩下降非常小,7950GX2的大显存容量、高显存带宽发挥了充分的优势。 | |
| 图形性能测试——F.E.A.R./超能特警组
/F.E.A.R.图形特点/:
游戏3D API:D3D
《FEAR》是一款结合了美式动作片如《黑客帝国》以及日式恐怖片如《午夜凶铃》的恐怖游戏。游戏中所谓的“F.E.A.R.”是一个专门解决灵异任务的特别行动部队,这次他们面对的是一群神秘的恐怖组织。
作为新一代FPS游戏,本作的画面表现也十分出色,游戏完全支持DirectX9,pixellighting、shadow volumes、normalmapping、advancedshaders等最新图形技术全部应用其中,新一代Havok2物理引擎使得场景的互动程度更高,玩家将会看见留在敌人身上的弹孔里鲜血一滴一滴的落下,而负责本作开发的是拥有极强技术实力的Monolith。
/F.E.A.R.测试设置/:
图形选项的总体设置为“最高”,所有高级特效开启。nVIDIA和ATi显卡不存在设置的区别,反锯齿和各向异性过滤采用游戏打开。
/F.E.A.R.测试方法/:
利用游戏自带的系统测试得出成绩。
FEAR同样是新一代游戏中非常有代表性的产品,对系统、显卡的要求也是非常高,7950 GX2在游戏中的表现非常出众,领先幅度甚至达到了一倍。
图形性能测试——Tomb 7/古墓丽影7
/TOMB7图形特点/:
游戏3D API:D3D
《古墓丽影:传奇》不仅仅是在游戏性上得到了提升,另外在画面效果上也是有了飞跃性的提升。借助于最新的SM3.0技术以及HDR技术等,为大家带来了一个崭新的游戏画面效果。当然,游戏画面效果的提升也必定引发对显卡以及整个系统的更高要求。不过《古墓丽影7》还是照顾了广大玩家,整个游戏对显卡的要求弹性空间非常大。
/TOMB7测试设置/:
除了“次时代特效”关闭,游戏其它图形选项的所有高级特效开启并为最高,nVIDIA和ATi显卡不存在设置的区别,反锯齿和各向异性过滤采用驱动打开。
/TOMB7测试方法/:
利用Fraps测试游戏固定的即时演算动画,得出成绩。
《古墓丽影7》效果全开的资源消耗非常恐怖,7950GX2同样可以胜任这款游戏,领先X1950XTX接近20%。 | |
| 单卡双核心创意设计,GeForce 7950GX2称霸最强单卡
通过性能测试我们看看到GeForce 7950 GX2表现出了强劲的性能,即使是对手最高端的产品,也是单拳难抵7950 GX2的双掌,7950 GX2是NVIDIA的SLi技术进一步的升级和进化。
○ 分清市场定位,7950 GX2是单卡市场的升级产品
我们再来看看7950 GX2的市场定位,这里再次需要强调的是,7950 GX2是7900GTX的性能升级产品,而不是7900GTX或者其它显卡的SLi升级产品。原因我们在前面也多次讲到,7950 GX2虽然采用了SLi技术,但是全部电路集成到显卡PCB上,所以不需要主板的电路再有改动。7950 GX2其实就是实际意义上的一块单卡。
→
本次测试的七彩虹显卡报价5999元人民币,这和七彩虹普通版7900GTX的价格仅仅相差1000元,更是和华硕、技嘉等等品牌的7900GTX价格接近,从价格来说,7950 GX2的确是7900GTX的升级产物。
→
而Quad SLi则是7900GTX SLi的性能升级产品,组建Quad SLi可以获得更强大的性能和更优秀的画质。这里要提及一点的是,NVIDIA目前对于Quad SLi的产品是只向OEM厂商提供的,这有多方面的考虑,因为Quad SLi可以实现更高的游戏分辨率,有更高的电源功率需要,所以对于个人用户来说,可能无法匹配出合适的配置发挥Quad SLi的强大特性。 |
网友评论