Z68双卡能发挥几成功力?
不管目前X79目前是否有缺陷,还是如期的携手Core i7 3960X一同上市,履行Tick-Tock计划,给本已不堪重负的AMD又狠狠的踹了一脚,貌似在X86 CPU方面Intel也根本没把她当做对手。X79同样的提供了多达40条的PCI-E通道,以表示它比Z68更为优越的旗舰级地位。
Z68和X79一样都为单芯片设计,也就是说PCI-E控制器已经在CPU的内部了,提供的总线通道数包括时钟速度都是由CPU来实现的。比如PCI-E通道数,其实就是总线引脚的模组数,X79提供40条,Z68/P67/H67为20条,X58同样为40条。
今日揭真相
尽管SNB声称已经集成PCI-E 3.0的控制器,那么不管是否真以3.0的模式工作,市面上仍然是2.0居多。那么很多朋友就开始担心假如是PCI-E 2.0的Z68(或P67/H67)仅有的20条PCI-E总线,在满足其他设备的同时能否让双显卡发挥最大的功力?
华硕P9X79-V Pro
拿最新的X79来说,以华硕的颜色标识,蓝色PCI-E为全速16×,当然根据华硕给出的资料P9X79-V Pro仍然是一块基于PCI-E 2.0的主板。不过以目前的标准来看,这已经是双卡最佳的组合了——全新的PCI-E控制器+双16×满速总线接口。
华硕P8Z68-V Pro
还是华硕自己家的玩意,还是定位于Pro级的主板,它和大多数Z68是一样的布局——总共3条PCI-E 16×的插槽,其中第一条蓝色为满速16×,当然这仅仅是单卡的时候,而当在双卡的系统中,它会和下面白色的PCI-E插槽共享这16×的带宽,也就是每条均8×,剩下的4×则用于其他的设备。
测试分析以及环境介绍
记得前几期揭真相栏目中提到了《如何双卡玩PhysX才是最合理》的问题,我们都知道在双卡系统中,无论是CrossfireX还是SLI,应用的都是分帧渲染技术,也就是两块卡从内存接收到的数据是对等并且各不统一的数据,这一点很类似RAID。
双卡机制
上图是提供的一个双路SLI的简易示意图,当然三路四路包括CrossfireX都是这么实现的,也就是说主副卡各接收一半的标准数据,然后副卡计算好后的数据由SLI桥传入主卡并由主卡做合并和修整,然后输出,当然主卡还要承担一些别的运算例如与CPU和内存之间进行反馈,同步等等。按照原理和机制来说,理论上两个8×正好能和一个16×的带宽保持一致。
在非旗舰级芯片组的主板上,我们以往都是以16×+8×为最佳选择,这对于大多数Z68/P67/H67平台的朋友纷纷表示困惑,同样是3000块钱,是买俩GTX560Ti效能高,还是单GTX570效能高?要知道在理论性能上GTX560TiSLI要比GTX580还要猛一些。所以这就是今天要论证的话题。
今天的测试平台:
我们今天的主题是:以目前的标准(即PCI-E 2.0的总线,和基于PCI-E 2.0总线接口的显卡),双8×的双卡组合方式能赶的上满速双16×性能的几成,如果在9成以内,那么对于以最少钱获取最大性能的用户是一个很重要的指导意义,因为届时就能排除主板PCI-E总线不再是制约性能的因素了。
为了得出更加鲜明的对比,全速的平台当然选择目前桌面级最为强劲的X79+Core i7 3960X,而8×+8×的平台则选择了目前较为主流的LGA1155平台,当然为了能够保证全速施展显卡而让CPU保持极高的主频,故选择了华硕自家的P8Z68-V Pro。
尤其是在基准性能测试中,测试软件基本是支持多线程的,那么这样以来,12线程,15M三级缓存的Core i7 3960X显然是秒杀Core i7 2600K的,但又必须让两颗U都保持在超高的主频以保证显卡的绝对发挥,因此笔者采取将Core i7 3960X关闭两颗核心的方式来保持线程数一致,但三级缓存容量仍然高出后者近1倍,因此若是保持性能无限接近的情况下,需要将Core i7 3960X的主频稍稍降一些,经过笔者摸索四核心的Core i7 3960X在4.3GHz主频下和Core i7 2600K 4.5GHz下性能接近(两者仅相差0.2GHz,看来LLC大到一定程度对性能的提升也是不明显)。
内存方面均使用双通道1866MHz@CL9,其他方面的设定均一致,测试不涉及到磁盘等环节,因此系统所必须的驱动均使用微软更新来获得。
先给出一个Core i7 2600K@4.5GHz+GTX570单卡下的成绩:
3DMark Vantage Performance:
Core i7 2600K@4.5GHz+单GTX570
失落的星球2:
Core i7 2600K@4.5GHz+单GTX570
Core i7 3960X 4C@4.3GHz+单GTX570
3DMark Vantage Performance:
Core i7 3960X 4C@4.3GHz+单GTX570
Core i7 3960X 4C@4.3GHz+单GTX570
基准测试软件《3DMark Vantage》会提供有一个CPU方面的测试,笔者摸索出Core i7 3960X在四核4.3GHz主频时得分为30437,和4.5GHz的Core i7 2600K得分相差仅1%。《失落的星球2》对显卡性能非常依赖,而且不偏重A或N的一方,在结束时还会给出一个折线图,是本次测试的最佳选择。这是两套平台搭配单GTX570的成绩,性能方面“对等”调校工作到此结束。
效能对比测试
测试配置如下图所示,双GTX570组建SLI,X79下使用两条16×通道,而Z68在SLI下只能以双8×的带宽工作:
X79平台 SLI已开启
Z68 双8× SLI已开启
理论测试3DMark Vantage,Performance:
(44505-44051)/44051≈1.03%
我们看CPU得分几乎是一致的,相差160多分相对于70000多分那几乎是误差,GPU部分得分也是数百分,在3DMark Performance环节中的差距比例换算约为1.03%。
High:
(31943-31438)/31438≈1.61%
在High模式下,也就是较高负载下,差距约为1.61%,在CPU得分和GPU得分之间相比较来说,这个1.61%的差距主要是由GPU的得分造成的。
理论测试Unigine Heaven 2.1 DX10模式,1920*1080 4×AA/16×AF:
(2838-2743)/2743≈3.5%
在Unigine Heaven(天堂)的DX10模式下测试差距较多,达到了3.5%,但是从最小帧来看,两者是没有差距的,反而Z68的双8×稍稍高于双16×。
Unigine Heaven 2.1 DX11模式,1920*1080 4×AA/16×AF:
(1642-1610)/1610≈1.9%
在DX11模式,也就是说在高负载下差距缩小,这和3DMark的趋势相反(3DMark Vantage负载越高差距越大),并且同样是Z68平台最小帧比较高,最高帧则没有X79高,和在DX10模式下的趋势相同,笔者估计在最小帧的情况下,4.5GHz的主频占了优势,而在轻负载下,显卡带宽较高的双16×沾了光。
游戏测试《失落的星球2》,DX11,1920*1080 AA4×/AF16×:
(114-115)/115≈-0.9%
看来游戏方面还是比较依赖CPU的主频,无论是从平均帧数还是折线图的平稳度都是4.5GHz的双8×占优,当然前提是内核和缓存量要足够。
这也就是说如果在主频相差无几的话,双8×足以和双16×相媲美,无论是理论测试还是游戏测试,最高幅度不超过4%,甚至可以宽松的认为这就是误差而已。
GTX570是次顶级的显卡,SLI的效率跟芯片的性能也是有一定关系的,那么是不是低阶的显卡也是这个结果?能无限接近双16×吗?我们用SLI的最低档次GTX550Ti来试验。
效能对比测试2
将显卡还成双GTX550Ti,开启SLI,其他设置和GTX570的保持一致。
理论测试3DMark Vantage,Performance:
(21315-21285)/21285≈0.14%
N卡可以帮助CPU在物理测试方面提高得分,不过相差竟然1000++,好歹这仅仅是CPU部分的得分,而GPU部分,上下相差不到200分,总得分差距0.14%。
3DMark Vantage,High:
(14762-14834)/14834≈-0.5%
在High档下,貌似CPU的主频再一次的成瓶颈,主频略高的Z68平台PCI-E链路并没有成为绊脚石,反而小超0.5%。
通过和当时游戏以及天堂最小帧的综合差别,CPU主频是影响整个系统性能的关键性因素。
理论测试Unigine Heaven 2.1 DX10模式,1920*1080 4×AA/16×AF:
(1461-1450)/1450≈0.8%
天堂对GPU要求比较高,其实就是显卡专业测试软件,那么得分以及最小帧和最高帧差别都非常的小,DX10模式下综合幅度在0.8%左右。
Unigine Heaven 2.1 DX11模式,1920*1080 4×AA/16×AF:
(767-764)/764≈0.4%
在DX11下,由于测试环节非常苛刻,差距缩的幅度比较大,几乎可以说是一样的,差距在0.4%左右。
游戏测试《失落的星球2》,DX11,1920*1080 AA4×/AF16×:
(48.3-49.5)/49.5≈-1.6%
这个差距和双GTX570的情况是一样的,都是主频高的领先,双8×并不是瓶颈,从这线图上看,Core i7 2600K的帧数跨度比较大,但是高于49.5帧那根红线的帧数就高的多,低就低的多,典型的高主频拔高现象。
不必追求高端平台
从测试中看的出来,我们对目前的显卡能否在双8×下发挥100%功力的担心稍显多余,无论是高端显卡还是在低端显卡,无论是在理论测试,还是在游戏测试中,差距均在4%以内,发挥出九五成以上的“功力”是不成问题的,那么不足4%的差距完全可以认定那就是测试误差。
一两帧的帧数不会让你有明显的卡顿感觉,跟显存容量搭配的考虑角度一样,PCI-E的通道都是经过Intel和板卡厂商在实验室阶段都已经测试好的配比设计,发挥目前PCI-E 2.0的显卡是完全不成问题的。
技嘉Sniper 2通过PCI-E 3.0带宽分配芯片已经实现
我们不管SNB是处于何种原因致使目前大多数的主板还是以PCI-E 2.0的带宽工作,至少目前通过一个带宽分配芯片可以利用单刀双掷原理来将带宽等效为PCI-E 3.0的标准,当然不管是PCI-E 2.0还是PCI-E 3.0,这不是用户现阶段关心的东西。
这篇探讨性的文章除了和网友进行探讨之外,还能让这些网友受益:想用双路显卡获得最佳性能的,盲目追求双16×而进行没必要的升级的。
目前的主板,够用。
网友评论