真的不需要独显了么?
HD7970上市之后便夺回了单芯卡皇的宝座,借助全新的PCI-E 3.0接口也顺便把自己的身价提了再提,主板厂商也可以借机将自己所谓的PCI-E 3.0主板炒一把。全新的PCI-E 3.0在引脚定义,电能供应方面没有变化,带宽相比PCI-E 2.0翻了一番,双向带宽达到了32GB/S,应承显卡带宽高速发展之势。
我们之前分别从另外两个角度剖析目前PCI-E 2.0是否山穷水尽:《揭真相:新型显卡插槽效率能有多高?》一文中论证了外部芯片实现的“PCI-E 3.0 8×”是否等效PCI-E 2.0 16×;《揭真相:Z68能发挥双显卡几成功力?》一文中则探讨了PCI-E 2.0 8×是否能满足多卡系统的需求。现在真PCI-E 3.0的卡出来了,它的带宽需求真的只能由PCI-E 3.0来满足么?
我们通过显存带宽就可以感受的到GPU日新月异的吞吐需求,外部带宽即与CPU通信的PCI-E总线却已经在2.0的标准上停留了好多年,无论是单芯还是双芯的卡皇,PCI-E 2.0的带宽对所有基于PCI-E 2.0接口的显卡来说还绰绰有余。这一点我们之前的对比测试也验证过。现在HD7970的问世带来了3个第一:第一款28NM制程,第一款DX11.1,第一款基于PCI-E 3.0的显卡。
28NM的制程我们毋庸置疑,从理论性能反推出运算单元的规模是比上代要多很多,再从晶圆面积和空前强悍的工作主频证明28NM所言不虚。但DX11.1的API目前尚无法验证,因为即便是最新版本的Windows 7 SP1也没有提供该支持。那么我们就来验证一下新接口能否让HD7970跑的更快吧。
我们上文已经提到,按照PCI-E 3.0标准的定义,提供75W以上的电能支持,双向带宽达到32GB/S,比上代高出整整一倍,也就是说PCI-E 3.0 8×的带宽就等效于2.0的16×。如果HD7970的外部带宽需求远大于16GB/S,那么PCI-E 2.0很显然已经制约了它的性能发挥,在基于PCI-E 3.0接口的主板上肯定要优于PCI-E 2.0接口的主板。之前苦于理论阶段的难题终于可以解决了,因为如今基于PCI-E 3.0的显卡和主板都具备了。PCI-E 3.0快多少?两主板拷问HD7970。
测试思路已经平台介绍
在测试之前,笔者也不确定答案:倘若HD7970在PCI-E 3.0主板上性能较2.0有明显的提升的话,那么可以断定南方群岛和开普勒的中高端以上的显卡都要使用最新的接口以确保性能的绝对发挥,如果在两种接口上的性能表现尤为接近,证明PCI-E 2.0仍然可以满足目前显卡的外部吞吐量,或者是目前的PCI-E 3.0主板仅仅是噱头(目前有部分主板是通过外部芯片动态分配带宽来实现)。
技嘉的G1 Killer Assassin2和华硕的P9X79 Pro都是基于Intel X79芯片组的主板,均支持目前最顶级的Core i7 3960X处理器,不同的是前者支持PCI-E 3.0接口,而后者仍为2.0。
技嘉G1 Assassin2主板
该主板在PCI-E 接口分配方面是16×+8×+16×设定,基于PCI-E 3.0设计,X79为旗舰级芯片组,因此PCI-E通道比较充足,不需要通过外部芯片来实行带宽调配。
华硕P9X79 Pro
华硕这款主板给了4条PCI-E 16×形态的插槽支持,当然上图这三个槽的默认分配仍然是16×+8×+16×。
测试平台
对于显卡的测试我们一贯是选用最为强大的周边设备以保证避免瓶颈的发生,为了防止出现带宽动态调拨的情况,还加入了3路CrossfireX的测试成绩。
处理器选用Core i7 3960X,频率设定为4GHz,既然不会出现瓶颈,性能又不会高到离谱的失去参考意义。为了发挥处理器的最大性能,内存搭配方面使用了四通道共8GB金士顿骇客神条,运行在1600MHz CL9,操作系统使用Windows 7旗舰版64位,催化剂驱动使用Catalyst 11.12。测试项目为纯理论测试——3DMark Vantage/3DMark11。
3DMarkVantage测试对比
3DMARK Vantage是专为Windows Vista DX10环境下开发的3D性能测试软件,分为高、中、低三种测试级别,对显卡的计算能力要求和显卡性能在得分中所占的比重也依次递减,通常以中档Performance设定为通用衡量标准。
测试参数设定:
3DMARK Vantage有一项PhysX测试基于NVIDIA物理加速技术设计,拥有CUDA架构的NVIDIA显卡可以借助庞大的并行计算内核帮助CPU大幅度提高这项测试的得分,而使用AMD显卡时则只能依靠效率不佳的CPU计算。参测显卡使用Performance和High模式各测试一遍,驱动中AA/AF选为应用程序控制。
3DMark Vantage Performance
3DMark Vantage High
在Performance/High这两个典型档的设定的测试下,两者成绩无限接近,但技嘉的3.0主板还是稍稍的领先1%左右,尤其是GPU子项的得分。
我们看看三路交火的性能表现:
3DMarkVantage Performance (3Way CrossfireX)
3DMarkVantage High (3Way CrossfireX)
在三路交火中,P档55000多分以及H档也接近5万的成绩可以说非常强大,但这对于交火的效率来说不算太佳,相对单路还不足200%,驱动还有待于完善和改进。
在这四项成绩中,只有三路交火中,High测试环节是PCI-E 2.0领先,其他均是技嘉的Assassin2.0领先,无论是GPU得分还是综合得分,看来HD7970的吞吐需求还没有苛刻到如此程度。
3DMark11测试对比
2010年的最后一个月,Futuremark的大作3DMark 11终于发布,这也堪称2010年Benchmark方面最重磅的炸弹了。作为业内公认的专业图形性能测试工具,3DMark 11会在最短时间内进入所有硬件网站的测试标准,成为衡量市面上所有显卡和PC平台的标准型测试项目——从3DMark 99到3DMark Vantage十多年的时间里3DMark系列都是如此成为图形测试的标准。
Futuremark总是在版本号的前一年推出新软件,这次也不例外,3DMark 11在09年底就诞生了,不过巧合的是,它的版本号应该还有另一层含义——基于DirectX11接口的基准测试软件。
测试参数设定:
运行Performance和Extreme两项测试,分别检验显卡在高低不同负载下的DX11渲染能力。显卡驱动中将AA和AF设定为应用程序控制,分辨率使用测试项目默认设定。
3DMark 11 Performance
HD7970加强了DX11方面的性能,尤其是在曲面细分等特效,3DMark 11的测试中取得了空前优异的成绩,P档接近1万分,两套平台的得分分别是9484/9540。PCI-E 3.0的技嘉Assassin2主板又有不到1%的领先幅度。
3DMark 11 Extreme
Assassin2稍稍领先。
3DMark 11 Performance (3Ways CrossfireX)
在三路交火的测试中,驱动的效率还算可观,达到了近240%的水准,看来在3DMark Vantage的交火测试中多路表现不佳的原因应该是出在4D架构擅长DX11而不擅长DX10/9。PCI-E 3.0又有不足1%的性能领先。
3DMark 11 Extreme (3Ways CrossfireX)
Extreme档对于显卡的测试是极其苛刻的,因此两者仅仅差6分,按照比例来说不足0.07%,可以看作是误差。结合3DMark Vantage交火系统的High档成绩来说,越苛刻的测试成绩悬殊越小,瓶颈完全出在GPU的计算能力上,而PCI-E带宽稍显次要。
总结:
本以为PCI-E 3.0的接口能让PCI-E 3.0的显卡表现更加出色,但是从测试成绩上来看3.0并没有比2.0有太出彩的地方,至少以目前HD7970的带宽需求来衡量,PCI-E 2.0仍然存在相当富裕的带宽。
从未来的CPU硬件参数来看,PCI-E 3.0在支持之列,PCI-E 3.0的确能在减半的通道下提供与2.0相同的带宽,其意义不单单是让未来更加迅猛的显卡跑的更快,而且还可以让非旗舰级芯片组(例如未来的Z77)也能享受多路显卡的高速组合,20条PCI-E 3.0的通道可以设计成8×+4×+8×的方案,性能等效PCI-E 2.0的16×+8×+16×,包括未来的SSD等设备都可以享用高速通道。
技嘉Assassin2的确在绝大多数测试中凸显了PCI-E 3.0的带宽优势,即便这个优势微乎其微,但想要体验PCI-E 3.0全新的性能还需等待双芯旗舰级显卡甚至下一代。
网友评论