新架构石破天惊 HD6900系列显卡首测

PChome | 编辑: 马振华 2010-12-17 07:00:00原创 返回原文

令人不解 HD6000为何特立独行

回顾AMD显卡发展史,HD6000系列是特例独行的。就在两个月前,我们迎来了这个系列首发的两款产品——HD6870和HD6850,与以往不同的是,它们却不是旗舰定位。随后我们了解到,在HD6000系列中AMD没有按照之前的习惯将高端和旗舰系列命名为“HDX8XX”,而是把此称号给了以上两款主间于中端和高端之间的型号。真正的高端和旗舰以“9”来分级,即HD6900系列,今天,它终于登台亮相了。

和6800系列一样,HD6900系列首发的产品中也包括两种型号:HD6970和HD6950。注意,HD6900名称的定义和HD5900不同,前者是单核显卡,后者是由双核组成内部交火的最高性能代表。

● AMD弃旧迎新,HD6900宣告R600时代结束

在先前了解HD6800之后,人们理所当然地会对HD6900的性能配置做出这样的猜测:“流处理器加倍”,然而事实却令人震惊,它的GPU竟然是新的架构。如果说HD6800是在HD5000的基础上做了小幅改进,那么HD6900则可以称为“全新”,因为就连流处理器内部的工作模式都改变了。

这宣告了在2007年由R600奠基并历经四代产品的工作模式正式终结。是什么促使AMD做出如此决定?除此之外HD6900还有哪些变化?本文都将予以一一解析。

每当新显卡发布,参数配置表往往是读者想在第一时间看到的,资深的玩家或许已从中看出蹊跷。同为单核旗舰型号,HD6970的核心面积和晶体管数目都比HD5870大,但逻辑流处理器数量却减少了。另外SIMD流处理器结构中少了“1D”又作何解释?要通透了解这一切,恐怕得翻翻旧黄历,从R600开始说起。

欲了解HD6900 先翻R600的旧黄历

● 2007年R600奠定了AMD图形技术大方向

在2007年以前的图形架构中,处理器分为顶点着色器和像素渲染器两个不同功能的部分,前者负责形成几何框架,后者则填充图像。但很多时候两者之间的负载并不平衡,经常出现一方任务繁重,而另一方较多闲置的情况,不能充分利用GPU的计算资源。若要用原有模式满足未来游戏的需求,就必须把两个部分都设计的非常庞大,这显然不是可取之计。整个业界都意识到老架构已穷途末路,未来的3D应用需要新的工作模式。

AMD和NVIDIA不约而同地认为新的GPU必须拥有一种新的处理器,它的数量足够多,即能充当顶点着色器,又能做像素渲染,这样在图形计算的各个环节都能最大利用核心资源。于是在这个理念的引导下,AMD开发出它的首款统一渲染核心——R600,而NVIDIA则推出了G80。R600和G80虽然都采用统一渲染设计,但具体的工作模式却有别,这使两者的方案从此走上不同的道路。

● AMD的单指令多数据流技术(SIMD)

AMD与NVIDIA最大的区别就是前者采用传统的矢量运算单元,而后者采用创新的标量运算单元,这也是当年业界和硬件发烧友们争论的焦点。

 

 

 

所谓标量(Scalar)运算单元(ALU),是相对于早期图形芯片采用的矢量(Vector)运算单元而言。我们知道,在3D图形处理中,顶点(Vertex)一般是由xyzw四个坐标生成多边形,一共是四个通道;像素是由R.G.B(红黄蓝)三原色构成,加上他们共有的信息说明(Alpha),一共也是四个通道;处理3D图形其实就是改变R.G.B.Axyzw的数值。在一个时钟周期内,运算单元进行一次这种变量操作,就被称做1D标量操作。为了一次性处理一个像素渲染或几何转换,大多数图形芯片运算单元都被设计为一个时钟周期并行执行41D运算,即4D矢量运算单元。所以这种运算的指令发射端只有一个,但却可以同时运算四个通道的数据,这就是SIMD(单指令多数据流)。

AMD之所以将R600设计成SIMD结构,是因为它早在像素和顶点着色仍各自独立时便为顶点着色器选择了VILW5设计。它能同时处理四个矢量(W、X、Y、Z)和一个标量分量,AMD认为它是顶点着色器的最佳方案,这便是后来统一渲染所用1D+4D SIMD架构的雏形。

1D+4D不再适用 VILW4架构应运而生

● VILW5规模大但不利于通用计算—代表产品:RV870(HD5000)

VLIW中文名全称是“超长指令字(Very long instruction word)”,代表一种可以利用指令级并行优势的计算体系结构。如AMD从HD2000系列一直到HD6800所用的1D+4D SIMD架构便称为VILW5。在通用计算GPGPU普及之前,这种从传统架构中提取出的设计适应的很好,尤其是在DX9顶点着色中。

但是这种核心架构非常依赖于指令级并行计算,最理想的情况就是5个指令能在每个时钟周期里,每个ALU上一起调度执行。遗憾的是在DX10/DX11下这种概率非常低,计算指令并不总是4D的,也有很多1D、2D、3D的情况,一旦4D矢量单元收到了这类较短的指令,流处理器单元便只能发挥一部分能力,其余部分成为浪费。由于计算指令最终是由驱动程序中的编译器发出,所以VILW5模式同时也增加了驱动编写的难度,它必须尽可能3D程序中那些较短的指令重新编排打包,以提高流处理器资源的利用率。

GPGPU通用计算现在已经开始大行其道,Windows 7、DX10/11也正在将DX9挤下历史舞台。根据AMD的内部数据,VLIW5架构的五个处理槽中平均只能用到3.4个,也就是在游戏里会有一个半浪费了。显然,DX9下非常理想的VLIW5设计已经过时,必须缩短流处理器单元,重新设计里边的逻辑流处理器布局。

● VILW4提高了SIMD效率,适应未来需求—代表产品:Cayman(HD6900)

VLIW4相比于VLIW5最明显的区别就是去掉了体积最大、可同时处理普通整数/浮点操作和超越操作的第五个逻辑流处理器:特殊功能T单元(SFU)。这样每个流处理器单元中可以一次性处理的普通整数/浮点操作数从五个减少到四个,原本SPU负责的指令(如超越指令)可由其中三个流处理器合并起来代替。

现在四个流处理器性质相同,编译器不需要考虑它们和T的差别,使资源调度更加简单,转化为更高的效率。

VLIW5变为VILW4的好处还不止于流处理器单元内部,从宏观角度上看,此前用于T单元的核心面积可以用于设置更多的SIMD引擎。HD5800的R870有320个流处理器单元,而HD6900的Cayman增加到了384个,核心面积只提高了59mm²,晶体管数量为26.4亿,随之可并行执行的线程数量、纹理单元数量等都相应提高。

不过鱼和熊掌不可兼得,一种架构基本只能为一个时期的3D应用形式做最优设计,VILW4的转变难免不会有损失。HD6900将不会像以前那么高效地处理以VILW5指令为主的游戏,但这种游戏大多数基于DX9环境,运行速度的绝对值已经相当高了,即便帧率下降一点也丝毫不影响游戏体验。另外,因VILW缩短,驱动程序编译器必须也跟着转变,AMD还将面临一个逐渐熟练的过程。但这同时也意味着随着驱动的更新,HD6900的性能将来还可能有明显的提升。

图形引擎加倍 曲面细分大幅升级

微软在去年七月发布了最新的应用程序接口DirectX11,相对DX10而言主要改进在提供ShaderModel5.0,加入对MSAA的直接采样控制。大幅改进多线程性能,设置三个独立接口。进一步提高了纹理压缩,曲面细分的性能。其中大幅度提高的曲面细分性能可使DX11游戏的几何图形更接近现实中的逻辑,创造出前所未有的逼真效果。NVIDIA和AMD都早早开始研发支持DX11的下一代GPU。

● HD5000的DX11设计仓促,曲面细分性能不足

AMD针对DX11的设计思路使它注定先于NVIDIA完成开发工作,全球第一款支持DX11的GPU RV870采用40nm工艺制造,整合了21.5亿晶体管,芯片面积330mm²。RV870的架构设计基本还是沿用RV770的老路子,流处理器数量增加了一倍,并在图形指令调度引擎中加入了一个Tessellator,提供曲面细分操作。

相比较后来NVIDIA为每一个流处理器群配置Tessellator的做法,HD5000的曲面性能太单薄了。由于DX11尚处于起步阶段,游戏中的曲面细分应用量还很少,HD5000在实际应用中还没有体现出过于明显的劣势,但在如UnigineHeaven这样的专项测试中,相比竞争对手AMD确实捉襟见肘。

DX11技术在游戏中普及只是时间问题,AMD不会意识不到问题的严重性,于是我们在HD6800的Barts核心中看到了初步的改进。

结果证明HD6800的曲面细分性能确实有明显进步,定位于中高端的HD6870在多项DX11测试中性能优于上代单核旗舰HD5870。然而这点提升用于对抗在DX11方面近乎疯狂的NVIDIA还是不够,所以HD6900系列做了进一步改良。

● 如同细胞分裂 HD6900的图形引擎规模完整翻倍

总管从RV770到现在的Cayman,AMD内核的整套系统就如同细胞分裂的过程一样在变化。先是HD5870的着色器引擎变为两个,接着HD6870的超线程指派处理器变成两个。现在到了HD6970,负责为几何生成、像素着色调度资源的图形引擎也变成了两个,并且每个管辖一个着色器引擎,形成了一套对称的体系。

在这个变化中,最重大的升级是负责曲面细分的Tessellator和顶点汇编、几何汇编的数量增加一倍,同时光栅器发送到Z坐标分级的背面像素能两倍的速度剔除,这些使HD6970的曲面细分性能理论上达到HD5870的三倍。

尽管DX11游戏中的曲面细分含量在不断增加,可要达到如同专项测试中那样密集的程度近一两年内还不会出现。AMD认为在核心内安置过多的曲面细分器只会使架构变得臃肿,徒增功耗和发热,而实际应用中起不到明显作用。因此无论HD6970的曲面细分性能比NVIDIA如何,AMD暂时不削做这种竞争。

改良抗锯齿功能 赋予用户多样选择

● HD6900改良了抗锯齿功能,赋予用户多样选择

AMD特有的EQAA技术是指在每个像素中提取的色彩样本数量不变,但提供多一倍的覆盖样本。也就是说之储存较大样本,但在渲染过程中使用所有样本地点,这样来提高一个既定覆盖区域的质量。这样做的目的是在尽可能减少性能降低的基础上提高抗锯齿效果,为用户提供了一些更折中的抗锯齿选择。

在HD6800系列中就加入的形态抗锯齿技术,HD6900当然也会有。这是一种新型抗锯齿模式,与MSAA不同的是,它使用着色器来操作以提高图像质量,而不是ROPs,属于后处理操作。

在上一代产品中,AMD已经改进了抗锯齿的“解析”过程,将多重采样降低到最终像素。事实上,边缘侦测抗锯齿使用片段信息和内容来自适应这样做减少的工作。 现在形态抗锯齿则更加简单。它只是着眼于整体的内容,并找到边缘,利用后处理来对它们进行抗锯齿处理。

形态的性能损失类似于边缘侦测抗锯齿,但忽略几何边缘,均等地对所有颜色/ Z轴的边缘进行处理。

3D视觉多屏应用 最豪华输出端口配置

跟HD6870一样,HD6970、HD6950的输出端口配置是到目前为止公版显卡中最齐全、最豪华的,它共有五个输出端口,分别为两个MiniDP、表尊HDMI、两个DVI。每个输出端口均有独立的信号输出,组建多屏幕自由方便,方式的选择面极其宽。

同工一个MST HUB,就可以只依靠两个DP端口组建6屏幕合并,当然你也可以换用其它的组合方法。

与NVIDIA不同,AMD的3D视觉技术并没有和硬件绑定在一块儿,而是兼容市面上所有通过快门原理的120Hz显示器及3D眼睛,用户完全可以选择自己心仪的产品。

测试方案介绍与测试平台软硬件构成

对AMD HD6900系列的理论介绍刚告一段落,接下来将要进行的性能测试以及与现有旗舰显卡的对比是广大发烧友最为关注的部分,在此之前笔者先对本次测试的重点以及测试方法做一简介。

● 测试和对比将分为四大部分

第一部分:理论性能测试。使用现有的四款公认测试软件,分别针对显卡的DX9.0C、DX10和DX11性能部进行评估。

第二部分:实用性能测试。选取12款现今主流的大型3D游戏检测显卡在实际应用中的表现。由于DX11不久之后会成为主流应用程序端口,所以选取的游戏中DX11游戏占了一半左右。又因为DX9.0C游戏对本次参测显卡形成不了压力,帧率绝对值达到一定程度后,显卡之间的差距已经不会对用户产生实质影响,所以除了今年的暴雪神作《星际争霸2》之外没有再加入其它DX9.0C游戏。

第三部分:双HD6970与双HD6950的交火性能测试。本次首测我们的有幸获得著名AIB—“迪兰恒进”提供的两套样品,可以在第一时间让读者领略新架构多核计算的性能。

第四部分:散热与功耗测试。旗舰显卡性能固然强悍,可同时这两项属性也会使人头疼。这部分测试结果将提示有购买意向的人应该如何为迎接它做准备。

● 测试平台软硬件构成如下

● 测试平台的设定状态

本次参测显卡非旗舰即高端,为了使它们充分发挥性能,尽可能体现出之间的真实差距,测试所用的CPU Core i7 980X模拟硬件发烧友的使用状态,被超频至4GHz,内存以三通道运行在DDR3-1600,时序7-7-7-19-1T。

测试平台已准备就绪,下面进入性能实测环节。

DX9.0C基准测试:3DMARK06

● 基于DX9.0C的基准测试:3DMARK06

3DMARK06从发布到今天已超过4年光景,与日新月异的计算机芯片技术不同,3DMARK在推出后很久的一段时间里都可用于对显卡的3D性能做出准确判断,只要是这款3DMARK所基于的图形引擎技术仍在被使用,测试就不会失去意义。如3DMARK06的DX9引擎至今仍被大量新游戏使用。

测试参数设定:

分辨采用程序默认的1280×1024和符合测试所用显示器尺寸的1920×1080。其中1280×1024测试部分在NVIDIA驱动和AMD驱动均将AA/AF设为应用程序控制,3DMARK06默认设定这两项为关闭状态。1920×1080测试开启4×AA和16×AF,用于观察显卡在更高3D负载下性能的变化。

3DMARK06毕竟是多年前的基准测试软件,对现在的显卡而言负载较轻,CPU变成了主要瓶颈,因此默认设定下这些高端显卡比不出明显的差别。换用大分辨率并开启AA/AF之后,差距开始凸现,HD6900系列依然能很出色地进行DX9计算,得分超过NVIDIA旗舰GTX580。

DX10基准测试:3DMARK Vantage

●  基于DX10的基准测试:3DMARK Vantage

3DMARK Vantage是专为Windows Vista DX10环境下开发的3D性能测试软件,分为高、中、低三种测试级别,对显卡的计算能力要求和显卡性能在得分中所占的比重也依次递减,通常以中档Performance设定为通用衡量标准。

测试参数设定:

3DMARK Vantage有一项PhysX测试基于NVIDIA物理加速技术设计,拥有CUDA架构的NVIDIA显卡可以借助庞大的并行计算内核帮助CPU大幅度提高这项测试的得分,而使用AMD显卡时则只能依靠效率不佳的CPU计算。参测显卡使用Performance和High模式各测试一遍,驱动中AA/AF选为应用程序控制。

借助GPU参与PhysX计算的先天优势,NVIDIA在这项测试中占尽便宜。不过在High模式测试中,显卡性能计入总分的比重增加,拥有两颗HD5870核心的HD5970还是力挽狂澜了。

DX11基准测试:3DMARK 11

● 基于DX11的基准测试:3DMARK 11

2010年的最后一个月,Futuremark的大作3DMark 11终于发布,这也堪称2010年Benchmark方面最重磅的炸弹了。作为业内公认的专业图形性能测试工具,3DMark 11会在最短时间内进入所有硬件网站的测试标准,成为衡量市面上所有显卡和PC平台的标准型测试项目——从3DMark 99到3DMark Vantage十多年的时间里3DMark系列都是如此成为图形测试的标准。

Futuremark总是在版本号的前一年推出新软件,这次也不例外,3DMark 11在09年底就诞生了,不过巧合的是,它的版本号应该还有另一层含义——基于DirectX11接口的基准测试软件。

测试参数设定:

运行Performance和Extreme两项测试,分别检验显卡在高低不同负载下的DX11渲染能力。显卡驱动中将AA和AF设定为应用程序控制,分辨率使用测试项目默认设定。

3DMARK每出新一代都要给当时所有显卡一个下马威,原本得分数以万计的显卡现在都无法嚣张了。3DMARK11与之前的3DMARK Vantage的不同之处,除了加入DX11曲面细分之外,还将原来可由NVIDIA CUDA内核加速的PhysX计算收归CPU门下,谁也占不着便宜。这个决定其实对AMD十分有利,于是在Extreme模式中,连HD6850的性能都超过了GTX570。而GTX580虽然强势,可也无法与双核HD5970相提并论。

DX11基准测试:UnigineHeaven2.1

● 基于DX11的基准测试:Unigine Heaven2.1

俄罗斯Unigine公司开发的新款3D性能测试软件,主要针对DirectX11 API设计,同时还兼带DirectX9、DirectX10以及OpenGL3.2.这款测试软件的引擎,在DirectX11模式下可以选择开启或关闭Tessellator(细分曲面技术),这时DX11的重要标志性技术之一,也是DX11相对于以往API的明显提升部分,可使渲染对象拆分得更精细,模型边缘层次感明显,视觉上更加真实。

测试参数设定:

Unigine Heaven2.1的测试运行DX11和DX10两种模式,因为现在和未来一两年内,大型3D游戏将主要基于这两种API设计。测试使用1920×1080分辨率,开启AA/AF,其中DX11模式下的Tessellator(曲面细分)级别设定为Extreme。

疯狂的Fermi架构不惜一切为DX11做出优化,换来UnigineHeaven DX11模式中的绝对优势。而AMD一直秉持DX11够用就好的理念,DX11性能循序渐进地增加。我们可以看到从HD5800到HD6900,Radeon显卡的DX11性能有非常明显的提升。现在在这项测试中,HD6970和GTX570的差距已远不如从前那般悬殊。

DX11游戏测试:《科林麦克雷:尘埃2》

● DX11游戏《科林.麦克雷:尘埃2》测试

《科林.麦克雷:尘埃2》是一款为了纪念去世的英国赛车手科林.麦克雷制作的模拟赛车类游戏,在前作发行了两年之后,这款续作在2009年底正式发布。这款游戏最大的亮点是率先支持DX11引擎,无论是画面质感还是可玩性都大有超过《极品飞车》之势头。

测试参数设定:

所有显卡运行在DX11最高画质设定下,测试使用游戏自带的Benchmark程序,设定1920×1080分辨率,开启AA/AF。

去年与第一款DX11显卡(AMD)同期发布的DX11游戏,据说AMD还参与了这款游戏的开发,不过NVIDIA确实后来者居上,无奈双核的HD5970也被GTX580比了下去,HD6970的性能只能击败GTX470。

DX11游戏测试:《地铁2033》

● DX11游戏《地铁2033》测试

《地铁2033》改编自俄国作家Dmitry Glukhovsky的畅销小说,由乌克兰4A游戏工作室开发,采用4A游戏引擎,而且PC版支持nvidia的PhysX物理特效。 2013年,由于大面积的核泄漏,导致几乎所有的人类都被消灭,而且地面已经被污染无法生存,极少数幸存者存活在莫斯科的深度地下避难所里(俄罗斯的地铁站在建造之初就有防空防炸防核防辐射的设计)人类文明进入了新的黑暗时代。直至2033年,整整一代人出生并在地下成长,他们长期被困在“地铁站”的城市。

测试参数设定:

这款游戏没有自带Benchmark程序,人工测试场景选择第一关从爬梯子开始直到消灭三个怪物后拉铁门结束,使用Fraps软件记录游戏帧率。八款参测显卡运行在DX11最高画质设定下,测试使用1920×1080分辨率,开启AA/AF。

《地铁2033》面前再强的显卡都是笑话,比起这款游戏的画面,更让它出名的是变态的硬件要求。原本NVIDIA在这款游戏中占明显优势,现在时过境迁,HD6900系列在这款游戏上有惊人的性能提升,HD6970性能超过同价位GTX570,而HD6950则逼平NVIDIA上代旗舰GTX480。从中可以看出Cayman架构在支持未来重负载3D游戏上的潜力。

DX11游戏测试:《普利皮亚季的召唤》

● DX11游戏《潜行者:普利皮亚季的召唤》测试

《潜行者:普里皮亚季的召唤》(S.T.A.L.K.E.R.: Call of Pripyat)的故事剧情发生在《切尔诺贝利的阴影》的故事之后,Pripyat是乌克兰的一个城镇名字,是切尔诺贝利事件的隔离区,它是一座被废弃的城市,具体在乌克兰首都基辅以北的区域,民间有“鬼城”之称,现时Pripyat市已经成为了一个旅游景点。显然,新版S.T.A.L.K.E.R.游戏的舞台就在这里搭建。

测试参数设定:

使用游戏自带Benchmark程序,六款显卡运行在DX11最高画质设定下,测试使用1920×1080分辨率,开启AA/AF。《潜行者:普利皮亚季的召唤》Benchmark测试分为白天、黑夜、雨天、光照各种场景,每个场景都会得出各自的测试结果,下面我们在同一个柱状图中对比这四个场景的测试结果。

与AMD上代单核旗舰HD5870相比,HD6970在这款游戏中的进步可用“超大”来形容,帧率竟然超过双核的HD5970,直逼对手旗舰GTX580,而对相同价位的GTX570则胜之不武。HD6950的性能接近GTX480,胜GTX470没有悬念。

DX11游戏测试:《异形大战铁血战士》

● DX11游戏《异形大战铁血战士》测试

《异形大战铁血战士》是一款由Rebellion公司开发的FPS游戏,本作的游戏舞台设定为名叫BG-386的行星,殖民采掘集团在该星球发现了古代金字塔,围绕该金字塔隐藏的巨大秘密异形、铁血战士以及人类3种族再次展开激烈的战斗。游戏的单机游戏模式中玩家可以分别扮演三种种族进行各种族的故事模式,挑战完成种族各自的目的。联机模式中则可以扮演三种族进行对战,扮演不同种族时其视点以及攻击方式都将发生变化。

如果你选择的是海军陆战队,你将体验到前所未有的黑暗幽闭的恐怖,一丝丝光线都会让你激动不已。海军陆战队是人类最后的抵抗阵线,他们被各种尖端装备武装到牙齿。如果你选择的是铁血战士,那么你会以敏捷的身手在高空穿行,从高处伏击你的敌人。尽管铁血战士的装备也非常先进,但都是近战武器,所以你需要与敌人近距离争斗。如果你选择的是宇宙中最致命的物种异形,你最致命的武器就是你捕兽夹一般的嘴和刀刃一般的触手。

测试参数设定:

使用专为这款游戏开发的Benchmark程序,使用Fraps记录游戏帧率,八款显卡运行在DX11最高画质设定下,测试使用1920×1080分辨率,开启AA/AF。

异形大战铁血战士》是较早出现的DX11游戏之一,其中应用的曲面细分含量不太多,所以基本还是考验显卡的传统渲染能力。双核HD5970压阵无人能敌,新角色HD6970力压GTX570,HD6950与GTX480平分秋色。

DX11游戏测试:《失落的星球2》

● DX11游戏 《失落的星球2》测试

《失落的星球 2》承袭前作内容第3人称射击,针对多人连线部分加以强化,并加入4人Co-op连线合作共同对抗巨大异形怪兽“艾克里德(Akrid)”崭新玩法,玩家不只是要正面对抗艾克里德,甚至还要爬上AK小山般的庞大身躯展开攻击。

 游戏采用 CAPCOM 独自研发并进一步强化的“MT-Framework 2.0”游戏引擎,呈现比前作更为细致绚丽的画面,使用该引擎的还有《鬼泣4》和《生化危机5》。

测试参数设定:

所有显卡运行在DX11最高画质设定下,测试使用游戏自带的Benchmark程序,分辨率设定为1920×1080,开启AA/AF。

这款最新推出的DX11优势似乎与AMD显卡的兼容性不好。

DX11游戏测试:《战地:叛逆连队2》

● DX11游戏《战地:叛逆连队2》测试

《战地:叛逆连队2》(Battlefield: Bad Company 2),是EA DICE开发的一款第一人称射击游戏。游戏开发商美国艺电确定2010年3月2日为游戏Xbox 360、PS3、PC版的首发日期。该游戏是EA DICE开发的第9款“战地”系列作品,也是《战地:叛逆连队》的直接续作,在继承前作特性的基础上,强化了多人联机载具对战和团队合作元素的设定。游戏使用加强版的寒霜引擎,加入了建筑物框架破坏和物体分块破坏的支持。

测试参数设定:

这款游戏没有自带Benchmark程序,选择第二关“Cold war”刚开始时长达两分钟的自动过场剧情,使用Fraps软件记录游戏帧率。八款显卡运行在DX11最高画质设定下,测试使用1920×1080分辨率,开启AA/AF。

这款游戏原本是AMD HD5000系列的优势项目,从HD5870和GTX480的对比就可以看出。但是HD6000系列采用VILW4架构或许会对其产生影响,游戏性能提升不是非常明显,以至于被GTX500系列迎头赶上,不过双核HD5970仍戴性能王冠。

DX10.1游戏测试:《鹰击长空》

● DX10.1游戏《汤姆克兰西之鹰击长空》测试

类似经典的《皇牌空战》的座舱式模拟空战游戏,玩家可以驾驶超过50种飞机进行战斗。游戏的背景时间设定在2012年,那时的世界正越来越依赖于私人的军火公司(PMCs)。随着PMCs逐渐强大,世界正走向全球冲突的悬崖。这听起来好像是个足够充分的理由让玩家跳进自己的战斗机去干掉那些坏蛋。

测试参数设定:

使用游戏自带Benchmark程序,八款显卡运行在DX10.1最高画质设定下,测试使用1920×1080分辨率,开启AA/AF。

原来《鹰击长空》一直是AMD显卡的大弱项,再强势的产品到了这里都不堪一击,不过从HD6000系列开始,这个情况开始有了转机。HD6870在这款游戏中的性能就有很大的改观,而HD6900系列的性能更强。HD6970与GTX570已相差不多,而HD6950则完胜GTX470。

DX10.1游戏测试:《孤岛惊魂2》

● DX10.1游戏《孤岛惊魂2》测试

《孤岛惊魂2》的画质和游戏引擎都较前作有了提升,许多不曾有的特效借由DX10.1引擎得以应用,彻底颠覆前作经常为人诟病的“画面偏卡通”特点,带给玩家耳目一新的真实体验。

测试参数设定:

使用游戏自带Benchmark程序,八款显卡运行在DX10.1最高画质设定下,测试使用1920×1080分辨率,开启AA/AF。

AMD和NVIDIA双方的最强代表打成平手,HD6970的帧率比GTX570略少一点。

DX10游戏测试:《孤岛危机》

● DX10游戏《孤岛危机》测试

《孤岛危机》(Crysis)是一款科幻题材的第一人称射击游戏,此游戏由德国游戏开发商Crytek制作开发,在由美国艺电发行,是孤岛危机三部曲的第一部。《孤岛危机》的背景发生在一群外星机器的船舰在地底被发现,玩家扮演三角洲特种部队中暴龙小队的成员──诺曼(Nomad)进行搜索和撤离的任务。这款游戏对硬件配置尤其是显卡的要求极高,发售没几天便获得“硬件杀手”的称号。

测试参数设定:

使用游戏自带Benchmark程序,所有参测显卡运行在DX10最高画质设定下,测试使用1920×1080分辨率,开启AA/AF。

这款游戏中充斥着大量惊喜纹理贴图,以至于对纹理单元和显存带宽要求相当高,NVIDIA由于这方面的短板一直无法撼动AMD的领先地位,HD6970和比它贵1000元的GTX580竟不相伯仲,而GTX570则不敌HD6950。从中似乎能觉察出一个规律,但凡用对硬件要求超高的游戏比拼,AMD的胜算总是更大一些,这或许是它拥有庞大矢量计算阵列所致。NVIDIA的标量处理单元虽然利用率非常高,但这种情况下难免捉襟见肘。

DX10游戏测试:《战锤40K:战争黎明》

● DX10游戏《战锤40K:战争黎明之混沌崛起》测试

《战锤40K:战争黎明2》的独立资料片《混沌崛起(Chaos Rising)》将增加血鸦军团的战役,结合20个任务,等级上限将提升到30级,并且加入新的英雄升级模式。这款游戏将角色扮演与即时策略融合的玩法导入新境界,此次将带领玩家一睹星际战士与混沌星际战士可歌可泣的奋战力量,将通过两者的游戏元素为玩家创造更紧张、刺激的游戏经验。

测试参数设定:

使用游戏自带Benchmark程序,所有参测显卡运行在DX10最高画质设定下,测试使用1920×1080分辨率,开启AA/AF。

通常3D即时战略游戏都会对FPS有封顶,有趣的是性能不同的四款显卡测试结果竟如出一辙,HD5970的双核基本没有发挥作用。总体而言这款游戏还是AMD这一方占优势。

DX10游戏测试:《生化危机5》

● DX10游戏 《生化危机5》测试

《生化危机》,这个不朽的名字几乎任何80年后出生的男孩都知道。早在12年前这款游戏就已存在,并就此开创了AVG(冒险解谜类)游戏的先河。时至今日,《生化危机》系列已推出第五代作品,官方正式登陆PC平台,这次主人公要前往非洲无名小镇完成任务。相比第四代作品,《生化危机5》上的射击类游戏特征似乎更加明显。

测试参数设定:

使用游戏自带Benchmark程序,所有参测显卡运行在DX10最高画质设定下,测试使用1920×1080分辨率,开启AA/AF。

《生化危机5》的情况同《孤岛惊魂2》类似,这款游戏对硬件的要求已不算高,所有参测显卡的帧率都超过了100fps,它们之间的差距带给人感受上的差别微乎其微。

DX9游戏测试:《星际争霸2:自由之翼》

● DX9.0C游戏 《星际争霸2:自由之翼》测试

《星际争霸》是个该载入电脑文化发展史册的绝世之作,它的第一部作品于1998年诞生于美国暴雪娱乐,奠定了“暴雪出品必定精品”格言。可能就连当时的制作者也不曾料到它会成为迄今为止最成功的即时战略游戏,就在这款游戏发售12年后的今天,世界各地仍然在开展这款游戏的比赛,孕育出无数令人敬仰的电竞明星。

游戏界赋予《星际争霸》的评价越高,对其续作《星际争霸2》的压力就越大,暴雪多年积累的口碑让“二代不如一代”变成对它的亵渎。于是竟然时隔12年之久,我们才有幸体验到《星际争霸2》的Beta试玩版,而正式发售日期更是无法预料。这款游戏支持DX10 API,游戏画面发生翻天覆地的变化,再也不是那个“无论多烂配置”都能流畅运行的游戏了。

测试参数设定:

《星际争霸2》没有自带的Benchmark程序,需要通过Fraps测试回放的replay来计算帧数,笔者在replay中选择了一个让显卡负载较高的固定场景和固定时间段用于测试。测试中所有参测显卡运行在“Ultra”画质设定下,分辨率为1920×1080,AA/AF开启。

此前HD5000系列显卡在《星际争霸2》的性能上一马当先,后来方才得知是因为A卡驱动在此游戏中不能正常实现抗锯齿功能。在催化剂驱动更新到10.6版本时,AMD忍着“使帧率下降的痛苦”解决了抗锯齿问题,结果fps一溃千里,NVIDIA就这么“莫名其妙地实现大逆转”。

双卡交火测试 性能提升比例有多少?

● HD6900系列双卡Crossfire测试

在经历了单卡测试对比之后,接着我们使用两片HD6970和两片HD6950做双卡交火测试,检验AMD新一代显卡的多GPU并行计算的利用率,或许还会从中发现额外价值。

下面使用一款基准测试软件和三款大型3D游戏软件对交火系统做检测,它们都有一个共同的特点:支持DX11或重负载。

UnigineHeven不愧是理论测试,交火的得分几乎刚好是单卡的双倍,这也反映出AMD的多卡并联技术确实相当成熟。

《尘埃2》测试中,HD6970双卡比单卡性能提升将近一倍,HD6950比例略低。

在《失落的星球2》中,HD6850交火的性能提升竟然超过了单卡的一倍,笔者猜这八成是与Catalyst A.I.专门针对多核渲染做优化的结果。

《孤岛危机》这个硬件杀手被HD6900双卡彻底征服,提升率也接近一倍。

以上三项实际游戏测试告诉我们,HD6970和HD6950在双卡交火状态下的性能差距不是特备大,后者的总价要比前者便宜1600元左右。

HD6950的官方指导价仅为2200元,而当前正值新品发布,相信经第一轮调价后卖到2000元不是问题,那么双卡的价格便与GTX580的3999元相同,但性能差距之大有目共睹。所以发烧友若追求极致性能,买两片HD6950绝对是比买一片GTX580强得多的选择。

功率控制随心所欲 电源不够仍可用

● 功耗控制随心所欲,电源功率不够仍可使用

HD6900系列显卡具备一项以前没有的功能——PowerTune(功率调节),这个功能在驱动程序的超频控制面板中予以调节。

它的作用是为显卡限制一个最大输出功率,当系统检测到功率就要超过上限时,显卡会自动降低工作频率,将功耗控制在设定范围内。驱动面板内的具体操作方式为增加或减少功耗上限百分比,可以每档1%调节,正负最大调节范围是20%。默认状态为0%,也就是维持默认的功耗上限。

◎ 默认状态的功耗控制会不会影响性能?

以下AMD官方资料显示,在运行Perlin Noise这样的极致像素着色负载时,功耗是会超出默认设定上限的,那么显卡会自动降频,维持规则不被打破。以HD6950为例,只有手动设定将功耗上限提高10%后才能确保始终全速计算Perlin Noise。

但是Perlin Nosie是一种纯理论化的测试,它将所有流处理器用作像素着色,使GPU功耗达到峰值,而这种情况在实际应用中几乎不会出现。

看到这里,相信许多人跟笔者一样非常关心一个问题,那就是默认的功耗上限会不会降低游戏性能?是否必须将上限设到最大值才能确保显卡全速运行游戏?

于是笔者做了以下测试

测试结果说明,在实际3D应用中,只有将功耗上线减小20%后,才显著降低性能,而默认的功耗限制已可以满足几乎所有正常应用了。

AMD在HD6900系列中加入PowerTune可能是借鉴了NVIDIA为GTX580/570设置功耗限制的做法,它能使显卡在一些极端特殊的重负载环境下保持安全工作状态。此外,如果你的电源不够大,那么这项功能也可以让你不被显卡拒之门外。

AMD的方式比NVIDIA灵活,可以人为控制,而后者是定死的。这项功能被置于超频面板中也说明另一个问题:超频必然会使功耗提高,那么别忘了将功率上限设到最大值,这样才能一丝不漏地发挥更高的频率设定。

待机及满载的散热、静音效果测试对比

● HD6900系列散热、静音效果测试对比(待机)

待机状态时,HD6900系列显卡的离心式风扇转速较低,静音效果优秀,同时温度控制的也非常理想。

有趣的是待机时HD6950的风扇转速比HD6970更低一些,所以前者的温度反而比后者更高一些。

● HD6900系列散热、静音效果测试对比(满载)

尽管核心规格有差别,但满载测试时HD6970和6950的温度相同,这可能是由相同的风扇温控阀值造成的。也就是说,HD6950的发热量更小,那么维持88℃只需比HD6970更低的风扇转速,静音效果也会略好。

待机及满载的功耗测试对比

● HD6900系列功耗测试对比(待机)

HD6000整列整体的功耗控制都非常出色,两款分别定位高端和旗舰的显卡待机功耗与中高端的HD6870相同,普遍低于NVIDIA产品。

● HD6900系列功耗测试对比(满载)

使用Furmark施加满负载时,NVIDIA的GTX500显卡由于加入了针对这类测试的功率限制,并且没有手动调节,所以无法真正令其处于满载状态,它们的实际满载功耗一定高于柱状图中显示的数字。而HD6900虽然也加入了功率限制,但是手动控制将上限设至最高时,便不会出现降频现象,应该处于更准确的满载状态。所以6970和6950所测得的功耗是非常理想的。

总结:性能还可优化 HD6900潜力很大

● 总结:用HD6970对付GTX570;HD6950无对手

客观地来说,尽管HD6900系列从里到外都做了改进,但就单核性能而言,NVIDIA仍然领先,这也是GTX580打出3999元价格的原因。但过分追求单核的性能规模也要付出代价,成本功耗都不易控制,是要做双核显卡更难上加难。

AMD采取的是田忌赛马的路线,H6970定价2999元,与GTX570样,用自己的旗舰对付对方的准旗舰,然后在用双核旗舰击败对方的旗舰。只要内核架构符合当今使用环境需求,单位晶体管数的效率够高,AMD凭借更灵活轻便的芯片要做到这一点没有太大难度。

尽管从本次评测的结果上看,HD6970对GTX570还没有明显优势,但别忘了这次AMD使用了全新的4D SMID架构,也就是VILW4,新的编译器还有待完善,日后的驱动更新或许会见分晓。

HD6950,定价2200元,它面前称不上对手的对手GTX480价格高、功耗大,且即将退市,而GTX470的性能不敌,除了尽快推出GTX560之外,NVIDIA没有别的办法与之竞争。

HD6900产品展示:迪兰恒进

● 迪兰恒进(Dataland)HD6970

● 迪兰恒进(Dataland)HD6950

HD6900产品展示:蓝宝石

● 蓝宝石(SAPPHIRE)HD6970

● 蓝宝石(SAPPHIRE)HD6950

HD6900产品展示:微星

● 微星(MSI)HD6970

● 微星(MSI)HD6950

HD6900产品展示:XFX

● XFX HD6970 697A-CNFC 钻石版

HD6900产品展示:盈通

● 盈通 HD6970

 

HD6900产品展示:艾尔莎

● 艾尔莎 HD6950

 

HD6900产品展示:镭风

● 镭风(ColorFire)HD6970

● 镭风(ColorFire)HD6950

HD6900产品展示:华硕

● 华硕(ASUS)HD6970

● 华硕(ASUS)HD6950

返回原文

本文导航

相关阅读

每日精选

点击查看更多

首页 手机 数码相机 笔记本 游戏 DIY硬件 硬件外设 办公中心 数字家电 平板电脑