XXX
有7必有5 AMD新准旗舰显卡HD7950发布
前不久,在2011年12月22日,我们获悉了AMD新一代旗舰HD7900系列显卡发布的消息,只是当时中国地区还未获得评测样品,这距离AMD在2010年12月17日发布上一代旗舰HD6900系列过去了整整一年。
在春节前的1月9日,PCHOME评测室收到了HD7000系列的旗舰型号HD7970并对其进行了首测,这款显卡所用的GPU芯片在原有的HD6000系列的基础上做了多项改进,包括架构组成和工艺制程,晶体管数目也得以增加。最引人著名的成就是在DX11性能方面获得将近40%的提升,扳回原先的不利局面,反超了竞争对手的GTX580,成为当前性能最强的单核心显卡。
有七就有五,这是AMD显卡一向的命名习惯,所以在HD7970发布后不久,我们理所当然地迎来了它的次级型号,面向高端显卡用户的准旗舰HD7950,本文将通过测试为读者展示它的特点和性能。
就如同HD6950和HD6970的关系一样,HD7950与HD7970也是使用相同的GPU芯片,芯片代号都是“Tahiti”,物理规格完全相同,只是因为定位需要,HD7950关闭了一些流处理器单元。
AMD在HD7000系列显卡中引以为豪三大新技术标准:28nm、PCI-E3.0、以及DX11.1同样为HD7950所享有。
HD7950 GPU-Z截图
从以上这份规格对比列表中可以看出,HD7950的大多数规格参数均超过上一代旗舰HD6970,核心频率设定与其齐平。与7970相比也仅仅是逻辑流处理器线程少了一些,其它方面并无削减,由此可以预料到HD7950作为高端产品也将拥有相当不错的性价比。
只少了256个线程 旗舰规格大部分保持
HD7970和HD7950的GPU芯片由同一款“Tahiti”衍生而来,只是两者的流处理器开设情况略有不同,在介绍HD7950的芯片规格之前,先让我们回顾一下在HD7970首测中介绍的“Tahiti”芯片架构模式。
每当显卡行业有新品发布,在芯片架构和计算性能方面的升级进步都是最为人关注的话题,这方面AMD一直以有条不紊的步伐前进,大刀阔斧式的改变是比较罕见的。下面将HD7970芯片架构与上一代HD6970做对比。
从AMD官方给出的架构图来看,各部件的功能和组成结构基本沿用上一代HD6900系列的模式,28nm工艺可以让AMD在相同的DIE面积内整合更多的晶体管,换言之主要变化就是扩大了性能规模。
HD7970 Tahiti芯片架构示意图
就以HD7000系列的旗舰芯片“Tahiti”为例,它共有512个流处理单元,每个单元采用VLIW4的结构,共计2048个逻辑线程,比上一代旗舰HD6970的“Cayman”多出了512个。
HD6970 Cayman芯片架构示意图
这512个流处理单元(非逻辑线程)的排列分布方式与上一代Cayman芯片相同,每16个为一个工作组,每组配备四个纹理单元,这样便有32个工作组,共128个纹理单元。在这次Tahiti芯片上,AMD给这种工作组起了个新的名字:GCN。
但是像素输出端口方面HD7970的Tahiti做出了重大改进,它将ROPs处理器重新编排,不再为每两组ROPs配备独立的L2缓存,而是共同连接到一个共享L2缓存,这样能使缓存利用率得到优化,从某种程度上讲是借鉴了NVIDIA的做法。
此外,共享L2缓存的做法可以使显存接口不必再与ROPs处理器一一对应,于是Tahiti核心整合了12个显存端口,每个端口位宽64bit,总位宽由256bit增加到384bit。单从位宽数据上已与NVIDIA的Fermi架构平起平坐了,不过AMD显存控制器可以使GDDR5显存运行在更高的频率上,就显存理论性能而言,或许竞争对手暂时只能望尘莫及。
● HD7950只是关闭了少量流处理器单元,其它芯片组件并无变化
HD7950 Tahiti芯片架构示意图
HD7950的Tahiti芯片只是关闭其中一组四个GCN,削减了64个流处理器单元,计256个逻辑线程,以及所属的16个纹理单元。这样HD7950共有448个流处理器单元,共1792个逻辑线程,其它方面规格则与HD7970完全相同,仍有32个ROPs和384bit的显存位宽,充分保证了流处理器的性能发挥。
关于Tahiti架构是如何从Cayman架构衍生出来,所采用的4D SIMD矢量架构和4D+1D SIMD矢量架构的渊源等问题,可查阅1月9日笔者撰写的《AMD HD7970首测》文章,这里不再重复描述。
选择多样性个性化 HD7950不设公版
与HD7970不同,AMD在HD7950的板型的设计制造方面并没有设立公版方案让厂商遵照,而是直接提供GPU芯片让各个合作伙伴自行设计非公版产品,这样有利于成本的控制和个性化的突出,不同品牌之间的多样性也为消费者提供了更多选择空间。下面以专业设计制造AMD显卡的著名品牌迪兰为例。
这款HD7950具有典型的非公版设计特征,采用开放式直吹散热器,两枚9cm直径风扇配合大尺寸热管鳍片,能做到在较低的转速下维持足够的散热性能,获得静音效果。这是公版封闭式离心散热器通常不具备的优点,不过开放式散热会将热量排放在机箱内,对机箱环境温度影响较大,可谓互有利弊。
迪兰在HD7950上一改原有的板型设计风格,PCB从一层不变的红色为高端非公版显卡中最常见亚光黑,似乎它也觉得这样的设计更能体现出高端显卡产品的质量感。
PCB板的长度为27厘米左右,与HD7970公版PCB的长度相仿。PCB板上共有12颗GDDR5显存芯片,每两颗对应一个64bit显存接口,形成384bit总位宽。供电设计规格与HD7970甚至上一代HD6970没有什么变化:6相位数字模拟GPU供电和单相显存供电。
采用28nm蚀刻工艺制造的Tahiti芯片上设有精巧的防护盖,既能保证芯片DIE与散热器直接充分接触,也能保护其不易受到压损。与HD7970一样,这次在芯片封装上没有出现任何标记。
显存芯片采用海力士0.4ns GDDR5颗粒,单颗容量256MB,总容量3GB,与HD7970相同。
关于HD7950的介绍到此告一段落,下面让咱们速度进入测试环节,为读者揭晓他们迫不及待想知道的性能情况。
测试方案和测试平台软硬件配置介绍
下面我们直入主题,进入对HD7950的上机实测环节。在测试中我们需要着重观察HD7950与旗舰HD7970的性能差别;与其上一代对应产品HD6950相比的性能提升;以及与竞争对手目前对应产品GTX570的性能差别。同时还需关注HD7950在运行不同类型、不同引擎的游戏时性能较以往的变化情况。
需要说明的是,尽管HD7950支持Intel提出的PCI-E3.0标准,但目前Intel官方宣布支持PCI-E3.0的艾薇桥架构处理尚未问世,那么关于新的接口标准能否进一步发挥显卡性能的测试选题,我们将在不久以后进行,本次评测仍使用PCI-E2.0标准的X58主板。
● 测试平台软硬件配置列表
● 测试平台的设定状态
本次参测显卡非旗舰即高端,为了使它们充分发挥性能,尽可能体现出之间的真实差距,测试所用的CPU Core i7 980X模拟硬件发烧友的使用状态,被超频至4GHz,内存以三通道运行在DDR3-1600,时序7-7-7-19-1T。
DX10基准测试:3DMARK Vantage
● 基于DX10的基准测试:3DMARK Vantage
3DMARK Vantage是专为Windows Vista DX10环境下开发的3D性能测试软件,分为高、中、低三种测试级别,对显卡的计算能力要求和显卡性能在得分中所占的比重也依次递减,通常以中档Performance设定为通用衡量标准。
测试参数设定:
3DMARK Vantage有一项PhysX测试基于NVIDIA物理加速技术设计,拥有CUDA架构的NVIDIA显卡可以借助庞大的并行计算内核帮助CPU大幅度提高这项测试的得分,而使用AMD显卡时则只能依靠效率不佳的CPU计算。参测显卡使用Performance和High模式各测试一遍,驱动中AA/AF选为应用程序控制。
DX11基准测试:3DMARK 11
● 基于DX11的基准测试:3DMARK 11
2010年的最后一个月,Futuremark的大作3DMark 11终于发布,这也堪称2010年Benchmark方面最重磅的炸弹了。作为业内公认的专业图形性能测试工具,3DMark 11会在最短时间内进入所有硬件网站的测试标准,成为衡量市面上所有显卡和PC平台的标准型测试项目——从3DMark 99到3DMark Vantage十多年的时间里3DMark系列都是如此成为图形测试的标准。
Futuremark总是在版本号的前一年推出新软件,这次也不例外,3DMark 11在09年底就诞生了,不过巧合的是,它的版本号应该还有另一层含义——基于DirectX11接口的基准测试软件。
测试参数设定:
运行Performance和Extreme两项测试,分别检验显卡在高低不同负载下的DX11渲染能力。显卡驱动中将AA和AF设定为应用程序控制,分辨率使用测试项目默认设定。
DX10基准测试:Unigine Heaven2.1
● 基于DX11的基准测试:Unigine Heaven2.1
俄罗斯Unigine公司开发的新款3D性能测试软件,主要针对DirectX11 API设计,同时还兼带DirectX9、DirectX10以及OpenGL3.2.这款测试软件的引擎,在DirectX11模式下可以选择开启或关闭Tessellator(细分曲面技术),这时DX11的重要标志性技术之一,也是DX11相对于以往API的明显提升部分,可使渲染对象拆分得更精细,模型边缘层次感明显,视觉上更加真实。
测试参数设定:
Unigine Heaven2.1的测试运行DX11和DX10两种模式,因为现在和未来一两年内,大型3D游戏将主要基于这两种API设计。测试使用1920×1080分辨率,开启AA/AF,其中DX11模式下的Tessellator(曲面细分)级别设定为Extreme。
DX11游戏测试:《科林麦克雷:尘埃2》
● DX11游戏《科林.麦克雷:尘埃2》测试
《科林.麦克雷:尘埃2》是一款为了纪念去世的英国赛车手科林.麦克雷制作的模拟赛车类游戏,在前作发行了两年之后,这款续作在2009年底正式发布。这款游戏最大的亮点是率先支持DX11引擎,无论是画面质感还是可玩性都大有超过《极品飞车》之势头。
测试参数设定:
所有显卡运行在DX11最高画质设定下,测试使用游戏自带的Benchmark程序,设定1920×1080分辨率,开启AA/AF。
DX11游戏测试:《地铁2033》
● DX11游戏《地铁2033》测试
《地铁2033》改编自俄国作家Dmitry Glukhovsky的畅销小说,由乌克兰4A游戏工作室开发,采用4A游戏引擎,而且PC版支持nvidia的PhysX物理特效。 2013年,由于大面积的核泄漏,导致几乎所有的人类都被消灭,而且地面已经被污染无法生存,极少数幸存者存活在莫斯科的深度地下避难所里(俄罗斯的地铁站在建造之初就有防空防炸防核防辐射的设计)人类文明进入了新的黑暗时代。直至2033年,整整一代人出生并在地下成长,他们长期被困在“地铁站”的城市。
测试参数设定:
这款游戏没有自带Benchmark程序,人工测试场景选择第一关从爬梯子开始直到消灭三个怪物后拉铁门结束,使用Fraps软件记录游戏帧率。八款参测显卡运行在DX11最高画质设定下,测试使用1920×1080分辨率,开启AA/AF。
DX11游戏测试:《异形大战铁血战士》
● DX11游戏《异形大战铁血战士》测试
《异形大战铁血战士》是一款由Rebellion公司开发的FPS游戏,本作的游戏舞台设定为名叫BG-386的行星,殖民采掘集团在该星球发现了古代金字塔,围绕该金字塔隐藏的巨大秘密异形、铁血战士以及人类3种族再次展开激烈的战斗。游戏的单机游戏模式中玩家可以分别扮演三种种族进行各种族的故事模式,挑战完成种族各自的目的。联机模式中则可以扮演三种族进行对战,扮演不同种族时其视点以及攻击方式都将发生变化。
如果你选择的是海军陆战队,你将体验到前所未有的黑暗幽闭的恐怖,一丝丝光线都会让你激动不已。海军陆战队是人类最后的抵抗阵线,他们被各种尖端装备武装到牙齿。如果你选择的是铁血战士,那么你会以敏捷的身手在高空穿行,从高处伏击你的敌人。尽管铁血战士的装备也非常先进,但都是近战武器,所以你需要与敌人近距离争斗。如果你选择的是宇宙中最致命的物种异形,你最致命的武器就是你捕兽夹一般的嘴和刀刃一般的触手。
测试参数设定:
使用专为这款游戏开发的Benchmark程序,使用Fraps记录游戏帧率,八款显卡运行在DX11最高画质设定下,测试使用1920×1080分辨率,开启AA/AF。
DX11游戏测试:《失落的星球2》
● DX11游戏 《失落的星球2》测试
《失落的星球 2》承袭前作内容第3人称射击,针对多人连线部分加以强化,并加入4人Co-op连线合作共同对抗巨大异形怪兽“艾克里德(Akrid)”崭新玩法,玩家不只是要正面对抗艾克里德,甚至还要爬上AK小山般的庞大身躯展开攻击。
游戏采用 CAPCOM 独自研发并进一步强化的“MT-Framework 2.0”游戏引擎,呈现比前作更为细致绚丽的画面,使用该引擎的还有《鬼泣4》和《生化危机5》。
测试参数设定:
所有显卡运行在DX11最高画质设定下,测试使用游戏自带的Benchmark程序,分辨率设定为1920×1080,开启AA/AF。
DX11游戏测试:《鹰击长空2》
● DX11游戏 《汤姆克兰西之鹰击长空2》测试
由育碧布加勒斯特开发的《汤姆克兰西之鹰击长空2》在2010年9月面市,新作中玩家将扮演精英飞行员,驾驶世界上最先进的飞机,担任一系列的战斗任务。
《鹰击长空2》新增了许多新特性和玩法,包括自控起降、无人侦察机、4人合作等,另外在画面特效上也有很大的改善,尤其在地貌效果上采用最新的DX11技术,来自GeoEye的商业级高分辨率卫星地图能确保游戏营造出令人震撼的逼真程度
测试参数设定:
使用游戏自带Benchmark程序,六款显卡运行在DX11最高画质设定下,测试使用1920×1080分辨率,开启AA/AF。
DX11游戏测试:《战地:叛逆连队2》
● DX11游戏《战地:叛逆连队2》测试
《战地:叛逆连队2》(Battlefield: Bad Company 2),是EA DICE开发的一款第一人称射击游戏。游戏开发商美国艺电确定2010年3月2日为游戏Xbox 360、PS3、PC版的首发日期。该游戏是EA DICE开发的第9款“战地”系列作品,也是《战地:叛逆连队》的直接续作,在继承前作特性的基础上,强化了多人联机载具对战和团队合作元素的设定。游戏使用加强版的寒霜引擎,加入了建筑物框架破坏和物体分块破坏的支持。
测试参数设定:
这款游戏没有自带Benchmark程序,选择第二关“Cold war”刚开始时长达两分钟的自动过场剧情,使用Fraps软件记录游戏帧率。八款显卡运行在DX11最高画质设定下,测试使用1920×1080分辨率,开启AA/AF。
DX10.1游戏测试:《孤岛惊魂2》
● DX10.1游戏《孤岛惊魂2》测试
《孤岛惊魂2》的画质和游戏引擎都较前作有了提升,许多不曾有的特效借由DX10.1引擎得以应用,彻底颠覆前作经常为人诟病的“画面偏卡通”特点,带给玩家耳目一新的真实体验。
测试参数设定:
使用游戏自带Benchmark程序,八款显卡运行在DX10.1最高画质设定下,测试使用1920×1080分辨率,开启AA/AF。
DX10游戏测试:《孤岛危机》
● DX10游戏《孤岛危机》测试
《孤岛危机》(Crysis)是一款科幻题材的第一人称射击游戏,此游戏由德国游戏开发商Crytek制作开发,在由美国艺电发行,是孤岛危机三部曲的第一部。《孤岛危机》的背景发生在一群外星机器的船舰在地底被发现,玩家扮演三角洲特种部队中暴龙小队的成员──诺曼(Nomad)进行搜索和撤离的任务。这款游戏对硬件配置尤其是显卡的要求极高,发售没几天便获得“硬件杀手”的称号。
测试参数设定:
使用游戏自带Benchmark程序,所有参测显卡运行在DX10最高画质设定下,测试使用1920×1080分辨率,开启AA/AF。
DX10游戏测试:《生化危机5》
● DX10游戏 《生化危机5》测试
《生化危机》,这个不朽的名字几乎任何80年后出生的男孩都知道。早在12年前这款游戏就已存在,并就此开创了AVG(冒险解谜类)游戏的先河。时至今日,《生化危机》系列已推出第五代作品,官方正式登陆PC平台,这次主人公要前往非洲无名小镇完成任务。相比第四代作品,《生化危机5》上的射击类游戏特征似乎更加明显。
测试参数设定:
使用游戏自带Benchmark程序,所有参测显卡运行在DX10最高画质设定下,测试使用1920×1080分辨率,开启AA/AF。
DX10游戏测试:《使命召唤:黑色行动》
● DX10游戏 《使命召唤:黑色行动》测试
《使命召唤》系列在3D游戏爱好者中几乎是家喻户晓的,即便你不是一个FPS游戏玩家,你也至少听说过这个名字,它从第一代开始铸就的经典实在令人难以忘怀。从那以后,《使命召唤》系列一直保持着将近一年一部新作的发布频率,如今大家翘首企盼的系列第七部《使命召唤:黑色行动》终于面世,无论各游戏机构的评价如何,它都将是炙手可热的作品。
测试参数设定:
游戏没有自带Benchmark程序,选择第五关“S.O.G.”刚开始时长达两分钟的自动过场剧情,使用Fraps软件记录游戏帧率。所有参测显卡运行在DX10最高画质设定下,开启AA/AF。
HD7970测试结果汇总分析及笔者点评
关于AMD新一代旗舰显卡HD7950的评测到此高一段落,最后我们将所有测试结果汇总制表,从中分析AMD这次新品发布对竞争局面以及行业态势可能产生的影响。
● HD7970测试结果汇总分析
注:图表中HD7950与GTX570的对比中成绩最优的一方用白色粗体字予以提示
HD7950相对上一代产品HD6950性能有很大提升,更多的流处理器和显存位宽发挥了显著作用。最让人感到不可思议的是,HD7950的曲面细分理论测试性能较前辈有了质的飞跃。不知AMD对它施了什么魔法,在原本较为弱项Heaven2.1测试中,竟然领先大幅度反超GTX570。
除了《异性大战铁血战士》,可能是该游戏与HD7970显卡内核或显卡驱动兼容还不完善。
与同为单核准旗舰的竞争对手GTX570相比,但凡基准测试项目HD7950一路凯歌,以完胜收场,不过实际游戏测试没有那么乐观。一共10款基于各种引擎和应用程序接口的大型3D游戏,HD7950其中6款超过GTX570,4款稍逊,若是完全从实用角度出发,则结局是HD7950险胜。
● 笔者点评:HD7950与HD7970只相差10%,是十分厚道的高端显卡,28nm潜力无穷
总的来说,HD7950的Tahiti芯片架构和上一代产品大致相同,主要的改变是提升了制程,增加了计算规模,那么它所擅长运行的项目与以往大致相同。HD7950在测试中不及GTX570的那些游戏项目,是因为原先它们就是NVIDIA的绝对优势项目,AMD新芯片的提升尚不足以扳回。
不过令人激动的是,测试结果证明从HD6870开始AMD对曲面细分性能的改进是成功的,在原本AMD显卡落后的一些DX11游戏项目中,HD7950的表现出现明显改观,个别游戏实现反超。新的双几何引擎设计从是从那时候定型,现在被HD7970和HD7950继承。此外这还说明了制约曲面细分性能的不光是几何引擎,显存带宽恐怕也是重要原因,于是HD7950的超强显存配置使性能充分释放。
作为与AMD上一代Cayman架构相近的升级替代产品,Tahiti芯片无疑是成功的,他不仅明显增强了性能,还凭借新制程和新技术有效地控制了功耗,同时原有的一些特色功能也经过升级变得更加先进。28nm的潜力绝不止如此,今后HD7000系列或许会被挖掘出更大能量。
网友评论