“老二”迟来一个月 GTX570发布
对于关注图形计算的用户而言,2010年的第四季度可谓是惊喜不断。两大图形芯片巨头NVIDIA和AMD争相推出重量级新品,最高性能被不断刷新。俗话说英雄还需用武之地,另一方面的游戏产业也相当给力,多款游戏大作陆续发售,令玩家眼花缭乱。要说这其中最引人注目的事件,当属NVIDIA第二代DX11显卡Geforce GTX580诞生,它在前作GTX480的基础上完善了不足,令性能、散热、功耗等多方面重要元素都得到显著提升。
GTX580是GT500系列的旗舰单核型号,从它发布至今已过去近一个月,按照惯例,旗舰之后便是高端,于是GTX570今天也要与我们见面了。作为相对偏向于消费层面的高端产品,GTX570将提供怎样的性能?它与GTX580有多大差距?这些都是用户关注的话题,本文悉数予以解答。
● 先睹为快,GTX570与相近产品账面规格对比
在解析GTX570之前,首先呈上它与相近产品的规格参数列表,对于较为了解显卡的资深用户来说,这是最直截了当的介绍。
通过上表想必读者已经对GTX570有了大致的了解。它不出所料地与GTX580使用相同的GPU,各种计算单元数量比GTX580略少,与上代旗舰—GTX480和高端—GTX470都有相同之处。
其中GTX570的SP和纹理单元数量与GTX480相同,而ROPs和显存规格比后者低,与GTX470相同,不过GTX580的三种频率都比GTX480高一些。之前我们已经了解到GT580的性能超过GTX480并不仅仅因为计算单元多,GF110本身的效率也更出色。那么现在GTX570比GTX480又如何,相信这是大多数人最感兴趣的事儿,别着急,在本文的测试对比部分你会找到详尽的答案。
Fermi技术特点回顾 曲面细分时辰已到
要说Fermi架构最使人印象深刻的特点,就是它专为最新应用程序接口DirectX11开发的多形体引擎架构,也是它主要领先竞争对手的地方。在开始介绍GTX570之前,我们先对这一部分内容做个简单回顾。
● 主要特点回顾,GT400、GT500系列所基于的Fermi架构
从Geforce FX5000系列开始直到现在的GTX285,GPU的图形渲染性能提升了150倍,可是几何性能提升连3倍都不到。而未来DX11游戏将显著加大对图形几何逼真度的计算,NVIDIA意识到继续原有的设计思路势必会形成瓶颈。
NVIDIA耗费了较长的时间研发支持DX11的新GPU—GF100,它的核心架构与之前的GT200大相径庭。GF100将内核中的处理器分为四个模块,称为GPC,每个GPC中包含四组SM,每个SM中除了拥有32个流处理器和4个纹理单元外还有一个专用于计算DX11中曲面细分的多形体引擎“Polymorph”,这样总共便有16个Polymorph引擎。
每个Polymorph引擎将顶点获取、曲面细分、观察口转换、属性设置、流式输出这五种功能打包配属到每一个SM当中,这样可以高效地根据Shader流水线中曲面细分指令对顶点数据进行曲面细分处理,最后回过来经过RASTER单元分配筛选后再开始下一步的着色工作。
这种结构在遇到繁重的曲面细分任务时可以并行工作,极大地提高了几何性能。GTX480中的GF100核心关闭了一组SM,其中包含的Polymorph也不会工作,实际上是有15个多形体引擎。现在GTX580的GF110核心规格全开,16个Polymorph同时生效必然使几何性能更上一层楼。
● 随着DX11游戏增多,Fermi的优势愈发明显
刚开始的DX11游戏中曲面细分应用非常稀少,诸如著名的《尘埃2》、《叛逆连队2》、《异形大战铁血战士》都是如此,因为游戏开发者需要考虑用户电脑图形性能的承受能力,NVIDIA的设计显得未雨绸缪。
不过从Fermi架构诞生开始,NVIDIA在DX11计算方面的成就愈发受到游戏开放商的重视。可以看到现在的DX11游戏出现的频率正在加快,而游戏中应用的曲面细分含量也在增多,最近出现的《失落的星球2》和《鹰击长空2》便是好例子。
DX11特效使游戏画面的逼真度有了翻天覆地的变化,就像每一代DirectX API一样,它成为主流应用程序接口的趋势只是时间问题,Fermi架构的价值将愈发明显。
GTX570为Fermi系列的第二代产品,关于此系列的所有相关内容我们之前已做过多次介绍,这里不再重复。欲知详情可查阅以下文章。
继承GF110的改良 570比580少了什么
按照NVIDIA的习惯,仅次于旗舰的高端显卡使用与旗舰相同的芯片,只是在规格上有所削减,这次也不例外。
GTX570的GPU核心与GTX580一样,同为GF110,采用40nm工艺制程,集成30亿个晶体管,核心面积520mm²。此外,两者GPU外壳上的编号不同,前者为GF110-275,后者是GF110-375,这与NVIDIA以往的编号规律是一样的。
我们已知GF110的新设计方式减少了功耗和发热,具备更好的电气性能与电气效率。它不仅仅是GF100打开最后一组SM那么简单,而是整体架构的执行效率都增强了。假设GF110依然只有480个流处理器,频率设定也与GTX480一样,它的性能仍优于后者。GTX570使这个假设有了验证的机会。
GTX580官方售价为3999元,GTX570官方售价为2999元,显然,前者主要为形象定位,而后者则更偏向实际销售。不过从以上架构图可以清楚地看到,GTX570的定价还是算比较实惠的,与相差1000元的旗舰相比,GPU规格削减的并不多,令我们十分期待它的性能表现。
GTX570实物亮相 如同孪生不稀奇
● 实物亮相,GTX570与GTX580一模一样
与GTX580发布时一样,本次GTX570的送测样品也由NVIDIA重要合作伙伴索泰提供。这款索泰GTX570完全依照NVIDIA公版设计,具备标准品质保障,显卡上贴有索泰Logo标签。
与GT400系列不同,GTX570与GTX580的外观几乎没有区别,这让人联想到十分经典的GT200系列,是否预示着GT500必将重现辉煌呢?
除了核心规格和显存配置减少了一点之外,GTX570的各项频率设定均略低,但高于GTX480。同样由于功耗相对GTX580较低的原因,GTX570的电源输入端口为双6pin接口,区别于后者的8pin+6pin。
探秘内部结构 拆解GTX570分两步
● 拆解GTX570,内部结构与GTX580相同
GTX570不仅外观与GTX580相同,内部结构也是完全按照同一设计。
NVIDIA在GTX580/570的结构设计中加大了离心式风扇的尺寸,由GTX480的直径6cm增加到直径6.5cm,这样只需更低的转速就能提供原有的风量,使静音效果得以改善。
散热器本体为独立结构,它由四颗螺丝固定在GPU扣具底座上,拆下整流罩后,它也可以单独取下,令用户定期除尘维护变得非常方面。对这类散热需求较严格的高端显卡而言提高了使用保障。
GTX570的板型和结构设计与GTX580近似,更多拆解详情可浏览《GTX580首测》。
探秘内部差异 供电显存散热器均不同
● GTX570与GTX580的PCB元件配置存在细微差别
虽说GTX570与GTX580使用相同的PCB板型,但毕竟前者的定位、性能、功耗都较低,那么在元件配置上必然不会如出一辙,超出需求的部分还是要减免的。
在PCB上能看到的区别具体为,GTX570核心供电相数减少到4相,对应的电感、功率IC和高压、低压滤波电容都一并省略。此外,因功耗减小,所以换用6pin+6pin的12V电源端口;显存位宽减少了64bit,因而显存芯片数量减少了两颗。
● GTX570的均热板散热器与GTX580不同
既然功耗和发热不同,所以精打细算的NVIDIA也不会给GTX570和GTX580配完全相同的散热器。前者的鳍片略微窄一点,长度略短。
GTX580作为公版显卡首次采用了均热板散热技术,成为它举足轻重的亮点。GTX570延续了此设计,这是它们控制核心温度的法宝之一。
▲ 关于均热板散热器
热管的原理是让水吸热从中空腔蒸发到另一端,冷凝后利用毛细原理从孔壁回流到吸热处,如此循环可比实心铜棒有更高的传热效率。但热管的弊端是容易导致散热鳍片受热不均,靠近热管穿孔的部分总是会更热一些,使散热器的效率打折扣。
那么试想将热管做成一个“圆饼”,再将鳍片码放在上面会如何呢?均热板的传热原理和热管相同,它能使贴附在表面的鳍片均匀受热,从而有效利用每一寸散热表面积。
均热板的制造成本较高,工艺要求更严格,因而在电脑散热器中并不多见。
传承智能负载管理 电路设计放大解析
● GTX570电路设计具体细节放大解析
GPU核心中的计算单元越来越多,它们本来各司其职,而一些拷机软件,却能使计算单元中的大部分集中做同一种工作,如Furmark所进行的Pixel Shader。这种超高密度的计算会使GPU产生非常大的电流,可能导致电子元件损坏,或加速老化缩减寿命。
为避免这种现实中不合理的使用状态对显卡造成损害,NVIDIA在GTX580中加入功率监测芯片和性能动态调节芯片。当前者检测到12V端输入的电流达到安全上线时,后者便启动阻止GPU产生更高的电流,起到保护作用。此外,这套管理系统还可以根据输入电流大小控制风扇转速,几乎在GPU刚开始升温时就达到程序设定的合适转速。
尽管GTX570供电规格缩减,这方面却是一脉相承的。
● GTX电源端口与显存配置
上一页中已经提到GTX570这方面电源和显存方面的不同,这里提供两张特写。值得注意的是GTX580使用0.4ns的显存,而GTX570使用0.5ns的显存。虽然它们的默认频率设定只相差200MHz,但理论频率上限相差1GHz。也就是说前者的显存更具超频潜力。
对GTX570的介绍到此告一段落,下面进入各项性能测试对比环节。
测试方案介绍及测试平台软硬件构成
● 测试和对比将分为三部分
第一部分:理论性能测试。使用现有的四款公认测试软件,分别针对显卡的DX9.0C、DX10和DX11性能部进行评估。
第二部分:实用性能测试。选取15款现今主流的大型3D游戏检测显卡在实际应用中的表现。由于DX11不久之后会成为主流应用程序端口,所以选取的游戏中DX11游戏占了一半左右。又因为DX9.0C游戏对本次参测显卡形成不了压力,帧率绝对值达到一定程度后,显卡之间的差距已经不会对用户产生实质影响,所以除了今年的暴雪神作《星际争霸2》之外没有再加入其它DX9.0C游戏。
另外加入CUDA视频编码性能测试。
第三部分:散热与功耗测试。旗舰显卡性能固然强悍,可同时这两项属性也会使人头疼。这部分测试结果将提示有购买意向的人应该如何为迎接它做准备。
● 重点关注的对比
本次测试需重点关注GTX570与GTX580、GTX480、HD5870之间的对比。其中AMD目前的单核旗舰产品HD5870售价与GTX570十分接近,两者互为直接竞争对手。
● 测试平台软硬件配置如下
● 测试平台设定状态
本次参测显卡非旗舰即高端,为了使它们充分发挥性能,尽可能体现出之间的真实差距,测试所用的CPU Core i7 980X模拟硬件发烧友的使用状态,被超频至4GHz,内存以三通道运行在DDR3-1600,时序7-7-7-19-1T。
一切准备工作已就绪,下面进揭晓测试结果,首先是理论性能测试。
DX9.0C基准测试:3DMARK06
● 基于DX9.0C的基准测试:3DMARK06
3DMARK06从发布到今天已超过4年光景,与日新月异的计算机芯片技术不同,3DMARK在推出后很久的一段时间里都可用于对显卡的3D性能做出准确判断,只要是这款3DMARK所基于的图形引擎技术仍在被使用,测试就不会失去意义。如3DMARK06的DX9引擎至今仍被大量新游戏使用。
测试参数设定:
分辨采用程序默认的1280×1024和符合测试所用显示器尺寸的1920×1080。其中1280×1024测试部分在NVIDIA驱动和AMD驱动均将AA/AF设为应用程序控制,3DMARK06默认设定这两项为关闭状态。1920×1080测试开启4×AA和16×AF,用于观察显卡在更高3D负载下性能的变化。
3DMARK06是基于DX9的图形测试软件,发布距今已有许多年光景,它的图形渲染量对现在的显卡不形成丝毫压力,双方性能表现多数是受到CPU的初始建模效率限制。
在默认设定测试中,GTX570与GTX580相差无几。在开启AA/AF和更大分辨率后,图形工作量大幅增加,后者的优势开始体现。前后两项对比中与GTX480几乎相同
HD5870在两项测试中均不及GTX570,但负载加重后差距有一定缩减。
DX10基准测试:3DMARK Vantage
● 基于DX10的基准测试:3DMARK Vantage
3DMARK Vantage是专为Windows Vista DX10环境下开发的3D性能测试软件,分为高、中、低三种测试级别,对显卡的计算能力要求和显卡性能在得分中所占的比重也依次递减,通常以中档Performance设定为通用衡量标准。
测试参数设定:
3DMARK Vantage有一项PhysX测试基于NVIDIA物理加速技术设计,拥有CUDA架构的NVIDIA显卡可以借助庞大的并行计算内核帮助CPU大幅度提高这项测试的得分,而使用AMD显卡时则只能依靠效率不佳的CPU计算。为秉持公平对比的原则,除了对Performance和High两种模式的总分作对比之外,还将提取它们成绩构成中的GPU得分单独对比。
3DMARK Vantage基于DX10设计,负载比3DMARK06重,因此GTX570与GTX580之间的差距更为明显一些。在这项测试中,HD5870全然不是GTX570对手,也明显超过了GTX480。
DX11基准测试:UnigineHeaven2.1
● 基于DX11的基准测试:Unigine Heaven2.1
俄罗斯Unigine公司开发的新款3D性能测试软件,主要针对DirectX11 API设计,同时还兼带DirectX9、DirectX10以及OpenGL3.2.这款测试软件的引擎,在DirectX11模式下可以选择开启或关闭Tessellation(细分曲面技术),这时DX11的重要标志性技术之一,也是DX11相对于以往API的明显提升部分,可使渲染对象拆分得更精细,模型边缘层次感明显,视觉上更加真实。
测试参数设定:
Unigine Heaven2.1的测试运行DX11和DX10两种模式,因为现在和未来一两年内,大型3D游戏将主要基于这两种API设计。测试使用1920×1080分辨率,开启AA/AF,其中DX11模式下的Tessellation(曲面细分)级别设定为Extreme。
这项测试的情况与3DMARK Vantage很相似。尤其是DX11模式下,Fermi架构的优势使GTX500显卡的得分双倍于HD5870。
DX11基准测试:微软SDK曲面细分
● 基于DX11的基准测试:微软 DirectX SDK曲面细分
微软针对它的每一代应用程序接口(API)都会推出相应的配套测试程序已检测电脑以此接口运行相关程序时的性能。DirectX SDK Browser中含有这种API支持的各种功能和效果范例,针对DX11推出的最新版本的DirectX SDK Browser中有一项DetailTessellation11用于检测电脑的曲面细分能力,它能够逐级增减曲面细分的含量,得出电脑对不同几何图形数量的支持效果。
测试参数设定:
测试使用1920×1080分辨率,画面显示设定为三角形框架模式,分别在Tessellation Factor设定值为3/7/15的状态下捕获帧率,测试不同级别曲面细分时显卡的性能表现。
这项测试能够地体现NVIDIA与AMD运行曲面细分的理论数据。从条形图中可以看出,在曲面细分量较低时,双方性能差距较小。然后随着曲面细分量加大,AMD显卡的下降趋势较为明显,主要是因为RV870只有一个曲面细分引擎,而GF110却多达16个。这也正是NVIDIA称Fermi架构是专为DX11设计的原因。
或许是受显存规格影响,GTX480在这项理论测试中的表现优于GTX570。
DX11游戏测试:《尘埃2》
● DX11游戏《科林.麦克雷:尘埃2》测试
《科林.麦克雷:尘埃2》是一款为了纪念去世的英国赛车手科林.麦克雷制作的模拟赛车类游戏,在前作发行了两年之后,这款续作在2009年底正式发布。这款游戏最大的亮点是率先支持DX11引擎,无论是画面质感还是可玩性都大有超过《极品飞车》之势头。
测试参数设定:
所有显卡运行在DX11最高画质设定下,测试使用游戏自带的Benchmark程序,设定1920×1080分辨率,开启AA/AF。
去年与第一款DX11显卡(AMD)同期发布的DX11游戏,如今NVIDIA GTX580仅凭单核便力克竞争对手的双芯旗舰HD5970,更何况单芯的HD5870?在DX11性能改良方面,前面的漫漫长路还等着AMD去走。
DX11游戏测试:《地铁2033》
● DX11游戏《地铁2033》测试
《地铁2033》改编自俄国作家Dmitry Glukhovsky的畅销小说,由乌克兰4A游戏工作室开发,采用4A游戏引擎,而且PC版支持nvidia的PhysX物理特效。 2013年,由于大面积的核泄漏,导致几乎所有的人类都被消灭,而且地面已经被污染无法生存,极少数幸存者存活在莫斯科的深度地下避难所里(俄罗斯的地铁站在建造之初就有防空防炸防核防辐射的设计)人类文明进入了新的黑暗时代。直至2033年,整整一代人出生并在地下成长,他们长期被困在“地铁站”的城市。
测试参数设定:
这款游戏没有自带Benchmark程序,人工测试场景选择第一关从爬梯子开始直到消灭三个怪物后拉铁门结束,使用Fraps软件记录游戏帧率。六款参测显卡运行在DX11最高画质设定下,测试使用1920×1080分辨率,开启AA/AF。
恐怕在《地铁2033》面前再强的显卡都是笑话,比起这款游戏的画面,更让它出名的是变态的硬件要求。HD5870的帧率已经达到接近幻灯片的程度,不过就这项测试的数据来看,无论谁输谁赢都没有太多实际意义,20几fps无法满足最基本的流畅度需求,也许就像《孤岛危机》一样,N年以后的显卡才能完全征服它。
DX11游戏测试:《普利皮亚季的召唤》
● DX11游戏《潜行者:普利皮亚季的召唤》测试
《潜行者:普里皮亚季的召唤》(S.T.A.L.K.E.R.: Call of Pripyat)的故事剧情发生在《切尔诺贝利的阴影》的故事之后,Pripyat是乌克兰的一个城镇名字,是切尔诺贝利事件的隔离区,它是一座被废弃的城市,具体在乌克兰首都基辅以北的区域,民间有“鬼城”之称,现时Pripyat市已经成为了一个旅游景点。显然,新版S.T.A.L.K.E.R.游戏的舞台就在这里搭建。
测试参数设定:
使用游戏自带Benchmark程序,六款显卡运行在DX11最高画质设定下,测试使用1920×1080分辨率,开启AA/AF。《潜行者:普利皮亚季的召唤》Benchmark测试分为白天、黑夜、雨天、光照各种场景,每个场景都会得出各自的测试结果,下面我们在同一个柱状图中对比这四个场景的测试结果。
这款游戏原本就是NVIDIA Fermi显卡占优,GTX570赢HD5870丝毫没有悬念。有趣的是前者的帧率与GTX480惊人地相同。
DX11游戏测试:《异形大战铁血战士》
● DX11游戏《异形大战铁血战士》测试
《异形大战铁血战士》是一款由Rebellion公司开发的FPS游戏,本作的游戏舞台设定为名叫BG-386的行星,殖民采掘集团在该星球发现了古代金字塔,围绕该金字塔隐藏的巨大秘密异形、铁血战士以及人类3种族再次展开激烈的战斗。游戏的单机游戏模式中玩家可以分别扮演三种种族进行各种族的故事模式,挑战完成种族各自的目的。联机模式中则可以扮演三种族进行对战,扮演不同种族时其视点以及攻击方式都将发生变化。
如果你选择的是海军陆战队,你将体验到前所未有的黑暗幽闭的恐怖,一丝丝光线都会让你激动不已。海军陆战队是人类最后的抵抗阵线,他们被各种尖端装备武装到牙齿。如果你选择的是铁血战士,那么你会以敏捷的身手在高空穿行,从高处伏击你的敌人。尽管铁血战士的装备也非常先进,但都是近战武器,所以你需要与敌人近距离争斗。如果你选择的是宇宙中最致命的物种异形,你最致命的武器就是你捕兽夹一般的嘴和刀刃一般的触手。
测试参数设定:
使用专为这款游戏开发的Benchmark程序,使用Fraps记录游戏帧率,六款显卡运行在DX11最高画质设定下,测试使用1920×1080分辨率,开启AA/AF。
《异形大战铁血战士》是较早出现的DX11游戏之一,其中应用的曲面细分含量不多,所以Fermi的优势不太明显,GTX570、GTX480和HD5970都处于同一水准。
DX11游戏测试:《失落的星球2》
● DX11游戏 《失落的星球2》测试
《失落的星球 2》承袭前作内容第3人称射击,针对多人连线部分加以强化,并加入4人Co-op连线合作共同对抗巨大异形怪兽“艾克里德(Akrid)”崭新玩法,玩家不只是要正面对抗艾克里德,甚至还要爬上AK小山般的庞大身躯展开攻击。
游戏采用 CAPCOM 独自研发并进一步强化的“MT-Framework 2.0”游戏引擎,呈现比前作更为细致绚丽的画面,使用该引擎的还有《鬼泣4》和《生化危机5》。
测试参数设定:
所有显卡运行在DX11最高画质设定下,测试使用游戏自带的Benchmark程序,分辨率设定为1920×1080,开启AA/AF。
《失落的星球2》是最近发售的DX11游戏,曲面细分含量较多,导致比分再次变得悬殊,GTX570的帧率刚好是HD5870的双倍。
DX11游戏测试:《鹰击长空2》
● DX11游戏 《汤姆克兰西之鹰击长空2》测试
由育碧布加勒斯特开发的《汤姆克兰西之鹰击长空2》在2010年9月面市,新作中玩家将扮演精英飞行员,驾驶世界上最先进的飞机,担任一系列的战斗任务。
《鹰击长空2》新增了许多新特性和玩法,包括自控起降、无人侦察机、4人合作等,另外在画面特效上也有很大的改善,尤其在地貌效果上采用最新的DX11技术,来自GeoEye的商业级高分辨率卫星地图能确保游戏营造出令人震撼的逼真程度
测试参数设定:
使用游戏自带Benchmark程序,六款显卡运行在DX11最高画质设定下,测试使用1920×1080分辨率,开启AA/AF。
这款游戏是刚刚发布的DX11大作,其中的地貌效果应用了较多的曲面细分,于是导致了N卡与A卡之间最悬殊的帧率对比。GTX570运行它的性能超过了HD5870的双倍,与GTX480则在伯仲之间。
DX11游戏测试:《战地:叛逆连队2》
● DX11游戏《战地:叛逆连队2》测试
《战地:叛逆连队2》(Battlefield: Bad Company 2),是EA DICE开发的一款第一人称射击游戏。游戏开发商美国艺电确定2010年3月2日为游戏Xbox 360、PS3、PC版的首发日期。该游戏是EA DICE开发的第9款“战地”系列作品,也是《战地:叛逆连队》的直接续作,在继承前作特性的基础上,强化了多人联机载具对战和团队合作元素的设定。游戏使用加强版的寒霜引擎,加入了建筑物框架破坏和物体分块破坏的支持。
测试参数设定:
这款游戏没有自带Benchmark程序,选择第二关“Cold war”刚开始时长达两分钟的自动过场剧情,使用Fraps软件记录游戏帧率。六款显卡运行在DX11最高画质设定下,测试使用1920×1080分辨率,开启AA/AF。
AMD的HD5000显卡一直在采用HAVOK引擎的《叛逆连队2》中保持着绝对优势,HD5870的帧率领先GTX480。但从GTX460开始NVIDIA改进了Fermi架构,现在GTX500显卡对它的优化已经十分趋于完善,逐将比分大幅度反超。
DX10.1游戏测试:《正当防卫2》
● DX10.1游戏《正当防卫2》测试
在PC和家用机平台上评价不错的动作游戏《正当防卫》(Just Cause)正式宣布推出第二作:《正当防卫2》,玩家将会在一个全新的孤岛上进行冒险任务。它是以真实的自由动作为卖点,标榜《GTA》的风格而制作的。《正当防卫2》使用了全新的Havok图形引擎开发,除了PC平台外,它还登陆了XBOX360/PS3平台。
测试参数设定:
五款显卡都运行在DX10.1最高特效设定下,AA、AF开启。这款游戏有自带的Benchmark程序,选择第二个负载适中的场景“Desert Sunrise(沙漠日出)”进行测试,使用1920×1080分辨率。由于这款游戏在分别使用AMD和NVIDIA显卡时,Advanced Display Settings中选项会发生一些变化,所以在对比之前需先说明此情况。
使用AMD显卡时,高级显示设定中的“Bokeh Filter”和“GPU Water Simulation”两个特效不被支持,它们是NVIDIA显卡的专有特效。这俩选项的中文含义为“远景模糊”和“GPU水面仿真处理”,开启后景深效果和河流睡眠逼真度都会提升一个档次,但同时也会耗费一定量的GPU运算,使帧率降低。
为更准确地体现AMD与NVIDIA双方的性能对比,此测试项目采取开启和关闭上述特效各测试一次。
基于NVIDIA CUDA架构计算的那两个特效给人带来更多的视觉享受,同时也相当消耗资源。将特效关闭与AMD公平对比,证明NVIDIA显卡运行这款游戏的效率是大幅度领先的。开启特效后,GTX580和GTX570的帧率都低于HD5870。
DX10.1游戏测试:《孤岛惊魂2》
● DX10.1游戏《孤岛惊魂2》测试
《孤岛惊魂2》的画质和游戏引擎都较前作有了提升,许多不曾有的特效借由DX10.1引擎得以应用,彻底颠覆前作经常为人诟病的“画面偏卡通”特点,带给玩家耳目一新的真实体验。
测试参数设定:
使用游戏自带Benchmark程序,六款显卡运行在DX10.1最高画质设定下,测试使用1920×1080分辨率,开启AA/AF。
GTX570运行这款游戏的性能大幅领先HD5870,小幅超越GTX480。
DX10游戏测试:《孤岛危机》
● DX10游戏《孤岛危机》测试
《孤岛危机》(Crysis)是一款科幻题材的第一人称射击游戏,此游戏由德国游戏开发商Crytek制作开发,在由美国艺电发行,是孤岛危机三部曲的第一部。《孤岛危机》的背景发生在一群外星机器的船舰在地底被发现,玩家扮演三角洲特种部队中暴龙小队的成员──诺曼(Nomad)进行搜索和撤离的任务。这款游戏对硬件配置尤其是显卡的要求极高,发售没几天便获得“硬件杀手”的称号。
测试参数设定:
使用游戏自带Benchmark程序,所有参测显卡运行在DX10最高画质设定下,测试使用1920×1080分辨率,开启AA/AF。
这款游戏中充斥着大量精细纹理贴图,对显卡的纹理填充率是个很大的考验。64个纹理单元的GTX580,面对有80个纹理单元的HD5870时难有太大作为,双方平分秋色。
DX10游戏测试:《生化危机5》
● DX10游戏 《生化危机5》测试
《生化危机》,这个不朽的名字几乎任何80年后出生的男孩都知道。早在12年前这款游戏就已存在,并就此开创了AVG(冒险解谜类)游戏的先河。时至今日,《生化危机》系列已推出第五代作品,官方正式登陆PC平台,这次主人公要前往非洲无名小镇完成任务。相比第四代作品,《生化危机5》上的射击类游戏特征似乎更加明显。
测试参数设定:
使用游戏自带Benchmark程序,所有参测显卡运行在DX10最高画质设定下,测试使用1920×1080分辨率,开启AA/AF。
要说对AMD和NVIDIA双方显卡测试对比的平衡性,源于次世代主机的《生化危机5》无疑是非常公平。对决的结果是HD5870对GTX570没有还手之力,同时后者还超过了GTX480。
DX10游戏测试:《使命召唤:黑色行动》
● DX10游戏 《使命召唤:黑色行动》测试
《使命召唤》系列在3D游戏爱好者中几乎是家喻户晓的,即便你不是一个FPS游戏玩家,你也至少听说过这个名字,它从第一代开始铸就的经典实在令人难以忘怀。从那以后,《使命召唤》系列一直保持着将近一年一部新作的发布频率,如今大家翘首企盼的系列第七部《使命召唤:黑色行动》终于面世,无论各游戏机构的评价如何,它都将是炙手可热的作品。
测试参数设定:
游戏没有自带Benchmark程序,选择第五关“S.O.G.”刚开始时长达两分钟的自动过场剧情,使用Fraps软件记录游戏帧率。所有参测显卡运行在DX10最高画质设定下,开启AA/AF。
在新推出的热门游戏中占优是最幸福的事,现在NVIDIA和所有热爱《使命召唤》的N卡用户们都享受到了。
DX9.0C游戏测试:《星际争霸2》
● DX9.0C游戏 《星际争霸2:自由之翼》测试
《星际争霸》是个该载入电脑文化发展史册的绝世之作,它的第一部作品于1998年诞生于美国暴雪娱乐,奠定了“暴雪出品必定精品”格言。可能就连当时的制作者也不曾料到它会成为迄今为止最成功的即时战略游戏,就在这款游戏发售12年后的今天,世界各地仍然在开展这款游戏的比赛,孕育出无数令人敬仰的电竞明星。
游戏界赋予《星际争霸》的评价越高,对其续作《星际争霸2》的压力就越大,暴雪多年积累的口碑让“二代不如一代”变成对它的亵渎。于是竟然时隔12年之久,我们才有幸体验到《星际争霸2》的Beta试玩版,而正式发售日期更是无法预料。这款游戏支持DX10 API,游戏画面发生翻天覆地的变化,再也不是那个“无论多烂配置”都能流畅运行的游戏了。
测试参数设定:
《星际争霸2》没有自带的Benchmark程序,需要通过Fraps测试回放的replay来计算帧数,笔者在replay中选择了一个让显卡负载较高的固定场景和固定时间段用于测试。测试中所有参测显卡运行在“Ultra”画质设定下,分辨率为1920×1080,AA/AF开启。
此前HD5000系列显卡在《星际争霸2》的性能上一马当先,后来方才得知是因为A卡驱动在此游戏中不能正常实现抗锯齿功能。在催化剂驱动更新到10.6版本时,AMD忍着“使帧率下降的痛苦”解决了抗锯齿问题,结果fps一溃千里,NVIDIA就这么“莫名其妙地实现大逆转”。
暴雪神作的延续《星际争霸2》在游戏界是如此重要,而现在的性能对比格局对AMD来说简直是场噩梦。
PhysX游戏测试:《黑手党2》
● PhysX游戏 《黑手党2》
由2K Czech开发的PC/PS3/Xbox 360黑帮游戏《黑手党2》(Mafia II),带领玩家进入1940年至1950年虚构的地下世界,就像好莱坞电影般的游戏世界,玩家可在拟真的城市中冒险。2在《黑手党》受到全球超过200万玩家欢迎的基础上,2K Czech开始制作描述无情黑帮社会的《黑手党2》,游戏采用2K Czech专为《黑手党2》打造的次世代游戏引擎和NVIDIA PhysX物理加速引擎,带领玩家在细致的游戏画面中、深入不为人知的黑帮世界,为了生存而必须进行残酷的争斗。
测试参数设定:
所有显卡运行在最高画质设定下,参测的NVIDIA显卡运行在PhysX最高画质设定下,AMD显卡可以运行游戏但不能使用GPU为PhysX加速。测试使用游戏自带的Benchmark程序,设定1920×1080分辨率,开启AA/AF。
如果有人说加入PhysX游戏测试对AMD有失公平,笔者不反对,但不包括《黑手党2》。因为这款游戏并没有像以往大多数PhysX游戏那样默默无闻,它凭借优秀的剧情和出色的画面成为本年度最卖座游戏之一,以至于许多游戏迷都在研究如何添加一片Geforce显卡作为物理卡来使它更流畅。
没有GPU对物理计算的支持,CPU是不堪重负的。不支持PhysX加速的AMD显卡都只有15fps,那不代表它们在此游戏中的3D渲染能力只是如此,而是因为同一套测试平台中的CPU只能提供这么快的物理建模速度。
PhysX游戏测试:《蝙蝠侠》
● PhysX游戏《蝙蝠侠之阿卡姆疯人院》测试
由Rocksteady Sudios开发,Eidos发行的《蝙蝠侠:阿卡姆疯人院》是根据Grant Morrison同名漫画改编,堪称蝙蝠侠历代最黑暗的一作,游戏中的加入了大量的PhysX特效。阿卡姆疯人院里关的都是蝙蝠侠亲手逮捕的罪犯。某天,以小丑为首的病人们声称觉得“无聊”,所以劫持了医护人员,要求蝙蝠侠前去陪他们“ 游戏”。这场疯狂的迷藏中,占尽优势的是反派们,蝙蝠侠不仅要提防杀气腾腾的各个患者,同时他自己的精神状态也处于失常的边缘。
测试参数设定:
使用游戏自带Benchmark程序,参测的NVIDIA显卡运行在PhysX最高画质设定下,AMD 显卡可以运行游戏但不能使用GPU为PhysX加速。测试使用1920×1080分辨率,开启AA/AF。
测试情况与刚才的《黑手党2》完全相同,不是AMD显卡的性能只是如此,而是CPU运行PhysX差劲的3D建模效率严重制约了GPU。
显卡不止能玩游戏 CUDA视频转码测试
● 显卡不止能玩游戏 CUDA转码对抗旗舰i7
一个普通的CPU有两颗核心,高端一点儿的是四核,就算旗舰i7 980X也不过是六核心12线程,如今随便拿出一款NVIDIA显卡就有上百个CUDA核心,如果能让它们代替CPU做一些繁重的工作岂不是美事?
的确,除了游戏之外,视频转码是最实在的CUDA应用,如今iPhone、iPad之类的便携式影音设备随处可见,但它们通常容量有限,且支持的视频格式与PC也不尽相同,如果想随时随地欣赏大片,就需要事先在电脑上将视频文件转换成播放器支持的格式与合适的大小。
视频转码对CPU而言是一件苦差,它会使CPU满载,同时再做其它事效率会大打折扣,而且视频压缩耗时漫长,有时等了一晚往往只处理好一部片子。不过利用CUDA庞大的通用计算矩阵可以令转码效率大幅增加,同时CPU资源还可以腾出来为其它操作服务。
MediaCoder是著名的免费转码软件,能很好地支持CUDA运算,下面我们将用它测试GTX580用作CUDA转码时的效率。AMD显卡不支持CUDA,无法参与测试对比,尽管AMD驱动中自带基于Stream技术的AVIVO转码器,单输出的视频质量并不理想,因此现实中也鲜见有人使用。
测试方案设定:
测试压缩一部446MB的1080P HD.264视频,码率20000KB/s,输出规格为184MB的720P H.264视频,码率压缩到8192KB/s,记录所耗时间。
测试中用在用CUDA转码时,将CPU启用核心数量关闭到最后一个,使主要工作移交给GPU,从而测试出更准确的GPU转码速率。
在这四款显卡中,核心单元数量最多,频率最高的GTX580无疑是最强的,GTX570比GTX480块一秒,这或许是频率差距导致的。因为CUDA转码工作主要由SP单元负责,而570与580的差别主要是在ROPs单元与显存位宽方面。
满载温度比HD6870低 GTX570很凉快
● GTX580待机、满载温度与静音效果测试
◎ 待机温度测试方法:停滞桌面状态15分钟后截取GPU温度数值。
◎ 满载温度测试方法:运行Furmark极致负载测试,待GPU温度升至平稳点不再变化时截取数值。
GTX570与GTX580一样具有智能负载控制功能,因此Furmark实际上无法让它的每一个流处理器都做像素着色操作,GTX580和GTX570的发热都得到了很好的控制,与电炉版的GTX480相比尤为明显。
GTX570的满载温度甚至比以节能著称的HD6870都低,它待机时静音效果非常出色,满载时噪音有所增加,但依然在能接受的范围之内。
功耗控制大有长进 GTX570无需大电源
● GTX580待机、满载整机功耗测试
◎ 待机功耗测试方法:停滞桌面状态15分钟后读取功率测量仪数值。
◎ 满载功耗测试方法:运行Furmark极致负载测试,读取功率测量仪最高数值。
在待机状态下,AMD显卡的功耗控制依然出色一些,然而由于NVIDIA智能电源管理设计的加入,使原本只会让差距加大的满载测试截然相反。以上柱状图显示数据虽然是整机功耗,但可以体现出智能电源管理所允许的最高功率情况。事实上我们无法让GTX580和GTX570处于真正的满载状态,不过至少它告诉我们一款质量过硬的450W电源便可以胜任。
测试结果汇总:淘汰HD5870,取代GTX480
最后我们将GTX570总共21项性能测试结果汇总,马上便能看出GTX570的推出将对现有市场格局带来什么影响。为便于观察,下列表格中用“WIN”标注性能领先一方。
● 21项性能测试结果汇总:淘汰HD5870,取代GTX480
总的来说,GTX570的性能大致相当于GTX580的90%,这在售价相差1000元的高端和旗舰显卡中并不是十分常见。前者虽然是登峰造极的产物,但3999元的价格使它与AMD的双核产品HD5970形成竞争关系,毕竟是以一打二,GTX580只能险胜后者,至于NVIDIA会不会像GT200时那样也推出双核旗舰,这是后话了。
GTX570则完全不同,它的定价与定位AMD当前最高级单核产品HD5870相同,但如此丰富的测试对比却出现一边倒的局面。除了《孤岛危机》这一项目双方打成平手之外,其余的GTX570完胜HD5870。这恐怕是到目前位置同一时期同一定位下差距最悬殊的比分。
回过头再比NVIDIA自家的GTX480,新一代高端超越上代旗舰,GTX570完成了使命。无需多做描述。
● 尾声:一张图总结GTX570
网友评论