Kepler
怎看都不像旗舰 Kepler什么来头?
在文章的开始,首先要祝贺所有NVIDIA显卡粉丝,从上一代Fermi(费米)架构发布,让他们苦等两年之久,传说中的Kepler(开普勒)架构今天终于揭开庐山真面目,并以GTX680为首发旗舰型号正式登场。
回顾往昔,自2006年至今,图形技术领域已发生过两次重大改革:第一次是2006年底,NVIDIA和竞争对手AMD双双进入统一渲染时代;第二次是2009年底到2010年初,微软推出新应用程序接口DX11,AMD为此在原有架构上做修改,NVIDIA则是全新设计了Fermi。
显卡芯片技术你追我赶由来已久,今年年初AMD发布的Tahiti芯片(HD7900)凭借28nm制程使流处理器数量大幅增加,总算扭转了之前面对Fermi的颓势。不过这次对竞争对手的动作NVIDIA却一反常态地冷淡,看来Kepler的意义已不在以往的竞争层面,它的诞生似乎预示着新的改革即将开始,而这次改革将属于GPU乃至显卡设计理念的高度。
从GT200芯片开始,NVIDIA芯片的命名规律为G加上架构名称的头一个字母,如Fermi称为GF,那么这次的Kepler理所当然叫做GK。不过不同寻常的是,通常后缀“100”表示它为本系列的旗舰,但这次Kepler首发的芯片却命名为GK104。缘何如此,通过我们下文的介绍中你将看出端倪。
NVIDIA的Geforce GTX680官方公版产品
由于从获得测试样品到发布日期时间紧迫,本文中我们将先为读者着重介绍Kepler架构特点和设计思路,并对GTX680的性能做严谨的评测。通过阅读本文,你将会了解它的各项属性参数、性能特点以及它所倡导的新的GPU设计理念。
下面是体现GTX680新技术特性关键词,建议读者关注:
1536个CUDA核心|28nm制程|PCI-E3.0|FXAA与TXAA|自适应垂直同步|超低功耗|单卡三屏立体视觉|GPU Boost技术
核心变多个头变小 GTX680外观与规格
● GTX680与同类旗舰产品参数对比
作为NVIDIA的单核旗舰产品,这次的GTX680几乎可以用“奇葩”来形容。首先它的型号后缀是104,熟知NVIDIA芯片产品的读者都明白这通常是中高端产品所使用的,例如GTX560Ti的GF104。其次,GK104的芯片面积竟然不超过300mm²,晶体管数量只有35亿个,竟然都低于竞争对手的HD7970,这与NVIDIA一贯的“巨核”路线大相径庭。最后再看芯片结构设定,在芯片面积和晶体管都大幅减少的前提下,CUDA内核数量提升到了1536个,并且流处理器与ROPs不再分频,而是像AMD那样同步运行。好吧,无论NVIDIA做了什么,至少可以肯定这绝对是大刀阔斧的变革。
● GTX680与同类旗舰产品实物对比
制程提升,芯片缩小,意味着功耗降低,那么要支持GK104的运行,不比再像之前那样配以体型巨大的板型。同为单核旗舰型号,GTX680的体积比他的前辈GTX580更加短小,几乎和GTX470差不多。如若与竞争对手的HD7970相比,则差别更大,用以往的眼光来判断,你可能不会认为它们是同一级别的产品。不过武功的强弱不是由身高决定的,显卡也是如此。
芯片架构解析 欲知开普勒先回访费米
● 欲知开普勒先回访费米
Kepler架构虽然是NVIDIA的新生代产物,在设计思路上颠覆了许多Fermi的元素,但不能说它们没有联系。Fermi是NVIDIA为了支持DX11全新设计的产品,它摒弃了GT200的模式,结构变化非常大。在Fermi中,NVIDIA提出GPC和SM的结构概念,以此将GPU分成若干平级并行的工作组,每一个SM有32个CUDA核心,而每一个GPC则有4个SM。重点在于为了尽可能地满足DX11曲面细分计算需求,NVIDIA为每一个SM组配置了独立的几何引擎,并且拥有独立的纹理单元。相较之下,AMD当时的做法只是沿用了RV770的设计模式,扩充了流处理器,在工作网路上加入一个单一的几何引擎来获得对DX11的支持。
NVIDIA GF100/GF110芯片架构
AMD Cypress芯片架构(HD5800)
这两种截然不同的做法导致的结果是,针对曲面细分的理论测试项目中,面对巨大的工作压力,Fermi架构表现优异,AMD不堪重负,以至于NVIDIA一度不愿意承认竞争对手产品也算是真正的DX11显卡。可是实际应用中,游戏开发者为了权衡DX游戏的硬件适应范围,曲面细分量不会设置太多,通常只用在一些特定的效果表现上,因此Fermi的优势很难找到用武之地。
GF100/GF110与GF104的SM组构成
NVIDIA无法不正视这个问题,于是在随后推出的中高端芯片上做出了改进的尝试,GF104/GF114将SM内的CUDA数量增加到48个,但SM只有八个。因为SM少,与其对应的几何引擎“Polymorph”数量也减少,相当于调整了曲面细分器和流处理器之间的配比,实际应用中的结果令人相当满意。
殊途同归?开普勒放弃分频CUDA暴增
● 小芯片多内核,开普勒一切遵循实际
Kepler可以说是通过在Fermi架构探究中不断总结,不断优化得出的结晶。NVIDIA发现八个几何引擎已经能够完全满足实际游戏中曲面细分的需求,即便是理论测试也一样。因为曲面细分的几何结构最后需要做像素渲染,这样便需要更大量的流处理器,末端输出的性能也不只是由几何引擎决定的。
Kepler GK104芯片架构图
于是最后以GF104的组成形式为蓝本,Kepler架构中同样有8个SM,这里称为SMX。从G80开始NVIDIA便让流处理器的工作频率与ROPs以一定的比例运行,这个比例最初由BIOS内的设定控制,最后在Fermi架构固定为2赔。现在,每个SM中的流处理器数量扩充到了惊人的192个,整个芯片拥有1536个CUDA核,频率与ROPs频率同步运行。与GTX580相比,CUDA频率只降低了三分之一,但CUDA数量却是原来的三倍,这无疑是提升性能的更好方式。
GK104的SMX组构成
每一个SM单元中包含16个纹理单元和一个Polymorph2.0引擎以及四个Warp调度器。Warp调度器的配置效仿GF104的设计,下辖两个指令分派单元。这样有足够的数据通道调度192个流处理器。这些流处理器又以六个为一列,每列有专属的LD/ST单元和SFU指令单元。
自适应垂直同步 完美画面不是梦
● 自适应垂直同步技术,完美画面不是梦
垂直同步技术会将游戏画面帧率限定与显示器刷新率同步,我们用的LCD通常是60Hz,那么游戏帧率上限也锁定在这一数字,但它造成的弊端不仅是这些。
当帧率达不到60Hz时,为了保持同步的规则,帧率会下降到30Hz,这样能与显示器刷新率保持1:2的同步。所以如果开启垂直同步,帧率会在30~60之间无过度地相位跳动,严重影响游戏体验,所以大多数人玩游戏是都会关闭垂直同步。
开启垂直同步后帧率在60fps~30fps之间跳动
但是关闭垂直同步,画面则偶尔会出现撕裂断层的现象,这也令许多完美主义者不满,NVIDIA在GTX680显卡上开发出“自适应垂直同步”技术,能有效解决这个问题,令游戏体验与画面两全其美。
“自适应垂直同步”,顾名思义其工作机制便是由驱动程序对游戏帧率做即时判断。帧率高于60fps时即时开启垂直同步,低于60fps时则即时关闭,这样便将帧率上限锁定在60fps,但低于60fps时又不会出现迅速回到30fps的现象,确保良好的流畅度体验。
TXAA抗锯齿技术 一份消耗十份效果
● NVIDIA独家抗锯齿技术FXAA与TXAA
FXAA全称为“Fast Approximate Anti-Aliasing”,翻译成中文就是“快速近似抗锯齿”。它是传统MSAA(多重采样抗锯齿)效果的一种高性能近似值。它是一种单程像素着色器,和MLAA一样运行于目标游戏渲染管线的后期处理阶段,但不像后者那样使用DirectCompute,而只是单纯的后期处理着色器,不依赖于任何GPU计算API。正因为如此,FXAA技术对显卡没有特殊要求,完全兼容NVIDIA、AMD的不同显卡(MLAA仅支持A卡)和DX9、DX10、DX11。 相比于MSAA,FXAA的目标是速度更快、显存占用更低,还有着不会造成镜面模糊和亚像素模糊(表面渲染不足一个像素时的闪烁现象)的优势,而代价就是精度和质量上的损失。
FXAA现在有三种版本:“FXAA 1”是最早最基础的版本开启fxaa效果图(31张),也是在PC游戏中使用最广泛的,已用于《F.3.A.R》、《永远的毁灭公爵》、《柯南时代》、《Crysis 2》、《无主之地》等等;“FXAA 2”是针对Xbox 360游戏机专门设计的;“FXAA 3”又有两种算法,Quality质量版本面向PC,Console主机版本则面向Xbox 360、PS3。
FXAA已经取得了不错的成效,基于Kepler架构,NVIDIA下一代独家抗锯齿技术TXAA会带给我们更惊艳的画面视觉。它能以消耗极少的性能的代价换来极佳的抗锯齿效果,其中TXAA1只消耗相当于2×MSAA的资源达到8×MSAA的效果,而TXAA2只消耗4×MSAA的资源却远超过8×MSAA的效果。
3D立体幻镜升级 单卡即可实现
● 多屏3D立体再升级,单卡即可实现
NVIDIA完善有效的3D立体幻境技术是目前用户使用电脑所能获得的最佳视觉享受,在GTX480和GTX580时,NVIDIA三联屏功能的使用至少需要两片显卡组成SLI,而现在GTX680单片显卡即可搞定。
使用GTX680组建三联屏需要使用它的两个DVI端口和DP端口,此时剩下的HDMI端口仍可连接第四台显示器作为扩展屏幕使用。
● GTX680支持SLI技术,极限3D性能攀新峰
SLI是获得超强3D性能的手段,Kepler架构的GTX680理所当然地支持这项NVIDIA招牌技术。
受酷睿灵感启发?GPU自动超频技术
● 受酷睿灵感启发?GPU自动超频技术
就像Intel处理器支持的睿频技术一样,NVIDIA这次也在GTX680中加入类似的自动升频技术,称作GPU Boost,目的是让显卡性能和功率负载之间的更加平衡,更充分地利用GPU计算能力。
我们平时玩游戏时,运行3D程序时,由于不同时刻的数据和指令有多有少,并不能一直将所有线程占满,GPU计算单元的负载是时高时低的,绝对意义上的满载只有理论测试才能实现。GPU boost的工作机制就是利用这一现象,当GPU处于非满载工作状态时,在TDP限制范围内,自动提升GPU工作频率,以超出频率的功耗来替代闲置计算单元的功耗。
最新版的GPU-Z 0.6.0已经加入了对GTX680的识别,可以看到原本Shader频率的部分变成了Boost频率,这个设定便是刚提到当满足条件时GPU自动升频的起始频率。
我们通过Heaven3.0和Furmark的测试验证此技术的效果,在Heaven3.0测试中,GPU负载忽高忽低不停变化,始终不达TDP上限,GPU boost使GPU频率在大多数时候运行在1100MHz左右。
随后使用Furmark1.9对GTX680实施理论满载测试,实际功耗超过TDP上限20%以上,这时GPU Boost则完全不会启动,确保显卡的安全稳定运行。
这项技术势必会让GTX680之后的NVIDIA显卡的实用价值都得到可观的提升。
NVIDIA官方公版GTX680显卡图片赏析
● NVIDIA官方公版GTX680图片赏析
GTX680的外形与上代旗舰GTX580类似,只是两侧少了凸缘和凹陷。
面积只有294mm²的GPU芯片不再像以往那样需要外壳保护,只是安装了一个护框。
GK104的DIE显微照片,从中可以依稀辨认各功能部分。
GTX680的双6pin供电接口设计为上下叠置,不用占用PCB的长度空间。高度上下错开是为了便于插拔。
拆解NVIDIA官方公版GTX680窥其内部
● 拆解NVIDIA官方公版GTX680窥其内部
28nm制程,294mm²面积GPU的发热非常有限,公版散热方案依然采用封闭离心式设计,其中散热器本体毫不吝啬地沿用GTX580上纳入的均热板技术,使温度问题永远都不会成为GTX680的困扰。
PCB裸板,可看见正面有8颗显存,每颗显存容量256MB,构成2GB的总容量。
新制程,小面积的核心功耗同样不会高,NVIDIA只为其配备4相GPU供电和双相内存供电。从上图中我们可以看到原PCB的电路设计是5相GPU供电,只是中间一相留空了,这难道是为更高的型号预备的?
视讯输出端口规格十分丰富,有一个DL-DVI接口和一个SL-DVI接口,以及独立的标准DP和标准HDMI接口,可用于单卡实现三联屏。
测试平台软硬件构成与测试方案介绍
不到300mm²的核心面积,比HD7970小的多,35亿的晶体管数目,也比HD7970少的多,就连显卡的个头也比HD7970矮了一截,难道NVIDIA主动放弃了最强单核性能的宝座?这不像是NVIDIA的行事风格。这个怎么看都不像“旗舰”的GTX680比HD7970性能如何,将预示Kepler架构模式的成败。
相信读者们早已迫不及待地要观看开普勒第一弹GK104的性能表现,下面我们便进入基准测试和游戏测试环节。
测试中我们选用了Fermi历代旗舰和AMD最近几代旗舰产品参与对比,这里面当然包括AMD最近气势汹汹的HD7000系列。
● 测试平台软硬件构成
● 测试平台的设定状态
本次参测显卡非旗舰即高端,为了使它们充分发挥性能,尽可能体现出之间的真实差距,测试所用的CPU Core i7 980X模拟硬件发烧友的使用状态,被超频至4GHz,内存以三通道运行在DDR3-1600,时序7-7-7-19-1T。
基于DX10的基准测试:3DMARK Vantage
● 基于DX10的基准测试:3DMARK Vantage
3DMARK Vantage是专为Windows Vista DX10环境下开发的3D性能测试软件,分为高、中、低三种测试级别,对显卡的计算能力要求和显卡性能在得分中所占的比重也依次递减,通常以中档Performance设定为通用衡量标准。
测试参数设定:
3DMARK Vantage有一项PhysX测试基于NVIDIA物理加速技术设计,拥有CUDA架构的NVIDIA显卡可以借助庞大的并行计算内核帮助CPU大幅度提高这项测试的得分,而使用AMD显卡时则只能依靠效率不佳的CPU计算。参测显卡使用Performance和High模式各测试一遍,驱动中AA/AF选为应用程序控制。
基于DX11的基准测试:3DMARK 11
● 基于DX11的基准测试:3DMARK 11
2010年的最后一个月,Futuremark的大作3DMark 11终于发布,这也堪称2010年Benchmark方面最重磅的炸弹了。作为业内公认的专业图形性能测试工具,3DMark 11会在最短时间内进入所有硬件网站的测试标准,成为衡量市面上所有显卡和PC平台的标准型测试项目——从3DMark 99到3DMark Vantage十多年的时间里3DMark系列都是如此成为图形测试的标准。
Futuremark总是在版本号的前一年推出新软件,这次也不例外,3DMark 11在09年底就诞生了,不过巧合的是,它的版本号应该还有另一层含义——基于DirectX11接口的基准测试软件。
测试参数设定:
运行Performance和Extreme两项测试,分别检验显卡在高低不同负载下的DX11渲染能力。显卡驱动中将AA和AF设定为应用程序控制,分辨率使用测试项目默认设定。
基于DX11的基准测试:Heaven3.0
● 基于DX11的基准测试:Unigine Heaven3.0
俄罗斯Unigine公司开发的新款3D性能测试软件,主要针对DirectX11 API设计,同时还兼带DirectX9、DirectX10以及OpenGL3.2.这款测试软件的引擎,在DirectX11模式下可以选择开启或关闭Tessellator(细分曲面技术),这时DX11的重要标志性技术之一,也是DX11相对于以往API的明显提升部分,可使渲染对象拆分得更精细,模型边缘层次感明显,视觉上更加真实。
测试参数设定:
Unigine Heaven3.0的测试运行DX11和DX10两种模式,因为现在和未来一两年内,大型3D游戏将主要基于这两种API设计。测试使用1920×1080分辨率,开启AA/AF,运行在DX11模式下,Tessellator(曲面细分)级别设定为Extreme。
DX11游戏测试:《科林麦克雷:尘埃2》
● DX11游戏《科林.麦克雷:尘埃2》测试
《科林.麦克雷:尘埃2》是一款为了纪念去世的英国赛车手科林.麦克雷制作的模拟赛车类游戏,在前作发行了两年之后,这款续作在2009年底正式发布。这款游戏最大的亮点是率先支持DX11引擎,无论是画面质感还是可玩性都大有超过《极品飞车》之势头。
测试参数设定:
所有显卡运行在DX11最高画质设定下,测试使用游戏自带的Benchmark程序,设定1920×1080分辨率,开启AA/AF。
DX11游戏测试:《科林麦克雷:尘埃3》
● DX11游戏《科林.麦克雷:尘埃3》测试
尘埃3》完整版是由Codemasters制作并发行的一款赛车竞速游戏,对此前发布的《尘埃3》进行资料上的填充和优化。 更新内容包括: 2个地点的12个新赛道,新车,和大量其他内容。 游戏采用的是Ego引擎,拥有更加拟真的天气系统及画面效果。 游戏拥有着出色的画面,激情的背景音乐,真实的操空性与音效。 一个赛车游戏其操控性是很重要的,而《尘埃3》操作很简单,给人的那种物理感觉很强。
测试参数设定:
所有显卡运行在DX11最高画质设定下,测试使用游戏自带的Benchmark程序,设定1920×1080分辨率,开启AA/AF。
DX11游戏测试:《地铁2033》
● DX11游戏《地铁2033》测试
《地铁2033》改编自俄国作家Dmitry Glukhovsky的畅销小说,由乌克兰4A游戏工作室开发,采用4A游戏引擎,而且PC版支持nvidia的PhysX物理特效。 2013年,由于大面积的核泄漏,导致几乎所有的人类都被消灭,而且地面已经被污染无法生存,极少数幸存者存活在莫斯科的深度地下避难所里(俄罗斯的地铁站在建造之初就有防空防炸防核防辐射的设计)人类文明进入了新的黑暗时代。直至2033年,整整一代人出生并在地下成长,他们长期被困在“地铁站”的城市。
测试参数设定:
这款游戏没有自带Benchmark程序,人工测试场景选择第一关从爬梯子开始直到消灭三个怪物后拉铁门结束,使用Fraps软件记录游戏帧率。所有参测显卡运行在DX11最高画质设定下,测试使用1920×1080分辨率,开启AA/AF。
注:在固定的场景的游戏测试中,AMD显卡的平均fps普遍优于NVIDIA。但在用户实际游戏中,遇到沙尘、光线、爆炸等高负载特效时,AMD显卡难以承担,帧率会急剧下降,甚至死机。此游戏不建议使用AMD显卡。
DX11游戏测试:《失落的星球2》
● DX11游戏 《失落的星球2》测试
《失落的星球 2》承袭前作内容第3人称射击,针对多人连线部分加以强化,并加入4人Co-op连线合作共同对抗巨大异形怪兽“艾克里德(Akrid)”崭新玩法,玩家不只是要正面对抗艾克里德,甚至还要爬上AK小山般的庞大身躯展开攻击。
游戏采用 CAPCOM 独自研发并进一步强化的“MT-Framework 2.0”游戏引擎,呈现比前作更为细致绚丽的画面,使用该引擎的还有《鬼泣4》和《生化危机5》。
测试参数设定:
所有显卡运行在DX11最高画质设定下,测试使用游戏自带的Benchmark程序,分辨率设定为1920×1080,开启AA/AF。
注:AMD显卡运行此款游戏帧率波动幅度较大,而NVIDIA较为平稳,建议采用NVIDIA显卡。
DX11游戏测试:《鹰击长空2》
● DX11游戏 《汤姆克兰西之鹰击长空2》测试
由育碧布加勒斯特开发的《汤姆克兰西之鹰击长空2》在2010年9月面市,新作中玩家将扮演精英飞行员,驾驶世界上最先进的飞机,担任一系列的战斗任务。
《鹰击长空2》新增了许多新特性和玩法,包括自控起降、无人侦察机、4人合作等,另外在画面特效上也有很大的改善,尤其在地貌效果上采用最新的DX11技术,来自GeoEye的商业级高分辨率卫星地图能确保游戏营造出令人震撼的逼真程度
测试参数设定:
使用游戏自带Benchmark程序,所有显卡运行在DX11最高画质设定下,测试使用1920×1080分辨率,开启AA/AF。
DX11游戏测试:《战地:叛逆连队2》
● DX11游戏《战地:叛逆连队2》测试
《战地:叛逆连队2》(Battlefield: Bad Company 2),是EA DICE开发的一款第一人称射击游戏。游戏开发商美国艺电确定2010年3月2日为游戏Xbox 360、PS3、PC版的首发日期。该游戏是EA DICE开发的第9款“战地”系列作品,也是《战地:叛逆连队》的直接续作,在继承前作特性的基础上,强化了多人联机载具对战和团队合作元素的设定。游戏使用加强版的寒霜引擎,加入了建筑物框架破坏和物体分块破坏的支持。
测试参数设定:
这款游戏没有自带Benchmark程序,选择第二关“Cold war”刚开始时长达两分钟的自动过场剧情,使用Fraps软件记录游戏帧率。所有显卡运行在DX11最高画质设定下,测试使用1920×1080分辨率,开启AA/AF。
DX10.1游戏测试:《孤岛惊魂2》
● DX10.1游戏《孤岛惊魂2》测试
《孤岛惊魂2》的画质和游戏引擎都较前作有了提升,许多不曾有的特效借由DX10.1引擎得以应用,彻底颠覆前作经常为人诟病的“画面偏卡通”特点,带给玩家耳目一新的真实体验。
测试参数设定:
使用游戏自带Benchmark程序,所有显卡运行在DX10.1最高画质设定下,测试使用1920×1080分辨率,开启AA/AF。
DX10游戏测试:《孤岛危机》
● DX10游戏《孤岛危机》测试
《孤岛危机》(Crysis)是一款科幻题材的第一人称射击游戏,此游戏由德国游戏开发商Crytek制作开发,在由美国艺电发行,是孤岛危机三部曲的第一部。《孤岛危机》的背景发生在一群外星机器的船舰在地底被发现,玩家扮演三角洲特种部队中暴龙小队的成员──诺曼(Nomad)进行搜索和撤离的任务。这款游戏对硬件配置尤其是显卡的要求极高,发售没几天便获得“硬件杀手”的称号。
测试参数设定:
使用游戏自带Benchmark程序,所有参测显卡运行在DX10最高画质设定下,测试使用1920×1080分辨率,开启AA/AF。
DX10游戏测试:《生化危机5》
● DX10游戏 《生化危机5》测试
《生化危机》,这个不朽的名字几乎任何80年后出生的男孩都知道。早在12年前这款游戏就已存在,并就此开创了AVG(冒险解谜类)游戏的先河。时至今日,《生化危机》系列已推出第五代作品,官方正式登陆PC平台,这次主人公要前往非洲无名小镇完成任务。相比第四代作品,《生化危机5》上的射击类游戏特征似乎更加明显。
测试参数设定:
使用游戏自带Benchmark程序,所有参测显卡运行在DX10最高画质设定下,测试使用1920×1080分辨率,开启AA/AF。
DX10游戏测试:《使命召唤:黑色行动》
● DX10游戏 《使命召唤:黑色行动》测试
《使命召唤》系列在3D游戏爱好者中几乎是家喻户晓的,即便你不是一个FPS游戏玩家,你也至少听说过这个名字,它从第一代开始铸就的经典实在令人难以忘怀。从那以后,《使命召唤》系列一直保持着将近一年一部新作的发布频率,如今大家翘首企盼的系列第七部《使命召唤:黑色行动》终于面世,无论各游戏机构的评价如何,它都将是炙手可热的作品。
测试参数设定:
游戏没有自带Benchmark程序,选择第五关“S.O.G.”刚开始时长达两分钟的自动过场剧情,使用Fraps软件记录游戏帧率。所有参测显卡运行在DX10最高画质设定下,开启AA/AF。
注:使用AMD显卡会自动省略掉该游戏中的一些火光、火花特效,不建议使用AMD显卡。
DX9.0C游戏测试:《上古卷轴5》
● DX9.0C游戏 《上古卷轴5》测试
本作是Bethesda五年磨一剑的《上古卷轴》系列新作,Bethesda将提供充满无限期待与幻想的诺德大陆,本作和上古卷轴4拥有同等大小的地图。在这广阔的地图之上,Bethesda工作室给玩家提供了超过120个不重复的地下迷宫,以及5个规模宏大的城市供玩家探索,而玩家将在这个奇异自由的世界踏上史诗性的征程,使用自己心仪的武器装备自己擅长的技能,去和巨兽,飞龙战斗。前作作为引领PC硬件新潮流的RPG,续作的配置则平易近人,不过Bethesda依然为该作注入了新元素,那就是新引擎“创造”打造的重峦叠嶂的规模与细节的华丽。
测试参数设定:
这款游戏没有自带Benchmark程序,选择第一关从屏幕亮起时主角坐马车直到马车走到村庄内停下时的一段自动路径。所有显卡运行在DX11最高画质设定下,测试使用1920×1080分辨率,开启AA/AF。
注:AMD显卡运行该游戏无法关闭垂直同步,最高帧率不能超过60fps,为该游戏选择显卡时需慎重。
PhysX游戏测试:《蝙蝠侠:阿甘之城》
● PhysX游戏 《蝙蝠侠:阿甘之城》测试
2009年最佳动作游戏《蝙蝠侠:阿甘疯人院》的续作,《蝙蝠侠:阿克汉姆之城》仍然建立在《阿克汉姆疯人院》的气氛上,不过这次上升至阿克汉姆之城——高谭市内戒备森严的,关押了大量暴徒的监狱之中。而且新作还汇集了众多明星参与的配音阵容以及蝙蝠侠中的极度凶残的恶棍,并改进和加强了一游戏特点,让玩家们拥有像《蝙蝠侠:黑暗骑士》一般的终极游戏体验。
测试参数设定:
所有显卡运行在DX11最高画质设定下,测试使用游戏自带的Benchmark程序,设定1920×1080分辨率,开启AA/AF。
注:该游戏需NVIDIA显卡为其PhysX物理特效加速,使用AMD显卡时这部分工作由CPU替代,巨大的瓶颈会严重影响游戏流畅度。
PhysX游戏测试:《黑手党2》
● PhysX游戏 《黑手党2》测试
由2K Czech开发的PC/PS3/Xbox 360黑帮游戏《黑手党2》(Mafia II),带领玩家进入1940年至1950年虚构的地下世界,就像好莱坞电影般的游戏世界,玩家可在拟真的城市中冒险。2在《黑手党》受到全球超过200万玩家欢迎的基础上,2K Czech开始制作描述无情黑帮社会的《黑手党2》,游戏采用2K Czech专为《黑手党2》打造的次世代游戏引擎和NVIDIA PhysX物理加速引擎,带领玩家在细致的游戏画面中、深入不为人知的黑帮世界,为了生存而必须进行残酷的争斗。
测试参数设定:
所有显卡运行在最高画质设定下,参测的NVIDIA显卡运行在PhysX最高画质设定下,AMD显卡可以运行游戏但不能使用GPU为PhysX加速。测试使用游戏自带的Benchmark程序,设定1920×1080分辨率,开启AA/AF。
注:该游戏需NVIDIA显卡为其PhysX物理特效加速,使用AMD显卡时这部分工作由CPU替代,巨大的瓶颈会严重影响游戏流畅度,最后获得的帧率几乎与显卡渲染性能无关。
比HD7970低100W 温度与功耗测试
● GTX680待机与满载GPU温度测试
待机状态时,GPU频率以及显存频率运行在2D状态设定档位,保持系统启动进入桌面维持30分钟后,在室温25℃环境下读取GTX680显卡的GPU待机温度只有37℃,风扇由PWM控制转速较低,静音效果优良。
使用变态显卡拷机软件Furmark1.92对GTX680实施理论满载,20分钟后温度不再变化趋于平稳,室温25℃环境下读取GPU温度为84℃,离NVIDIA GK104芯片的温度安全上限设定很远。满载时风扇转速由PWM控制逐步升高,最后稳定在2600rpm左右,如同所有离心式散热器一样,这个状态下会发出明显的噪音,但处于可接受范围内。
● GTX680待机与满载GPU功耗测试
NVIDIA和AMD双方对于待机功耗控制的都很出色,双方不相伯仲,因为无论显卡级别高低,在待机状态时都只消耗极少的资源。
GTX680满载功耗测试结果值得炫耀,28nm制程和小面积核心发挥了作用。使用Fumark1.92令显卡满载20分钟后,观察到整机的功耗只有383W。GPU-Z显示此时GTX680的功耗已经达到其TDP的120%,据此判断它没有像GTX580、GTX570那样采用功率控制措施。即便如此,它的满载功耗仍低于受限制后无法真正达成满载的GTX580。
最引人瞩目的亮点在于GTX680的满载功耗竟然比HD7970低了100W左右,也比HD7950低70多W。之前的游戏测试显示GTX680反而比HD7970强不少,两者之间刚好形成性能功耗比的反例,让我们好奇的是AMD的那么多电和晶体管用到哪里去了?
测试汇总与点评:好显卡要舒心惬意
对NVIDIA Geforce GTX680显卡各项属性介绍及性能评测到此高一段落,相信通读全文的读者已经能够揣摩到NVIDIA这款新芯片的设计用意。下面我们将GTX680、GTX580以及最直接的竞争对手HD7970的各项参数、测试结果进行汇总分析,从中我们能对GTX680以及Kepler有个清晰全面的认识。
● Kepler架构第一弹GTX680显卡测试结果汇总分析
注:下列表格中测试结果获胜的一方用白色粗体字标出
两个月前,HD7970奋力将GTX580赶下神坛,AMD在时间跨度上经历三代产品之后终于在单核性能上击破了NVIDIA的Fermi。尽管对于显卡消费者而言这种江山互坐的变化是件令人兴奋的事,但让我们回过头看看Fermi的本质以及Kepler的改变,HD7970的成就并不值得夸耀。
Fermi刚亮相时,GTX480的性能令人乍舌,可事实上它的架构设计略有偏激,在晶体管规模和制程上将自己逼到极限。GF100单纯追求曲面细分性能,可实际中少有用武之地,以及那些被迫关闭的内核和惊人的热功耗,这些都说明它离完善适用还很远。随后称之为Fermi2.0的GTX580改善了热功耗的问题,打开了屏蔽的内核,很大程度上依仗新加入的电流监管措施,但抑制终究不是上策。
现在,Kepler的巨大变革说明NVIDIA在经过Fermi的成与败之后清醒地认识到:轻便高效、可靠实用的架构才是GPU领域的王者之道,用户需要的是舒心惬意的游戏体验,而不是成天摸着烫手的机箱忧心忡忡。本文中的测试结果已经全面传达了Kepler的声音:我的芯片面积比你小70mm²,我的晶体管比你少8亿,我的功耗比你低100W,就连定价我也比你便宜,我比你多的,只有性能。
依稀HD7970发布时NVIDIA只是冷淡地回应了一句:“Kepler一定是款令各位惊喜的产品。”它实现了诺言。
试想:两片GK104合在一起,一个完美的双核显卡便诞生了,它会叫什么,GK110吗?我们拭目以待吧。
网友评论