揭真相:探究开普勒和费米PhysX的问题

PChome | 编辑: 夏阳 2013-08-22 06:30:00原创 返回原文

Kepler的PhysX性能如何?

很久没有听到PhysX的声音了,NVIDIA也许感觉这已是强势无可比拟的计算引擎,CPU再发展个几年也是望尘莫及了,不过NV不是微软也不是苹果,在显卡上做封闭的东西注定小众。好吧策略和市场问题我们不再多说,今天想跟大家分享几个结果:Kepler架构显卡的PhysX效能没有Fermi的高,并且由此还延伸出了更多的问题。

在PhysX游戏中,为了增加物体的真实感,会让物体受到外力的时候呈现随机但符合地球物理规则的运行轨迹,而并不是常规游戏中简单的定点定位死板路线。比如玻璃收到左侧炸弹的气波冲击,那么此时碎成多少片,每一片往右侧飞溅的轨迹都是得靠大量的计算来来实现、维持。这如果使用CPU来计算的话,CPU直接就不堪重负让帧数直线下降到个位数。因此开启支持PhysX的游戏的话,必须使用N卡来承担PhysX的引擎计算。

从GeForce 8开始,GPU内部就一直内置PhysX计算引擎,到目前Kepler,PhysX一直都做为NV的王牌在推广,找游戏合作商普及,以扩大PhysX游戏的市场份额从而确立选购N卡的必要性。不过从Kepler架构开始,核心和着色器的频率变得同步,不再是以以前的以2.16:1或者2:1的比例运行了,为了保证着色和顶点的能力,同时扩充了大量的CUDA内核。也就是我们看到Kepler家族CUDA内核数量暴增的现象。

我们都知道PhysX运算和CUDA数量以及工作频率比较敏感,对位宽以及ROPS甚至PCI-E带宽都不是特别的敏感,那么问题出来了,同样是X60Ti,1344CUDA的GTX660Ti是不是比384CUDA的GTX560Ti在PhysX计算上强悍的多?况且前者的频率又是相当的高。那使用主副卡配合的方式,主卡使用高性能以确保PhysX之外的计算无瓶颈,副卡则分别使用Fermi和Kepler不同CUDA数量的显卡做专属PhysX计算,就可以揭开Fermi和Kepler在PhysX计算上的效率比。

现在思路很明确了,就看PhysX计算能力,于是我们将使用Core i7 3970X@4GHz+四通道2133CL11的硬件平台,主卡使用手头性能最强的GTX770Lightning版,操作系统使用正版Windows 7 SP1 X64纯净版,安装.NET 4.0和NVIDIA 320.49WHQL驱动,游戏设定中除了开启PhysX之外,其他画质选项全部降至最低,副卡则分别使用参测的显卡作专属PhysX计算。以上所做的所有操作和设定,都是奔着常规渲染达到最高帧数以消除对副卡的影响。

参测的游戏分别是黑手党II,蝙蝠侠之阿甘之城以及全球使命。我们先看看关闭PhysX,GTX770Lightning能让这些最低特效的游戏跑出多少帧。

黑手党2

蝙蝠侠之阿甘之城

全球使命

都是以1024*768分辨率,效果能关则关,能最低则最低,分别跑出了数百帧的成绩,分别是232.7、279、197.02,看来PhysX游戏的帧率杀手就是PhysX计算。

开普勒爆出天大BUG?

现在开始开启PhysX,并且指定副卡为专属计算卡,而为了保持渲染计算部分的负担一致,仍然保持与刚才的设置相同,即1024*768,能关就关,能低就低。副卡分别搭配384CUDA的GTX560Ti、1344CUDA的GTX660Ti和384CUDA的GTX650。

选择这三种副卡是处于GTX560Ti和GTX660Ti在定位上相同,而GTX560Ti和GTX650之间又是CUDA相同,这样得出的结果可以通过不同的角度来分析。

测试平台以及软件环境等信息

以GTX560Ti做副卡为例  在驱动中强制设定专属计算

以GTX560Ti为例,分别是GTX770做主卡,GTX660Ti、GTX560Ti、GTX650做副卡专属PhysX计算,设置如上,即相同的软、硬、游戏设置,只是做PhysX的副卡不同而已。

参测游戏成绩如下:

 黑手党II

蝙蝠侠之阿甘之城

全球使命

从测试结果上看,GeForce GTX560Ti和GTX660Ti的物理加速能力基本一致,因为最终帧数差不多,而在之前关闭PhysX计算高达230多帧的情况上来看GTX770不存在渲染着色上的瓶颈。

这一点在阿甘之城上面也有同样的体现,同定位的GTX660Ti和GTX560Ti的物理加速能力基本一致,而GTX650则稍显逊色。也就是说不管架构,不管核心和着色同频之后的对应关系,Kepler的CUDA绝对不是和Fermi的CUDA构成相同。至于1344个CUDA,以1033MHz频率下工作,和384个CUDA以823MHz下工作的能力相当是由于PCI-E总线的效率限制还是的确二者的计算能力相当,这个暂时不确定,但可以肯定的是,Kepler架构下的一个CUDA,简化于Fermi架构下的CUDA。

再注意看全球使命的测试结果,发现了什么问题了么?效率最高的GTX560Ti竟然是最慢的,而GTX650都要超越GTX560Ti。其实这并不是Kepler的PhysX效能逆袭,而是在全球使命中出现了问题。

下面是我们录制的一段视频:

这段视频就是使用同样的测试平台,软件,驱动,Kepler的显卡在运行我们在NVIDIA提供的全球使命Benchmark程序中,即便是开启了PhysX计算选项也无法正常执行,导致帧数会比较高,这其实就是等同作弊,并且游戏中偶尔也会出现画面等贴图或建模错误,在视频不切镜头的情况下,使用Fermi架构的显卡,使用同样的系统、软件,均正常。

本期揭真相总的来说虽然都是相同数量的CUDA,但是由于架构不同,比如Kepler桌面版弱化了通用计算的性能等,它单个CUDA的效能,比Fermi时代的要弱,而且有过双卡玩PhysX游戏的都知道,PhysX计算只需要CUDA数量和着色器运行频率,并且数量达到一定程度之后,再提升的性能就不是特别明显了,因此综上原因,GTX660Ti即便在着色和顶点渲染方面再强,也只是和GTX560Ti处于同一档次。

关于刚才视频所述的这一BUG,我们已经联系NVIDIA中国,他们表示已经在排查和测试,我们PChome也会进一步的确认是否为个性因素,若真的是BUG,那么我们该如何吐槽NVIDIA呢?

返回原文

本文导航

相关阅读

每日精选

点击查看更多

首页 手机 数码相机 笔记本 游戏 DIY硬件 硬件外设 办公中心 数字家电 平板电脑