欲了解GTX465先从GF100说起
NVIDIA在今天三月份发布了GTX400系列显卡,预示着图形渲染全面进入DX11时代。或许是有了ATi HD5000系列的借鉴,GF400显卡后来者居上,灵活智能的核心资源调度机制使它在DX11的曲面细分性能方面更胜一筹,聚集了无数用户的目光。
然而基于新生代架构的显卡往往都是奢侈品,GTX480、470售价不菲,即便是作为消费级准旗舰的后者售价也近3000元人民币,不是普通大众都能消受的。那么遵循以往显卡产品线发展的惯例,在以上两款旗舰吊足了人们的胃口之后,真正适合千家万户的高端性价比型号也该出现了,它便是GTX465。
到目前为止,GTX465显卡实物还未曾谋面,但通过一些渠道得知了一些它较为详细的信息,使我们现在便有足够的资料来分析它的架构规格和性能。要系统地了解GTX465以及它和现有GTX400显卡之间的关系,首先要重温一下GF100芯片概况。
● GTX400系列之源:NVIDIA GF100芯片
GF100图形处理器基于大量可扩展的图形处理集群(GPC)、流式多处理器(SM)以及存储器控制器。GF100拥有4个GPC、16个SM群组以及6个存储器控制器。我们希望能够推出在GPC、SM以及存储器控制器等方面具有不同配置的GF100产品,以满足不同价位的市场需求。
因为每个SM群组内含32个流处理器,因此从NVIDIA的原设计来看,完整的原生GF100芯片应该拥有32×16=512个流处理器,而首发的旗舰型号GTX480或许出于功耗和发热的考虑而将其中一组SM关闭,即为480个流处理器。据此也可以猜测GTX480并不是GF100家族的终极型号,火力全开的GF100显卡很可能会在不久工艺制程进一步更新后问世。
GF100拥有48个ROP单元,它们可用于像素混合、抗锯齿以及原子存储器操作。ROP单元每8个一组,共有6组。每一组均由一个64位存储器控制器来进行控制。存储器控制器、2级高速缓存、以及ROP群组全都密切关联,改变一个单元就会改变其它部件。
上图中的暗色的区域表示GTX480被关闭的一组SM,除此之外其余部分均处于有效工作状态。
像玩七巧板 核心架构不难猜● GTX480的同源产品:GTX470与GTX465
GTX470与GTX480的GPU来源相同,都为GF100核心,唯一的区别是后者被用硬件手段关闭了更多的核心组件。与GTX480相比,GTX470又减少了一组SM,同时一组ROP单元以及一个64bit显存控制器也被关闭。
那么关于GTX465的GPU,可靠信息显示,它是NVIDIA对GF100核心做进一步削减屏蔽的产物,也就是说,它仍属于GF100芯片系列的产品,就如同上代的GTX285、GTX275以及GTX260一样。
到目前为止我们得知,GTX465的核心频率、Shader频率与GTX470相同,流处理器数量削减到352个;显存仍配备GDDR5,但由于核心规格的变动,显存位宽缩减到256bit,显存频率降低到3206MHz,另外ROPs被关闭两组。
上图为GTX465的核心规格示意图,暗色部分为被屏蔽的核心功能组件。
通过以上分析,相信一些读者已经了解GTX465的核心概况——它相当于被再度精简的GTX470,那么接下来的问题是GTX465的GPU将被安装在什么样的PCB上与我们见面呢?
470还是465 刷谁BIOS就是谁吗?
看到下图中的产品,可能读者不禁会提出疑问:这不就是GTX470吗?没错,你可以说它是GTX470也可以说这是GTX465。曾有相关人员向我们透露:GTX465实际上就是GTX470,从原始的出厂板型、规格上看,它们完全是同一种东西,只是在下一级厂家对这些显卡进行品质检测时才根据产品优良率区分出两者,通过固件设定出频率、规格上的差异。然而厂商端的优良率检测环境是非常苛刻的,无法通过不代表在正常的用户环境中也无法使用,这便为玩家们津津乐道的“刷卡开核”埋下契机。
因为GTX465的流处理器数量比GTX470减少了96个,这是个十分可观的变化,因此可以预期前者的在节能方面会比前辈有更大建树,同时规模不变的散热系统也可能赋予它更佳的静音效果。
GTX470作为准旗舰显卡的一大突破是PCB长度大为缩减,已经低于全尺寸ATX主板的宽度,可应付更小巧轻便的机箱。
470原有的四相核心供电用于支持GTX465将显得更加游刃有余,这也预示着在未来针对这款显卡的超频尝试中,供电障碍已被彻底扫除。
GTX465的显存容量、位宽都会缩减,但与GTX470相比,仅仅是通过固件中的软性设定屏蔽,物理上这些元件仍然存在。最浅显的证据是GTX465上依然有十颗显存芯片,每颗容量128MB,显然在总容量为1024MB的GTX465上有两颗显存会成为纯粹的摆设,不过是否同时也意味着只要将GTX465刷入GTX470的BIOS,被屏蔽的流处理器和显存能立刻恢复工作?
虽然我们现在还没有GTX465实物,但却有公版GTX470显卡和GTX465的BIOS,试着刷BIOS把470降低到465或许也能说明问题。
470刷465BIOS 测试平台介绍● “四不像”诞生,显存位宽减少但SP不变
将GTX470刷写GTX465 BIOS之后,显卡可正常工作,没有出现稳定性方面的故障。不过奇怪的事情也随之发生,尽管驱动中已经将这片显卡识别为GTX465,但它的流处理器数量并没有减少,仍然为448个,只是显存位宽和容量分别减少到了256bit和1024MB。据此我们猜测或许是为了防止经销者求利滥刷BIOS,造成市场和产品线混乱,NVIDIA采取了硬件上的手段在显卡确认型号后锁死了流处理器数量。
尽管如此,对于这个448个SP/256bit位宽的“四不像”,我们还是有必要测一下它的性能。至少通过测试我们可以更准确地预估GTX465的性能,可以提前知晓显存位宽的大幅度降低会对GTX400系列显卡产生多大影响。为便于称呼,下面我们把这片只有显存位宽和容量被阉割的GTX465称作“伪GTX465”。
● 测试平台软硬件构成如下
测试平台已经一切就绪,下面揭晓这片怪异显卡的性能,并与GTX470、480做对比。
基准测试:3DMARK Vantage
● 基于DX10的基准测试:3DMARK Vantage
3DMARK Vantage是专为Windows Vista DX10环境下开发的3D性能测试软件,分为高、中、低三种测试级别,对显卡的计算能力要求和显卡性能在得分中所占的比重也依次递减,通常以中档Performance设定为通用衡量标准。High和Extreme则是展现显卡在重负载情况下所能提供的3D性能。
测试参数设定:
测试运行3DMARK Vantge中Performance和Hi两种不同级别的画质设定。
在通用检测设定Performence测试中,因为分辨率只有1280×1024,显存阉割对伪GTX465的影响不大,得分与GTX470较为接近。但在使用1680×1050分辨率的High测试中,显存削减产生的影响被略微放大。
基准测试: Unigine Heaven2.0
● 基于DX11的基准测试:Unigine Heaven2.0
俄罗斯Unigine公司开发的新款3D性能测试软件,主要针对DirectX11 API设计,同时还兼带DirectX9、DirectX10以及OpenGL3.2.这款测试软件的引擎,在DirectX11模式下可以选择开启或关闭Tessellation(细分曲面技术),这时DX11的重要标志性技术之一,也是DX11相对于以往API的明显提升部分,可使渲染对象拆分得更精细,模型边缘层次感明显,视觉上更加真实。仿佛为了庆祝GF100芯片诞生,就在昨天Unigine Heaven官网上又推出了2.0版本,加入了许多新的场景。
测试参数设定:
Unigine Heaven2.0的测试运行DX11和DX10两种模式,因为现在和未来一两年内,大型3D游戏将主要基于这两种API设计。测试使用1920×1080分辨率,开启AA/AF,其中DX11模式下的Tessellation(曲面细分)级别设定为Extreme。
因为DX11的曲面细分技术主要对核心计算单元消耗较大,所以伪GTX465依然没有落后GTX470多少,毕竟他们的核心规格还是相同的,前者这方面没有像真正的GTX465那样被削减。
DX11游戏测试:《尘埃2》
● DX11游戏:《科林.麦克雷:尘埃2》测试
《科林.麦克雷:尘埃2》是一款为了纪念去世的英国赛车手科林.麦克雷制作的模拟赛车类游戏,在前作发行了两年之后,这款续作在2009年底正式发布。这款游戏最大的亮点是率先支持DX11引擎,无论是画面质感还是可玩性都大有超过《极品飞车》之势头。
测试参数设定:
测试运行在游戏程序内设定的DX11最高画质设定下,使用1920×1080分辨率,开启AA/AF。
尽管《尘埃2》先前是与ATI合作开发的DX11游戏,由于NVIDIA显卡核心架构对曲面细分工作的优化,GTX400系列后来者居上,性能对比格局依然没变。
DX11游戏测试:《普利皮亚季的召唤》
● DX11游戏 《潜行者:普利皮亚季的召唤》测试
《潜行者:普里皮亚季的召唤》(S.T.A.L.K.E.R.: Call of Pripyat)的故事剧情发生在《切尔诺贝利的阴影》的故事之后,Pripyat是乌克兰的一个城镇名字,是切尔诺贝利事件的隔离区,它是一座被废弃的城市,具体在乌克兰首都基辅以北的区域,民间有“鬼城”之称,现时Pripyat市已经成为了一个旅游景点。显然,新版S.T.A.L.K.E.R.游戏的舞台就在这里搭建。
测试参数设定:
使用游戏自带Benchmark程序,运行在DX11最高画质设定下,测试使用1920×1080分辨率,开启AA/AF。《潜行者:普利皮亚季的召唤》Benchmark测试分为白天、黑夜、雨天、光照各种场景,每个场景都会得出各自的测试结果,下面我们在同一个柱状图中对比这四个场景的测试结果。
显存位宽的严格对这款游戏影响微弱,伪GTX465与GTX470性能差别不大。
DX11游戏测试:《地铁2033》
● DX11游戏 《地铁2033》测试
《地铁2033》改编自俄国作家Dmitry Glukhovsky的畅销小说,由乌克兰4A游戏工作室开发,采用4A游戏引擎,而且PC版支持nvidia的PhysX物理特效。 2013年,由于大面积的核泄漏,导致几乎所有的人类都被消灭,而且地面已经被污染无法生存,极少数幸存者存活在莫斯科的深度地下避难所里(俄罗斯的地铁站在建造之初就有防空防炸防核防辐射的设计)人类文明进入了新的黑暗时代。直至2033年,整整一代人出生并在地下成长,他们长期被困在“地铁站”的城市。
测试参数设定:
这款游戏没有自带Benchmark程序,人工测试场景选择第一关从爬梯子开始直到消灭三个怪物后拉铁门结束,使用Fraps软件记录游戏帧率。运行在DX11最高画质设定下,测试使用1920×1080分辨率,开启AA/AF。
《地铁2033》真是比《孤岛危机》还要变态的游戏,对显卡资源的优化不是一般的差,再加上其中含有不少DX11特效,使得显卡的强弱在它面前都失去了意义。伪GTX465比GTX470少2fps左右,从比例来看,显存对这款游戏的影响还是比较明显的。
DX11游戏测试:《叛逆连队2》
● DX11游戏 《战地:叛逆连队2》测试
《战地:叛逆连队2》(Battlefield: Bad Company 2),是EA DICE开发的一款第一人称射击游戏。游戏开发商美国艺电确定2010年3月2日为游戏Xbox 360、PS3、PC版的首发日期。该游戏是EA DICE开发的第9款“战地”系列作品,也是《战地:叛逆连队》的直接续作,在继承前作特性的基础上,强化了多人联机载具对战和团队合作元素的设定。游戏使用加强版的寒霜引擎,加入了建筑物框架破坏和物体分块破坏的支持。
测试参数设定:
这款游戏没有自带Benchmark程序,选择第二关“Cold war”刚开始时长达两分钟的自动过场剧情,使用Fraps软件记录游戏帧率。运行在DX11最高画质设定下,测试使用1920×1080分辨率,开启AA/AF。
《叛逆连队2》中存在大量基于HAVOK引擎的物理特效,这种引擎所使用的开放式语言与PhysX截然不同,主要依靠CPU计算,少部分由显卡计算,而CUDA架构是针对PhysX引擎设计的内核,因此几乎所有NVIDIA显卡的表现都强差人意。当显存位宽下降64bit之后,伪GTX465有5fps的降速。
DX10.1游戏测试:《鹰击长空》
● DX10.1游戏 《汤姆克兰西之鹰击长空》测试
类似经典的《皇牌空战》的座舱式模拟空战游戏,玩家可以驾驶超过50种飞机进行战斗。游戏的背景时间设定在2012年,那时的世界正越来越依赖于私人的军火公司(PMCs)。随着PMCs逐渐强大,世界正走向全球冲突的悬崖。这听起来好像是个足够充分的理由让玩家跳进自己的战斗机去干掉那些坏蛋。
测试参数设定:
使用游戏自带Benchmark程序,运行在DX10.1最高画质设定下,测试使用1920×1080分辨率,开启AA/AF。
经过以上四款DX11游戏的考验后,这是首个测试的DX10.1游戏,从总共上百的帧率来看,位宽和容量减少后伪GTX465只比GTX470降低了8fps,看来影响不是特别明显。
DX10游戏测试:《孤岛危机》
● DX10游戏 《孤岛危机》测试
《孤岛危机》(Crysis)是一款科幻题材的第一人称射击游戏,此游戏由德国游戏开发商Crytek制作开发,在由美国艺电发行,是孤岛危机三部曲的第一部。《孤岛危机》的背景发生在一群外星机器的船舰在地底被发现,玩家扮演三角洲特种部队中暴龙小队的成员──诺曼(Nomad)进行搜索和撤离的任务。这款游戏对硬件配置尤其是显卡的要求极高,发售没几天便获得“硬件杀手”的称号。
测试参数设定:
使用游戏自带Benchmark程序,所有参测显卡运行在DX10最高画质设定下,测试使用1920×1080分辨率,开启AA/AF。
从它诞生那一天开始,至今没有一片单卡能在大分辨率特效全开的前提下达到40帧,这已经不是一款游戏,因为几乎没有人能痛痛快快地玩,Benchmark是《孤岛危机》更适合扮演的角色。尽管这款游戏的纹理量多的惊人,但毕竟是几年前出品,伪GTX465 1024MB的显存容量和256bit位宽配上GDDR5的速度还是能满足它,因此显存规格的减少并没有对伪GTX465产生太多影响。
DX10游戏测试:《生化危机5》
● DX10游戏 《生化危机5》测试
《生化危机》,这个不朽的名字几乎任何80年后出生的男孩都知道。早在12年前这款游戏就已存在,并就此开创了AVG(冒险解谜类)游戏的先河。时至今日,《生化危机》系列已推出第五代作品,官方正式登陆PC平台,这次主人公要前往非洲无名小镇完成任务。相比第四代作品,《生化危机5》上的射击类游戏特征似乎更加明显。
测试参数设定:
使用游戏自带Benchmark程序,所有参测显卡运行在DX10最高画质设定下,测试使用1920×1080分辨率,开启AA/AF。
《生化危机5》对PC系统资源的优化异常出色,即便是只有中端显卡也能让用户在特效全开的状态下获得较为流畅的体验。这款游戏对显存的要求不高,伪GTX465相比GTX470而言只减少了6fps而已。
《星际争霸2》测试及GTX465未来预测
● DX10游戏 《星际争霸2:自由之翼》测试
《星际争霸》是个该载入电脑文化发展史册的绝世之作,它的第一部作品于1998年诞生于美国暴雪娱乐,奠定了“暴雪出品必定精品”格言。可能就连当时的制作者也不曾料到它会成为迄今为止最成功的即时战略游戏,就在这款游戏发售12年后的今天,世界各地仍然在开展这款游戏的比赛,孕育出无数令人敬仰的电竞明星。
游戏界赋予《星际争霸》的评价越高,对其续作《星际争霸2》的压力就越大,暴雪多年积累的口碑让“二代不如一代”变成对它的亵渎。于是竟然时隔12年之久,我们才有幸体验到《星际争霸2》的Beta试玩版,而正式发售日期更是无法预料。这款游戏支持DX10 API,游戏画面发生翻天覆地的变化,再也不是那个“无论多烂配置”都能流畅运行的游戏了。
测试参数设定:
《星际争霸2》没有自带的Benchmark程序,需要通过Fraps测试回放的replay来计算帧数,笔者在replay中选择了一个让显卡负载较高的固定场景和固定时间段用于测试。测试中所有参测显卡运行在DX10最高画质设定下,AA/AF开启。
《星际争霸2》基于HAVOK物理引擎开发,不是NVIDIA所擅长的项目,但这仅仅是相对ATi显卡而言,从速度的绝对值上看,所有GTX系列显卡都是能够满足需求的。游戏设定中提示要开启最高特效需要1024MB的显存容量,伪GTX465正好能满足这个需求,所以比较GTX470并没什么明显变化。
● 测试结果总结,预测真GTX465玩法
我们确信GTX465和GTX470是采用相同GF100芯片、相同板型的显卡,不过简单地依靠刷BIOS无法将GTX470变成一片真正的GTX465,问题出在SP流处理器上。尽管显存位宽和容量已按照GTX465的设定被削减,但SP单元数量仍然维持GTX470的448个不变。这要比真正GTX465的352个多96个,所以真实性能与本次所测结果还会有可观的差距。
显存位宽和容量的降低在大分辨率下的高端游戏中已经产生影响,那么再减少96个SP单元可想而知,可见从GTX470到GTX465的规格下降幅度还是比较大的,它与GTX470至少会形成后者与GTX480那样的差距。
关于GTX465是否刷BIOS就会变成GTX470,从理论上来说确实可行,因为它们实物上毕竟是一模一样的东西,但从本文的尝试来看,真实情况可能不会那么乐观。厂商似乎通过除BIOS之外的手段锁定了SP单元数量,毕竟官方不希望因为这个缘故导致市场混乱,但对于广大硬件玩家们来说也不必气馁,我们现在关于这款显卡的了解十分有限,等产品正式发布了,越来越多的技术点被曝光之后才见分晓。
网友评论