Radeon HD5870发布已经一段时间了,在抢占时间上我们评测室无疑是落后的,因此,我们这次尝试用一个更独特的视觉——视频来看Radeon HD5870。本文将会讨论Radeon HD5870架构设计、40纳米工艺、DirectX 11,还会通过图文视频的方式来演绎Radeon HD5870的性能测试。
前言:早起的鸟儿有食吃
“全世界第一款DriectX 10显卡,世界上性能最强的显卡,领先竞争对手出货半年以上....... ”
2006年底,全世界的硬件消费者几乎都能听到来自NVIDIA气宇轩昂如潮水般的宣传。NVIDIA成功的使用了障眼法,当许多人还不明就里的时候,全球第一款基于统一渲染架构,符合DriectX 10规范的芯片:G80突然问世。在随后半年内,G80芯片几乎横扫整个高端显卡市场。而半年后问世的ATI R600芯片,历经三次重制,性能却始终未达预期。此时整个红色国土已遍布狼烟,最终留给ATI的,只剩下一片废墟......
同时期,AMD启动了对ATI的收购。
回顾往昔,许多人猜测,产品竞争总有优劣之分,但如果当时的ATI能够如期拿出对应的产品,也不至败的如此惨淡。
时间,许多时候可能比产品性能更重要。
2007年低,AMD拿出了RV670,给人以意外。
2008年中,AMD拿出了RV770,给人以惊喜。
终于,在2009年,时隔三年之后,成为AMD一部分的ATI显卡研发团队捧出了HD5800系列显卡。
“全世界第一款DriectX 11显卡,世界上性能最强的显卡,可能领先竞争对手出货半年以上.......”
这句话终于从AMD的口中说出来了,尽管加了“可能”两个字。3年后的今天,是否会重演3年前的一幕,没有人能够定论。不过卖断货的事实还是印证了那句老话:“早起的鸟儿有食吃”。
三年来,PC业界围绕着AMD-ATI与NVIDIA的之间的话题从未间断过,甚至在对显卡的讨论中加入了更为重量级的INTEL。
时光在飞速的前进,每一天、每个小时、甚至每一分钟,在INTEL、IBM、TSMC、Globefoundries、AMD、NVIDIA等等这些企业的实验室或者工厂里,数以万计甚至十万计的工程师们都在苦苦的寻求着每一次细小的突破,无数细小的突破最终汇聚成我们手中的一块块芯片,一张张显卡。每当我们还沉寂在得到性能强劲,功能强大的新产品的喜悦中时,这些工程师都已经在忙于开发用于未来数年,甚至十数年的新技术的路途上。
任何一款好产品,都值得我们为之疯狂。
历经波折的40nm工艺
当INTEL利用无与伦比的工艺优势在CPU领域步步紧逼AMD时,很多人却不曾想到,AMD也正在GPU领域面对NVIDIA摆开同样的阵势。
众所周知,AMD与NVIDIA双方的GPU生产线都依赖目前全球最大的半导体代工企业,也是我们宝岛台湾的骄傲:晶圆双雄TSMC(台积电)和UMC(台联电)。其中又以台积电所接手的晶圆业务份额最高。因此在某种程度上,台积电的工艺研发与生产能力就决定了两家企业在GPU研发与制造上所能实现的最高目标。
不过在TSMC顺利的迈过了90nm、80nm、65nm和55nm节点之后,在45nm节点之下,遇到了极大的困扰。由于在65nm和55nm工艺节点,尤其是55nm工艺节点上,逆势崛起的AMD与雄心勃勃的NVIDIA展开了异常激烈的争夺战,双方因各方因素都承担着巨大的压力。因此都不约而同的把目光锁定在了TSMC的次世代工艺之上。希望能通过次世代工艺的更新能获得某种转机。在此之前,双方面对工艺的革新展现出两种截然不同的态度:AMD(ATI)方面经常承担着先锋的角色,不惜首先试水TSMC的最新工艺。而NVIDIA方面则略显保守,经常作为第二梯队跟进,而在这一过程中,TSMC的“半代”工艺经常扮演着特殊的角色,由于80nm和55nm这样的半代工艺存在,双方都维持着有规律的更新步伐。但是在45nm之后节点上,AMD与NVIDIA以及台积电不约而同的选择跳过45nm节点,而直接迈向40nm,令业界人士感到意外。
跳过45nm节点也就意味着首批试水新工艺的产品可能会遇到比以往更多的技术困难。在同一时间同一代产品上都选择同一种工艺,也就意味着双方站在了同样的起跑线上,开始比拼双方的工艺把握能力和设计理念。这一点,让习惯于尝试新工艺的AMD(ATI)在无形中占据了优势。
2009年4月末,AMD方面率先拿出了首款基于40nm工艺产品:RV740核心及与之对应的HD4770显卡。这款显卡在诞生之初所产生的轰动效应及其对市场带来的影响是显而易见的,国内DIY用户群体对该款产品的热切关注也给小编留下了非常深刻的印象。不过也同样是在那个时候,TSMC的40nm生产线所暴露出的问题也一一浮出水面。
最早的40纳米产品——Radeon HD4770
45nm工艺是半导体制造领域的一个历史性的节点,任何厂商要跨越这个节点都需要克服比之前任何一代工艺还棘手的各类问题。在PC业界,INTEL是最早完成向45nm产品线过度的厂商,其在2007年底就已经拿出了基于45nm工艺的CPU产品。在2008年第三季度,AMD也成功拿出了基于45nm工艺的新型皓龙芯片,代号“上海”,随后在2008年初开始将桌面产品线向45nm过度。而TSMC在2008年4月时却在能够制造高性能芯片的40nm工艺上遭遇了严重的挫折。
首批使用TSMC 40nm工艺的AMD使用晶体管数量8.26亿的RV740核心作为先锋,最终结果令所有人感到震惊。在此工艺版本下的RV740核心,面积控制在137平方毫米,但是晶圆良率却始终徘徊在在极低的水平,据流传出的不完整数据显示,RV740核心的晶圆良率很可能只有15%以下,甚至是个位数。要知道,核心面积137平方毫米的GPU核心,通常其对应的显卡定位在100美元左右,15%以下的良品率是完全不可接受的。因此AMD方面尽管在全球范围内发布了基于RV740核心的HD4770显卡,但是首批上市的产品,却只有4万块左右,而在中国大陆地区则根本没有上市......这也引起了大陆地区玩家的极度不满。
同样是在此时,围绕AMD RV740核心产品的谣言和诋毁叫嚣尘上。在市场及网络间,少数“枪手”利用普通消费者对半导体概念知之甚少,将生产良率不高的状况,刻意与RV740芯片产品描述成“暇疵”产品而大肆诋毁......
在此,我们必须说明,所谓产品良率不足,并非是AMD拿出的芯片产品有瑕疵,而是一块完整的晶圆上所切割下来的晶片中,符合设计要求的数量不足。被制造成显卡的核心产品,必然是符合设计要求的合格产品,换而言之,AMD所拿出的HD4770显卡,全部都是经过测试合格的产品。只可惜HD4770显卡在国内无法成行,以及9月发布的基于市场考量的HD4750显卡的实际规格,使得我们在此说阐述的任何观点都显得苍白无力。
我们有理由质疑,HD4770显卡独独在国内无法成行的背后,到底发生了什么?
不过,从4月末RV740核心的小批量发布,到9月底AMD真正的重头产品“Radeon HD 5000系列”系列发布,这段时间内也正是TSMC为40nm工艺而苦苦寻求改进的时期。在这段时间内,我们不断的获得了来自TSMC的信息情报,显示TSMC不断的与业内相关企业合作以改进40nm工艺上所发现的问题。
另一方面,由于40nm产品的良率过于低下,TSMC被迫向AMD方面提供优惠报价,并且采取措施稳住AMD这个重要客户,避免AMD过早转而向其旗下的合资工厂Globalfoundries。
6月,台北ComputeX展会上,AMD与TSMC合作向外展示全球首款符合DX11规范的“evergreen”家族核心晶圆,关于40nm的争论就此划上了休止符。
扑朔迷离的“双核”芯片
本次Radeon HD 5000系列显卡的所属的evergreen家族GPU核心,采用了与以往截然不同的代号命名,使用植物名称,取代传统的RXXX,RVXXX等等规范。
根据目前的消息,AMD方面一共规划了5款核心:代号分别是:Hemlock(代号类似R800,预计用于单卡双芯片产品HD5870X2或者HD5900系列显卡,定位400~500美元级市场)、Cypress(代号类似RV870,用于单卡单芯产品HD5870显卡,定位300美元左右市场)、Juniper(原代号不明,用于HD5700系列显卡,定位200美元左右市场)、Redwood(代号类似RV830,预计用于HD5600系列显卡,定位100美元以下市场)、Cedar(代号类似RV810,预计用于HD5300等显卡,定位OEM及入门级市场)
在这些看似奇特的代号中,Hemlock,Redwood,Cedar的定位比较符合传统,最令人感到迷惑的代号是:Cypress与Juniper,两者无论在核心规格还是芯片外形等各个方面,都显得格外特殊。
首先来看一下关于Cypress的相关规格信息表:
再来看下Cypress与Juniper目前的已知信息对比:
最后来看看Cypress芯片与Juniper芯片的核心照片和架构图:
Juniper的核心照片
Cypress的核心照片
Juniper的架构图
Cypress的架构图
从以上的数据及照片细节不难看出,Cypress芯片与Juniper芯片之间极有可能存在着某种特殊的紧密联系,Juniper芯片无论在芯片规模,核心面积以及芯片布局等方面都几乎是Cypress芯片的一半。
根据AMD自K10处理器以来的研发及产品状况,我们很自然的联想到Cypress芯片采用了与之类似的思路,甚至更为激进。尽管对于GPU诞生以来,我们一直认为其本身就是天然的多核心芯片,例如NVIDIA方面就声称其GT200核心内部有着240个“核心”,AMD也宣称自己的RV770核心内部相当于800个“核心”只是两者具体的定义不同,但这并不意味着这种“多核心”的概念是一成不变的。对于一颗大型芯片,即使是GPU芯片,如果其中的内部设计可以模块化,那么拥有扎实的互联设计经验的研发者就可以根据需求以更大的模块而不是传统的“核”来进行组装。这样做的价值在于其芯片的设计难度将大大简化,研发周期也可以明显缩短,同时模块化的方式也就可以更加便利的将不同数量的“部件”“拼装”成规格,定位,价格均不同的多款芯片。如此一来大芯片的设计风险可以明显降低,同时也更有助于尽快向市场推出面向不同价格区间的丰富产品线。
我们坚信,Cypress芯片与Juniper芯片的诞生使得AMD在这样一条道路上迈开了坚实的一步,尽管AMD方面可能因为种种原因不愿公开谈论Cypress芯片与Juniper芯片间存在的具体关联,我们暂时也无从获得更加详细的信息来印证我们的观点,但其所产生的正面影响却可以立刻展现。
就在未来数天内,刚刚完成了以Cypress芯片构建的HD5800系列显卡发布的AMD,又将可以拿出以Juniper芯片构建的HD5700系列显卡,前者面向300美元左右的市场,而后者面向200美元左右的市场。两款芯片短时间内就将构建出4款显卡组成的DX11阵营,分别是HD5870、HD5850、HD5770、HD5750,几乎填满了由100美元至350美元的市场空间。而在此前的RV770芯片时代,首批由RV770芯片构建的HD4800系列显卡只能祭出HD4870和HD4850两款产品,其所覆盖的市场区间也只有299美元和199美元两个相对狭窄的价格区域内。
由此可见,在整个2009年第四季度内,AMD方面明显将受益于前瞻且务实的产品研发策略,在100美元至350美元价格段内,以代差、性能、成本和能耗比优势向竞争对手的产品线展开全面的挤压,无论在零售市场还是OEM市场。
一地鸡毛的DriectX 10.1
首先,我们必须承认,与Vista同期发布的DriectX 10,并不是一个成功的产品。DriectX 10诞生的重大意义之一在于其促使了GPU向统一渲染架构的转变。可以说这种转变无论对于软件界还是硬件界的潜在价值都相当高,但同时DriectX 10在其所面对的游戏领域表现令人失望。在整个DriectX 10世代,唯一给用户留下极其深刻印象的作品,当属Crysis(孤岛危机)。Crysis的成功,在于其所带来的令人乍舌的极度夸张的渲染效果,但其失败也同样是因为如此夸张的渲染效果使得其成为了令人难以接受的“硬件杀手”,而在这其中,DriectX 10的效率问题不可回避。
鹰击长空,为数不多DX10.1游戏
为了使DriectX 10的效率问题得到改善,微软方面拿出了DriectX 10.1。应该承认,DriectX 10.1的主要目的不是提升画质,而是尝试提升硬件的运作效率。这一点,在目前支持DriectX 10.1的游戏中可以看出,支持DriectX 10.1的显卡相比仅支持DriectX 10的显卡在效率上会有明显的提升,尤其是在抗锯齿效果的处理上。
但是对于DriectX 10.1的支持,两大GPU厂商AMD与NVIDIA的态度截然不同。AMD方面历来与微软的关系非常紧密,第一时间便宣布在HD3800系列显卡上就提供对DriectX 10.1的支持。而NVIDIA方面自2007年末至不久前,都坚决拒绝提供对DriectX 10.1的支持,原因可能是DriectX 10.1所需的硬件设计改动对NVIDIA已经设计完成的产品影响较大。由此形成了AMD DriectX 10.1显卡阵营面对NVIDIA DriectX 10显卡阵营长达一年零10个月之久的对峙局面,在此期间双方围绕DriectX 10.1所产生的交锋令人实在无话可说。
不过,在Windows 7操作系统的开发进度加快,并且Windows 7操作系统对DriectX 10.1中的某些特性提出了明确的要求之后,NVIDIA方面在旗下的40nm新产品开发阶段转变了态度,宣布对已在开发中的40nm低端和入门级产品提供对DriectX 10.1规范的支持,我们认为,这其中最大的影响因素可能来自OEM厂商因Windows 7操作系统的变化而提出的明确要求。不过,在Windows 7操作系统和即将面世的DriectX 11即将到来之际作出这样的调整,我们很难不因此产生联想,鉴于目前已知的NVIDIA产品开发规划,NVIDIA方面是否因为对自身DriectX 11世代显卡的问世时间无法做出准确的预计,迫于市场及时间压力才出此下策?同代产品中,低端型号显卡反而比高端型号支持更高的DriectX版本,又会对NVIDIA自身的市场布局产生什么样的影响?我们拭目以待......
DX11突破一:多核心成主流
Windows 7操作系统和DriectX 11的问世,无论对于GPU厂商还是CPU厂商,都具有非常正面的影响,其中的原因之一在于DriectX 11所提供的处理模式发生了根本的转变:多核心CPU的利用将更加自由,由此带动GPU性能的充分发挥。
在DriectX 10及此前的任何一代DriectX中,GPU的性能总是要受制于CPU的性能,当CPU的发展由提升频率转向增加核心之后,这种限制就变得更加明显,DriectX10及此前的DriectX版本无法充分利用多核心的处理能力来带动GPU性能的发挥,因此我们也就在很多游戏测试中看到了低频多核心处理器的表现可能不如高频双核心情况,而当时我们认为多核心处理器优势的发挥可能要依靠部分非GPU处理的工作,例如物理加速,人工智能等来满足,而现在微软方面用Multi-Threading(多线程)分派方式将问题大大简化了。
DX11突破二:曲面细分被接纳
DriectX 11世代中并没有提供太多针对渲染画质改善,更专注于对硬件运作效率的改进。不过其中有一个非常重要的例外:Tessellation(镶嵌单元曲面细分技术)。
Tessellation是ATI苦心开发与推广的一套堪称神奇的技术,这项技术的特点在于实现对模型深度精细化的同时,却不会消耗更多的硬件资源,也就是我们俗称的“免费”。
Tessellation接过了原先属于设计者需要花费大量时间进行设定的模型节点,自动完成将固定贴图和平面细化。使得模型显得更加精细和真实。这项技术最早出现在ATI R200 GPU世代,历经长达7年的改进与完善,最终成为DriectX 11中的重要规范。在这7年中,ATI的工程师们对Tessellation技术进行了不懈的完善和推动,历经波折后最终得以推广,也算是告慰了历代ATI工程师的心血。印证了那句老话:“是金子总会发光的”。
DX11突破三:GPU通用计算标准初定
DirectCompute的正式发布,无疑是DriectX 11下最令人期待的技术特性。
严格的来说,DirectCompute与我们对于DirectX的传统认识有很大的区别,DirectCompute并非为3D处理而生,更重要的目标是GPGPU(显卡GPU的通用计算)。DirectCompute技术标志着微软尝试在操作系统中将CPU与GPU的计算能力综合利用的可能。
当前GPU性能早已今非昔比,且GPU架构体系在DriectX 10世代已经迈向了统一渲染架构,具备了成为更强大通用计算核心的可能。让擅长于并行计算的GPU承担更多的处理任务,是当前两大高性能GPU厂商AMD与NVIDIA都热切期盼的方向。 AMD(前ATI)是最早在业界推广GPGPU技术的厂商,在R500时代,ATI方面就在尝试将旗下的GPU应用在更多的领域,其中最广为人知的便是与斯坦福大学合作开发的“Folding@home”蛋白质折叠计算应用。但在2006年之后,由于前ATI的经营状况不佳及AMD的收购举措,ATI方面的GPGPU应用推广停顿了下来,转而由NVIDIA承担了这项使命。由于NVIDIA作为GPU的独立开发商,缺乏与AMD和INTEL类似的CPU技术,因此尽力提升GPU的地位,最大限度的替代CPU,也就成为了NVIDIA的研发方向。其第一代的统一渲染架构G80的问世,就已经显露出了这种思路。
由于面对AMD与INTEL双方的平台化战略进逼,NVIDIA方面不惜重金试图拓展GPU的应用范围,并且力推以硬件架构和软件开发环境并举的CUDA作为急先锋,开始了向CPU阵营的挑战。而此时AMD方面则因资源的限制没有做出太大的调整,其旗下的GPGPU套件依然基于老旧的自有规范:Brook+,AMD方面也仅仅把Brook+作为应付NVIDIA在宣传战中挑战的筹码而已,并没有花费太多的力气在扩展Brook+的开发应用上。但这并非是AMD没有开发的实力或者意愿,而是在等待一个至关重要的东西:标准。
在PCL领域,标准可以决定企业的生死存亡。经历了R500时代的AMD认为,GPU性能的开发确实非常重要,但也正是因为GPU性能开发的重要性,AMD不能也没有实力独享GPU性能开发所带来的收益。在这样的环境下,一个开放的,众多企业参与的标准或者由某一家具有领导地位的企业所制定的标准就是必须的。前者AMD等到了苹果的Open CL,后者AMD则等到了微软的DirectCompute。
我们认为,未来的通用计算标准很有可能延续3D世代的竞争模式,3D世代是Open GL vs DriectX,通用计算时代则是Open CL vs DirectCompute。
由于AMD坚持奉行开放标准,因此Open CL与DirectCompute也就共同构成了支持AMD Stream技术的两大支柱,原有的Brook+开发套件已经被取消。今后我们提到的AMD Stream加速技术的实质,就是基于AMD硬件平台之上的Open CL与Direct Compute技术。
目前在GPU领域,分别形成了两大硬件对立阵营与标准,AMD GPU具备Stream加速技术,NVIDIA的GPU具备CUDA技术,两者都提供了针对Open CL与DirectCompute两大标准的支持。相对而言,NVIDIA的CUDA定位更加模糊。CUDA包括一个硬件架构体系,在这个硬件架构体系上,可以提供对Open CL与DirectCompute的支持,另外一方面,CUDA也包括一套与Open CL与DirectCompute功能近似的软件开发环境,这一部分与Open CL与DirectCompute存在某种冲突,无论NVIDIA方面试图如何阐述CUDA与另外两者的关系,都无法回避这样一个疑问:程序的开发者通常都只会选择一个标准来开发,那么他们是选择只能在NVIDIA GPU上运行的CUDA还是选择可以在更广泛硬件上运行的Open CL和Direct Compute呢?这个疑问,留给时间去回答吧。
DX11的其他亮点
ShaderModel 5.0(着色器模型5.0)与HDR Texture Compression(HDR纹理压缩)也是DriectX 11的两项重要改进,ShaderModel是历代DX更新都必须做出改进的部分,ShaderModel5.0也成为了此前ShaderModel4.0版本的超集。
因此现有的DriectX 10.1游戏可以通过较少的代价完成程序代码的升级,尽快转换为符合DriectX 11规范的游戏。
而HDR纹理压缩则代表了DriectX 11对硬件资源利用率的另外一个重要提升,通过HDR Texture Compression的应用,在处理纹理数据时,可以占用更少的显存,有效的降低新特效对于硬件资源的需求,并尽可能真实的将图像还原出来。
完美的各向异性过滤
各向异性过滤(AF)曾经被看作是游戏设置中仅次于抗锯齿(AA)的重要环节。
开启各向异性过滤下的性能也就被认为是衡量GPU性能的标准之一。HD5800系列显卡之上,AMD GPU的研发团队实现了一项不小的突破:完美AF。
由上图所示,HD5800系列显卡的AF性能在历经多代的完善后,终于可以将AF以近乎完美的姿态纳入其技术规范。在此之前,AF性能上ATI显卡并未占据优势,而此次,完美意味着已经无法超越。
HD5000系列显卡的多头显示技术
早在Radeon8500出现的时候,Matrox已经在幻日显卡上实现了三屏显示了,而现在AMD亦在Radeon HD5870上通过实现了3屏输出。一般版本的Radeon HD5870提供DVI-I×2、HDMI×1和Displayport×1共4个接口,最高支持3屏协同输出,拥有如下图所示的4种不同实现方式。
除了DVI-I×2、HDMI×1和Displayport×1配置的Radeon HD5870外,AMD还推出一款支持Eyefinity6技术的Radeon HD5870(如下图所示),拥有6个Displayport接口,最高支持6屏同时输出,不过这款Radeon HD5870尚未全面上市。
Eyefinity6技术下,拥有5种不同6屏输出组合
多屏输出的不同数量显示器组合
规格惊人的Radeon HD5870
离开数据化的芯片规格,让我们来看看目前Cypress核心的代表作:ATI Radeon HD5870显卡本身。
ATI Radeon HD5870显卡使用完整的Cypress核心,具备惊人的1600个流处理器单元,浮点运算能力达到史无前例的2.72T,超越了以往任何一款单卡,无论是单芯片还是双芯片。
得益于40nm制程的演进,ATI Radeon HD5870显卡的核心频率设定在了850MHz,为这颗性能强劲的核心搭配的是频率高达4.8Gbps的1GB容量GDDR5显存。由于高频GDDR5显存的使用,256bit位宽下就可以提供高达153.6GB/s的显存带宽。同时,这样的显存规格也意味着:1GB显存容量的时代到来了。令人感到欣慰的是,尽管不久前GDDR5显存的提供商奇梦达申请了破产保护,但是后继的韩系显存大厂三星和海力士出色的完成了接班任务。
显卡上的Cypress核心与采用45度封装,与RV670和RV770世代GPU不同,Cypress核心的面积被放宽到334平方毫米,是AMD奉行小核心策略以来最大的一次。近年来与此面积类似的芯片大概当属65nm工艺下的G92核心。但是在AMD良好的工艺把握能力下,相似面积的Cypress核心所能实现的性能级别明显超过了以往。
由Cypress核心规格与RV770核心的规格,我们不难看出,Cypress核心是建立在RV770核心之上的扩张版本,其扩张的内容不仅仅包括翻倍的处理单元,同样包括符合DriectX 11规范的诸多改进。
由两者的晶体管数量差别可粗略计算得出:用于针对DriectX 11和Open CL等用途改进的晶体管大致为2.38亿。就是这2.38亿晶体管决定了Cypress核心及其衍生的所有产品的前途。
显卡赏析
与昔日ATi旗舰显卡不同,Radeon HD5870一改以往火红色风格,变成以黑色为主,再搭配红色的风格。
整张显卡被黑红色的散热器包裹起来,外露的电子元件不多。
Radeon HD5870采用双6pin电源接口设计。
在接口方面,Radeon HD5870提供了DisplayPort、HDMI各一,以及两个DVI-I接口,不过由于堆叠了两个DVI接口,导致Radeon H5870挡板散热槽偏小。
Radeon HD5870与ATi首款40纳米产品Radeon HD4770对比。
显卡拆解
在卸下散热器后,我们便可以看到Radeon HD5870的全貌,一改红色的PCB,Radeon HD5870采用的棕黑色的PCB。
与前代旗舰产品一样,Radeon HD5870采用的超高频供电电路设计,主要的供电电路布局在PCB尾端。
Radeon HD5870上的40纳米制程的RV870核心,RV870的边长略长于1角硬币的直径。
在Radeon HD5870的前端除了布置了一个小规模的供电电路外,就是输出接口。左边高耸的接口是两个DVI-I接口,在DVI-I接口旁边的是HDMI接口,远离DVI-I接口的是Displayport接口。
由于主要电子零件都布置在PCB正面,因此在PCB背面除了大量的贴片电容外,其他电子零件并不多。
在RadeonHD5870的PCB背面有大量贴片电路对应正面PCB的供电电路。
供电设计
为了满足RV870 20多亿个晶体管的电能需求,在Radeon HD5870 PCB的后端,布置了2个两个6pin电源接口,Radeon HD5870所需大部分电能通过这两个电源接口输入。
Radeon HD5870的主供电电路,属于超高频供电电路。采用了CSP封装、整合驱动器的的MOSFET,整合驱动器的MOFET由于驱动芯片和MOSFET集成到一个封装内以后,相互之间的连线大大缩短,寄生电感大大减少,从而不需要消振电阻。驱动回路的阻抗大大下降,更能提高开关速度 。同时CSP封装的MOSFET由于没有陶瓷或塑料外壳,散热效能更佳。但由于缺乏陶瓷或塑料外壳的保护,这种封装的MOSFET更容易损坏,玩家拆卸显卡时要多加小心。
Radeon HD5870主电源管理芯片Volterra的VT1165,VT1165已经是ATi公版显卡长期使用的电管管理芯片,但由于Volterra并没有提供Datasheet,详细性能无从得知。
在Radeon HD5870的PCB前端、Displayport接口旁,布置了一个小规模的供电电路。
散热设计
与前代旗舰一样,Radeon HD5870亦是采用吸气侧吹式涡轮风扇的热管散热器,不过在Radeon HD5870的散热器的尾端增加了两个进风口,用于Crossfire时进风使用。
Radeon HD5870背面的金属底板,其保护电子零件的作用。
散热器底部,对应显存、供电电路的地方都贴上导热垫辅助散热,核心则是通过硅脂与铜底相连。
散热设计续
在散热器的底部,覆盖了一层绝缘用的塑料薄膜。
在卸下散热器的塑料外壳后,我们便可以看到散热片的真容。采用四热管设计,铜底吸收核心的热量后通过四根恶热管递到铝质散热鳍片上。
测试平台
硬件平台 | ||||||
CPU |
Intel Core i7 870ES(开启Turbo Mode ) | |||||
主板 |
微星P55-GD80 | |||||
显卡 |
Radeon HD5870 | |||||
Geforce GTX285 | ||||||
内存 |
Corsair DDR3 2GB×2 | |||||
硬盘 |
日立1TB HDT721010SLA360 7200转16M SATAII | |||||
电源 |
长城双卡王发烧版BTX-600SE | |||||
显示器 |
优派 | |||||
软件环境 | ||||||
操作系统 |
Microsoft Windows 7 7100 | |||||
芯片组驱动 | Intel chipest 9.1.1.1015 | |||||
显卡驱动 |
ATi 8.66RC7 | |||||
NVIDIA 190.62 | ||||||
测试项目 | ||||||
基准软件测试
|
3DMark06 | |||||
3DMark Vantage | ||||||
游戏测试 |
《Campany Of Heroes》 | |||||
《Call Of Juarez》 | ||||||
《World in Conflict》 | ||||||
《Crysis》 | ||||||
《Farcry2》 | ||||||
《H.A.W.X》 | ||||||
《街头霸王4》 | ||||||
《Devil May Cry4》 | ||||||
测试工具 |
GPU-Z 0.3.5 | |||||
PCHOME硬件评测室
测试平台合作伙伴 |
||||||
CPU方面,我们选用了来自Intle的Core i7 870ES:
主板方面,我们选用了来自微星P55-GD80:
硬盘方面,我们选用了来自日立1TB HDT721010SLA360 7200转16M SATAII。在此,我们特别感谢讯怡为我们赞助的硬盘等设备。
显卡参数
在测试开始前我们先看一下参与测试的显卡的参数。
使用GPU-Z 0.3.5版软件已经能正确识别Radeon HD5870的参数了,采用40纳米工艺,核心面积334 mm^2,拥有1600流处理器,核心频率为850MHz,板载1GB 256bit GDDR5显存,显存运行频率为1200MHz,提供153.6GB/s带宽。
除了上述参数外,Radeon HD5870的闲置频率、风扇转速、电压等的参数都识别出来。在闲置状态下,Radeon HD5870的核心与显存频率分别为157MHz、300MHz,较前一代大为降低。
参与对比的测试的Geforce GTX285,由于这张Geforce GTX285显卡是高频版,所以我们在测试中将其降频到公版频率——核心648MHz、Shader 1476MHz以及显存1476MHz。
3DMark 06测试
3DMark 06早已是一款为人多熟悉的常用测试软件,不过3DMark 06的默认测试已经无法展现Radeon HD5870的实力,因此在把3DMark 06的测试设定为1920×1200分辨率、开启8XAA。在此设置下,Radeon HD5870领先Geforce GTX285达47%。
对于一个显卡测试来说,详尽的测试数据是必须的,但是纯粹是数据的话测试会显得冷冰冰,因此在这次测试引入大量的测试项目录像,让读者直观感受这两款显卡的速度差异。在下文的3D性能测试中,我们评测室提供了Radeon HD5870和Geforce GTX285在不同项目的最高特效下的Benchmark录像节选,在后期处理视频中,未调节视频播放速度。
3DMark 06 1920X1200 8X AA下的Radeon HD5870录像节选:
3DMark 06 1920X1200 8X AA下的Geforce GTX285录像节选:
3DMark Vantage测试
3DMark Vantage是Futuremark出品的最新的3D性能基准测试软件。在X设置下,Radeon HD5870取得8058的分数,领先Geforce GTX295 33%。
3DMark Vantage X下的Radeon HD5870录像节选:
3DMark Vantage X下的Geforce GTX285录像节选:
Call Of Juarez测试
虽然Call Of Juarez推出已久的DirectX10游戏,但是并不意味着现在的主流显卡能在最高特效流畅运行该游戏。但在1920X1200下Radeon HD5870取得了75.8FPS的平均帧速,领先Geforce GTX285一倍;1920X1200 4XMSAA下Radeon HD587的平均FPS从75.8FPS下滑到63.1FPS,而Geforce GTX285仅下滑了1.4FPS。在Call Of Juarez中,Geforce GTX285的开启AA的性能下降幅度较小,不过性能扔远不如Radeon HD5870。
Call Of Juarez High 1920X1200 4XMSAA下的Radeon HD5870录像节选:
Call Of Juarez High 1920X1200 4XMSAA下的Geforce GTX285录像节选:
Campany Of Heroes测试
注:Model Detail设置为最高
Campany Of Heroes是测试的FPS(first-person shooter)游戏中,两款显卡性能差异最小的FPS游戏,Radeon HD5870在1920X1200和1920X1200 4XAA分别领先Geforce GTX285仅16%和18%。
Campany Of Heroes U High 1920X1200 4XAA下的Radeon HD5870录像节选:
Campany Of Heroes U High 1920X1200 4XAA下的Geforce GTX285录像节选:
World in Conflictc测试
对于RTS游戏来说,对CPU的性能需求往往比显卡更为强烈,而在本次评测中唯一一款RTS游戏《World in Conflictc》的测试中,这点体现尤为明显,两款显卡的性能差距是所有测试中最小的(《街头霸王4》除外)。在1920×1200分辨率、高特效的情况下,二者的差距仅有8FPS;开启4XAA、16XAF的情况下,亦只有12FPS。
World in Conflict V High 1920X1200 4XAA 16XAF下的Radeon HD5870录像节选:
World in Conflict V High 1920X1200 4XAA 16XAF下的Geforce GTX285录像节选:
Farcry2测试
Farcry2,一款著名的FPS游戏,在1920X1200分辨率、最高特效下,Radeon HD5870领先Geforce GTX285为36%;开启8XAA后,Radeon HD5870的领先幅度降低为21%。
Farcry2 U High 1920X1200 8XAA下的Radeon HD5870录像节选:
Farcry2 U High 1920X1200 8XAA下的Geforce GTX285录像节选:
H.A.W.X测试
注:Radeon HD5870开启了DirectX 10.1
作为首选支持DirectX 10.1的游戏,《H.A.W.X》已经成为了近期测试A卡必测的项目了。在1920×1200分辨、高特效下,Radeon HD5870取得了81FPS的成绩,领先Geforce GTX285 15PFS。而在开启8XAA后,虽然Radeon HD5870下滑到64FPS,但是其对手Geforce GTX285的下滑幅度更大、仅达到35,Radeon的领先幅度达到83%。
H.A.W.X V High 1920X1200 8XAA下的Radeon HD5870录像节选:
H.A.W.X V High 1920X1200 8XAA下的Geforce GTX285录像节选:
Crysis测试
又到了高端显卡评测必跑的测试游戏——显卡危机《Crysis》了。在1920×1200分辨率、非常高特效的情况的下,以平均FPS衡量的话,Radeon HD5870依然能流畅运行《Crysis》,而且还领先Geforce GTX285约11FPS。在开启16XAA后,Radeon HD5870仅下降了约3FPS,依然能流畅运行游戏。
Crysis V High 1920X1200 16XAA下的Radeon HD5870录像节选:
Crysis V High 1920X1200 16XAA下的Geforce GTX285录像节选:
街头霸王4测试
注:测试中关闭了垂直同步
《街头霸王4》,测试中唯一的一款DirectX 9.0C游戏,相对前面的测试游戏来说,画质水平相差甚远,而且游戏引擎的执行效率亦不高,但这并不代表着并没有测试意义。毕竟显卡的任务是流畅运行游戏,而不是设计游戏。在《街头霸王4》中,在1920×1200分辨率、开启高特效下两款显卡都能跑出极高的FPS;但当开启16XAA、16X Texture Filter的情况下,Geforce GTX285的FPS下滑到84.74FPS,而Radeon HD5870保持在139.68的高FPS。
街头霸王4 High 1920X1200 16XAA下的Radeon HD5870录像节选:
街头霸王4 High 1920X1200 16XAA下的Geforce GTX285录像节选:
由于在游戏设置中关闭了垂直同步,而且《街头霸王4》的要求相对前面的游戏来说低得多,因此读者会发觉游戏录像像是开了快进一样。
Devil May Cry4测试
注:DirectX 10模式下测试
在《Devil May Cry4》中,出现了本次测试中唯一一次Geforce GTX285领先Radeon HD5870情况——在1920×1200分辨率、高特效下,Geforce GTX285达到191FPS,比Radeon HD5870高出35FPS。但是在开启8XAA的情况后,Radeon HD5870仅降低了10FPS、达到146FPS,反超Geforce GTX285的134FPS。
Devil May Cry4 1920X1200 8XAA下的Radeon HD5870录像节选:
Devil May Cry4 1920X1200 8XAA下的Geforce GTX285录像节选:
测试成绩汇总
注:红色数字为Radeon HD5870的领先百分比,绿色数字为Geforce GTX285领先的百分比
从前文中的测试中,除了1920X1200分辨率、高特效下的Devil May Cry4测试外,Radeon HD5870均以不同的幅度领先Geforce GTX285。虽然Radeon HD5870在1920X1200分辨率、高特效下的Devil May Cry4测试中落败,但是该测试中两张显卡在两种不同设置下的平均帧速已经高达100多FPS,这点性能落后已经无足轻重了。同时,我们看到Radeon HD5870在开启AA的测试中,性能降低幅度往往低于Geforce GTX285,提供了一个更佳的AA效率,这点对于高端显卡尤为重要。可以说,Radeon HD5870依靠自己的实力肯定的价值所在。
温度测试
Radeon HD5870除了3D性能大幅度提升以外,还一定程度改进功耗与温度控制。在以往,或许是由于TMDS驱动原因,HD4800系列显卡在2D闲置状态的频率的只能较3D状态小幅下降,且GDDR5显存在2D状态下也不启用自动降频。可以因因此造成了部分型号的2D状态功耗居高不下(蓝宝石等品牌推出的高品质版除外)。而到了Radeon HD5870,该状况得到了极大的改观,在闲置时,Radeon HD5870的核心频率仅为157MHz、显存频率为300MHz。
透过GPU-Z的检测,我们可以看到Radeon HD5870下2D闲置时核心温度仅为38°C,风扇为1527RPM。(环境温度28°C,下同)
虽然2D状态下可以依靠降频控制温度,但是在3D状态下这招行不通了,虽然Radeon HD5870采用了4热管散热器,但是数量庞大高频晶体管下,即使采用在开放式平台下,Radeon HD5870满载运行时的核心温度仍然高达80°C,这也说明AMD 显卡设计部门将原装散热器可接受的最高温度上限设定在了80度左右。
Displayport浅尝
提供丰富Displaypot接口是Radeon HD5870特色之一,因此我们在戴尔UltraSharp 3008WFP上进行简单了测试,对比Dual Link DVI与Displayport的性能差异。也许有些读者奇怪,为何是Dual Link DVI与Displayport的对比测试,而不是HDMI与Displayport的对比测试。答案很简单,HDMI TypeB尚在火星,HDMI TypeA的带宽不足支持UltraSharp 3008WFP的2560 x 1600@60Hz 24bit显示。同时我们也必须提醒,采用的双通道并行输出的Dual Link DVI的带宽与Displayport相近。
UltraSharp 3008WFP设置:120CD/m^2,6500K,2560 x 1600@60Hz 24bit;使用UltraSharp 3008WFP自带的Displayport线与Dual Link DVI线。
由于无论在Dual Link DVI还是在Displayport下,屏幕中心点的对比度都是600:1,因此略过,主要进行3D色域的对比。在下面两张图中,彩色的色域属于Displayport下的色域,灰色的色域属于Dual Link DVI下的色域。若是图中彩色较灰色多,即Displayport下的色域占优势,反之则Dual Link DVI下的色域占优势,面积越大者越好。
黑位(两条黑线交叉点)方向观察3D色域
白位(两条白线交叉点)方向观察3D色域
从上图中,我们可以观察到在整体色域上,二者差距极少,但是无论在黑点或是白点上,都是Displayport占优,整体上说,Displayport略为占优,但不明显。不过必须说明的是,由于测试时使用的是短线材,同时亦受到系统、硬件等的其它因素限制(如Windows无法提供高色深支持),因此尚未完全展现Displayport与DVI之间的差异。对于现阶段的Radeon HD5870来说,Displayport的支持最有价值的还在于轻松实现多头输出。
功耗测试
2D状态下频率的降低带来了好处除了温度的降低外,还有效降低了系统的功耗,我们现在通过视频来了解一下测试平台在闲置时的功耗吧。
虽然Radeon HD5870晶体管数量众多,但是功耗并未太吓人,在3DMark 06的部分场景中整个平台的功耗仅有200多瓦,当然这个不是峰值功耗。
结语
毋庸讳言,ATI Radeon HD5800系列显卡对于AMD来说,是一次意料之中的胜利。究其原因,我们认为其在于:
1.策略的胜利
本次HD5800显卡的成功发布,首先应当归结为AMD在策略制定上的一次胜利。从RV670核心时代开始,转变竞争策略的说法就一直挂在AMD的嘴边。对于AMD而言,夺取绝对性能优势固然重要,但已不是唯一因素,这与ATI时代有着根本的区别。在某种程度上,AMD在学习NVIDAI当年针对ATI所实行的竞争策略。在过去ATI与NVIDIA的竞争中,几乎每次都在复制着ATI赚得一点名声,但最终NVIDIA赢得更多的市场的经历,直至在2006年末,不堪重负的ATI作为商业公司被拖垮并被AMD收购。NVIDIA G80面对ATI R600的胜利,绝非偶然。严格控制芯片规模,小步快跑的研发策略让AMD可以用最短的时间获取对最新技术特性的支持。一旦赢得了时间要素,那么也就等于获得了性能优势。如果对手是空气,就算是跳蚤也可以赢得属于自己的比赛。
2.工艺把握能力的优势
这是个老生长谈的话题,在过去10年的竞争中,无论CPU还是GPU,对于工艺的把握能力经常决定着一款产品的生死存亡,严重的,甚至可以决定一家企业的生死存亡。许多人在谈论业界几家企业时,经常容易忘记,AMD不单单是一家设计CPU和GPU的企业,也曾经是一家有着数十年历史的半导体厂商,尽管2008年底AMD已经将晶圆厂分拆组建合资公司,但这并不影响AMD拥有和继续获取芯片制造的相关经验。当AMD的GPU在2009年4月拿出第一款40nm试水产品RV740核心时,AMD的CPU部门已经在8个月前,就大批量出货了基于45nm工艺制造的新型Opteron服务器用芯片。尽管其CPU与GPU所使用的制造工厂和具体的工艺版本不同,但没有人敢否认AMD不能从两者之间获得某种宝贵经验。除此之外,我们也可以确定,在不久的未来,AMD方面将把部分GPU产品转移至其合资工厂Globefoundries,一方面为其倾注了全部心血的Fusion芯片中的GPU部分做好准备,另外一方面也可以利用Globefoundries在技术上的领先而获取额外的收益。
3.模块化设计助益
在不久前的AMD处理器测试中我们就提到过,AMD第一代K10架构处理器可能是AMD第一块基于模块化设计的处理器产品,而HD5870显卡所使用的Cypress芯片,很可能也是基于同样的设计思路而来,尽管目前还没有得到AMD方面的最终确认。模块化设计的好处,在于芯片的规格可以根据需要自行添加或删减,在短时间内得到面向不同市场的产品。例如在此之前,AMD的HD2000系列显卡在单芯旗舰产品HD2900XT问世数月后,面向中端和入门市场的HD2600和HD2400系列显卡才推向市场。即使在奉行小核心策略的RV770世代,RV730和RV710芯片同样是在RV770芯片出货3个月后才正式向市场推出。而本次Cypress与Juniper芯片所带来的HD5800和HD5700系列显卡可以相隔仅半个月就全面推向市场,其中的意义不可谓不重要。
Radeon HD5750,它将于Radeon HD5870共同构筑AMD DX11产品线
4.坚决支持开放性标准
AMD设计的HD5800系列显卡在附属功能添加上的态度异常坚决。面对竞争对手竭力推行的PhysX和CUDA技术面前,AMD方面始终没有松口,甚至不惜联合另外一家物理加速方案提供商Bullet推广开源物理计划也坚决不向NVIDIA让步。而面对竞争对手力推CUDA的进逼,AMD也不惜彻底抛弃老旧的自有GPGPU技术,全力支持开放性标准Open CL和Driect Compute。应当说,这样的策略是完全正确的,即使少数玩家可能会所抱怨,但同时也使竞争对手陷入了两难的境地。在PC历史上,要将某一种关系行业未来的前瞻技术禁锢在某一家企业的硬件之上,是非常危险也不可能取得成功的。物理加速技术并不只针对某一种甚至某一家企业的硬件而生。我们无法想象所有PC游戏玩家因为某一种技术的限制而只能被迫选购一种品牌的硬件产品,因为这样的后果将只有一个:垄断。
5.抢在圣诞节前
众所周知,圣诞节前是欧美市场销售旺季,Radeon HD5870已经在圣诞节前的2个月就上市,Radeon HD5X00系列也将陆续上市,同时其竞争对手NVIDIA的旗舰产品得等到明年初才能上市。毫无疑问,AMD已经抢先一步了,而且世界经济已经开始了反弹,AMD有望借Radeon HD5X00系列在这个销售旺季中获得丰厚利润,当然,欧美消费者的信心必须足够的强才行。
ATI Radeon HD5800系列和HD5700系列显卡的如期出世表明其已经获得了初步的成功,我们相信未来5个月之内AMD方面至少在旗舰和性能级市场上都将获得难得一见的领先优势,上一次获得这样的局面,还要追述到2002年的R300时代。不论竞争对手如何评价,同代产品的先发优势都是无法回避的,何况HD5000系列显卡所具备的也不仅仅是对DriectX 11的支持,而是在性能、能耗比、成本等各个方面的明显优势。
不过,摆在AMD面前的,也绝非是一条坦途,仅对中国市场而言,AMD方面需要作出的努力,就依然很多。就在发文的此刻,对AMD中国区玩家至关重要的驱动下载点,依然悬挂着6月发布的ATI催化剂9.6版本驱动,而其外壳之下的,依然是令多数玩家望而却步的英文官网。而在过去的三个月内,ATI催化剂驱动已经历了9.7、9.8、9.9三个版本,并即将提供对HD5800系列显卡而编译的9.10版驱动。我们甚至可以说,使用AMD显卡的中国区玩家,他们的利益并没有被真正的关注过。如果不能建立起用户的信心,那么任何优势都将是不可持续的。
其次,在显卡技术的宣传与推广上,AMD的表现远没有竞争对手NVIDIA积极。在对待几天前发布的对GPU处理作出重大改进的Adobe Flash Player 10.1高清播放加速功能的态度上,AMD方面毫无音讯,而NVIDIA方面则表现出作为GPU行业领袖的风范,不遗余力的宣传与推广。两者巨大的反差几乎使人误以为AMD显卡根本不具备此类功能。
科技竞争从来没有不可被超越的领先,如果在顺境下不能利用优势局面完善自身,那么逆境之下就将面临更为艰巨的困难。任何一次成功,都只是下一次战斗的开始,何况,全面战斗还没有真正的开始。
网友评论