显卡的核心GPU发展至今已经有10余年了,从许多玩家第一次认识这些GPU开始就认识到了一些看似怪异的工艺代号,诸如110nm,80nm 55nm ,尽管许多玩家并不明白这些制程的具体含义,但仅从数字上也可以感受到GPU这些年来变化的脚步。制程工艺从芯片的远古时代开始一路发展而来,在
导言及产品综述
显卡的核心GPU发展至今已经有10余年了,许多玩家第一次认识这些GPU开始就认识到了一些看似怪异的工艺代号,诸如110nm,80nm 55nm。尽管许多玩家并不明白这些制程的具体含义,但仅从数字上也可以感受到GPU这些年来变化的脚步。制程工艺从芯片的远古时代开始一路发展而来,在经历了90nm节点后受到了显而易见的困扰,而工艺制程的进一步微缩和芯片代工厂的优胜劣汰,使GPU在这一阶段获得了明显的进步。45nm在芯片制程历史上是一个非常关键的节点,在这一节点上,以往的传统的工艺技术已经发挥到了尽头,尽管新技术的采用使65nm转换至45nm节点成为可能,但这些新技术的采用也使得芯片的设计方面临着对芯片进行的较大的改动,以适应新工艺的应用。由于GPU本身的特性所决定,其对于晶体管数量和处理资源的规模的需求要远高于对频率的需求,因此制造GPU的工艺制程可以更进一步的微缩晶体管和芯片结构,也就出现了我们常见的半代工艺(half-node),也就是我们在GPU上常见的110nm,80nm 55nm等等,直至我们今天所接触到的40nm。理论上,半代工艺(half-node)并不能提供太多的性能提升,但可以明显的缩小芯片的面积和成本,从另外一个角度说,也就可以在同样的核心面积下置入更多的晶体管,这对于GPU来说,显然是梦寐以求的。台积电(TSMC)的40nm工艺同样由45nm工艺衍生而来,AMD和NVIDIA方面不约而同的选择跳过45nm节点而直接采用40nm,显然对40nm抱有很高的期望,或者也可以说双方都认为在迈过了45nm这个关键的节点之后,以往的全代——半代更新步骤在成本上并不划算。尽管如此,40nm工艺对GPU而言同样是非同寻常的,虽然我们不能说GPU上使用的40nm工艺超越了CPU上使用的45nm工艺,但却可以说,扬起了40nm这面旗帜,GPU已经可以和CPU平起平坐了。
经常关注硬件信息的朋友应该已经知道,第一个为我们带来40nm工艺GPU的是AMD,早在上个月,AMD的40nm移动GPU已经率先出货。而今天,AMD正式为我们带来了第一款40nm工艺的桌面显卡产品:基于RV740核心的ATI Radeon HD4770。
制程先锋:RV740
RV740核心在AMD的GPU发展路线图上是一个非常特殊的型号。之所以说他特殊,是因为其代号容易使人理解产生偏差,按照ATI RV610-RV620,ATI RV630-RV635这样的更新方式来理解,RV740相对RV730似乎应是非常接近的核心,但事实并非如此,RV740核心的资源规模,性能表现,远远超过了RV730,而且是成倍的增长,这一点,让原先猜测RV740核心的人颇感意外。下面是RV740核心与RV730核心的规格对比列表。最终,我们看到的RV740核心是如下的惊人面貌:
在提供了接近RV770核心性能的同时,RV740在40nm工艺下,核心面积仅有137平方毫米,而晶体管数量则达到8.亿个,毫无疑问的创造了GPU历史上史无前例的晶体管密度。作为一款为新工艺试水的芯片产品,RV740核心在架构设计上并没有太大的变动,而是吸取了RV770核心与RV730核心的精华。
RV770LE核心具备128个1D+4D(总计640个)联合流处理单元和32个纹理单元 16个光栅单元,实质上是完整的RV770核心屏蔽两组共32个1D+4D(总计160个)联合流处理单元和8个纹理单元而成。而RV740核心则采用原生128个1D+4D(总计640个)联合流处理单元
和32个纹理单元,辅以经历RV730芯片而优化设计的8个光栅单元构成,由于ATI的R700系列芯片的架构设计较为特殊,其对光栅单元的需求并不像竞争对手那样明显,因此RV740核心采用的改良设计后的8个光栅单元完全可以实现原先16个光栅单元所能实现的性能。除此之外,RV740核心与RV770LE核心非常接近,最大的不同是取消了256bit的显存位宽,改为128bit显存位宽与高频GDDR5显存的组合,为使用RV740核心的HD4770显卡提供了与HD4850几乎相同的显存带宽,从而给RV740核心节约相当数量的晶体管。
RV740核心的设计思路使得其移动版显卡大受欢迎 |
整体而言,RV740核心的外形和内涵都透漏出一种简约,实用的新气息,尽可能的节约和利用好每一个晶体管,尽可能的提升每平方毫米芯片下所能实现的性能。本次40nm工艺的成功应用,使得RV740核心能在甚至比RV730核心,也就是HD4600系列显卡的GPU核心更小的面积下,实现超越HD4830,接近HD4850显卡的性能,确实令人感到惊讶。
此外,根据本次RV740核心在HD4770显卡上的表现,我们也相信,只要能再适当提升RV740核心的频率,适当加强RV740核心搭配的GDDR5显存的频率扩大带宽,或者增加至1GB GDDR5显存,RV740核心完全具备挑战拥有完整RV770核心的HD4850显卡的实力。
众说纷纭的HD4770公版显卡
本次HD4770显卡发布前的围绕其做工和外观有着很多争论,但最终的上市零售版本却与之前的所有猜测都完全不同,我们只需从以下三张图片就可以明白为什么HD4770显卡的外观会有这么多的争论:
ATI Radeon HD4770 加拿大原厂版(也是我们收到的测试样品) |
ATI Radeon HD4770 最早泄漏的照片 |
ATI Radeon HD4770 正式零售版 |
坦白说,这是我们第一次发现自己不知道该如何向玩家介绍这款“公版”显卡,ATI Radeon HD4770打破了ATI公版显卡的两个传统,统一的靓丽外形和奢华的做工,尽管我们所收到的测试样品依然保持着公版的传统外形设计,但显然普通的玩家是无法购买到这样的产品的,在做工上,仅从最早泄漏的公版照片中,玩家们就可以一窥究竟,思民散热器的外形显然不足以遮盖住显卡的正面外观。不过,从以上三个版本的HD4770显卡来看,HD4770不论外观如何,其PCB设计和元器件的使用确实是依照ATI公版规划设计的,区别集中在散热器及显存散热片等等外部环节,这也就意味着最早泄漏的外观照片确实是ATI内部规划的严格控制显卡成本的产物,显然AMD方面对这样的设计(破天荒的半封闭电感)和成本控制来满足核心面积和发热量均大大减小的40nm RV740核心有足够的
信心。
值得一提的是,公版HD4770尽管在功耗方面有大幅的降低,依然保留着外接6pin供电,这样也有利于超频用户挑战HD4770显卡的RV740核心与GDDR5显存的极限。
回击JS枪手:显存位宽与显存带宽之辩
至今为止,依然有数量非常多的用户对于识别显卡的规格信息不甚了解,以至于购买时往往会被显卡的外部规格所迷惑,为人所熟知的几个规格数据不外乎核心频率,流处理单元数量,显存位宽,等等,在经历了若干个显卡世代之后,显存位宽这一概念被越来越多的玩家所熟知,在以往不同厂商的GPU产品均使用类似显存的情况下,直接对比显存位宽确实是一个衡量显卡显存带宽数据的简单标准。久而久之位宽取代了原本他所体现的“带宽”。以至于有人认为位宽越大,显卡性能也就越高。这种状况在GDDR5显存出现后发生了明显的改变。由于AMD显卡首次尝试并大规模使用了GDDR5显存,因此对于显存位宽的需求大幅降低。
GDDR5在ATI Radeon HD4870上的卓越表现已经证明了自身的价值 |
显存带宽的计算公式如下:
显存带宽=显存频率×显存位宽/8
按照HD4770显卡的显存规格,我们可以得到如下计算结果:3200MHz×128bit/8=51.2GB/s
而HD4830显卡的显存带宽则为:1800MHz×256bit/8=57.6GB/s
可以看到,因为GDDR5显存的应用,仅使用128bit位宽显存的HD4770已经完全可以提供接近HD4830的显存带宽,以满足RV740核心的需求。尽管如此,小编依然确信,HD4770这块100美元内最强显卡在国内上市之后,必然有很多初阶玩家在选购时会受到来自各个方面的误导性宣传所迷惑,包括电脑卖场中商家的蛊惑:“256bit位宽的卡当然比128bit位宽的要好啦”以及分布在各个角落的网络枪手的肆意诋毁:“XXXX显卡是垃圾,位宽才128bit”。在此,我们不得不说,在国内的电脑市场中,商家向用户推荐的显卡,依据是其能够为其带来更多利润的显卡,因此只要某款显卡能够有更多的利润,显卡的真实性能则往往退居其次甚至不被商家所考虑。如此一来,消费者的利益就被无情的牺牲,而牺牲最惨重的无疑就是对硬件知识几乎一无所知,对某些商家的推荐言听计从的所谓“菜鸟”甚至“鸟蛋”。由此我们看到了那些用只拥有极其低下性能的低端核心搭配1GB DDR2“海量显存”摇身一变成为宰杀“菜鸟”无往不利的“高端”显卡,看到了那些明明只搭配了128MB显存颗粒却在包装上加注两个小小的HM字母就敢宣称自己是512M甚至1GB“显存”的“高性能”显卡,看到了中国DIY市场上演劣币驱逐良币式的恶性竞争,看到了某些厂商无奈之下退出中国市场或者随波逐流,看到某些媒体毫无愧色助纣为虐摇旗呐喊......
我们的力量微不足道,我们只希望通过本文能够让更多的网友们知道一点事实的真相,以有足够的勇气和底气去抵制和斥责这些谎言:“忽悠,继续忽悠~”
这是我们的希望,也是我们的使命。
测试平台、软件及测试方法介绍
硬件平台 | ||||||
CPU |
Phenom II X4 955 Black Edition(黑盒) | |||||
主板 |
微星790FX-GD70 | |||||
显卡 |
ATI Radeon HD4770 | |||||
ATI Radeon HD4830 | ||||||
NVIDIA Geforce 9800GT高频版 | ||||||
内存 |
Kingtiger DDR3-1333 2G | |||||
硬盘 |
三星金宝SATA 1TB | |||||
电源 |
长城双卡王发烧版BTX-600SE | |||||
显示器 |
明基G2400W | |||||
软件环境 | ||||||
操作系统 |
Microsoft Windows Vista 32bit SP1 | |||||
显卡驱动 |
GeForce Release 182.50 | |||||
ATI Catalyst 9.5beta | ||||||
主板驱动 |
ATI Catalyst 9.5beta | |||||
测试项目 | ||||||
基准软件测试
|
3DMark06 | |||||
3DMark Vantage | ||||||
游戏测试
|
《孤岛危机》 | |||||
《孤岛惊魂》 | ||||||
《冲突世界》 | ||||||
《狂野西部》 | ||||||
《英雄连》 | ||||||
《鬼泣4》 | ||||||
《鹰击长空》 | ||||||
测试工具 |
Fraps 2.9.4 | |||||
GPU-Z 0.3.3 | ||||||
PCHOME硬件评测室
测试平台合作伙伴 |
||||||
主板方面,我们选用了同样来自微星科技的790FX-GD70。
内存方面,我们选用了来自金泰克的DDR3 2GB内存套装。
|
散热器,我们选用了来自的AVC的蝠翼战士。
3DMark 06测试成绩一览
3DMark06是DX9时代很多玩家所熟知的测试软件,由于其使用范围较广及DX10带给玩家的惊喜有限,,DX10世代显卡似乎依旧难以摆脱DX9的阴影,许多玩家依然关注这个堪称老牌软件的测试,下面我们列出测试结果:
3DMark Vantage测试成绩一览
3DMark Vantage测试软件是最新发布的DX10世代基准测试软件,对于当前的显卡,尤其是新发布的显卡是一个比较好的衡量标准,唯一的争议在于其中开启的物理加速模式额外给CPU分数加成进而影响总分的做法是否恰当,不过本次测试我们不深究这一问题,统一采取双方显卡的默认状态,不做任何改动。
Crysis测试成绩一览
Crysis是到目前为止依然难以逾越的DX10大作,尽管对硬件的需求极为变态,但硬件显然也在努力应对这种要求。
Far Cry 2测试成绩一览
Far Cry 2被认为是一款可以与Crysis齐名的游戏,但双方的重点显然不同,至于双方在画质上的造诣,仁者见仁,智者见智。测试结果如下:
Far Cry 2是我们的测试结果中出现异常的唯一个项目,HD4770的表现不尽人意,或许是我们所使用的ATI测试版驱动尚不完善的原因,也可能是我们选用的Benchmark与新驱动的配合问题,有待验证。
COH测试成绩一览
英雄连中大量使用了由CPU软处理的Havok物理特效,实际效果也非常明显,保证了在不影响游戏性的同时增强游戏的真实感,比当前业界一些“为了物理而物理”,丧失不顾游戏性乃至直接牺牲画质的做法,英雄连游戏制作团队的态度值得赞赏,他们带给了我们一个出自于即时战略游戏,但又大胆创新的好游戏,也正是因为这样的游戏,PC游戏平台才值得我们留恋。
DMC4测试成绩一览
鬼泣4自建的Benchemark对于许多玩家来说是个好帮手,其中选择了四个场景进行测试,我们求得平均值后进行对比。
WIC测试成绩一览
小编认为WIC是与COH可以并列的独具创意的即时战略类游戏,WIC也同样大量使用了基于CPU处理的物理特效,且由于单位数量众多及场景复杂,在高特效下和高分辨率下对显卡的处理能力及显存的需求也比较高。
COJ测试成绩一览
狂野西部是针对ATI显卡表现较好的游戏之一,在此列出供玩家参考。
H.A.W.X测试成绩一览
H.A.W.X,中文名:鹰击长空,是近期发布的相当不错的空战游戏,颇受空战类爱好者群体的欢迎,该游戏的画质表现及模拟逼真度都相当突出,并且选用了许多新技术加入游戏中,例如区域环境光遮挡(SSAO),以及ATI显卡已全面支持的DX10.1规范,在DX10.1模式下,ATI显卡在抗锯齿模式中的效率表现的空前强劲,且对SSAO特效的适应度明显胜出对手的显卡。
功耗测试成绩一览
毫无疑问本次RV740核心采用的来自台积电40nm工艺重点改进方向之一就是大幅降低了显卡的功耗表现,让RV740核心在同样的功耗下实现更高的性能,或者在同样的性能下实现更低的功耗。本次测试我们使用的ATI工程样板显卡在对应GPU-Z软件的识别方面还有一些不准确的地方,但功耗表现的优秀则无可挑剔。
可以看到,作为一款性能胜过前任HD4830显卡的新产品,HD4770在功耗的控制上非常优秀,空载功耗有小幅的下降,而满载功耗降低了近20W之多,并且这是在工程样品上取得的成绩。随着RV740生产线的逐渐成熟,其所需的电压和功耗还有很多优化的空间。而9800GT在性能和能耗比上都已经丧失了与HD4770抗衡的能力。
评测总结:700元内无敌手
本次RV740核心系HD4770显卡的发布让我们不由的为之振奋,毫不夸张的说,RV740核心及其HD4770显卡是近年来以700元价位登场的显卡中堪称绝无仅有的划时代产品,得益于AMD旗下ATI GPU团队对新工艺的利用得当。RV740核心又一次创造了GPU核心晶体管密度的世界纪录以及每平方毫米及每瓦特性能的世界纪录。这个记录何时能够被打破还需要参照后续AMD与NVIDIA双方产品的详细信息。根据目前的消息,AMD的40nm产品线会在今天第三季度之后全面导入,而NVIDIA方面在短期内似乎还不能拿出与RV740核心及HD4770显卡相抗衡的GPU和显卡产品。
从测试的数据可以很明显的看到,RV740核心及HD4770显卡的规格、性能与他们的成本之比已经大大超出了现有全部显卡所能达到的极限,如此也就不难理解为何AMD官方默许显卡厂商采用开启800个联合流处理单元的方式快速清空HD4830显卡的库存。另外一方面,目前誓要与AMD血拼到底的NVIDIA方面则面临着棘手的困难,以G94和G92核心衍生的9600GT、9800GT、GTS250(800GTX+)都将受到了来自AMD RV740核心产品的袭扰。9600GT显卡面对HD4770显卡已经明显低了一个档次,而9800GT显卡即使超频至核心700Shader1700显存900的高频也仅可勉强接近默认规格的HD4770。当HD4830显卡登场时,NVIDIA方面通过鼓励厂商推出非公高频版应对,而此次HD4770显卡的发布,使9800GT丧失了在性能上抗衡的能力,毕竟和40nm工艺的新产品比拼频率极限绝非明智之举。纵观NVIDIA方面的产品线,定价相近的9800GT高频版无力与HD4770相抗,GTS250此时确实却依然徘徊在899元以上的价位与HD4850苦战。HD4770以700元价位切入市场无人可挡......而NVIDIA方面的40nm工艺桌面产品短期内似乎还难觅踪影。
左为55nm工艺RV770核心 右为40nm工艺RV740核心 |
网友评论