泪流满面 细谈AMD RV770背后的故事

互联网 | 编辑: 张政 2009-01-13 00:30:00转载-投稿 一键看全文

如果不打破这个现状...

  如果不打破现状,我们会很危险。在2005年,AMD和NVIDIA都面临这样的情况:造一颗最快的GPU,并提供稳定的驱动程序,那么就可以赢得市场。过去几年中,AMD一直是这么干的。但是在公司内部,有一些人认为是时代改变了。在很多方面AMD和NVIDIA都面临不同的挑战,NVIDIA从之前激进的工艺更新策略中汲取了教训,GT200很有可能仍然采用老的,更成熟的工艺,因此导致GT200的面积很大。AMD选择走一条NVIDIA没有走过的路,制造工艺的演进更加迅速,以此造出更小面积的GPU。竞争对手偏爱造一颗越来越大的GPU,而AMD则分两面看待这个问题,他们没有遇到真正的竞争,他们可以干任何他们想干的事。对AMD而言,问题变成小核心的策略会奏效吗?

中型核心打天下之路其实荆棘满途

今天我们很容易说:“当然”。但是你要明白那是在2005年,RV770的规格正在被草拟的时候。想象坐在一大群人中,他们的工作一直是制造世界上最快的GPU,但是你却要对他们说“把性能王座让给NVIDIA,让NVIDIA获得光环效应,我们要做的是设计在$200-$300价格段最好的GPU”的话,会是怎样的一个状况。当然接下来就是白热化的讨论,是否AMD能把赌注下在不再造一颗最快的GPU,而是造一颗稍微低端的GPU上。

AMD把图形市场划分为5个区间:狂热级,性能级,平衡级,主流级和入门级。在2005年夏,AMD决定瞄准性能级市场,而非狂热级市场。你可以认为性能级市场正是2002年R300竞争的市场。R300 $399的价格和Radeon 4870 $299的价格很接近,而GTX280发布的时候价格是$599。AMD把这看作是策略上的改变,R300当时为了性能可以不管芯片面积,而RV770不同,它面临这芯片面积和功耗的明确限制。我们今天知道,AMD内部很多人对RV770大开绿灯。Rick Bergman,决定把他的职业生涯和RV770拴在一根线上,因为如果RV770不成功,他要为此负责。Carrell回忆Rick Bergman和一群人坐在桌子旁讨论RV770的场景;Rick把头转向Matt Skynner,问他是否认为这个策略可行,是否造一颗比NVIDIA的GPU更小,但是仍然能成功的GPU的可行性,是否我们能在性能级市场上制造光环效应。Matt很显然仔细思考了这个问题,他转向Rick说,我认为我们能。Carrell感到如果没有Matt Skynner的支持,AMD不可能走这条路。而Rick Bergman确保了RV770的项目被良好执行。当然也有很多非常聪明的工程师,他们造就了R300和R580这样的产品,但并不认同这个策略。有些人会说,如果AMD不弄出个和GT200能真正单挑的芯片,游戏就结束了。但是Carrell这样的人会说,这个策略是可行的,因为它是正确的方向。这就像政治,每一方都认为自己的观点是正确的,但是你只能选择一个。并且两方还要同处一个屋檐下,低头不见抬头见。

部分人很沮丧但是整个团队在继续发展——

整个RV770设计花了大约三年时间,这意味着当我们讨论R600的失败时,那帮工程师正在设计RV770并对此持乐观态度。Carrell,Rick Bergman和其他人要求整个团队忘记发生在R600上的事情,忘掉AMD丢掉性能王座这个事情,致力于做好RV770。在我的整个采访中,我一直能感受到这样一个事实:整个RV770团队给AMD留下了深刻印象。整个团队没有分崩离析,尽管有不同意见,尽管对往哪个方向走有过摇摆,但是整个团队仍然团结有力。AMD认为采取不追求绝对性能的设计策略是有意义的,但是如果失去了光环效应怎么办?历史上因为失去光环效应而失败的案例不甚枚举。对此AMD制定了严格纪律,把历史放在一边,做我们认为正确的事情。这不仅要求不受历史的影响,还要同以前养成的观念做斗争,即,要转变这样一种观念:在设计的时候从来不考虑芯片变大的限制。AMD通过RV770取得的成功使我想起了Intel的Atom设计团队。每一个团队成员在设计他们负责的模块的时候都面临着模块大小的严格限制,而这个限制从来不会被妥协。逆境中往往会涌现最好的人。在业界我听过最好的故事,就是Intel设计Banias的工程师,以及AMD设计RV770的工程师全身心的投入工作,而不管是否会被击倒。激情以一种有趣的方式成为一个人最强大的盟友。

R600那惊人的功耗相信不容易让人忘记

对于功耗的规划

  我们所有人都应该为把功耗当做免费的午餐而感到自责。Intel设计了5年的处理器,从来没有考虑过功耗问题,设计GPU的家伙同样如此。在R300和R420的时代,ATI从来没有考虑过功耗。在那个时候,对功耗的估计是如此的微不足道以至于ATI甚至没有找到一套好的估计功耗的方法。设计一款TDP被限定的产品是不可能的。现在AMD的工具好了很多,现在要达成功耗上的目标和达成时钟频率的目标或是芯片大小的目标没有什么不同。现在,功耗不会有大的变化(想想为什么高端CPU的功耗总是130W附近)。每一个人的设计都面临功耗的限制,现在面临的问题是如何在功耗保持不变的情况下提高性能。现在我们的处理器,无论是CPU还是GPU变得更加高效,而不是傻傻的堆规模上去以此提高性能。架构上面临一个有趣的问题是,在一颗大约10亿个晶体管的芯片里传递数据要耗费很多的功耗。Carrell告诉我在45nm和32nm阶段,在FPU里传递数据的功耗和这个FPU进行乘法运算的功耗一样多。考虑到数据传递变成了一个越来越高功耗的任务,未来GPU的设计很重要的一点是要尽可能的保持数据存储在本地,减少数据传递到寄存器和片上缓存中。我们能看到更多的本地寄存器(Local register)以及更多的多层内存结构。随着芯片变得越来越复杂,把寄存器文件集中放到一个位置越来越困难。

AMD承认在R600的制造上功耗过大的问题。从那以后,AMD重新专注于功耗效率。当晶体管越来越小时,漏电也变成一个日益严峻的问题,有时候为了提高那点效率而使得漏电很高并不划算。假设你有一块100W的GPU,你愿意其中的40W都是因为漏电而被消耗掉吗?还是你想要其中的80W用来真正干事情,只有20W被浪费?Intel也同样汲取了P4的教训。

真的只是小问题?AMD需要新的内存技术

  R600拥有令人难以置信的512bit显存位宽,因此引出的问题是芯片面积很大,所以你不得不进行复杂的绕线(Route)。为了达成RV770的芯片面积目标,AMD需要256bit的显存位宽。但是如果使用现在的显存技术,256bit的位宽无法提供足够的显存带宽来达成RV770的性能目标。再一次想象那是在2005年,ATI决定完全抛弃过去赢得GPU战争的策略,即使这个小核心策略的成功要依赖于一种新的显存技术,在那时这个新的显存技术甚至连技术原型都没有。那时GDDR5的规范还没有最终确定,没有测试设备,没有界面设计,什么都没有。只知道GDDR5可以提供GDDR3两倍的带宽,这样就可以依靠256bit的显存位宽达成一个512bit显存位宽的目标。这正是AMD想要的,所以AMD决定采用GDDR5。

三年前谁会知道GDDR5会成功面世?

  不幸的是GDDR5能否在2008年夏上市并不只是取决于AMD,内存制造商也有很多问题需要解决。AMD投入了很多金钱和工程师资源来和内存制造商紧密合作,以确保不仅GDDR5的规格要定下来,而且在2008夏GDDR5要可用,性能良好。注意只有RV770会用到GDDR5,这意味着只有AMD来独自推动这项新技术。

AMD做了很多工作来推动GDDR5,这是有风险的,即使RV770性能非常好,但是在上市时如果显存没有准备好,RV770仍然不得不延期。RV770许配给了GDDR5,没有其他选择了。如果GDDR5不能在3年内准备好并投入生产上市,AMD将面临既没有高端GPU,也没有性能级GPU的窘境。如果GDDR5工作正常,那么意味着RV770能够成功,并且从另一方面来讲,这是NVIDIA所不具备的。当然,这是建立在AMD的小核心策略是可行的基础上……

一名网站编辑拯救了Radeon HD4850

  AMD有这样的习惯:从媒体中选择好的评论员,然后招致到公司里。我们的第一个图形版块编辑Matthew Witheiler,从杜克大学毕业后就加盟了AMD。在加盟AMD之前,他在AnandTech度过了3年的美好时光。在ATI,他最终成为了最年轻的产品经理。另一个杰出的评论员是Dave Baumann,来自于Beyond 3D。在Beyond 3D,Baumann在分析两款彼此竞争的产品时表现出了卓越的能力。他在AMD的一项主要工作就是在公司内部比较R600和G80,这是发生在2006年11月份的事情(编者按:Dave Baumann是在06年6月加盟ATI的)。很显然,G80对RV770有重大影响。虽然当时架构已经定了,但是时钟频率、电路板设计、显存大小等等都是在2008年初才定下来。最初,RV770的目标是R600的1.5倍,现在回过头去看,这是不够的。在接下来的一年半里,1.5倍R600的性能变成2倍R600的性能,最终达到了2.5倍R600的性能,而价格却是位于$200 - $300这个区间里。Dave在2008年二月变成了RV770的产品经理。考虑到他加盟AMD并不久,而且这个产品非常重要,这是件大事。RV670让我们看到了AMD重回竞争者的行列,但是AMD需要RV770让他们重回巅峰。

Radeon HD4850爆发的光芒差点被埋没

  当Dave开始负责RV770的时候,很多产品的规格已经规划好了。芯片已经从Fabs里流片回来。在这个时候,AMD的工程师并没有准备好或者并不愿意再对规格做改变。Baumann先生认为RV770XT不错(XT是Radeon HD4870的内部代号),用他的话讲,规格很完美。对Radeon HD4870的唯一修改就是增加了第二条PCIe电源连接线,仅此而已。他关注的是另一个更重要的产品,RV770 Pro,即Radeon HD4850,他认为规格有些低了。

让我们来了解下AMD当时的处境。你的工程师团队过去三年一直在设计一款可能失败的产品,因为这是同过去你所做过的完全不同的产品。你的上一代旗舰级GPU并不完美(R600),而RV670做得不错,可仍然没有从NVIDIA手中抢到多少市场份额。你刚刚完成一款全新的GPU的设计,但是这个年轻的产品经理却告诉你必须要做些改变。对Baumann而言,这是有胆识的行动,他并不看重脸面,他要的是帮助他的团队赢得胜利。最后的改变迅速而容易的发生了,这是发生在RV770上的真实故事。

Radeon HD4850原来是256MB显存,500MHz的核心频率,900MHz的显存频率。Dave坚持认为Radeon HD4850需要512MB的GDDR3和625MHz的核心频率,以及933MHz的显存频率。他不但坚持这个规格,也使得工程师团队信服了这个规格并做了改变。Dave向工程师们论述为什么要改变规格以及市场需要怎样的规格。在讨论快结束时,他已经不需要说服他们了。板卡和ASIC团队拥护这样的改变。

如果没有这样的改变,RadeonHD4850不能对NVIDIA的GeForce 9800GTX施加如此大的压力,GeForce 9800GTX的价格也不会降得这么快。

提示:试试键盘 “← →” 可以实现快速翻页 

一键看全文

本文导航

相关阅读

每日精选

点击查看更多

首页 手机 数码相机 笔记本 游戏 DIY硬件 硬件外设 办公中心 数字家电 平板电脑