从1亿到100亿 回顾10年GPU膨胀历程

PChome | 编辑: 孙伟 2013-05-05 05:30:00原创 返回原文

从1亿到100亿 回顾十年GPU膨胀历程

也许你还没有意识到,NVIDIA在2月份发布的GTX TITAN显卡,其GK110核心已经达到了70.8亿个,这说明,NVIDIA的下一款旗舰核心也就是Maxwell必将超过100亿晶体管!

其实无论是CPU还是GPU,其成长的历程就是一个晶体管堆积的过程,世界首款GPU“NV10”只有2300万个晶体管,而且用的还是220nm工艺制程,而看看现在我们的显卡,马上明年就将进入20nm工艺时代。

好了,100亿晶体管必将是个不小的成就,届时每个晶体管之间的距离只有几十个原子的宽度那么长。那么你知道,在GPU的世界里,首个突破1亿晶体管的核心是哪一个么?

对本文起到“预热”作用的图

笔者首先要告诉你们的是,从1亿到100亿,我们将只用12年的时间,远超物价的增长速度。摩尔定律在GPU的世界里也发挥了重要的作用。下面就让我们从第一个突破1亿晶体管的GPU开始说起……

首次突破1亿晶体管 ATI R300震撼登场

2002年7月,在NVIDIA推出NV25核心刚刚半年之久,ATI抢先发布了全球首款支持DirectX 9.0的R300核心,在性能和各项技术指标上都完胜前者,并成为首个突破1亿晶体管的GPU(当时被ATI称为VPU),也远超NV25/R200的6千万晶体管的规模。

R300核心采用150nm制程工艺,虽然ATI当时并未公布核心面积,但显然要超过200平方毫米。

首款基于R300核心的便是Radeon 9700 Pro显卡,内建8条渲染管线,并提供了256bit显存控制器。后来登场的Radeon 9700、9500 Pro和9500也都是基于R300核心,通过采用不同的规格细分产品线。

NVIDIA对R300的反击便是于2003年1月正式发布的NV30核心,首发GeForce FX 5800 Ultra和FX 5800两款显卡。NV30核心内建1.25亿个晶体管,核心面积同样超过了200平方毫米,并激进地采用了130nm制程工艺和DDR2显存,不过只能支持128bit的显存位宽。

不过由于NVIDIA的NV30在架构设计方面存在缺陷,在运行DirectX 9.0的应用时性能不佳,虽然有超高的频率设定,最终在性能上还是没能超过R300。

几个月之后,NVIDIA和ATI展开了第二轮搏斗,两家分别发布了改进版的NV35核心和R350核心,也因而集成了更多的晶体管。其中前者终于实现了对256bit显存位宽的支持,全新的GeForce FX 5900Ultra在性能得以增进。而R350则得益于频率的增长,让Radeon 9800 Pro大受欢迎。

到了2003年下半年,ATI和NVIDIA又再一次更新了自己的旗舰产品,纷纷祭出R360核心和NV38核心,但两者基本上都只是频率的提升而已。

NVIDIA绝地反击 NV40核心的巨大优势

2004年4月,为了扭转NV3x的颓势,NVIDIA紧跟DirectX API的步伐,于4月发布了首款支持DirectX 9.0c的GPU——NV40,将Shader Model也从2.0升级到3.0,并支持了一系列的新特性。这使得NV40的晶体管数量达到了2.22亿,核心面积也接近300平方毫米。全新的NV40也让GeForce 6800系列显卡成为了经典。

由于2004年英特尔开始推广PCI Express总线,而NV40核心只原生支持AGP总线,于是NVIDIA又在6月发布了集成桥接芯片的NV45核心,其实只不过是将桥接芯片同时封装在了一起,并非对PCI Express提供原生支持。

ATI方面,他们在2004年5月发布的R420则沿袭了R300的架构,只能支持到Shader Model 2.0b,晶体管不过1.6亿个。此外,R420是原生支持AGP的核心,R423则是原生支持PCI Express的核心。

到了2004年年底,ATI再次发布了R480/R481核心,分别支持PCI Express总线和AGP总线,与R420/R423在架构上没有太大区别,对应Radeon X850系列显卡。R480开始支持CrossFire多卡并联技术,与NVIDIA的SLI相抗衡。

DX9末代之战 R580成就3.84亿晶体管

2005年6月,NVIDIA推出了全新的G70核心,架构方面延续了NV40并做了诸多改进。晶体管也首次突破3亿个,虽然采用了110nm制程,但核心面积依然(也是首次)突破了300平方毫米。

ATI方面则推出了全新的架构设计,于2005年10月推出了R520核心,集成了3.21亿个晶体管,还采用了环形总线设计。但由于激进采用90nm制程,为了尽快量产,使得R520并非“完全体”架构,对应的Radeon X1800系列显卡也成了短命的产品。

不过ATI的动作还是非常快的,推出R520仅三个月后便亮出了完全体R580核心,突破性地采用了着色单元和纹理单元3:1的架构设计,使着色单元达到了惊人的48个,晶体管数量更飙升到了惊人的3.84亿个,352平方毫米的核心面积在当时也是史无前例的。

NVIDIA方面过渡到90nm时代则采用小核心策略,发布的G71核心还在G70的基础上进一步精简至2.78亿晶体管,196平方毫米的核心面积绝对算得上是轻量级秒,但由于频率的大幅度提升,采用G71核心的GeForce 7900 GTX也有着不错的游戏性能。

此时,NVIDIA还首次尝试了Quad-SLI,推出了双核显卡——GeForce 7950 GX2,显然也是得益于G71的轻量级核心带来的较低的发热量和功耗。

逼近7亿晶体管 NVIDIA的首个巨核G80

我们已经看到了,每一次全新的架构设计都会让GPU核心急剧的膨胀,这是晶体管暴增的时代,NVIDIA的G80就以极好的方式诠释了这个时代的意义。

G80核心在当时来看是具有颠覆性的,不仅仅是首款支持DirectX 10的核心,也是首次采用了“统一渲染架构”的核心,并前瞻性地采用了1D MIMD架构。128个“流处理器”、384bit显存控制器直接让晶体管暴增至近7亿个,核心面积也终于快要向500平方毫米的巨核看齐。

受到被AMD收购的影响,ATI的R600的进展多少也受到了拖延,使得Radeon HD 2900XT直到2007年5月才正式发布。R600采用了全新的VLIW 5D SIMD体系架构,集成320个流处理单元,并延续了R520/R580的环形总线设计,还开创性地将显存位宽提升到512bit,而晶体管数量也达到了7亿个。

尽管采用80nm制程,但R600的核心面积依然超过了400平方毫米,这也是AMD目前唯一一个超过400平方毫米的核心。

DX10轻量化之争 以小核心打造双核显卡

2007年年底,DirectX 10显卡的竞争进入第二阶段,由于制程工艺来到65/55nm工艺节点上,NVIDIA和ATI均步伐一致地推出了轻量级的产品,并打造“双核显卡”,此时晶体管数量仍徘徊在7亿上下。

NVIDIA方面推出的G92核心延续G80的设计,加强了纹理单元,虽然显存位宽缩减至256bit,但凭借更高的工作频率,让GeForce 9800 GTX的性能并不亚于GeForce 8800 Ultra。

AMD(ATI)方面对R600的精简则成就了RV670,和G92一样为256bit显存位宽,集成6.66亿晶体管,但由于初始便采用55nm制程,核心面积仅为192平方毫米,远小于G92的324平方毫米。不过由于终究没能扭转R600的颓势,Radeon HD 3870 X2在和GeForce 9800 GX2的竞争中并未占到什么优势。

空前绝后 14亿的惊世巨核NVIDIA GT200

不得不说,NVIDIA在转入55nm制程节点上比ATI晚了半个节拍,使得他们在2008年6月发布的GT200核心以576平方毫米的惊人面积不仅刷新了G80的记录,还将这个记录保持到现在。

NVIDIA在GT200的设计上开始更多向通用计算靠拢,240个流处理器和512bit显存位宽耗费了14亿个晶体管,其规模远超AMD(ATI)后来的RV770核心,架构方面重回交叉总线设计,9.56亿个晶体管和256平方毫米的面积继续主打小核心策略。Radeon HD 4870还是计算能力首个突破1TFlops的显卡。

在Radeon HD 4870之后,AMD(ATI)还迅速推出了双核版本Radeon HD 4870X2,得到了性能桂冠的称号。而同样基于RV770核心的中高端产品Radeon HD 4850一度成为了市场热销产品。

在NVIDIA全面过渡到55nm之后推出的GT200b核心,面积缩小至470平方毫米,并先后发布了GTX285/295/275等显卡。AMD(ATI)方面的动作则是推出改良的RV790核心,比RV770多了300万个晶体管,对应的显卡则是Radeon HD 4890和HD 4860。

DX11竞争的开端 你破20亿我冲30亿

2009年下半年,AMD(ATI)和NVIDIA着手导入40nm制程,前者率先于当年9月发布了Cypress核心,自此改变了以往“RVxx0或Rxx0的命名方式”。相比RV790,Cypress的晶体管数量暴增了125%,达到了21.54亿——AMD(ATI)首个突破10亿晶体管的图形核心竟然也一下子突破了20亿。

不过Cypress最重要的意义则是它是首个支持DirectX 11的核心,并着重强调曲面细分功能。Cypress的核心面积达到了334平方毫米,属于中等身材,除了打造了Radeon HD 5870以外,还顺利地成就了双核版本Radeon HD 5970,并占据性能桂冠宝座长达一年。

NVIDIA基于Fermi架构的GF100核心直到2010年3月才正式推出,晶体管规模再次刷新到了30亿个,比Cypress多了40%,529平方毫米的核心面积也成为了NVIDIA的第三个巨核。不过NVIDIA在GF100上还是做了一点的取舍,GeForce GTX 480并非GF100的完全体。

DX11轮回之战 制程更迭放缓40nm依旧

由于在55nm之后,台积电放弃了原有的“半代制程”的过渡方式,40nm之后不会有28nm制程,可以说在一定程度上减缓了GPU晶体管增长的频率,NVIDIA和AMD(ATI)开始更多注重新产品的发布节奏,并对架构进行优化。

作为GF100的完全体,GF110于2010年11月推出,保持30亿个晶体管,核心面积小幅缩减至520平方毫米,对应的显卡包含GeForce GTX 590/580/570。得益于规格全开、频率提升以及小幅的内核优化,GeForce GTX 580在某些应用中可以获得比GTX 480高出30%的性能。

值得注意的是,从HD 6000系列显卡开始,AMD放弃了ATI的商标,全面采用AMD标示。他们于2010年12月发布的Cayman则在Cypress的基础上进行了架构的调整,改为VLIW 4架构,并通过改进指令分配引擎增加线程的利用效率,最终以“看少去更少了”的流处理器规模实现了性能的增长。不过Cayman还是集成了更多的晶体管,而389平方毫米的面积也也一步步地向400靠近。

首尝28nm AMD先发制人 NV小核反击

2012年1月,采用台积电28nm制程的AMD Tahiti核心发布,集成43.13亿晶体管,其实这个数字对28nm制程来说并不庞大,最终核心面积并未突破400平方毫米,反而是比Cayman更小的352平方毫米。

AMD还在Tahiti上采用了全新的架构设计,名为GCN,放弃了使用多年的VLIW体系结构。除了早期发布的Radeon HD 7970,后来AMD还推出了HD 7970 GHz版本与NVIDIA的GTX 680竞争。而Tahiti的双核版本Radeon HD 7990(Malta)直到今年上月才正式发布,并成为了这十年中首个采用三风扇设计的公版显卡。

经过了GT200和GF100的折磨,NVIDIA在切入28nm制程节点上选择了先发布小核心产品——GK104。GK104在晶体管数量上比GF110只多了16%,但依然实现近40%的性能增幅。得益于这种GK104这种小核心,NVIDIA顺利发布了GTX 690显卡。

28nm潜力何在 GK110再次诠释巨核概念

峰回路转,NVIDIA于今年2月正式发布了基于GK110核心的GeForce GTX TITAN显卡,事实上GK110核心已经在去年11月被用于Tesla K20上,集成70.8亿晶体管的它才是Kepler架构的完全体!GK110的核心面积达到了561平方毫米,看来GT200的576平方毫米的确是空间绝后了!

其实早在AMD的Tahiti发布之时就有消息透露NVIDIA已经准备好了一个巨核,但后来发现GK104已经足够招架Tahiti,也因此NVIDIA将这个巨核推迟了近一年以更完美的姿态出现。一时间NVIDIA风光无限,甚至推出了一个GTX TITAN这样的特殊产品。

然而在GK110公布后的半年多时间里AMD都没有新产品推出,老旧的HD 7970已经招架不住以GTX 780为首的GK110系列。直到今年10月,他们才正式发布了全新了Hawaii核心,有着一系列的架构微调,集成62亿晶体管,核心面积达到438平方毫米。Hawaii也是AMD旗下第二个核心面积突破400平方毫米的核心。

但GK110也足够招架Hawaii,GTX 780Ti也是全规格的GK110版本,Kepler架构至此终于完美!

20纳米的期待 谁将首破100亿晶体管?

前面10页的回顾其实并不能让你感受到晶体管爆棚的过程,简单的数字叠加是给予不了震撼的。我们看到每一代核心的面积都控制在了一个合理的水平下,这其实也是制程逐步迭代的功劳。假设如果以相同的制程来制造这些核心,并控制在相同的晶体管密度下,他们之间的面积将会是怎样的关系呢?

这种情况下核心面积自然是和晶体管数量成正比的,那么,GK110将能容纳56个NV30、32个NV40、10个G80、5个GT200。当然这是一个有趣而不切实际的比喻,因为真实环境中核心代号也包含制程的信息,但是这个比喻却能够让你一眼目睹这十年来GPU的膨胀规模!

我们把文中NVIDIA和AMD(ATI)重点列出来的核心,将其核心晶体管数量和对应的时间点进行汇总并生成趋势线,就得到了如下的统计:

这张图其实并不够直观,但是我们可以看得出来,在R600之后AMD由于以发展小核心为主,所以代表AMD(ATI)的红线的走势要比代表NVIDIA的绿线低一点。

如果以对数刻度重新描绘,就更能直观地看到NVIDIA和AMD(ATI)的平均增长趋势情况。观察几乎正好落在绿线上的点,他们正好是NV35、G70、G80(8800Ultra)、G92、GT200b、GF110以及GK110。

这些核心之间有什么共同点?没错,他们几乎没有受到过显著的良品率低下导致难产的困扰。而高出这条线的点,就很可能经历过一些技术性问题,比如在推出NV40的时候,NVIDIA就与IBM合作引入了冗余电路技术来提高良品率;GT200发布时NVIDIA也曾明确表示过良品率问题,至于NV30、GF100就不用说了。

而AMD(ATI)同样可以参照这个规律。只是你可以看得到,NVIDIA向来要比AMD(ATI)激进得多。

那么,到底谁会率先突破100亿晶体管呢?我们按照现有的规律将周期往后推算一年,当然最终的结果自然会受到NVIDIA和AMD主观态度以及市场策略的影响。

按照现有的情况来看,如果AMD的新一代旗舰直奔100亿晶体管,那么拿出的扔将是一个400平方毫米的大核心,但也有可能先采取小核心策略,推出一款在性能上不亚于GK110的产品占据Sweet Point制高点。而NVIDIA方面,也有可能延续Kepler时期先小后大的策略,不过完全体的Maxwell恐怕是一个不少于130亿晶体管的巨核。

返回原文

本文导航

相关阅读

每日精选

点击查看更多

首页 手机 数码相机 笔记本 游戏 DIY硬件 硬件外设 办公中心 数字家电 平板电脑