双芯合力“CPU-GPU”技术解析

互联网 | 编辑: 张杨 2008-01-08 00:30:00转载 返回原文

在刚刚过去的2007年,NVIDIA率先引入了Tesla通用GPU计算架构,最终目的是将CPU和GPU合二为一,然而NVIDIA并没有CPU的研发历史,在整合的道路上遇到了重重困难。另一方面,AMD计划于2009年推出内建GPU核心的Fusion处理器,而Intel整合GPU的Nehalem处理器将与之正面交火,届时

双芯合力“CPU-GPU”

PChomeEW评测室与电脑报的合作,今转载《电脑报》《怪兽来袭!解读双核显卡!》一文,原文如下:

在刚刚过去的2007年,NVIDIA率先引入了Tesla通用GPU计算架构,最终目的是将CPU和GPU合二为一,然而NVIDIA并没有CPU的研发历史,在整合的道路上遇到了重重困难。另一方面,AMD计划于2009年推出内建GPU核心的Fusion处理器,而Intel整合GPU的Nehalem处理器将与之正面交火,届时,处理器将全面进入整合GPU时代。

三足鼎立:CPU与GPU整合计划在PC技术领域,CPU和GPU始终是相辅相成,在二者已经发展到出现新的瓶颈时,“结合”也许是明智的解决方案,因此,关于整合CPU和GPU的方案就一直被人们所津津乐道。

自收购ATI之后,AMD公布了整合CPU和GPU的Fusion计划(为了不给大家在阅读上造成混乱,我们下文仍将集成在AMD处理器中的显示核心称为GPU),并计划于2008年年底发布。在2007年年底,AMD最终确定了Fusion处理器的细节,并将在2009年下半年以APU(加速处理器)的面目出现,首款APU的代号为Swift,初步计划采用45nm的SOI(Silicon on insulator,绝缘体硅片)工艺,集成GPU和北桥。

作为处理器领域的霸主,Intel显然不会坐以待毙,为了对抗AMD的Fusion处理器,Intel计划在下一代Nehalem处理器家族中,将代号为Havendale的处理器整合GPU,同样会在2009年上半年如期上市。

作为图形芯片领域的领头羊,NVIDIA此前推出了Tesla通用GPU计算架构,但这并不是NVIDIA的最终目的,不管是GPU集成CPU,还是CPU整合GPU,NVIDIA意识到未来GPU的发展趋势,那就是CPU与GPU的完美融合,NVIDIA已经抢先买下UlI Electronics,并收购了Stexar公司,获得了整体芯片组和x86架构的设计团队,并计划于2009年推出一款45nm处理器,为未来推出整合CPU和GPU做准备,届时,CPU和GPU整合市场将形成三足鼎立的局势。

解决瓶颈:整合GPU的实际价值

谈到CPU与GPU的整合,相信不少用户都会想到板载GPU,它的目的是为了降低用户的使用成本,然而在CPU里整合GPU,是否也仅为了降低成本那么简单呢?实际并非如此,在GPU刚刚诞生的时候,它的用途比较简单、专一,主要是为了处理图像贴图,然而随着3D技术的发展,GPU不仅具有可编程能力,而且还具备高强度并行计算能力。GPU有两个重要特征:在视觉上提供非常逼真的效果;可以分担CPU在计算中的负载,起到减负的作用。CPU的设计则不同,它适合管理多个离散的任务,但在处理并行化任务时显得力不从心,CPU进入多核时代后,依然不能满足用户的需求。因而,GPU在浮点运算能力上要远强于CPU,据说这个差距在25倍。

PCI-E总线限制了GPU与CPU的整合
如果能够发挥GPU的性能潜力,让它协助CPU处理复杂的任务,比如CPU负责一般任务计算,而GPU则负责专门浮点计算,这样就可以解决未来CPU发展的性能瓶颈。为此,通用“CPU-GPU”计算构架被一致看好,但实现二者的整合有两个途径:CPU整合GPU,或GPU集成CPU。就目前的情况来看,尽管PCI-E总线的带宽虽高,但始终未能满足CPU与GPU之间频繁的数据交换工作,加上GPU受PCI-E总线的限制,GPU集成CPU还不够成熟,CPU整合GPU才是最终出路,由于CPU通用处理器的设计,令它得以应付日常生活形形色色的工作,所以它与GPU的关系是并存的。

小贴士:CPU整合GPU的战略价值

CPU与GPU都是由晶体管组成的,而且CPU以后都是向着双核/多核的道路发展,制程方面也向着更精细的工艺前进,CPU与GPU整合在一起可以更充分地利用好各自的资源,无论是进行非游戏运算,还是3D游戏运算,两者都可以拥有最高的效率,同时也可以把兼容性提升到一个更高的档次。尽管这种整合会产生很多实际问题,但对于用户来说,一颗芯片拥有CPU与GPU的全部功能,也意味着拥有更出色的性价比。与此同时,CPU与GPU合二为一,也使得PC迈向更大规模的集成化之路,而且越简单的PC就越容易标准化统一化,也会更加廉价而实用,在未来,PC也可以像手机一样,拿在手里到处移动使用。

现实的问题:CPU如何与GPU整合?

要让CPU与GPU完美结合,摆在厂商面前的问题是如何去整合,对于AMD而言,它将直接在Fusion处理器中整合GPU核心。AMD将本来内建双核CPU的其中一个Core更换为GPU,使得CPU与GPU之间以 Crossbar(交叉开关)方式交换数据,更适合CPU的代码将在Fusion处理器的CPU部分被执行,而更适合GPU的代码将在GPU部分被执行。在这种新架构下,GPU也可以读取CPU的Cache资料,这是PCI-E 总线所未能提供的功能,Fusion处理器还整合了内存控制器,以同时满足CPU的DDR2/3及GPU的GDDR内存控制器的需求。无疑,Fusion处理器将内建完整的DirectX GPU核心、缓存和PCI-E通道,将是一款非常有价值的GPU处理器。

集成GPU和GPU的Fusion处理器构架图
实际上,Fusion处理器整合GPU的原理,与目前的Crossfire互联方案非常类似——CPU与GPU事实上仍是独立的,通过内部总线进行通信,同时还分别拥有独立的缓存,处理器中的GPU和CPU会共享系统内存,从而实现GPU与CPU的数据交换。值得注意的是,Fusion处理器还内置了1个HT总线,允许Fusion处理器的平台扩展外部显卡,AMD表示,Fusion处理器不仅以一个整合了北桥、GPU的单芯片面目出现,还将会整合不同数量的GPU和CPU核心,比如两个Fusion处理器连接在一起,可以达成并行GPU模式。在未来,AMD新一代整合GPU的处理器还将提供多条HT总线,以实现更高的带宽外接显卡,甚至会提供内建GPU与外接显卡的Crossfire新方案。
内建多颗GPU的AMD处理器模块

与AMD有所不同的是,Intel的设计路线并不是简单的内建GPU核心,Nehalem处理器是通过多芯片系统封装(Multi-Chip Package)方式,将北桥芯片及图形芯片直接整合在CPU之中,而CPU内核心与GPU核心是通过Quick Path Interconnect(QPI)方式连接,QPI内置内存控制器,有助于解决CPU和GPU从内存中读取数据时的延迟,内存延迟和带宽有了大幅度改进,QPI还具备处理器间的直接连接技术,使芯片能够共享数据,1个处理器能够存取与其他处理器相连接的内存中的数据,大大提升了整合GPU处理器的运行效率。Intel如此的设计方案,还可缩短产品设计周期,有助于降低生产成本。

Intel整合GPU处理器架构图

观点:CPU整合GPU前景广阔,困难也不少

尽管CPU整合GPU成为未来发展趋势,但至少可以肯定,在2009之前,对应产品不会上市,此外,CPU与GPU整合看起来容易,但实际遇到的问题还很多,比如现有主流GPU内建的晶体管目数目达到7亿之多,比CPU还要复杂,这意味着CPU还难以集成高端GPU内核。就算以后能集成高端的GPU,但GPU的发热量比CPU大许多,也是一个亟待解决的问题。

因此,AMD与Intel初期将以整合简单的GPU为主。同时,由于GPU在设计上的特殊性,它的核心工作频率远比CPU要低,这将会制约GPU与CPU之间的数据互通能力,在传输速度上会存在一定的延迟,至少不会有理想中那么好。

正是由于技术上的不足,导致了CPU整合CPU暂时并不会马上普及起来,毕竟对于高端游戏玩家或图形工作站用户而言,对CPU整合GPU的产品需求并不是那么迫切。他们更在乎强劲的图形处理性能,但对于普通用户而言,初期CPU整合的GPU已经达到了DirectX 10入门级水平,可以全面支持Windows Vista及高清视频播放等能力,不仅可满足日常娱乐应用需求,同时进一步降低了用户购买成本,更为重要的是,由于GPU被集成在CPU里,可以让系统的体积做到更小,整机功耗也更低,这符合未来低功耗、低噪音的节能环保PC的发展方向。

幸运的是,技术的发展总是永无止境,针对PCI-E总线存在的延迟问题,Intel推出了PCI-E 3.0标准,将帮助Nehalem处理器内建GPU核心的性能优势,同时对于GPU频率落后CPU的问题,AMD方面表示会致力于以CPU技术改良GPU,使之实现3GHz的工作频率,此时GPU的浮点运算能力可达更高的水平。另外随着GPU技术的进步,到2010年时,GPU可实现Petaflops(千万亿级)的超级浮点运算能力,是现在CPU的 40倍以上,完全改变计算机功能,此时CPU整合GPU的时代才会开始普及起来。

对于时下的主流应用,Windows Vista的3D性能、多媒体性能,对GPU并不会构成运算负担,随着CPU-GPU技术的发展,更多的浮点运算任务被安排给GPU计算,因为GPU强大的浮点运算能力比CPU的执行效率更高。GPU不仅仅是一颗3D图形处理器,它不是只能用于玩游戏,未来GPU更多实用的功能将会被开发出来,比如大型文档加速、视频转换、编码、查毒杀毒、压缩解压……而如果CPU整合GPU的技术足够完善,未来所有的工作都可以交给CPU去执行,届时,电脑体积将变得非常小巧、轻薄。

返回原文

本文导航

相关阅读

每日精选

点击查看更多

首页 手机 数码相机 笔记本 游戏 DIY硬件 硬件外设 办公中心 数字家电 平板电脑