在不到5年时间里,AMD成功地将APU这件“意识形态”层面的产品从蓝图变成了现实,其过程就好比有人在你眼皮底下变戏法,虽然并不明白其中玄机,却依然不禁拍手叫好。如果给你一个机会回到2006年去追溯这一过程,你会更加折服于这家公司对未来精准的前瞻能力与非凡胆识——在那
在不到5年时间里,AMD成功地将APU这件“意识形态”层面的产品从蓝图变成了现实,其过程就好比有人在你眼皮底下变戏法,虽然并不明白其中玄机,却依然不禁拍手叫好。如果给你一个机会回到2006年去追溯这一过程,你会更加折服于这家公司对未来精准的前瞻能力与非凡胆识——在那个90nm工艺芯片撑大局的年代,能够准确预见将CPU与GPU这两大毫不相干的功能芯片合二为一的真融合趋势,该是一项多么了不起的成就。
什么是APU,我们为什么需要APU?
产业界的新挑战
今天,我们便要来一起聊聊这个脱胎于5年前那场并购大戏的产物。Accelerated Processing Unit,中文称作“加速处理器”,尽管今年1月4日才是它正式问世的日子,但在此之前的很长一段时间,业界对它的发布却多少有些迫不及待,其中很重要一个原因是,市场上充斥着太多性能不均衡的产品——有的徒具高端CPU,却由于只采用了极低端的GPU或集成显卡而导致实际应用捉襟见肘;也有一些产品为求性能不惜成本,结果却因价格昂贵而只可远观。尤其是在HTPC、一体机与便携终端市场,产品尺寸、性能与功耗始终无法兼得,空有广阔潜力却发展极为缓慢。
个人电脑早就不是什么奢侈品,而是成为帮助人们提高办公效率、改善娱乐体验的必需工具,其地位堪比电视、冰箱、洗衣机等日用家电。在个人电脑发展的30年中,人们对产品性能的需求已经发生巨变,便携性与视觉体验正在成为重点,而普及的趋势也要求电脑的售价更为大众化。现实问题是,传统的计算架构已无力满足用户的这些需求,IT产业正面临新的瓶颈。
以移动平台为例,既要拥有卓越性能的CPU,显卡性能表现要达到主流DirectX 11级别,功耗必须足够低,产品外形尺寸还要尽可能满足便携乃至超便携计算的需求——当来自用户的这些“无理”要求集中爆发时,小打小闹式的产品升级已经无法承载,变革迫在眉睫,出路只有一条:融聚。
APU:超浓缩的3A平台
APU顺势而生。它的精髓在于,将高性能CPU、支持DirectX 11独显级别的显卡,以及北桥芯片无缝融合在一颗75平方毫米见方的硅芯片中,功能融合度达空前之高,而最低功耗则仅为9W。如果你认为这样解释太过抽象,那么站在芯片功能的角度来理解,可以将APU简单视作CPU与GPU合二为一的产物。但必须强调,二者并非单一的物理融合,APU更强调CPU运算性能与GPU图形性能的均衡,它们一起协同工作执行串行计算与并行计算,为眼下风头正盛的视觉应用提供耳目一新的加速体验。
不难发现,APU实际上是一个极度浓缩的AMD 3A平台,从CPU到GPU到芯片组,无一不是芯片级融合。有了这种融合,各系统组件间的数据交互无比顺畅,低延迟、高带宽,性能提升十分显著。在APU架构中,GPU与系统内存之间通过高达27GB/s的带宽连接,而在以往,北桥芯片中的集成显卡与CPU内存控制器之间的连接带宽仅有区区7GB/s,很显然,即便是同型号的GPU,与CPU融合之后也会表现得更加高效。APU的这种设计,让此前存在于3A平台中各系统组件之间的互连瓶颈一扫而光,数据传递无须再跨芯片进行,所需的额外延迟和功耗不复存在,芯片封装尺寸也更为小巧。
不同的面孔,同样的融聚
作为AMD的一项长远产品规划,APU家族将全面覆盖桌面与移动平台。首批亮相的APU定位超轻薄、入门级移动、一体机和高清小本市场,代号分别为Zacate和Ontario的E系列与C系列。今年年中即将推出面向性能级市场的A系列APU,其代号为Llano。其中,基于E、C两大系列APU的机型已经大量上市,而代号Llano的A系列APU也已于日前向OEM合作伙伴供货。
作为APU的旗舰型号,代号“Llano”的A系列APU将采用GlobalFoundries的32nm工艺制造,它的CPU部分将有四核心与双核心两个规格。而Llano的GPU部分与E系列的HD6310相比,则也会有显著的提升,融合的GPU流处理器数量、性能都不可同日而语,并将支持与外接独立显卡实现“混合交火”的双显卡技术,具体性能表现值得期待。由于尚未正式发布,关于这一系列目前没有太多规格和性能细节,但根据AMD官方博客此前提供的一段与英特尔四核Sandy Bridge Core i7-2630QM的对比视频,可以看到四核A系列APU在高清视频播放、3D游戏、高性能计算以及能效方面都有明显优势。
Zacate和OntarioAPU的CPU部分采用了新的低功耗架构Bobcat,前者热设计功耗为18W,后者则低至9W,它们都采用了台积电的40nm工艺生产。Zacate E系列和Ontario C系列在市场定位上也有所区分,前者主要针对轻薄型笔记本、入门级主流笔记本和一体机,后者则更多地定位于高清小本市场,为用户提供卓越的高清互联网浏览体验。
应对加速计算,两大异构处理器方案剖析
APU的种种技术细节让人很容易想到英特尔的Sandy Bridge处理器,疑问随即而至:同是CPU+GPU异构处理器,同样属于功能高度融合的产品,二者有何本质区别?带来的使用体验又有何不同?用户在选购的时候,又应该侧重考虑哪些因素?要回答这些问题,我们首先要从AMD、英特尔两大厂商不同的发展思路上来寻求答案。
我们都知道AMD是唯一同时具有CPU和GPU技术领先优势的厂商,所以AMD注重CPU和GPU的均衡发展,尤其是GPU性能的发展,因为AMD相信未来将是视觉应用的天下,并将其融合产物定义为CPU或GPU之外的全新类型的产品:加速处理器(APU, Accelerated Processing Unit)。英特尔则没有图形处理方面的技术优势,长期以来只能提供性能羸弱的集成显卡,所以更强调CPU的发展,其Sandy Bridge更像是在CPU里面集成了图形处理核心。下面,我们大致可以从四个方面来深入探讨这一话题。
怎样才叫加速计算?
什么是加速计算?简言之,就是利用专用处理能力来应对具体任务,从而加速特定的应用。我们知道CPU擅长串行计算,而GPU具有强大的并行计算能力,APU将两者融合在一起,组成一个异构的运算系统,智能判断和分配适合CPU或者GPU运行的工作负载,提高数据处理效率,从而达到应用加速的效果。
在APU给我们描述的加速计算蓝图中,还有更深的含义,就是利用GPU强大的并行计算能力,进行通用计算,进一步把CPU从繁重的计算中解脱出来,提高效率,这也是APU的真正诱人之处!但在像APU这样的异构计算环境中,要实现通用计算,就需要进行跨CPU和GPU的编程,而目前在软件产业界,OpenCL这一开放、成熟的标准一直被视作通向CPU+GPU异构计算的不二法门。软件开发商无不心知肚明,在非标准的应用程序接口上投入大量时间和资金无异于冒险。所以,对OpenCL的支持也就成了加速计算的关键。我们知道,AMD现在已经和即将推出的APU产品,都全面支持OpenCL标准,从而为软件开发商推出众多支持加速计算的应用,打开了加速时代的大门。
而反观英特尔的Sandy Bridge,虽然也是用CPU和GPU核心构建了异构计算系统,却不能完全支持OpenCL,只有CPU核心支持OpenCL,GPU核心并不支持,无法利用GPU的并行计算能力进行加速运算,这种硬件层面融合、软件应用层面隔离的处理器,只能算是“貌合神离”,与真正意义上的加速计算相去甚远。。
DirectX 11的挑战
APU与Sandy Bridge虽然同是CPU+GPU异构处理器,但在GPU部分的技术细节上,仍然有着本质性的差异。AMD凭借其领先的GPU技术优势,可以实现对DirectX11的全线支持,从中低端的E系列和C系列APU,到高端的A系列,都全面支持DirectX11。眼下,DirectX 11早已是大势所趋,更加绚丽的特效支持、更高效率的多线程渲染可以轻松营造出更精美的画面,从而令玩家流连忘返。而Sandy Bridge处理器搭载的HD Graphics 3000/2000只提供了对DirectX 10.1的支持,虽然DirectX 11提供了向下兼容的功能,但用户所获得的游戏体验无疑会遭遇降格。
真正的双显卡
必须承认,用户对更高3D性能的渴求是永无止境的。对于笔记本用户,尤其是游戏玩家而言,永远希望笔记本有更高的显卡性能。但摆在眼前的事实是,市面上很多笔记本产品号称是“双显卡”,但实际上只是支持双显卡切换,无论是NVIDIA的Optimus技术还是英特尔Sandy Bridge处理器的集显/独显切换技术,实际上永远只有一块显卡在工作,你无法借此获得更高的3D性能。
而据AMD透露,其即将推出的A系列高端APU可以带来不同的选项,支持真正的“双显卡”。与2008年提出Hybrid CrossFireX(混合交火)时的情形类似,双显卡技术允许用户接驳一块Radeon HD独立显卡与APU内的GPU核心进行混合交火,从而大幅度提升图形性能,不仅可以让游戏运行得更流畅,那些为APU加速计算量身定制的程序也会更加运行如飞;当然,如果你对系统续航时间有所要求,那么也可以选择只启用Llano APU中的图形核心或独立显卡,这才是真正意义上的双显卡技术。
均衡设计与设备小型化
一直以来,芯片厂商都被一个问题所纠缠:在设备小型化的趋势面前,如何在晶体管开销、性能与发热量之间取得完美平衡?
这一矛盾在APU时代得到完美解决,无论是Llano、Zacate还是Ontario,都在各自的市场区间实现了最佳每瓦能效比。其中,Ontario C系列APU仅用相当于主流桌面处理器一半的芯片面积,就达到了后者性能的90%,而热设计功耗仅为9W,待机功耗甚至不到1W。这样一来,全天候续航便不再是梦想,用户也无需在性能、功耗与设备尺寸之间纠结,因为你总是能轻易地在三大系列中找到最能符合自己需求的产品。相比之下,Sandy Bridge平台的用户恐怕就没那么幸运,当需要更高计算性能时,功耗轻易超标;要求更高图形性能时,用户将不得已配备独立显卡,这样设备尺寸与重量就无法兼顾,总而言之,你总是需要向某一方面妥协。
革命性的融聚,不一样的加速体验
时光逆转,2006年下半年,当AMD宣布启动Fusion战略,研发将CPU与GPU融聚于一体的处理器产品时,许多人一定没有料到,以APU为代表的异构处理器带来的变革会如此之猛烈。APU的问世,使高性能、超轻薄的笔记本电脑与一体机成为可能,以前需要通过笨重的台式机方能获得的体验,如今利用搭载APU的超便携设备唾手可得;借助APU,
流畅的高清视频播放、流畅逼真的3 D游戏体验近在眼前;基于APU的超便携设备,可毫无顾忌地不插电全天候续航……
一个新的产业生态系统正以APU为核心而创建。在1月4日APU发布当天,各大一线OEM厂商就纷纷曝光了各自的特色机型,而华硕、技嘉、微星和蓝宝石等ODM厂商,也已在第一时间向零售渠道和系统搭建商推出了众多基于E系列APU的主板设计。事实上,不止是OEM与ODM,软件产业界同样热情高涨。
得益于CPU和GPU的融合,加速计算将帮助消费者满足最新视觉体验的需求。在操作系统和软件应用的支持下,APU可实时智能分配CPU与显卡擅长的工作,真正实现“协同计算、彼此加速”。目前,微软IE9、Adobe Flash 10.2等当前最新应用都针对AMD APU进行了优化。IE9 引入了GPU支持的HTML5规范,网页开发者能够创建流畅、实景式的、越来越美妙的互联网体验;Flash 10.2的Stage Video硬件加速让支持此技术的网站可以快速地利用APU的硬件加速性能,将视频管线中的CPU负载降到最低,以更高的效率为用户带来更流畅的视频播放。此外,AMD还和国内软件厂商通力合作,与暴风影音联手发布了《暴风影音 锐·加速版》(AMD APU画质增强版),让用户享受“更高清,更平滑,更绚丽”的视觉效果。
无限商机正在围绕APU而产生:更健康的软件产业链、更加新奇的终端产品、更充满个性化的设计将蜂拥而至。APU的世界,精彩纷呈、方兴未艾。

网友评论