重新定义手机 Tegra 3四核暗藏的野心

PChome | 编辑: 韩翔 2012-02-29 06:07:00原创 返回原文

光是Tegra 3比对手强上8倍性能的GPU就让NVIDIA有了更多的竞争筹码,如果战力全开将电脑平台上的游戏合作伙伴全部挖来为其开发手机/平板游戏,那消费者还会选择搭载了Cortax-A15处理器的手机么?

双核未普及四核就来临 星球大战?

在写这篇文章之前,我可以问大家一个问题么?你们觉得双核手机和单核手机之间的区别是什么?相信很多人都会脱口而出:速度更快。那你们觉得四核手机与双核手机之间的区别又是什么?还是速度更快?今年MWC2012通信展的舆论显然都被诺基亚那部4100万像素的拍照手机所淹没,难道就没人仔细考虑一下四核手机究竟能为我们带来什么?

我们可以看一下双核手机给我们带来的好处:一个字,快。这指的是显而易见的速度优势,君不见iPhone 4S在对比上一代的时候,用了多少形容词来突出新手机的快?相比iPhone 4,快达2倍的性能和7倍的图形处理速度,让用户在网页浏览,应用软件切换,游戏以及所有操作中都获得更快的速度体验。看起来的确是很简单的道理,速度更快就能够让用户在碎片时间享用智能手机更多的内容,听起来的确很好对不对?

道理是没错,但这也代表着你的手机寿命(电池续航)被大大缩短,譬如iPhone 4S就是个很好的证明,相比iPhone 4它在待机时间上缩短了35%之多。我原本可以使用10个小时的时间,可以发100条微博,玩10个游戏,现在8个小时就能搞定这些,可手机的续航时间也缩短到了8小时,那和以前有什么区别?如果要在后面的2个小时享受更多内容,用户就必须配备一个充电宝或者额外电池板,否则就是一个以速度换取长度的等价代换。

这也是许多人对于智能手机目前的军备竞赛感到不解的地方,200Mhz的处理器升至1Gh可以看作是“不流畅“ 变为“顺畅”的使用体验,让用户在使用手机时起码能够觉得舒服。但我们是否真的需要“更舒服”的专业服务?这就有些萝卜与去筋萝卜,西瓜与无籽西瓜的味道了。这样的产品并不是说没有市场,消费者却并不会完全热衷于此,于是这完全成了厂商刺激消费的手段,就好比不停换季改款的服装,更变色彩的化妆品,推陈出新是每家厂商必然会做之事。

Android军备史

消费者对智能手机军备竞赛不满的原因还是在于电脑平台上,近10年的电脑史完全就可以用星球大战计划来形容:Intel与AMD之间的处理器之争从1Ghz发展到3Ghz,从单核发展到16核;内存从DDR发展到DDR3,频率从266Mhz变为1600Mhz(虽然只是厂商宣传数据);显卡从2管线跳到1600个流处理器,频率从333Mhz猛增到1Ghz。接近一年一次的升级完全让用户叫苦不迭,在财力人力上都要为之煎熬(不买又会被发烧好友们嘲笑,买了又觉得没什么用),现在这样的情况又开始在Android手机上出现,是不是稍微有点太过分了?那我们接下来就从处理器芯片近年来的发展简史看看到底是什么在迫使厂商不停的加压研发新产品,同时分析一下手机是否真的需要强悍的高性能多核处理器。

以古鉴今 从电脑发展历史看待问题

中央处理器(Central Processing Unit,处理器)可以说是每一台智能设备都需要的运算核心和控制核心。其功能主要是解释设备指令以及处理设备软件中的数据。处理器由运算器、控制器和寄存器及实现它们之间联系的数据、控制及状态的总线构成,处理器的运作原理可分为四个阶段:提取(Fetch)、解码(Decode)、执行(Execute)和写回(Writeback)。 处理器从存储器或高速缓冲存储器中取出指令,放入指令寄存器,并对指令译码,并执行指令。形象的来说他们的关系就是一个财务,一个出纳,一个库管以及一个物流组成。他们平时需要进行出货、记账、管理与提货的任务。

相信大家对于处理器的运行模式已经非常熟悉,不再需要我赘述,这里我就先结合近10年的英特尔处理器发展看看每年他们都在产品上提升了些啥功能,对用户来说又有什么好处。

 

2002年 新款奔腾4处理器

超线程技术(Hyper-Threading,HT)能同时快速执行多项运算应用,或针对支持多重线程的软件带来更高的性能。

2002年下半年 频率高达3.06 GHz的奔腾4处理器

首次将民用处理器的运算速度提升到了每秒执行30亿个运算周期,主要得益于英特尔当时拥有业界最先进的0.13微米制程技术。

2003年 新型奔腾M处理器

该处理器拥有多个供电电压和计算频率的增强型Speedstep技术,智能供电分布可将系统电量集中分布到处理器需要的地方,并关闭空闲的应用;移动电压定位(MVPIV)技术可根据处理器活动动态降低电压;Micro-opsfusion微操作指令融合技术,在存在多个可同时执行的指令的情况下,将这些指令合成为一个指令,以提高性能与电力使用效率。

2005年 奔腾D双核处理器

该处理器是英特尔为了应急对付AMD X2而出,这款简单把两个单核处理器粘在一起的产品显然没有达到预期效果,面对着AMD X2的“真双核”有备而来,英特尔首款胶水双核完全成为了处理器多核之路上的小白鼠。

2006年 酷睿构架双核处理器

首次将能效比这一概念优先于处理器频率之前,你可以看到酷睿构架的处理器频率都不算高,但性能相比之前却有了40%的提升,每瓦特的性能比大大的提高,英特尔还加入了细微的逻辑控制机能独立开关各运算单元,只有需要时才会被开启,减少闲置时不必要的功耗,也即所谓的晶体管睡眠技术。

2008年 凌动处理器Atom

2.5瓦超低功耗,价格低廉且性能满足基本需求,主要为上网本(Netbook)和上网机(Nettop)使用。作为具有简单易用、经济实惠的新型上网设备——上网本和上网机。

2008年下半年 酷睿i7处理器

该处理器集众多先进技术于一身,如集成内存控制器、三通道技术支持、全新QPI总线以及超线程技术的回归等。

2009年 酷睿i5处理器

与酷睿i7支持三通道存储器不同,酷睿i5只会集成双通道DDR3存储器控制器。另外,i5首次集成了一些北桥的功能,将PCI-Express控制器集成在处理器内。

2010年 酷睿i3处理器

酷睿i3作为酷睿i5的进一步精简版,是面向主流用户的处理器家族标识。拥有Clarkdale(2010年)、Arrandale(2010年)、Sandy Bridge(2011年)等多款子系列。

2011年 Sandy Bridge处理器

这一构架的最大意义莫过于重新定义了“整合平台”的概念,与处理器“无缝融合”的“核芯显卡”终结了“集成显卡”的时代。由于高清视频处理单元的加入,新一代酷睿处理器的视频处理时间比老款处理器至少提升了30%。

众多看官可能要问了,为什么把电脑平台上的处理器发展史规列出来,而不是仔细研究一下手机处理器的发展史。我这样做的目的很简单,如今的手机市场已经开始从非智能时代向智能时代冲刺跑,过往的那些经历根本给不了我们太多启示,反倒是电脑处理器有着一部完整的发展历程史,从中我们能够看到什么?理清一下头绪看看:2002年的『多任务运行』,2002年下半年的『更精细制程工艺』,2003年的『节能技术』,2005年的『引入双核』,2006年的『功耗能效比』,2008年的『超低电压移动版』,2008年下半年的『先进技术集成』,2009年的『内存精简』,2010年的『性能精简』,2011年的『集显精简』。是不是已经看出门道来了?英特尔曾经是加法与减法轮流做,从2008年开始却不停的做减法,尽可能的降低设备的整体功耗。后几年的唯一的区别仅仅是2008年时四核处理器是旗舰,现在四核是普及大众的产品。

当消费者已经习惯了英特尔的减法节奏,现在又突然冒出来一个移动设备上的加法,甚至是更为夸张的乘法,自然会大为不满:能够随时插着电源的固定设备我们都嫌功耗厉害,现在一个随手拖着走的移动设备却跑来说追求极限性能,不正是鸟撞枪口打的就是出头的你?

如果我们摒弃先入为主的概念,回头来看看移动设备上日益增长的性能需求,你真的确定手机或平板电脑不需要再提高性能吗?全高清视频播放、高画质3D游戏、多任务同时处理,除了第一个选项勉强能够在如今移动设备的双核处理器上实现,另外两个功能难道真的不需要?当年NVIDIA刚刚发布Tegra 2处理器的时候,大家都认为这种处理器耗电,没有出路,完全是不切实际的产品。可经过一年的市场实际使用反馈下来,更多的用户希望能够有一款性能更高的处理器出现在下一代的移动设备上,更有效播放高清视频,玩更多的高画质游戏,同时使用更多的应用程序是大家的希望,而这也让NVIDIA即时推出了Tegra 3四核处理器。

别出心裁 NVIDIA新构架Tegra3详解

或许是电脑平台上的战斗让NVIDIA习惯了快节奏的生活,当高通、TI等传统移动处理器巨头都还处在半遮半掩的时候,抢先推出了代号为Kal-El的四核心移动处理器Tegra 3,将手机和平板电脑的处理性能带到了『四核』这一全新的高度。与移动设备的元件供应商所不同的是,NVIDIA更加喜欢凡事高声宣扬,从去年下半年开始就宣扬他们的这个『氪星超人』。拥有四核心的ARM Cortex-A9处理器,采用了台积电40纳米制程工艺(很快将更新为28纳米),拥有12个单元的GeForce ULP图形处理器,配备了LPDDR2 1066MHz内存,完整支持Neon指令集,从参数上看,似乎看不出有些什么特别之处?

如果我说Tegra 3是一个五核处理器,大家的第一反应就是耗电吧:原本以为四核处理器已经够吓人了,没想到NVIDIA还故意骗人,五核处理器那得多吓人啊,搭配这种处理器的手机是不是和以前的笔记本电脑一样用两小时就没电了?事实上多出来的这颗核心是vSMP(Variable Symmetric Multi Processing)可变对称式多重处理器,vSMP能够实现Tegra 3处理器在低功耗与高性能之间的平衡,进一步延长电池续航力,这也是为什么NVIDIA会宣称Tegra 3四核处理器会上一代Tegra 2更加省电。

通俗的讲,vSMP技术对于处理器的分类处理就像是一个公司里的员工与清洁工,两种处理器分别是采用了低功耗制程技术与快速制程技术的处理器:前者拥有更低的漏电功耗,但在高性能下会消耗更多功耗;后者则在待机时拥有较高的漏电功耗。就像是一个普通员工比较好学上手较快,但是身体薄弱不能持续干体力活,而清洁工则拥有不错的体力,虽然培训比较花时间,但上手之后就能比普通员工擦更多窗,搬更多桶水,洗更多的地。

NVIDIA于是就将这两种员工融合到了一起,员工在上班时间自然做更为重要的工作,打扫公司这种事自然就交给清洁工来做啦。公司自然能够节省开支(节省功耗)。

从3.0蜂巢(Honeycomb)系统开始,谷歌就开始将多重处理技术作为常规支援功能内置Android系统中,以便系统能够同时利用多个处理器核心的性能。但问题在于该系统会假定所有可用的处理器核心均能够实现相同的性能,并根据这一假设来为可用的核心调度任务。因此,Tegra 3针对的4个主要运算核心与协同运算的Companion“伴芯”采用了软硬两套不同管理办法。

硬件上,专业的处理器管理逻辑单元会不断监控处理器的性能负载,以便动态地随时启用和禁用处理器协同伴芯和主核心。是否开关伴芯和主核心的决定完全取决于当前的处理器协同运算负载以及处理器频率控制子系统所得出的处理器工作频率推荐值,该子系统则用软件的形式嵌入在操作系统内核之中,用户在使用时并不需要对应用程序或者操作系统进行任何更动,这也有点类似之前笔记本电脑上的智能显卡切换技术NVIDIA OPTIMUS。

但工作的时间并不适合打扫卫生,Tegra 3的协同伴芯和主核心频率不同,两者在工作时的内存频率也各不相同,直接导致了协同伴芯和主核心不能同时开启,这也让NVIDIA想出了最佳的解决办法:

1、高速缓存一致性: 因为vSMP技术不允许协同伴芯与主核心同时启用,所以在这些以不同频率运行的核心之间不涉及高速缓存同步的补偿问题。协同伴芯与主核心共用同一个L2快高速缓存,NVIDIA通过对该高速缓存进行编程设计,使其以相同的几十亿万分之一秒速度为协同伴芯与主核心返回资料。

2、改善操作系统效率:Android操作系统默认会假定所有可用的处理器核心均相同,能够实现相近的性能,作业系统按照这一假定的情形来为这些核心调度协同运算。 当多个处理器 核心中的每一个都以不同的非同步频率运行时,就会导致这些核心实现不同的性能,这样会造成操作系统在任务调度上效率不高。与之相比,vSMP技术则始终让所有活动的核心均保持相近的同步工作频率,从而实现优化的操作系统任务调度。 即便当vSMP从协同伴芯切换至另一个或多个主核心时,处理器管理逻辑单元也会确保无缝的过渡,最终用户完全觉察不到这种过渡,而且这种过渡也不会造成操作系统的调度补偿。

3、功耗最佳化:在基于非同步时序的处理器架构中,每个核心一般均处于不同的电源层(亦称电压轨或电压层)上,以便根据工作频率来调整每个核心的电压。 这会导致整个电压层的信号线以及电源线杂讯增大,从而对性能造成负面影响。 因为每个电压层均可能需要自己的稳压器,所以这些架构并不像增加处理器核心数量那样易于扩展。增加稳压器会提高处理器的成本以及功耗。 如果所有核心均使用同一个电压轨,那麽每个核心将以最快核心所需的电压运行,如此一来,便失去可降低功耗的“电压平方”效应优势。

实际上vSMP技术也有些许问题所在,譬如协同伴芯与主核心之间的切换过程在2毫秒左右,会不会出现在打开程序或者切面界面时带来迟滞感还有待观察,同时切换的这段时间处理器将处在一个真空期,任何工作都会暂时停滞下来,不过说到底,用户还是更加关心四核处理器的功耗,协同伴芯到底能否解决移动平台上最关键的续航问题?下一页我们来仔细研究一番。

功耗大对比 “第五核心”真实作用

首先我们来看看NVIDIA自家产品间的较量,同样采用了台积电40nm工艺的Tegra 2与Tegra 3作为对比。在睡眠状态(LPO)下Tegra 3要节约28%的能耗;如果关闭屏幕同时播放音乐,Tegra 3也要节省14%左右,而同时播放高清视频时差距更大,Tegra 3相比上一代竟然节省了61%;游戏时的对比也非常明显,Tegra 3也要比上代处理器节省1/3左右的功耗。

由于vSMP技术靠着协同伴芯来最大限度降低待机状态下的漏电功耗,同时利用四个主核心最大限度降低峰值工作频率下的动态功耗,从而可大幅降低整体功耗。 根据使用场合的不同,vSMP技术能够动态地启用和关闭处理器核心,从而在尽可能低的功耗下实现想要的性能。

和自家处理器比完之后,我们看看Tegra 3与其他处理器的差异,NVIDIA官方分别采用高低频的两款Tegra 3处理器与高通、TI两家巨头的双核处理器运行Coremark基准测试软件进行对比。首先需要说明的是两款处理器都是采用45nm工艺的Cortex-A9构架,与Tegra 3属于相同构架工艺稍弱。但对比情况却完全可以忽略掉两者的小小差异:低频率的Tegra 3四核处理器得到的成绩与两款双核处理器相当,测得的功耗却要低了2-3倍;满频率运行的Tegra 3在成绩上翻了一倍,运行功耗却反而不如两款双核处理器,甚至还要低上15%左右。

 

除了Tegra 3搭载的vSMP技术之外,还有一点也很重要:在功耗管理上核心数量多要胜过核心数量少。例如,四核处理器在所有性能水准上均比双核处理器的功耗低。之所以会出现这种结果是因为,四个核心能够以更低的频率运行,因此与双核处理器相比,在处理同样的任务量时,四核的电压更低。 因为功耗与电压的平方成比例,所以处理器整体功耗可实现大幅下降,却依然能够完成相同的任务量。即便在全部四个处理器核心均以1 GHz频率运行时,Tegra 3也比双核处理器竞争产品的功耗更低。因为Tegra 3中的高性能处理器核心采用了高速制程技术,所以这四个核心在工作电压比竞争处理器更低的情况下,依然能够以更高的频率工作。因为动态功耗与工作电压的平方成比例,所以Tegra 3即便在以更高的频率工作时,也能够大幅节省电力。

四款高清游戏 完全改变手机游戏旧观念

看官或许要说了,Tegra 3无非就是一款拥有更高的性能与更低功耗的处理器,之前看过英特尔的发展历程之后,NVIDIA此举不还是军备竞赛?我不知道大家喜不喜欢玩游戏,反正对我来说,一款拥有出色画面同时又好玩有趣的游戏是迫使我更换电脑的最好办法。纵观我这10年的电脑使用史,即使电脑发生了故障我依然会懒得更换,随便修一下就应付了事。但当游戏市场上推出了更加好玩的游戏时:10年前的《暗黑破坏神2》、7年前的《GTA圣安得列斯》,5年前的《孤岛危机》,这些游戏都让我义无反顾的更换新电脑,买上新显卡来美滋滋的体验一番效果全开的顺畅画面,大家是不是也是如此?

所以我还要说明一点,Tegra 3并不只是一颗双核处理器,NVIDIA还在它上面配置了一颗全新构GeForce ULP图形处理器,在这方面NVIDIA可以说是熟门熟路,Tegra 3的GeForce ULP处理单元从上一代的8个提升到了这一代的12个,同时性能提升了100%以上。更为关键的是Tegra 3开始支持诸如PhysX、CUDA等原本是电脑平台上才有的高级功能,实时光照、纹理生成等传统效果更不在话下。

我知道大家并不想看枯燥的跑分对比图,因为跑分对于手机来说又有什么用处?手机游戏画面也就如此,再高的跑分又有何用?如果你带着这种观念来看到手机游戏,那我建议你看看下面四款NVIDIA刚刚在MWC2012上针对Tegra 3处理器推出的游戏视频,看完之后你将明白全新的四核处理器到底意味着什么。

索尼克4: Episode II

人人都爱超音速小子,现在他回来了。在世嘉总部,搭载了Tegra 3处理器的设备在运行这款全新的索尼克4时引起了轰动,因为这是他们所见过的最流畅最出色的画面,甚至好过家用主机!

 

若无法播放视频,请按此安装Flashplayer10.0播放插件

暗黑王国 THD

《暗黑王国 THD》使用了NVIDIA PhysX物理引擎来提供逼真的物理和粒子效果。这是一个质量非常高的ARPG游戏,拥有450个风格各异效果出众的技能来让玩家体验,游戏情节与武器装备同样一点不差。

 

若无法播放视频,请按此安装Flashplayer10.0播放插件

还绿伊甸园 THD

在这款免费的增值游戏里,外来的机械军团想要摧毁伊甸园星球,你所需要的就是带领植物们打败他们夺回行星,听起来是不是有点像植物大战机械?不过这是一个风格完全不同的塔防游戏,默认拥有20个高分辨率地图,同时将有更多的的地图进行在线购买。

 

若无法播放视频,请按此安装Flashplayer10.0播放插件

汉密尔顿的大冒险

在这款游戏上你将看到部分DirectX 11引擎才有的特效画面,带着你的搭档萨沙解决一系列的难题和挑战吧,Tegra 3出色的性能使得你能够从这个游戏上看到移动设备从未有过的宽广场景与丰富细节。

 

若无法播放视频,请按此安装Flashplayer10.0播放插件

Tegra3的真正野心 重新定义手机!

刚才大家所看到的4款游戏,就是今年的MWC2012通信展上NVIDIA通过刚刚发布的Tegra 3智能手机或平板电脑向大家所展示的效果,在高通,TI与三星还在为全新的Cortax-A15构架处理器苦苦折腾之时,NVIDIA又一次站到了移动领域的前沿。可曾记得去年也是相同的时间,NVIDIA带领一众厂商发布了Tegra 2处理器的设备?历史总是惊人的相似,当时间过去一年,Tegra 3又带着厂商们的新设备杀将回来,这次带给大家的是更高的性能,更低的能耗以及强悍的游戏能力,量变是否已经积累足够到该质变的时候了?

Tegra 3首次为移动设备带来诸如动态模糊等PC级画面效果

其实Tegra 3面前依然还有不少障碍,并非完全处于天下无敌。MWC 2012开幕之前国外媒体Anandtech就收到了高通送测的一款MDP MSM8960工程样机,也让大家见识了一下新一代“骁龙”Snapdragon S4流动处理器的威力,Snapdragon S4 MSM8960处理器仍是双核心1.5GHz,不过架构变成了基于ARMv7-A的“Krait”(金环蛇),搭配新图形核心Adreno 225、改进的ISP,以及支持几乎所有通信制式的新基带,加上28nm的全新制造工艺,几乎以全新的面貌来到人们眼前,而一系列的跑分图表让大家惊呼,高通竟然和英特尔学了起来!

MSM8960虽然CPU跑分惊人,但GPU甚至还不如4S与S2

说到英特尔,这次也在MWC展会上发布了代号为“Medfiled”的低功耗凌动处理器——Z2460,专门面向智能手机和平板电脑设备量身打造的32纳米系统芯片(SoC)平台一出场就吸引到了所有人的目光,同样也是来自于Anandtech的测试结果,单核1.6Ghz的凌动Z2460在性能表现上轻松击败了所有的双核处理器,其中苹果iPhone 4S、三星Galaxy Nexus等双核旗舰机型。待机14天、3G通话8小时,音乐连续播放45小时,HDMI视频连续播放6个小时的续航能力更是让大家惊呼英特尔解决了x86的功耗问题——要知道Z2460是一颗传统的x86处理器,而非目前移动领域流行的ARM构架。这一点也让Z2460的集成显卡在对比其他处理器时显得更有优势,Z2460的400MHz主频GPU在面对目前智能手机300MHz主频的GPU时游刃有余。

同时我们也不必为英特尔x86在Android系统上的兼容问题有所担心:英特尔与谷歌已经结成合作伙伴关系,共同优化用于英特尔低功耗凌动处理器产品系列的Android系统。从Android 2.3姜饼系统开始到最新的Android 4.0冰淇淋三明治,谷歌每个Android版本都将提供对于英特尔x86架构的支持。目前,英特尔已经参与到Android开源计划(AOSP)中,能够访问Android核心源代码。广泛的Android应用支持,可使基于英特尔技术的智能手机能够运行绝大多数的Android应用程序,甚至包括为其它架构(譬如工控系统)而编写的应用程序。

摆在Tegra 3处理器面前的形势瞬间严峻了起来,自己的vSMP技术处理器到底在平时使用上节能多少?多媒体性能是否比Tegra 2要好,要知道Terra 2在播放视频时的格式兼容问题也是造成蜂巢平板众无法匹敌苹果iPad 2的一大罪因。但别的不说,光是比对手强上8倍性能的GPU就让NVIDIA有了更多的竞争筹码,如果战力全开将电脑平台上的游戏合作伙伴全部挖来为其开发手机/平板游戏,那消费者还会选择搭载了Cortax-A15处理器的手机么,就为了那些漂亮的跑分结果?起码我不会。智能手机是拿来娱乐玩耍的,又不是拿来跑分的。

返回原文

本文导航

相关阅读

每日精选

点击查看更多

首页 手机 数码相机 笔记本 游戏 DIY硬件 硬件外设 办公中心 数字家电 平板电脑