Apple的必杀,引爆G5动力

互联网 | 编辑: 2003-09-04 12:00:00转载-投稿 一键看全文

一位分析家是这样评价Apple公司的:“苹果在电脑领域的影响力远远超过它所占有的市场份额,苹果的梦幻设计始终都是PC工业竞相追赶的对象!”但作为Apple却相当清楚自己的弱项,为了使自己成为Wintel阵营的对抗先锋,Apple发布了一款全新的处理器,这就是本文的主角。

G5处理器细节设计

拥有了先进的构架系统只是成功的一半,而成功的另一半则是处理器的设计。PowerPC970恰恰拥有了优秀的设计。该处理器具备了2 个双精度浮点运算单元、先进的分支预测逻辑设计以及一个高带宽前端总线,对于超标量体系结构(Superscalar),超级流水线结构(Superpipelined)的执行内核,苹果公司与 IBM 公司在其设计中增加了“极速引擎”(Velocity Engine),因此具有强劲的性能。

PowerPC970内核

缓存系统

众所周知,CPU的读写速度会比内存快上很多,这样就会造成CPU花费很长的时间来等待数据从内存的读出或写入,严重地浪费了处理器的资源。这样,处理器的设计者们便在DRAM和CPU之间加上一个容量较小但速度较快的SRAM。当CPU需要数据时,系统先将这个数据块从内存调到Cache中,因为CPU下一次很有可能需要的数据就在Cache中,这样使处理器的资源大大的被利用。PowerPC970处理器的缓存系统由32KB的L1数据缓存、64KB的L1指令缓存和512K的L2缓存三部分所组成。让人感到不解的是,在PowerPC970身上并没有看见以前G4所拥有的L3缓存,我们希望在以后的改进产品中看到L3 Cache的身影。在系统工作的时候,处理器即将执行的指令将以64GBps的速度从L2调入到64K的L1指令缓存中。同时,32KB的L1数据缓存可以同时预先读取8个有效的数据流。这样,大大增强了系统性能。

PowerPC970缓存部分

优化的“极速引擎”(Optimized 128-bit Velocity Engine)

你知道Power PC G4为什么在Photoshop中占据绝对的优势吗?其中除了RISC体系的作用外,更重要的就是“极速引擎”。大家都知道,在处理图形、构建3D模型等大型数据处理中矢量数据非常关键,因此Power PC G4使用了128-bit矢量处理单元来增强这些方面的能力。而PowerPC970自然继承了该优良传统并且加以改进,使得性能更为强劲。同前辈Power PC G4一样,PowerPC970在一个周期中能处理128-bit的矢量数据,而PC处理器一个周期只能处理32bit的矢量数据,这就意味在这些方面PowerPC970的性能是PC处理器的4倍!更让人高兴的是,“极速引擎”还拥有Altivec指令集(矢量多媒体扩展指令集)。Altivec指令集的作用类似与PC处理器的3Dnow!等指令,使其性能如虎添翼!

PC处理器与PowerPC970矢量处理能力对比

两个双精确度浮点运算单元(Two Double-Precision Floating-Point Units)

在高度复杂的科学运算中,对于精确度的要求是很高的,中国的一句古谚“失之毫厘,差之千里”大概就为我们说明了这样的一个道理吧。PowerPC970比上一代产品多出一个双浮点单元,性能有了很大的提升,但是并不是两倍,虽然在硬件规格上是其两倍。PC处理器同样能够实现双精确度64位运算,但是前提条件为让数据多次循环通过数字浮点运算单元。而64位处理器的一个双精确度浮点运算单元只是需要一个周期变可以达到与32位处理器同样的效果,更何况这里是两个。该单元不仅对于基因组匹配应用程序中非常关键的,而且在3D图形的渲染等日常运用中同样重要。

两个整数运算单元(Two Integer Units)

PowerPC970的整数运算单元与G4e存在很多的差别,G4e在执行整数计算时采用了类似的方式,将整数操作分为两种类型:简单和复杂。简单整数指令,是最普通的操作,在绝大多数处理器上都制需要一个时钟循环就可以完成;复杂整数指令,例如整数除法,出现几率比较少,需要多个循环来完成。G4e将整数部分划分成两个专门的执行单元,一部分专门处理简单、单循环的指令,而另外一个则用来处理复杂整数运算。这样处理器就可以在一定程度上提高自己的整数处理性能。但是PowerPC970并不是这样设计的,其整数运算单元能够以各种简单或复杂的指令进32位或64位计算。究竟是什么原因让IBM做出这样的设计我们现在还不清楚。

条件寄存器逻辑单元(Condition Register)

该部分是PowerPC970所特有的单元,其作用便是汇总浮点运算与整数运算单元的状态,并且显示比对操作的结果,并提供以分支状态测试它们的方法。作为分支单元和其他功能单元之间的信息桥梁,不仅如此他还可以提升数据在执行内核中的流通率。在G4e上,条件寄存器操作由复杂整数单元完成。把其单独分离出来的好处便是大大减轻了整数单元的负担。

3元件分支预测逻辑(Three-Component Branch Prediction Logic)

PowerPC970使用了能够大幅度提升效率的“分支预测”(Branch Prediction)与“推测运算”(Speculative Operation)功能。分支预测和推测运算是处理器动态执行技术的主要内容,而推测运算是依托于分支预测的基础上。分支预测功能可以预测应该执行的下一个指令,而推测运算则可以让这个预测指令确实得到执行。如果预测是正确的,处理器的运作就会更有效率——因为推测运算会在处理器发出某个预测指令需求之前就先执行了该指令。反之,如果预测不正确的,处理器会清除不需要的指令和相关数据,结果就会出现被称为“通路泡泡”(Pipeline Bubble)的一段空白空间。根据官方文档来看,PowerPC预测分支运算的正确度高达 95%!这样的成绩不能不让人吃惊。

提示:试试键盘 “← →” 可以实现快速翻页 

一键看全文

本文导航

每日精选

点击查看更多

首页 手机 数码相机 笔记本 游戏 DIY硬件 硬件外设 办公中心 数字家电 平板电脑