想要显著处理器的提升性能,无外乎四种方法:改进微处理器架构、增加处理器核心数量、提升频率以及增加二级缓存。而就目前的使用环境来说,有的时候增加处理器核心数量并不能很好的带来性能提升,而架构更新一般属于整代产品更新之际才能出现。因此在需要沿用数年相同架构的
前言介绍
想要显著处理器的提升性能,无外乎四种方法:改进微处理器架构、增加处理器核心数量、提升频率以及增加二级缓存。而就目前的使用环境来说,有的时候增加处理器核心数量并不能很好的带来性能提升,而架构更新一般属于整代产品更新之际才能出现。因此在需要沿用数年相同架构的处理器来说,主频和二级缓存则成为了提升性能,拉开产品差距的主要手段。
新老对比 |
你能看的出来哪个是老肉哪个是新肉么? |
Intel Penryn 45nm处理器虽然在架构上与之前的酷睿处理器架构差别不大,但是一些改良还是让新一代的Intel 45nm处理器有了更好的表现。比如增添的47条影音多媒体指令(SSE4指令集,架构的优化,更高的主频,更大的二级缓存,更低的功耗,等等。下面简单的讲下45nm penryn同老core性能上的优势。
增强高速缓存拆分负载功能(Split Load Cache Enhancement)
在Intel的酷睿2双核心处理器设计中,每个独立的核心都有自己的一级缓存,酷睿微架构透过核心内部的“Shared Bus Router”来共享的二级缓存,例如当一个核心处理完数据并将其存放在二级缓存中时,另外一颗核心便可通过“Shared Bus Router”来读取另一个核心存放在二级缓存中的数据,这样的数据读取和交换速度要远远大于通过前端总线进行数据传递,而L2 & DCU Data Pre-fetchers及Deeper Write output缓冲存储器的采用更是加大了缓存的命中率,“Shared Bus Router”和“Bandwidth Adaptation”技术还分别优化了数据传输排程和共享前端总线时候的效率。这也是酷睿微架构具有优异性能的一大原因。虽然具有上述这些技术让酷睿微架构具有强劲的性能,但是面对通过前端总线进行数据交换的四核心处理器来说,酷睿微架构的性能发挥却收到了一定的制约。
Penryn 45nm处理器的二级缓存容量相比65nm的二级缓存增加了50%,双核心产品二级缓存容量最大可达至6MB、四核心更是达到了12MB,Intel也是考虑到了四核心的一些限制问题,因此提升到了24路组相联(24-way set Associative) ,令二级缓存命中率进一步提升,从而让性能获得更好表现。
此外,Penryn 45nm处理器加入了名为“增强高速缓存拆分负载功能(Split Load Cache Enhancement)”的全新技术。当需要数据读取时,如果数据位于两个不同的高速缓存当中时,将会对在高速缓存中的数据进行拆分,让一个高速缓存进行数据读取,其速度要高于数据在两个高速缓存中进行读取和处理要快上许多。该技术我们可以看成是酷睿微架构中高速智能缓存技术的增强版本。
Fast Radix-16 Divider快速Radix-16除法器
原有的酷睿微架构可以支持每个周期同时处理4个指令,并且重新使用了较高效率的14层“Pipeline Stages”(流水线处理站)。
Penryn 45nm处理器在原有的架构上对除法器进行了改良,Intel称其为“Fast Radix-16 Divider快速Radix-16除法器”。改良之后的除法器在运行科学计算、三维坐标转换和其他数学密集型运算的时候,会带来比原来高两倍的运算速度,并可以加速浮点和整数运算的速度。其重要原理就在于,通过Radix-16除法器的采用,使得当面对基数提升到16的运算时,该功能会每次运算出4位商值,将运算延迟缩短了一倍。
网友评论