从拥有第一台电脑至今也应该有差不多十年了,十年人事几翻新,我的机器也换了几次,除了CPU,其他配件都在不停的换牌子,只有CPU一直留守在Intel的阵营内。从最开始的的Celeron
十年下来,换了四代CPU,虽然没有成为高手,但也是老鸟一名。从开始到现在,我所选择的四款CPU,除了刚入手的E6300,其他三款都可以称作是Intel CPU发展史上的经典之作。而E6300作为刚上市不久的产品,是否经典还有待时间去考验,但从我这段时间的使用情况来说,我相信E6300也一定会成为Intel CPU发展史上又一个经典。在细细品尝我的“扣肉大餐”之前,请容我先来简单回忆我的Intel CPU之路。
Intel Pentium II Celeron 300MHzA
Intel Pentium II Celeron 300MhzA,是一个让多少人闻之动容的产品,又陪伴了多少曾经年少的读者度过悠长的学生时代。Celeron
Intel Tualatin Celeron III 1.3GHz
图拉丁赛扬,可以说是继赛扬
Pentium 4
Pentium
P4
Core 2 Duo E6300
相对于Northwood,Prescott核心并没有带来太大的性能提升,反而带来了更多的热量和更高的功耗。尽管PCI-E平台充满诱惑,但始终没能打动我的心,直到Core 2 Duo处理器的出现,我才真正产生了那种升级的冲动,一种已经很久不曾有的升级所带来的快感。
Core 2 Duo是采用全新的Core微架构的处理器,相对于上代的Pentium系列产品,已经不能说是改良,而可以说是有了翻天覆地的改变。相比Intel上一代NetBurst架构,Core微架构有了革命性的变化,这变化并不是由NetBurst衍生出来的,根据Intel官方的说法,Core微架构综合了Pentium M(Banias、Tualatin等)和Netburst的优点。从Core微架构的一系列的变化我们可以看到Intel已经跳出了追求频率的怪圈,执行效率、运行功耗等成为首要解决的问题。
以往NetBurst架构的P4处理器为追求高频率而采用了更深的指令执行流水线设计,Williamette和NorthWood等拥有20级、Prescott核心则更达到31级,而AMD K8架构等拥有17级。更长的流水线会让频率得到更高的提升,但负面影响是一旦产生分支预测失败或缓冲区为命中的时间后将会浪费更多的时钟周期,虽然频率提升可以弥补这方面的缺陷,但是以现在所能达到的频率显然是不足以弥补这种性能损失。因此Core微架构设计了14级的指令执行流水线,更短的流水线也会让指令的处理速度更快,目前看来这是一种兼顾了效能和速度的解决方法。
而在这次CPU微架构的变革中,出了流水线架构的改变,另外五大创新技术的引入成为Core 2 Duo处理器性能大幅提升的主要因素,这五项创新技术就是宽区动态执行、智能功率能力、高级智能高速缓存、智能内存访问、高级数字媒体增强。其中宽区动态执行、高级智能高速缓存、智能内存访问是作为处理器大幅提高性能的最为重要的三项改进,而高级数字媒体增强技术则是使Core 2 Duo处理器继续维持甚至增加Intel在多媒体应用领域的优势。
宽区动态执行(Intel Wide Dynamic Execution)
当今衡量一款处理器的性能水平,已经不能再单纯的以频率的高低考量,而是更强调“每瓦特性能”,也就是所谓的能效比。“性能=频率×每个时钟周期的指令数”是英特尔提出的对性能的创新理解,英特尔宽位动态执行通过提升每个时钟周期完成的指令数,从而显著改进执行能力。
英特尔酷睿微架构拥有4组解码单元,相比上代Pentium Pro (P6) / Pentium II / Pentium III / Pentium M架构拥有3组可多处理一组指令。所谓四组解码单元,就是指能够在单一频率周期内编译四个x86指令。这四组解码单元由三组简单解码单元(Simple Decoder)与一组复杂解码单元(Complex Decoder)组成。简单讲,每个执行内核将变得更加宽阔,这样它们就可以同时获取、分配、执行和返回达4条完整的指令。带有2个内核的单枚多核处理器就可以同时获取、分配、执行和返回8条指令。
英特尔Core微架构在提升每个时钟周期的指令数方面做了很多努力,例如新加入宏融合(Macro-Fusion)技术,它可以让处理器在解码的同时,将同类的指令融合为单一的指令,这样可以减少处理的指令总数,让处理器在更短的时间内处理更多的指令。为此英特尔酷睿微体系结构也改良了ALU(算术逻辑单元)以支持宏融合技术。
Intel 的宏指令融合技术在AMD的K8处理器(包括Socket 939和AM2)上并不存在,不过AMD拥有与微指令融合技术类似的技术。在 Athlon 处理器中,也存在有微指令融合技术。例如,一条 ADD [mem], EAX 指令在真正执行前中始终保持为一条指令。因此,它在缓冲区中也只会占据1个单元的空间。不过,在 Core 微架构中 load 操作和 SSE 操作等也可以被融合,而 K8 处理器则不行,它会把SSE操作解码成2条宏指令。
微指令融合技术的目的就在于减少微指令的数目。处理器内部执行单元的资源有限,如果可以减少微指令的数目,就代表实际执行的X86指令增加了,可以显著提升执行效能。而且,微指令的数目减少还有助于降低处理器功耗,可谓有益无害。
因此而言,Core 微架构要更具有优势。在一般情况下,它每个时钟周期可以解码4条X86指令,加上宏指令融合技术的话则最多可以解码5条X86指令。而 AMD 的 K8 处理器每个时钟周期只能解码3条。仅当多条复杂指令同时需要复杂解码单元进行解码的时候,K8 处理器的解码单元会胜过 Core 微架构的解码单元。但是考虑到实际程序中的绝大多数X86指令对应简单解码单元的事实,这种情况不大可能发生。
高级智能高速缓存(Intel Advanced Smart Cache)
以往双核的无论是Intel的Pentium D系列还是AMD的Athlon 64 X2都是独立的二级缓存,核心之间数据只能通过系统总线来交换,这无疑占用了总线带宽和带来延迟,不利于核心之间的密切合作。当系统只需要其中一枚内核进行运算时,另外一枚内核将会处于闲置状态,而闲置内核就意味着闲置二级高速缓存。尤其是当另外的内核由于二级高速缓存负载过满而承受巨大性能压力的时候,这将是一种巨大的资源浪费。而Conroe拥有和Yonah一样的共享二级缓存,通过内部的Shared Bus Router共用L2 Cache脱离了对系统总线的依赖。共享智能缓存的设计也使得功耗和性能之间达到很好的平衡。在不同强度的运算强度下,Core微架构可以关闭其中一个核心而另外一个核心使用全部的二级缓存,以减少高速缓存错误并提高性能,而当不需要时也能够关闭部分的缓存单元以节约能源。这样可以降低二级缓存的命中失误,减少数据延迟,改进处理器效率,增加绝对性能和每瓦特性能,由此带来的强大性能是采用独立二级缓存设计的Athlon 64 X2所不能企及的。
智能内存访问(Intel Smart Memory Access)
智能内存访问是另一个能够提高系统性能的特性,通过缩短内存延迟来优化内存数据访问。智能内存访问技术能够预测系统的需要,从而提前载入或预取数据,反映到用户的直接使用体验上,就是大幅提高了执行程序的效率。
智能内存访问技术主要包括内存消歧(Memory Disambiguation)和增强的预取器(Advanced Prefetchers)。内存消歧提高了乱序处理的效率,因为它可以为执行内核提供内建的智能,以帮助其在执行完所有预先存储的指令前,预测性地载入指令即将需要执行的数据。经过内存消歧后,分别设置在一级缓存和二级缓存的预取器就会先将需要的数据载入到缓存中。为了让数据位于每个执行内核所需要的地方,英特尔酷睿微体系结构为每个一级高速缓存和二级高速缓存均配置了两个预取器。这些预取器同时检测多个数据流和大跨度的存取类型。这样它们便可以在一级高速缓存中“及时”准备待执行的数据。二级高速缓存的预取器可以分析内核的访问情况,以确保二级高速缓存拥有未来可能需要的数据。这两个技术配合能够最大化的使用总线带宽,减少突发性的数据交换造成堵塞。
高级数字媒体增强(Intel Advanced Digital Media Boost)
高级数字媒体增强技术是一项可以显著提高执行SIMD流指令扩展(SSE)指令性能的特性。128位SIMD整数算法和128位SIMD双精度浮点操作减少了执行特定程序任务所需的全部指令数,将能够促使整体性能的增高。它们能够加快诸多应用的速度,如视频、话音与图像、图片处理、加密、财务、工程设计和科学应用等。分别使用SSE和MMX指令,SSE指令可以让编程人员开发出混合集合数、单精度数、浮点数和整数的算法,以改进英特尔架构。在许多前代处理器上,128位SSE、SSE2和SSE3指令在执行时均采用每2个时钟周期执行一条完整指令的不变速率,例如,一个周期执行下面的64位,下一周期执行上面的64位。高级数字媒体增强特性可以在一个时钟周期完成这些128位指令的执行,从而有效地将这些指令的执行速度提高一倍。通过增加每个周期处理的指令数量,英特尔酷睿微体系结构的整体效率得到了进一步增强。在运行包括图形、视频和音频的诸多重要多媒体操作、以及处理其它使用SSE、SSE2和SSE3指令的数据集时,高级数字媒体增强技术的作用还将更加明显。
众多新技术的加入,使Core 2 Duo处理器的性能相对于上代处理器提高了40%,功耗却下降了40%,这在实际使用中是可以明显感受得到的。虽然我之前使用的不是Prescott核心的P4,但超频之后的Northwood P4发热量还是很大的,换用E6300之后,可以感觉到整套系统的温度有明显的下降,尤其是在打开Intel EIST节能技术之后,待机状态下CPU的温度甚至下降到30度左右,和原来的P4相比下降了超过10度,感觉非常棒!相对于发热量,整套系统的性能提升更是有种脱胎换骨的感觉,尤其是在支持多线程操作的多媒体应用方面,具有真正双核心架构的E6300比起原来的P4来说强大不止一倍,在视频剪辑所需要的时间甚至只是原来的一半,这种速度大幅度提升的感觉确实是让人感觉十分愉快。这种感觉远胜于之前任何一代电脑升级时的快感,Core 2 Duo确实是个让人爱不释手的好东西。
在最后,我要感谢Intel为我们这些消费者提供如此好的产品,高性能,低功耗,一款几乎可以说是完美的产品。我爱扣肉,我爱Core 2 Duo!
网友评论