如果CPU能一“芯”两用……

互联网 | 编辑: 2002-11-14 14:00:00 返回原文

如果你仅用现有的性能表现来评价Pentium 3.06GHz的话,就大错特错了。虽然它目前的表现不能让我们感到满意,但Hyper-Threading在Pentium 4上的运用是一个里程碑,我们不要要求事物在第一次就获得成功,不断获得完善才会获得成功。一“芯”两用就此启动,你准备好了吗?

第一页:革命性的Pentium 4 3.06GHz

不管你是对Intel顶礼膜拜也好,或者是痛恨它犹如不世仇人一般,你都无法否认,Intel比两年前刚发布Pentium 4那一刻时的竞争力实在是强大了无数倍。不过,如果你足够敏感的话,你应该能够感受到一些什么,或者说从中总结出一些什么。当年Intel刚刚推出著名的Pentium核心P5时,它得到的待遇是人们不断的指责:昂贵的60/66MHz的Pentium甚至在某些方面比不过廉价的486DX4-120,但不久以后,指责Intel的绝大多数人却转而升级成了Pentium 100/133;当Pentium Pro发布之时,几乎所有人都认为这么一个对16位程序优化不佳的CPU绝对不可能流行起来,但实际上,从那时起直到Pentium 4以前的所有Intel处理器都是基于Pentium Pro的P6核心。

这其中的奥秘看来并不算太难解释,简单来说,即使我们现在抛开过去所有一切历史,你会发现,Intel仍然那么强大,至少它现在占领了绝大部分的CPU市场。Intel在高端、中端以及低端都压迫着竞争对手AMD的同类产品,导致AMD产品的销售量受到了很大的冲击,而这其中绝大部分的功绩都来自于Pentium 4。虽然最近推出的333MHz FSB的Athlon XP 2700+/2800+可以说为AMD挽回了不少面子,但即使K7的绝唱Barton核心推出恐怕也很难动摇Pentium 4的主流地位。AMD的K8应该是试图充当Pentium 4终结者的最好选手,AMD也是按照自己的计划有条不紊地在进行,这款预计在今年年底,明年年初发布的新型64位新型处理器将可能会对Intel造成很大威胁。但这款产品目前还只是“将来式”,“AMD必须马上成功,而不是将来”。

Intel似乎完全没有感受到压力,这显然得益于它较有前瞻性和可行性的产品进度规划。在它看来,目前的技术、市场动态已经完全被它所掌握,只要自己能够按照计划行事,AMD永远只能退居次席。Pentium 4处理器没有令Intel失望,就前几年来看华丽花哨的架构体系在不断的发展后已经逐步体现出了应有的实力,Intel的工程师的确才华横溢。在前不久的一个会议上,Intel表示可以在0.09微米工艺上将Pentium 4的工作频率提升到5GHz,这的确是一个非常了不起的成绩,在AMD一直试图依靠改变架构来获得提升的时候,Intel只需在一个架构上进行改进即可带来事半功倍的效果,这的确是AMD所望尘莫及的。

不过,现实中,对Intel来说,5GHz的Pentium 4也是一个“将来式”,虽然前景不错,但是在IT行业中,走错一步就会大幅度落后,所以Intel也不敢太过于放心。在AMD的K8威胁下,Intel固然可以凭借早期的准备而不手忙脚乱,但也必须按时交出合格的答卷,而这份答卷现在就摆在笔者的桌子上——Pentium 4 3.06GHz。

对于3.06GHz的Pentium 4,首先需要注意的是,它和2.8GHz的差别不仅限于一个频率问题,而新的技术的应用将使它成为Pentium 4发展的另一个开端。今天,就让我们来揭示来自Intel Inside的最新力作——Pentium 4 3.06GHz的全方面评测剖析吧。

第二页:运行在3.06GHz的Pentium 4
产品规格
产品品牌 Intel Processor
产品型号 Pentium 4
内核代号 Northwood
晶体管数 55,000,000
制造工艺 0.13um
一级缓存 8KB + 12KB
二级缓存 512KB
时钟频率 3.06GHz
前端总线 533MHz
特殊技术 MMX/SSE/SSE2
  HyperThreading

Pentium 4 3.06GHz基于的依旧是NetBurst架构,所以在众多的技术细节方面,它和2.8GHz的Pentium 4是没有任何差别的,处理器核心集成了5500万晶体管,基于先进的0.13微米C1制程,C1的改良工艺使得处理器的工作电压得以下降,由于处理器具有Vcc Decoupling技术,所以处理器可以按照当时处理器的工作来自动调节内部的工作的电压。

最新的Pentium 4 3.06GHz在编号的最后结尾上继续提升,过去2.53GHz时为61512,到了2.8GHz时为72512,而在3.06GHz时则出现了最新的83512。这对于评测时由于测试样品不标明运行频率而分不清芯片也是一种变通的识别方式。

目前最快的两款桌面CPU:Pentium 4 3.06GHz(左)与2.8GHz(右)

请注意看处理器底部的元器件,我们在2.8GHz处理器评测时曾发现其底部元器件相对于老版本产品已经有了一定的改变,而到了3.06GHz时则再次发生变化。

C1制程的Pentium 4 2.8GHz的VID信息显示为1.525V,而同是C1制程的3.06GHz Pentium 4由于频率又提高了260MHz,所以VID信息提升到了1.550V,提高了0.025V。它的Vcc_Max为1.425V,Vcc_Min为1.340V,典型电压为1.385V,这一连串的数字保障了3.06GHz的Pentium 4的稳定工作。不过,从另一方面来看,电压的提高,使处理器的发热也更上一层楼了。

第三页:新奔4的参数检测
产品规格
产品品牌 Intel Processor
产品型号 Pentium 4
内核代号 Northwood
晶体管数 55,000,000
制造工艺 0.13um
一级缓存 8KB + 12KB
二级缓存 512KB
时钟频率 3.06GHz
前端总线 533MHz
特殊技术 MMX/SSE/SSE2
  HyperThreading

从2.53GHz开始,Pentium 4的FSB都被提升到了533MHz,提供高达4.2GB/s的内部总线带宽,这次,我们配套使用的是i850E主板,并搭配PC1066的RDRAM进行测试,全面展示Pentium 4极限性能。

C1制程的Pentium 4在TLB入口上从B0制程的64个增加到了128个,这可以在WCPUID中被发现,当初AMD使用Palomino以及Morgan核心时,就增加了指令,对于性能的提升也是会起到正面、积极的影响。不过我们发现,在3.06GHz的TLB入口又变成了64个,我们不明白Intel为什么会绕一个圈子又回到了原来的老路上。但既然这样做就一定有它的道理。

第四页:革命性技术:Hyper-Threading

在3.06GHz的Pentium 4上,Intel正式引入了Hyper-Threading技术(以下简称HT技术)。这是一种处理器的性能增强技术,拥有它,Pentium 4真正能做到一“芯”两用。

在了解HT技术之前,我们有必要先了解处理器线程以及相关的概念,这对了解HT技术会起到了奠基的作用。

在电脑中,大到一个大型程序,小到移动一下鼠标,我们都可以把它视作是编译代码,当系统执行一个程序或一个操作的时候,程序以及OS就会以一个线程的形式传达给CPU,CPU便会以时间的先后以及优先级逐一分配并执行指令集进行处理,因为线程的概念就由此产品,它可以被称之为一系列指令的集合。

不过我们需要的是,目前的处理器在处理流程只能处理一个线程,即表示在处理第一个线程的时候,是无暇顾及排在后面的线程的。在执行指令的时候,CPU先找出相应指令所在的内存位置,执行下一条指令,再转换到另一个位置,在同一时间内CPU只能对应一个指令。虽然不同的线程是可以交叉运行,形成一种多任务(Multi-tasking),但CPU仍只能运行一个线程。对于处理能力上,这是一个非常严重的瓶颈。我们来打个比方吧,在一个处理器上有一个ALU Unit(算术逻辑单元,处理整数运算)、一个FPU Unit(浮点运算单元)和一个存储/读取单元,来对内存进行指令的存储读取操作,每个操作要花费一个线程。那么当我们进行三个操作的时候,比如说进行一个读取操作,一次整数运算,最后进行一次储存操作,最终我们就需要花费三个时钟周期来完整这些事,处理器的工作效率就是33%,Pentium 4拥有7个执行单元,算下来它的效率还要更低。

长期以来,CPU厂商尝试着两种做法来改善这一问题。其一就是努力提高处理器的处理能力,这包括了频率的提升,架构的改进等等,收效相当巨大。而另一方面,就是采用了多个CPU并行工作的解决方案。这在服务器领域称之为TLP(Thread-Level Parallelism,线程级并行)技术,也就是SMP技术(Simultaneous Multi-Processing,同步多处理器)。它允许在同一周期你同时执行多个线程,充分利用处理器的资源,但是此技术需要基于多个处理器成双成对地进行,也就是2路、4路、8路等等,固然在处理能力上是获得了提高,但这成本也是非常惊人,一般来说,Intel和AMD都拥有专门的支持SMP的处理器产品,针对服务器市场,而在面向桌面市场的处理器产品,由于不需要对性能提出那么高的要求,所以也就屏蔽了SMP功能,对于桌面运用日益复杂的今天,是否能使桌面处理器具备多线程能力呢?HT给了我们答案。

第五页:革命性技术:Hyper-Threading(续)

HT技术演变于SMT技术。SMT(Simultaneous Multi-Threading,同步多线程)的一种。SMT技术是由Alpha引入的一个概念,它在一个处理器核心内集成两个处理器架构体系,也就是集成了两个逻辑处理单元,在OS中,两个逻辑处理单元就被认作为两个处理器,由于两个处理器可以构成SMP,所以也就具备了处理两个线程的能力。不过HT技术仅仅限于处理器核心,并没有就系统的FSB等等做一个完整的定义,所以HT技术开启后,处理器的FSB也将维持不变,即成为两个处理器共享一条总线,第二个线程的处理器在性能的发挥会受到一定程度的制约。

事实上,从Northwood开始,Pentium 4就拥有了HT技术,只不过Intel将其“冷藏”了起来,按照Intel的说法,要实现HT技术,必须符合三个条件:1、处理器本身支持;主板芯片组支持;3、OS以及应用程序支持。我们所使用的Pentium 4 3.06GHz+Intel D850EMV2,是完全符合这一标准的,在BIOS中,就赫然出现了Hyper-Threading Technology的字样,选择Enabled(激活)后,在支持多处理器工作的Windows XP的Professional版“任务管理器”的“性能”中,也发现了两个线程协同工作的景象。眼前的一切令人感到兴奋。史上最强的装备:支持HT技术的Pentium 4 3.06GHz+Intel D850EMV2+带宽达到4.2GB/s的512MB PC1066 RDRAM,究竟能够获得多么强大的性能,大家拭目吧。

第六页:测试用软硬件平台

在即将到来的Pentium 4桌面处理级别测试前,我们先简要介绍一下本次用于评测的各项硬件以及软件设施,尤其是经评测室费劲周折才取得的一些测试用设备,例如对照测试使用的Pentium 4 2.53GHz和Pentium 4B 2.4GHz,以及用于作为测试平台的Geforce4 Ti4400显卡,在此之前我们曾有机会使用Radeon 9700 Pro组建强悍的测试平台以提供更完善的测试效果。

Intel系统硬件(Socket 478 平台)
处理器1 Pentium 4 3.06GHz (3066MHz, 533MHz FSB)
处理器2 Pentium 4 2.8GHz (2800MHz, 533MHz FSB)
处理器3 Pentium 4 2.53GHz (2533MHz, 533MHz FSB)
处理器4 Pentium 4B 2.4GHz (2400MHz, 533MHz FSB)
处理器5 Pentium 4A 1.8GHz (1800MHz, 400MHz FSB)
主板 Intel D850EMV2 (i850E + ICH2)
内存 Samsung RDRAM PC1066 512MB
其它共用硬件
显卡 GeForce 4 Ti 4400
Memory
128 MB DDR-SDRAM
Memory Frequency
550 MHz
Core Frequency
275 MHz
硬盘 120 GB Barracuda V
UDMA100, 7200rpm, 2 MB Buffer
驱动程序与各项软件设置
显卡驱动程序版本 Detonator 5 v40.72 WHQL
DirectX版本 8.1
Intel IAA驱动程序版本 v2.3 beta
操作系统 Windows XP Build 2600(英文版)
各项基准测试与设置
PCMark2002 Pro 只测试CPU内存性能部分
3DMark2001 SE Pro Build 300
使用基准默认测试1024×76832bitNoAA
Science Mark Performance
Unreal Tournament 2003
Comanche 4
Business Winstone Version 2002
使用基准默认测试 
Content Creation Winstone Version 2001
使用基准默认测试
Version 2002
使用基准默认测试
SiSoft Sandra 2002 Professional SP1 Build 2002.6.8.97 
AquaMark V2.1
雷神之锤3
(Quake III Arena)
零售版v1.16
追加命令行:+set cd_nocd 1 +set s_initsound 0
画面质量(Graphics detail)设为一般(Normal
使用
Q3DEMO1场景测试
Super PI Japanese Version
第七页:SiSoft Sandra 2002 专业版测试
产品规格
产品品牌 Intel Processor
产品型号 Pentium 4
内核代号 Northwood
晶体管数 55,000,000
制造工艺 0.13um
一级缓存 8KB + 12KB
二级缓存 512KB
时钟频率 3.06GHz
前端总线 533MHz
特殊技术 MMX/SSE/SSE2
  HyperThreading

SiSoft Sandra 2002 专业版测试

从测试结果上说,Pentium 4 3.06GHz获得优势,夺得第一是毫无疑问的,但是请注意它的Whestone FPU测试结论,我们可以发现,它那高达5982分的FPU性能超过Pentium 4B 2.4GHz的2933得分一倍有余,是2.8GHz产品的171.9%,这显然是由于HyperThreading为我们带来的一“芯”二用技术发挥了极大的功效,否则,仅仅依靠不到10%频率的提升就可以获得70%的性能提升就是不可思议的了。

Multi-Media测试部分主要针对多媒体,同样的,这部分测试也分为整数和浮点,3.06GHz产品在浮点方面再次领先,虽然这次幅度不再象第一次那么大,相对2.8GHz只有61.1%的性能提升。可以预计,HyperThreading在SSE2的利用上有一定性能上的牵制,或许此时的资源并不足够使用吧。

第八页:ZD Media Benchmark 综合性能测试
产品规格
产品品牌 Intel Processor
产品型号 Pentium 4
内核代号 Northwood
晶体管数 55,000,000
制造工艺 0.13um
一级缓存 8KB + 12KB
二级缓存 512KB
时钟频率 3.06GHz
前端总线 533MHz
特殊技术 MMX/SSE/SSE2
  HyperThreading

ZD Media Benchmark 综合性能测试

在SiSoft Sandra 2002 SP1的最后一项测试中,我们进行的是内存带宽测试,这方面看起来拥有533MHz前端总线的产品优势明显,Pentium 4A 1.8GHz根本无法匹敌。

ZD公司出品的测试软件Business Winstone和Content Creation Winstone是两款非常出色的常用商务和多媒体软件性能测试工具,通过对它们的测试我们可以大致了解新CPU在桌面级别应用的性能上相对过去产品有多大提升。在测试前,我们曾经预测Pentium 4 3.06GHz的超线程技术或许可以在Adobe Photoshop等测试子项目上获得些许的应用优势,从而得到一些性能提升,但测试结果没有给我们留下任何揣测的可能性,在同样提升266MHz主频的情况下,2.8GHz比2.53GHz在各项测试成绩上分别提高了1.4、2.1和5.0分,而3.06GHz只比2.8GHz提升了0.3、0.5、1.9分,从某种角度来说,我甚至很难将它归入“领先”,因为如此小的得分差距,在实验术语中或许以“误差”来表述更为妥当一些。或许,某些网络曾经披露HyperThreading技术尚未完善,在某些程序应用中反而回拖慢整体性能的说法并非无稽之谈。

第九页:MadOnion 3DMark与PCMark测试
产品规格
产品品牌 Intel Processor
产品型号 Pentium 4
内核代号 Northwood
晶体管数 55,000,000
制造工艺 0.13um
一级缓存 8KB + 12KB
二级缓存 512KB
时钟频率 3.06GHz
前端总线 533MHz
特殊技术 MMX/SSE/SSE2
  HyperThreading

MadOnion 3DMark与PCMark测试

MadOnion实在是一个很出色的软件公司,不过它的出色大概也就在软件和硬件的专业领域之内,3DMark 2001 SE最新版本的测试显示Pentium 4 3.06GHz性能提升不小,虽然Geforce4 Ti4400只需要依靠2.4GHz就足以发挥它95%的性能,但是3.06GHz仍然帮助它在1280×1024分辨率上突破了万分大关。试想当初3DMark 2001标准测试突破万分大关时人们的兴奋,如今大概不会再有这样的情形了吧。3DMark 2001SE的测试较为抽象,只是一个3D性能大致档次评价的标准。

PCMark 2002也是MadOnion推出的一款测试软件,这个测试与SiSoft Sandra 2002的CPU测试是两种测试方式,后者是通过一系列数学计算,以非常理论化、最优化的方式对CPU进行测试,其数据代表的是CPU的理论性能,而PCMark 2002则是一款以实际应用为核心,采用类似多媒体编码、压缩解压缩这些实际使用方式的测试手段来对CPU性能进行测试的,其测试结果有一定实用意义。从这里我们看到3.06GHz处理器性能相当强悍,其CPU分数提升的幅度远超内存,由此可见,Pentium 4使用的高带宽RDRAM内存还是很有前瞻性的。不过在这个测试中我们仍然没有看到HyperThreading的任何帮助。

第十页:专业数学性能测试
产品规格
产品品牌 Intel Processor
产品型号 Pentium 4
内核代号 Northwood
晶体管数 55,000,000
制造工艺 0.13um
一级缓存 8KB + 12KB
二级缓存 512KB
时钟频率 3.06GHz
前端总线 533MHz
特殊技术 MMX/SSE/SSE2
  HyperThreading

专业数学性能测试

Super PI测试是一个相当通行的测试CPU性能的方法,不过前提条件是在除了CPU以外其他配件条件完全相同的情况下,因为一旦内存带宽改变,测试成绩就会产生极大差异。在这个测试中,3.06GHz产品的成绩足以骄傲,低于一分钟可以让Intel自豪一番了。(编者按:目前世界上最快的SuperPI测试成绩前十位已经全部进入30秒大关,当然,运行频率也早已超过4GHz,均为Pentium 4处理器)

Science Mark测试结果是我们对CPU科学性能方面进行的另一种测试方案的尝试,考虑到SiSoft Sandra 2002 SP1过于理论化的测试是否可能体现在一些科学计算、数学浮点计算上,我们选用了Science Mark进行了另一类的测试,但结果较为普通,当然,大幅度的频率增加仍然体现出了效果,等比例的MFlops浮点测试结果提升算是给Intel一个不错的回报了。

第十一页:DirectX 8.0游戏性能测试
产品规格
产品品牌 Intel Processor
产品型号 Pentium 4
内核代号 Northwood
晶体管数 55,000,000
制造工艺 0.13um
一级缓存 8KB + 12KB
二级缓存 512KB
时钟频率 3.06GHz
前端总线 533MHz
特殊技术 MMX/SSE/SSE2
  HyperThreading

DirectX 8.0游戏性能测试

Comanche 4是一个完整支持Direct X 8.0的游戏,这个游戏对显卡的要求相当高,不过在中低分辨率时仍然体现出了对CPU的渴求。性能上的提升是等比例的,在1024×768分辨率下尤为明显,3.06GHz产品相对2.8GHz有着10%的性能增加,而2.8GHz对2.53GHz也是同样比例。

AquaMark也称为怒海潜将,虽说它的效果从看多了数码电影的我的视线中看来实在是太一般,但是它也是一款利用到DirectX 8.0技术的游戏。这个游戏对显卡的要求看来要远高于对CPU的要求,频率的提升对它毫无意义。

第十二页:OpenGL游戏性能测试
产品规格
产品品牌 Intel Processor
产品型号 Pentium 4
内核代号 Northwood
晶体管数 55,000,000
制造工艺 0.13um
一级缓存 8KB + 12KB
二级缓存 512KB
时钟频率 3.06GHz
前端总线 533MHz
特殊技术 MMX/SSE/SSE2
  HyperThreading

OpenGL游戏性能测试

Quake III的测试仍然是必不可少的,而且它还是一款支持多线程,多CPU的游戏测试软件,不过可惜的是,在这次的3.06GHz的测试中,笔者无法看出超线程为游戏带来了什么优势,或许这个引擎实在已经太老了,难以用上超强的CPU潜力吧。

看起来,稍新一些的Unreal Tournament 2003在目前来说也仍然很难发挥出HTT的效果,不过等比例的成绩提升仍然体现了出来,看来至少HTT没有帮倒忙。

第十三页:结论和写在评测之后
产品规格
产品品牌 Intel Processor
产品型号 Pentium 4
内核代号 Northwood
晶体管数 55,000,000
制造工艺 0.13um
一级缓存 8KB + 12KB
二级缓存 512KB
时钟频率 3.06GHz
前端总线 533MHz
特殊技术 MMX/SSE/SSE2
  HyperThreading

想想今年的年初,Intel依靠Northwood核心才首先突破2GHz的频率,现在仅仅过了1年不到,成熟的NetBurst架构以及0.13微米制造工艺就把Northwood的频率拉升到了3GHz的高度。这一切让人觉得有些史料不及。

从测试来看,拥有Hyper-Threading技术的Pentium 4 3.06GHz在Sisoft Sandra 2002中的CPU Arthimetic Benchmark以及CPU Multi-Media Benchmark两个基准测试中的表现令人不可思议,Hyper-Threading技术给处理器所带来的性能提升的确不可小视,但Sisoft Sandra却给了我们一个错觉,在真实的测试软件中,Hyper-Threading就没有发挥出它应有的水平,从多个测试软件中我们根本无法感觉到Hyper-Threading的作用,只是简单的频率提升所带动的性能提升而已。从目前的分析来看,处理器的Cache以及内部的架构是直接关系到Hyper-Threading技术的两个重要环节,正由于这两个环节的制约,直接导致了Hyper-Threading技术的性能发挥。在Pentium 4下一代的Prescott处理器上,Intel会针对Hyper-Threading技术进行一个全面的架构改进,到那时候,恐怕Hyper-Threading技术才会发挥自己真正的功效。

在主板芯片组的支持上,i850E/845PE/845GE已经推出很久了,相关的主板产品在市场上也已经可以找出不少,而Intel下一代支持双通道DDR、AGP 8X、Serial ATA的Granite Bay也已经箭在弦上,可以说,更多的新技术都被注入Pentium 4的体系中,这无非使Pentium 4更为强悍。

总体来说,如果你仅用现有的性能表现来评价Pentium 3.06GHz的话,就大错特错了。虽然它目前的表现不能让我们感到满意,但Hyper-Threading在Pentium 4上的运用是一个里程碑,我们不要要求事物在第一次就获得成功,不断获得完善才会获得最终的胜利。一“芯”两用就此启动,你准备好了吗?

写在评测之后

在本次评测期间,我们的多项测试都显示出HyperThreading技术似乎尚未完善,理论上的性能提升没有在实际中体现出来,相反,在一些可以用到多线程应用的如Photoshop这样的操作测试(BWS、CCWS)中,测试成绩反而没有预期的好,让人对该技术的有效性,或者说工作效率有所怀疑,所以测试工作结束后我们征求了一些同行的意见,得到了不少宝贵的建议,同时,本次测试旨在展示Pentium 4 3.06GHz在完全原配的主板和内存配合下能发挥的最大性能潜力,也没有进行跨平台的测试,所以,我们评测室将在不久以后推出一篇以845PE、845GE为测试平台,同时进行HyperThreading实际工作效率测试的文章,将本次评测尚留的一些遗憾逐一补全,请大家期待。

返回原文

本文导航

每日精选

点击查看更多