2008年11月基于代号为Nehalem架构的新一代处理器Core i7如期赴约,intel 履行了当初“Tick-Tock(工艺年-构架年)”的承诺。和先前新架构处理器总是先亮相于服务器或移动平台不同的是,此次基于Nehalem架构的处理器产品首先出现在了桌面平台上。那么相比Core架构,修改后的Ne
评测前言
“Tick”,预示着intel将每隔2年的奇数年份中推出更先进的处理器制造技术。2007年intel发布代号为Penryn的下一代Core 2处理器家族,使已光彩夺目的Core架构不但身兼强大的性能又增添了完美的能耗比。凭借改良后的微架构及制程优势,巨人intel没有留给竞争对手任何喘息的机会,不断的发起猛攻并在极短的时间内完成了产品的全线布局。
“Tock”,预示着intel将每隔2年的偶数年份中推出新架构处理器。2008年11月基于代号为Nehalem架构的新一代处理器Core i7如期赴约,intel 履行了当初“Tick-Tock(工艺年-构架年)”的承诺。和先前新架构处理器总是先亮相于服务器或移动平台不同的是,此次基于Nehalem架构的处理器产品首先出现在了桌面平台上。那么相比Core架构,修改后的Nehalem架构有何改进呢?而在首批上市代号Bloomfield的旗舰四核Core i7处理器有什么样的亮点去值得我们关注呢?下面就请大家跟随我的笔触一起来揭开Core i7神秘的面纱。
Nehalem前瞻:08年intel微架构的集结号
把日历往前翻,06年代号为Penryn的下一代Core 2处理器的胜利至今历历在目,令我们感到欣慰的是intel并没有被胜利冲昏头脑,而是依旧按照模式进行发展,既是“Tick-Tock”这种钟摆式的发展使得intel在相邻的两年都会实行制程以及架构的改进。今年也就是2008年,钟摆转向“Tock”,intel处理器架构进行一次大的改良。
intel CEO Paul
Otellini在IDF上展示的Nehalem处理器 |
但之前无论在新闻还是同行讨论的时候一直关心Nehalem处理器的一些前瞻性东西,可能局限于Nehalem处理器是基于Core微架构作出的改良,所以很难去预测其前景如何。或许真的Nehalem仅仅是微架构发展战略的一块基石而已,不过种种迹象表明这块“基石”是尤为重要。在高调的提出“Tick-Tock”处理器发展模式后,2年为一个周期的CPU处理器架构的变革是一定的,关键是这个微架构真的就像传说中的那样么?
06年的Core 2架构风光无限 |
intel提出的每两年更新一代微架构,每两年更新一代硅芯片生产工艺,微架构和硅芯片工艺更新交替进行的周期。从现在来看多核时代已经从2006年的起步到2007年双核的普及,那么2008年就是多核普及年,从上图中也解释了2007年推出高K工艺45nm的Penryn处理器QX9650后,新的微架构Nehalem就是08年值得期待的产品。
凭借Penryn处理器制造工艺成功,有理由相信Nehalem微架构会有所作为 |
Core 2处理器的拍板让intel完全扭转了市场份额,而撑了5年之久的高频“低能”NetBurst架构处理器我们也渐渐的淡忘,时间证明了不可能在让intel汗颜的处理器出现。IT界里旧产品永远是衡量新产品的一个标尺,必然Penryn的处理器就承载了新架构Nehalem的一个标尺。
作为intel用以取代Penryn微架构的新一代处理器架构,和Penryn相比Nehalem还加入了许多令人更为兴奋的设计,并同时针对桌面处理器市场也会根据高端、中端和低端市场推出不同构架产品。
Nehalem前瞻:三种架构不相同
Core 2架构的LGA 775接口处理器在众多主板芯片上都可使用,例如:965、P35、X38、X48,就连最低端的945都能使用。兼容性可谓上下通吃,那是因为使用了相同的架构。虽然Nehalem的架构不同Penryn LGA 775接口的处理器是正常现象,但是同为45nm的Nehalem在高端、中端、低端型号上的架构似乎都各自有所不同。(这里可能会有很多人会将Nehalem等同于Core i7,其实并不然。intel将在Nehalem架构上开发出Bloomfield、Lynnfield、Havendale三款核心,分别对应高端和主流四核,以低端双核市场)。
最高端的是四核心“Bloomfield”架构图 |
最高端的是四核心“Bloomfield”,LGA 1366接口,集成三通道DDR3内存控制器,采用QuickPath直连总线,TDP资料显示为130W。通过QuickPath总线与Bloomfield搭配的芯片组也有很明显的变化,其中南桥是新一代“ICH10”,北桥“Tylersburg-DT”则支持两个全速PCI-E 2.0 x16插槽,另外MCH(内存控制器)将改名为“IOH”(输入输出控制器),因为内存控制器已经转移到处理器内部了。
中端的四核心“Lynnfield”架构图 |
中端主流部分交给“Lynnfield”,仍是四核心,但接口改为LGA 1160接口,DDR3内存控制器仅为双通道,PCI-E 2.0控制器从芯片组转移到处理器内部,但仅能支持一条PCI-E x16插槽,我们可以看到TDP也减少到95W,移动版本的Clarksfield仅为45/55W。 改变了接口方式的Lynnfield处理器,个人认为更多是为了打造市场,而非技术上方面的改变。
最低端的则是“Havendale”,和Lynnfield一样是LGA1160接口,但只有两个核心,而且还是intel首款集成GPU核心的处理器,同时提供PCI-E 2.0 x16通道,就可以供用户升级独立显卡,TDP资料显示已经小于95W,移动版本的Auburndale仅为35/45W。
高度集成的Havendale绝对会让竞争对手汗颜,毕竟intel的整合芯片组的优势就很强,这次通过Nehalem处理器的近乎捆绑式的整合,优势更加强大。整合的显示核心支持DX10、SM4.0和OpenGL2.1。采用Unified Shader架构, Shader运算单元数目由G45的10个增加到12个。高清视频解码方面,整合显示核心支持MPEG2、VC-1和H.264的硬解码。
Lynnfield和Havendale搭配的芯片组代号“Ibexpeak”,新的名称为“PCH”(平台控制器)。这是一种单芯片方案,不再区分南北桥,65nm的制程,处理器和它是通过DMI总线连接的,而不是通过QuickPath。当然,集成显示核心的Havendale和Ibexpeak之间还有一条图形连接总线。似乎板载的PCH平台控制器集成度很高,除了常见的一些I/O接口外,还看到了集成了WiFi/WIMAX芯片,真的就是无限无线,并且南桥内建HDCP Key功能。
Nehalem特点总览表
虽然从架构上来讲仍是同属目前的Core,但Core i7仍进行了不少技术创新。例如增添了SMT、3层Cache、TLB和分支预测的等级化、IMC、QPI和支持DDR3等技术,不过与Core架构一样,Nehalem还是4指令宽度的解码/重命名/撤销。另外作为下一代的处理器,intel把Nehaleme的重点更侧重在了对性能的提升方面,而并不是降低功耗。因为在32nm处理器Westmere未到来之前45nm的工艺制程的功耗已控制得很好并很难再进行改善。那么Nehalem构架在性能上又做了怎样的增强呢?以下就是我们总结出来的主要特性。
作为酷睿架构的继任者,Nehalem可以说是站在了巨人的肩膀上。既秉承了酷睿架构的高效流水线设计以及成熟的制程经验,又在此基础上完善了酷睿的不足,并作出了更多的突破。Nehalem带来的性能飞跃将比当年酷睿上市更多,而它里程碑式的一些革命性设计则会影响甚至引领以后多核处理器的潮流。下面我们将对几则在Nehaleme中扮演着重要角色的新技术进行更进一步的探讨。
技术细析:全新QPI总线
Nehalem架构下的四核处理器则是采用了原生设计,得益于先进的QPI(QuickPath Interconnect)总线,其数据传输速度可以达到FSB总线的5倍。
Nehalem架构最大的改进之一就是摒弃了FSB前端总线传统的并行传输方式,转而采用基于PCI Express串行点对点传输技术的通用系统接口(CSI),也就是intel所称的Quick Path互联系统架构。Quick Path将包括集成的内存控制器技术以及改善的系统组件间通信链路,类似对手AMD的Inter connect及Crossbar设计,而且在多处理器作业下,每颗处理器可以互相传送数据,并不需经过芯片组,从而大幅提升整体系统性能。
四路QuickPath互联
Quick Path能双向串联点对点传输,它可提供与FSB相近的延迟(Latency),可让软件及操作系统管理,并且针对部份Streams(Threading、ISOC、LT/VT) 及out of order requests作出了优化。QuickPath的传输速率为6.4Gbps,双向最高速合共10.8GT/s 。另外Quick Path还有很大的升级空间,在整合新的Quick Path技术后,Nehalem每个处理器核心都将拥有集成的内存控制器和高速互联,把处理器和其他组件连接起来,动态可扩展的互联带宽,可以全面释放Nehalem的性能。
技术细析:整合内存控制器
集成内存控制器虽然可以提高系统性能,但是由此也会带来成本增加以及处理器频率提升困难的问题。但在Nehalem上,我们就惊喜地看到其集成了DDR3内存控制器,据intel表示,Nehalem的内存带宽最高可提升3倍!
Nehalem集成内存控制器IMC(Integrated Memory Controller),可以支持三通道的DDR3内存,运行速度是外频x8,内存位宽从128位提升到192位。这样总共的峰值带宽就可以达到32GB/s(3×64bit×1.33GT/s÷8),达到了Core 2的3倍。
整合内存控制器(IMC)示意图
只要DDR3-1066即可满足Core i7需求Nehalem的IMC通过乱序执行来为DDR3三通道降低延迟,并让其每条通道都能够独立操作,这也使得内存的兼容性大大提高,组建三通道的门槛相对降低。目前DDR3内存的价格不断下调,为玩家采用DDR3平台创建了非常好的契机。随着Nehalem全面转入DDR3平台,这也意味着内存革命将随之到来。
技术细析:三级缓存设计
Nehalem的特色之一,三级缓存设计。Nehalem处理器重新设计了缓存结构,引入了L3缓存。Nehalem的L1缓存的设计与Core微架构相同,而L2缓存则采用超低延迟的设计,但容量大大降低,每个内核仅有256KB,新加入的L3缓存采用共享式设计,首批发布的Core i7配备了8MB L3缓存。
Nehalem处理器的L3缓存完全开放,由4颗核心共享,并完整地集成了4个核,带有一个包含与共享3级Cache。一个中央队列在Nehalem的四个核与非核区域之间充当交叉开关和仲裁器。L3 Cache集成存储控制器和QPI链接。从性能的角度看, 包含式L3 Cache是一个理想的结构因为它能在片上事务中保持Cache一致性。相信会在低延迟和低功耗上受益,另外最后一级Canche共享,会降低重复。
技术细析:多核还不够,还玩超线程
从Netburst到Core架构,intel放弃了HT超线程技术,而从Core架构到Nehalem架构,intel却重拾了超线程技术。所谓的超线程技术就是通过每核心内的闲置资源进行运算,进而提高运算效能。在对Core架构进行增强修改后,Nehalem配备了并发多线程技术Simultaneous Multi-Threading(SMT)技术(即intel的超线程技术),可有效提升多线程工作负载的性能,多线程运算效能比上代CorePenryn性能高出不少。Nehalem微构架的SMT功能支持每内核同时运行两条线程,照此计算,一个四核处理器可同时运行8条线程。
SMT技术能够在不高的功耗下提高性能,而且软件也已经支持这个技术。两年前发布的Conroe却没有采用SMT技术,可能也与SMT技术的实现不易有关,另外与Conroe没有足够的存储和处理器内联带宽来支持SMT技术也有一定的影响。
双路超线四核心(16个逻辑核心)Nehalem运行3d渲染程序
SMT技术所带来的性能的提升是非常明显的,一个物理核心通过SMT技术模拟出两个逻辑处理器,处理器处理多线程运算时,每个逻辑处理器均独立运行,一个逻辑处理器运行线程时,另外一个逻辑处理器运行其它线程,换句话就是尽最大可能地利用CPU的效能。当然,SMT技术也会带来争抢资源的问题。而得益于Nehalem内置三通道内存控制器,内存带宽相当惊人的特点,相信Nehalem可以很好的解决这一问题。
技术细析:SSE4.2优化文本处理
SSE指令集对处理器的重要性不言而喻。在去年intel发布的Penryn处理器上,最吸引人关注的就是其加入了对SSE 4.1指令集的支持。intel的SSE4(流式单指令多数据扩张)指令集包含了54条新指令,其中Wolfdale/Penryn实现了其中的47条指令集,称作SSE 4.1,而剩下的7条SSE4指令将在代号Nehalem架构的45纳米处理器上开始实现。SSE 4.1的引入主要是为了提升x86处理器在视频编缉、图形处理等效能。
而在Nehalem上,SSE4指令集再度扩展为SSE4.2,其在SSE 4.1的基础上新加入的7条指令集。据intel表示,SSE4.2指令包括了传处理的指令,一个CRC指令和一个popcount。串指令全是微代码,其对性能改进有限。CRC指令被用于计算校验和,这对存储和网络是有用的。SSE4.2指令集的加入,可以有效提升XML,sring和文本处理的性能。
首批顶级四核Core i7产品规划
由于Nehalem处理器是基于Core微架构作出改良,因此新一代处理器品牌仍会沿用Core 字样。但却不是市传言的Core 3 ,主要是不少消费者误把Core 2误以为代表两个核心的意思,intel也担心Core 3品牌会引起不必要的联想,这才有“Core i7”品牌。当然,Nehalem不是intel的第七代处理器架构,所谓的第七代处理器架构应该是从2000年的第一代180nm Pentium 4就已经开始了。也许等更多后续产品发布之后我们才能看出“i7”到底意味着什么。
Core i7将用于intel下一代高端桌面处理器,主要是代号Bloomfield和Lynnfield的四核心系列,而代号Havendale的双核心系列应该另有其名。型号方面,Core i7品牌不会再加入Quad、Duo等字样来区别核心数目,型号亦由现用的1个英文字母加上四个数字,简化为3位数字。
三款即将上市的Core i7处理器
首批上市的Core i7处理器全部采用最高端的Bloomfield内核,型号分别为Core i7 965 XE、Core i7 940、Core i7 920,千颗零售价分别为999美元、562美元和284美元。值得注意的是,由于舍弃了FSB,处理器不再需要极高的外频以达到高FSB频率。因此三款高端Core i7处理器的外频远低于目前的主流四核处理器,相信这样有利于良品率的提高以及降低对主板供电的需求。另外,作为至尊版Core i7 965与另外两款型号区别在于QPI总线速度达到了6.4GT/S,支持DDR3-1333规格内存,并支持Turbo Mode技术。从价格来看,三款处理器中Core i7 920的最便宜,所以按照国内行情来分析,无疑将是Nehalem推广的最佳武器,也是国人感受Nehalem架构魅力的性价比之选。
测试平台介绍及Core i7实物信息识别
本次测试使用了Core i7 Extreme 965,组建了三通道DDR3-1333内存,总容量为3GB,由金士顿提供。硬盘为intel原厂固态硬盘,容量为80G。主板同样来自intel原厂的X58。显卡为ATI Radeon HD4850。电源来自TT,额定功率1000W。
测试软件介绍:
1.EVEREST V4.5: 老牌硬件识别检测软件,附带的硬件测试工具虽然并不全面,但也有比较详细的参照对象列表,因此有一定的参考价值。
2.Wprime V1.6:多线程PI运算测试软件,与传统的SUPER PI运算相比,本软件可以充分的利用多线程运算,因而可以充分的发挥多核心处理器的真实性能。
3.Super PI:堪称古老的测试软件,测试成绩能够体现单核心的性能,对于多核心处理器则无能为力。
4.Fritz Chess Benchmark V4.2: 国际象棋AI逻辑测试软件,以国际象棋为基准测试处理器的基础逻辑运算能力。
5.CINEBENCH R10: 发布不久的权威多媒体渲染测试基准软件,可以有效的利用多核心并行处理能力,测试结果对3D制图及动画制作具有权威的指导意义。
6.CPUMARK:古老的测试软件,与SUPER PI一样可体现单核心处理器性能,对于多核心处理器利用严重不足。
7.PCMark Vantage:PCMark
Vantage完全基于Vista操作系统,更加全面地衡量PC的综合性能,而不再单纯强调处理器的用。
8.Cyrsis《孤岛危机》:游戏性能测试
9.3DMARK Vantage V1.0 :3D理论性能权威测试软件最新版
10.CPU-Z V1.48 :CPU型号规格识别软件
与LGA775封装的产品相比,Core i7大出许多,且由于加入了更多核心外的复杂设计,因此Core i7的背面也更加复杂。
CPU-Z 1.48可以正常识别出关于CPU的详细信息
全球首批三款Nehalem架构处理器型号分别为Core i7 965 Extreme、Core i7 940及Core i7 920,我们拿到了其中定位高端及低端的2款,两款处理器区别在于的QPI总线速度。
缓存信息
测试结果总列表
从各项测试成绩可以看到,内置三通道内存控制器,以及四核八线程的超强数据处理能力,Core i7处理器内存性能达到了让人吃惊的地步。并且都表现出了极低的延迟,集成在处理器内部的内存控制器起到了极大作用。日后等DDR3价格松动并保持较为优秀的延迟参数时,测试结果保证比半夜饿到醒然后找到家夜店去吃烤肉还爽。在运算能力方面,凭借可提供八个处理线程配合强大的运算能力,两款处理器均在各项测试中表现优异。游戏性能方面值得注意的是在高分辨率开启AA的高画质下,Core i7 还能提升几乎1-2帧。在3DMark Vantage的P档模式测试下,CPU得分接近19000。
实际测试Core i7的超线程功能
intel重新引入了Pentium 4时代的超线程(HT)技术,只不过名字换成了更技术化的同步多线程(SMT),那么在新架构的配合下,翻番的逻辑核心数是否能带来性能提升呢? 让我们通过测试来解答。
SMT/OFF:9262,SMT/ON:12083 |
SMT/OFF:12876,SMT/ON:15136 |
SMT/OFF:17.454,SMT/ON:13.328 |
可以很明显地看出,超线程技术带来了更好的基准测试成绩,性能提升幅度基本令人满意,这说明在理论性能测试和多线程渲染方面,超线程技术有着天然的优势。
评测总结
通过测试,我们不难看出基于Nehalem架构的Core i7具备十分强大的多核心多线程处理能力,同时也为桌面应用程序带来了良好的效能提升。另外Nehalem虽然内存带宽很大,但实际通过测试证明,并非借助三通道的内存,而完全是得益于集成内存控制所带来的低延时。所以个人认为intel这次最大的革新并非是Nehalem架构,而是处理器设计思想上的一次重要突破。相比以往为了突破性能方面的瓶颈,只是单单增加了处理器的时钟频率来提升处理器的运行频率,Nehalem则更是融入了多核心、多线程来进一步提高处理器的执行效率。
超频方面,由于增加了大量晶体管的Nehalem暂时并不会在工艺制程上进行升级,依然是现有的45nm,因此超频潜力方面表现如何并不好说。虽然intel官方从未正面支持超频的行为,但也并没有去刻意的去限制,而如果主板厂商想要“自主DIY”的话也更不会在BIOS中提供异常的调压调频选项。目前最大的问题在片上北桥对高压的承受能力有限,超过1.65V内存电压高压内存将影响i7寿命。就测试来看,处理器电压、温度,内存电压及总线电压在大幅提升后是会有体制下降的情况出现。当然对不是“烧包”的玩家而言,如果需要保证i7能长时间使用的话,除了要严格遵守intel指导规范以外,对高压内存DDR3的选择也需谨慎,内存厂商也需作出一定得改进。而对无刻意追求的普通用户来说,i7+X58的平台,内存电压在1.5-1.65V范围,三通道DDR3-1066/DDR3 1333MHz,就已经有足够的带宽和很低的延迟了。
超线程技术、整合内存控制器、intel QuickPatch架构等等,这些均是重大的改变。根据Nehalem微架构的这些新特性,我们是完全有理由相信Core i7会带来较明显的性能提升。而Nehalem的模块化设计相信也会更快的为我们带来6核心甚至8核心的产品,同时意味着竞争对手三核心田忌赛马策略的终结。不过到时我们必须花钱为升级Nehalem更换新的主板,因为Nehalem将会抛弃现有的LGA775接口换用LGA1366接口。所以无论是现在的旗舰X48主板还是目前主流的P45主板都将无用武之地。另外除了为主板支付金钱之外,高价的DDR3内存也是一个大问题,如果DDR3不能够迅速降价,Nelalem恐怕只能暂时成为消费者们的瞻仰品。
最后Core i7将于11月17日在北美发布并上市,第二天18日登陆亚洲和澳大利亚市场,随后陆续供应其他地区。首批上市的型号分别是Core i7 920、Core i7 940和Core i7 965,面向的全是高端用户群体,最便宜的i7 920也要2000元,短期内还难进入主流市场。相信等到DDR3内存进入主流市场之时,也将正式拉开更新intel处理器换代的序幕。所以对高计算性能痴迷的玩家们,只要你目前的电脑还能用的话,就坚持到Core i7的到来吧,目前您最睿智的选择并不是再继续购买LGA775平台的几款过度型产品了,而是手拿RMB死等“爱妻”!
更多精彩的最新配件资讯,请点击进入硬件中心!
大家如果对本栏目有任何建议、意见或任何IT配件资讯的投稿,欢迎发邮件到zhang.yang@staff.pchome.net,我们会尽快给予回复。最后,硬件频道全体同仁感谢大家对PChome一贯的关注和支持!
附:加入讨论 免费玩酷睿i7
举世瞩目的Intel新一代处理器产品,代号Nehalem的英特尔 酷睿 i7处理器即将发布了,为了能让网友们,零距离体验英特尔 酷睿 i7处理器产品,并亲眼目睹英特尔 酷睿 i7的发布盛况,PChome电脑之家网站和Intel达成协议,将从PChome的网友中选两人,亲临英特尔 酷睿 i7发布现场,并有机会参与Intel专家赵军面对面的座谈活动,并领取英特尔 酷睿 i7的平台产品免费试用一年。
活动时间:即日起至11月10日
活动形式:在阅读以下BLOG中有关于英特尔 酷睿
i7的博文后,只要用自己的ID,将自己对英特尔 酷睿 i7的期望、观点、想法甚至是提问,回复到这些相关博文中,或者在论坛主贴里留言。
PChome会精心的挑选出留言最为精彩、观点最为独到全面、见解最为深入的两位网友,邀请他们在11月中下旬亲临北京的英特尔 酷睿
i7发布会现场(外地网友将自理食宿以及差旅费用),与Intel专家赵军面对面座谈探讨英特尔 酷睿 i7 的产品性能, 并领取英特尔 酷睿 i7的平台( 英特尔
酷睿 i7 CPU 及主板)免费试用一年, 在试用期间撰写试用感受与广大网友分享。 >>点击详情
网友评论