架构优势大 智尊全能侠实战《尘埃2》

互联网 | 编辑: 吴俊杰 2010-07-23 08:30:00原创 返回原文

拥有多项先进技术 三级缓存优势强

2010年游戏市场从新苏醒,各种华丽画面,游戏性出众的杰出大作纷纷选择在本年发布,这些游戏不仅仅像魔兽世界那样光靠着更大的内存就可以流畅运行的,而是慢慢开始对处理器的要求越来越苛刻,场景复杂,渲染华丽的画面中,一款优秀的处理器与中高端显卡的完美结合才可以流畅运行这些"硬件杀手"级游戏。

而在高端市场中,提起高端处理器,大家一定会想到的就是Intel酷睿i7全能至尊侠系列处理器,其运算能力较老酷睿有了翻天覆地的变化,而AMD方面而一直依靠着老旧接口委曲求全的存在着,单核运算能力弱,功耗高等问题影响着AMD高端处理器的发展。

以往的游戏往往只能一核心对应一款运行中的游戏,而随着游戏开发者的不懈努力,如今的多款游戏大作均可以支持多核心协同合作运算方式,这样可以把游戏计算部分拆分给不同的处理器核心,从而提高整体运算效率,下面我们就来看下新酷睿i7四核处理器有何强势。


超大三级共享显存加入,效率提升关键之一

新酷睿至尊全能侠处理器重新设计了缓存结构,引入了L3缓存,Nehalem的L1缓存的设计与Core微架构相同,而L2缓存则采用超低延迟的设计,但容量大大降低,每个内核仅有256KB,新加入的L3缓存采用共享式设计,而Core i7配备了8MB超大L3缓存。

处理器的L3缓存完全开放,由4颗核心共享,并完整地集成了4个核,带有一个包含与共享3级Cache。一个中央队列在Nehalem的四个核与非核区域之间充当交叉开关和仲裁器。L3 Cache集成存储控制器和QPI链接。从性能的角度看, 包含式L3 Cache是一个理想的结构因为它能在片上事务中保持Cache一致性。相信会在低延迟和低功耗上受益,另外最后一级Canche共享,会降低重复。

架构先进 前端总线超AMD同级多倍


强大且先进的QPI总线技术:

新酷睿至尊全能侠采用了先进的Nehalem架构,运算性能的飞速提升得益于先进的QPI(QuickPath Interconnect)总线,其数据传输速度可以达到FSB总线的5倍。

新酷睿至尊全能侠最大的改进之一就是摒弃了FSB前端总线传统的并行传输方式,转而采用基于PCI Express串行点对点传输技术的通用系统接口(CSI),也就是intel所称的Quick Path互联系统架构。Quick Path将包括集成的内存控制器技术以及改善的系统组件间通信链路,类似对手AMD的Inter connect及Crossbar设计,而且在多处理器作业下,每颗处理器可以互相传送数据,并不需经过芯片组,从而大幅提升整体系统性能。

四路QuickPath互联

Quick Path能双向串联点对点传输,它可提供与FSB相近的延迟(Latency),可让软件及操作系统管理,并且针对部份Streams(Threading、ISOC、LT/VT) 及out of order requests作出了优化。QuickPath的传输速率为6.4Gbps,双向最高速合共10.8GT/s 。另外Quick Path还有很大的升级空间,在整合新的Quick Path技术后,Nehalem每个处理器核心都将拥有集成的内存控制器和高速互联,把处理器和其他组件连接起来,动态可扩展的互联带宽,可以全面释放Nehalem的性能。

提高交换带宽 内存控制器作用大

集成内存控制器虽然可以提高系统性能,但是由此也会带来成本增加以及处理器频率提升困难的问题。但在Nehalem上,我们就惊喜地看到其集成了DDR3内存控制器,据intel表示,Nehalem的内存带宽最高可提升3倍!

新酷睿至尊全能侠内存控制器IMC(Integrated Memory Controller),可以支持三通道的DDR3内存,运行速度是外频x8,内存位宽从128位提升到192位。这样总共的峰值带宽就可以达到32GB/s(3×64bit×1.33GT/s÷8),达到了Core 2的3倍。

整合内存控制器(IMC)示意图

只要DDR3-1066即可满足Core i7需求Nehalem的IMC通过乱序执行来为DDR3三通道降低延迟,并让其每条通道都能够独立操作,这也使得内存的兼容性大大提高,组建三通道的门槛相对降低。目前DDR3内存的价格不断下调,为玩家采用DDR3平台创建了非常好的契机。随着Nehalem全面转入DDR3平台,这也意味着内存革命将随之到来。

单核心多任务 英特尔独享超线程

从Netburst到Core架构,intel放弃了HT超线程技术,而从Core架构到Nehalem架构,intel却重拾了超线程技术。所谓的超线程技术就是通过每核心内的闲置资源进行运算,进而提高运算效能。在对Core架构进行增强修改后,Nehalem配备了并发多线程技术Simultaneous Multi-Threading(SMT)技术(即intel的超线程技术),可有效提升多线程工作负载的性能,多线程运算效能比上代CorePenryn性能高出不少。Nehalem微构架的SMT功能支持每内核同时运行两条线程,照此计算,一个四核处理器可同时运行8条线程。

SMT技术能够在不高的功耗下提高性能,而且软件也已经支持这个技术。两年前发布的Conroe却没有采用SMT技术,可能也与SMT技术的实现不易有关,另外与Conroe没有足够的存储和处理器内联带宽来支持SMT技术也有一定的影响。

双路超线四核心(16个逻辑核心)Nehalem运行3d渲染程序

SMT技术所带来的性能的提升是非常明显的,一个物理核心通过SMT技术模拟出两个逻辑处理器,处理器处理多线程运算时,每个逻辑处理器均独立运行,一个逻辑处理器运行线程时,另外一个逻辑处理器运行其它线程,换句话就是尽最大可能地利用CPU的效能。当然,SMT技术也会带来争抢资源的问题。而得益于Nehalem内置三通道内存控制器,内存带宽相当惊人的特点,相信Nehalem可以很好的解决这一问题。


先进指令领先AMD多年

SSE指令集对处理器的重要性不言而喻。在去年intel发布的Penryn处理器上,最吸引人关注的就是其加入了对SSE 4.1指令集的支持。intel的SSE4(流式单指令多数据扩张)指令集包含了54条新指令,其中Wolfdale/Penryn实现了其中的47条指令集,称作SSE 4.1,而剩下的7条SSE4指令将在代号Nehalem架构的45纳米处理器上开始实现。SSE 4.1的引入主要是为了提升x86处理器在视频编缉、图形处理等效能。

而在Nehalem上,SSE4指令集再度扩展为SSE4.2,其在SSE 4.1的基础上新加入的7条指令集。据intel表示,SSE4.2指令包括了传处理的指令,一个CRC指令和一个popcount。串指令全是微代码,其对性能改进有限。CRC指令被用于计算校验和,这对存储和网络是有用的。SSE4.2指令集的加入,可以有效提升XML,sring和文本处理的性能。

游戏尘埃2 测试平台介绍

说了这么多高科技参数,到实际应用中的i7 930处理器是如何发挥的呢?下面笔者挑选了一款时下非常流行的《尘埃2》游戏进行了测试,我们的系统采用Windows Vista 7 SP1版本,关闭一系列节能功能,将供电选项调节至高性能级别,同时驱动更新至最新,力保测试的准确性,可以为网友们提供真实可信的实战数据。

目前市场要提及高端处理器,唯有Intel家族中的i7系列,从性能上力压群雄,拥有四核心八线程处理能力,在工作软件及高端游戏应用上游刃有余,由于市场中i7 920缺货严重,一度被商家炒卖到2180元创2009年至今最高价格,而从市场上看到的i7 920基本都是被专业超频玩家拆盒后封回去的瑕疵产品,普遍电压都为1.25V以上,与期初DO步进默认1.18V相比,高压高温导致超频能力锐减,而i7 920已经开始缩水,而此次推出的i7 930首批产品,颗颗可以轻松超至4G以上,对于高端DIY玩家是个福音。

Core i7 930采用LG1366针脚,主频为2.80GHz,每核心均具备256KB L2缓存,L3共享缓存为8MB,内置内存控制器默认支持3通道DDR3 1066MHz/1333MHz,QPI速度为4.8GT/s,CPU的TDP为130W,第一批到货i7 930的S-Spec编号为“SLBKP”。

同时我们还可以注意到,由于新酷睿系列处理器均加入了智能睿频技术,此款处理器的默认频率为2.8GHz,而经过处理器自行调整,将主频提升至2940MHz,如今的处理器是越发的聪明。

华丽游戏画面 至尊全能侠应付自如

《尘埃2》可以说是当前最热门的赛车游戏之一,也是DX11游戏的大作,以逼真的游戏画面著称。《尘埃2》使用的EGO引擎支持DirectX 11技术,利用DX11显示特效可以更好的反应游戏中的物体,加强后的曲面分割技术,可将游戏中水花、旗帜、观众更加逼真的演示出来。

笔者也是一个赛车游戏忠实的FANS,尘埃2早早的已经通关N次,而每次测试时的感受都是不同的。尤其是在这种要求FPS的竞技类游戏中,哪怕是机器的一点小小迟钝都会影响整到最后比赛结果。记得有一次周末在中关村E世界参加尘埃2线下活动,笔者怀着拿第一的心情上去玩比赛,当时使用的是2块5870组建的交火,显卡的性能堪称顶级,而在游戏驾驶时的感觉犹如在水里游泳,阻力非常之大,在赛车操作上造成了极大难度,后来经过询问才得知,其使用的为一款低端双核处理器,造成了小马拉大车的现象发生。

在DX11加速环境下,游戏画面现实的淋漓尽致,每个细节都被良好的展示出来,画面的层次感非常强。

水面效果,在经过此场景时游戏帧速掉的比较严重。

整体来说尘埃2这款游戏加入了对四核处理器良好支持,在其他程序不运行的情况下,游戏场景复杂时四核i7处理器的使用率可达50%,占用了其中四个线程,如果是四线程处理器,遇到复杂场景时想进行例如QQ的额外操作会非常吃力,而在四核i7处理器软件与游戏间的切换非常轻松。

总结:在尘埃2测试中,处理器使用率达到了四线程,整体帧速在GTX460与i7 930处理器配合下,平均帧速可达60PFS流畅级别,一点不会影响驾驶感受,不过在尘土过多及车辆起步是帧速会降低至40FPS,此时会感觉方向有些迟钝,而在车辆少于3个的时候,画面一直保持非常流畅。

经过此次测试,大家一定要注意尘埃2不要一味去追求高端显卡,支持多核处理器的尘埃2这款游戏,建议选择i7 930级别以上的处理器才可发挥出显卡全部效能。

返回原文

本文导航

相关阅读

每日精选

点击查看更多

首页 手机 数码相机 笔记本 游戏 DIY硬件 硬件外设 办公中心 数字家电 平板电脑