核战爆发 AMD三核羿龙处理器详细评测

互联网 | 编辑: 陈晨 2008-06-04 00:30:00原创 一键看全文

半个世纪前,当现代意义上的计算机与大众依然无缘的时候,一种叫做晶体管的发明改变了世界,以其为基础的半导体科技在半个世纪内取得了当初难以想象的飞速发展,由此带来了人类科技的飞速进步。从上世纪90年代起,当以硅为主要材料的半导体科技开始面临重大挑战,由于晶体管

原生的力量:Phenom X3架构详析

继速龙X2在市场中受到了广泛欢迎之后,AMD方面继续沿着原生的道路前进。2007年下半年,AMD第一款桌面原生4核心处理器Phenom X4诞生,与之相伴随而来的,是吸引了所有人目光的Phenom X3计划发布。尽管AMD在坚持原生设计思路上付出了不小的成本和代价,但是也终于展现出了原生的力量,基于核心内部的直连架构设计,Phenom的架构设计可扩展性非常高,AMD由此领先于竞争对手获得了设计和制造不同数量核心处理器的能力,从理论上说,只要制造工艺能够满足,AMD完全可以设计并制造出3-5-7甚至更多核心数量,而无需与竞争对手INTEL一样延续着2倍数的发展道路,Phenom X3就是奇数核心的第一代作品。

Phenom X3总体架构延续着Phenom X4的设计,三颗核心单独享有512K的二级缓存,并共享2M的三级缓存,执行请求通过System Request Queue(系统请求队列)分配给相应的执行核心,核心间通过CROSSBAR SWITCH及L3进行数据交换和共享,并与内置内存控制器进行直接的通讯,而由K8架构开始启用的HyperTransport传输总线则由HT2.0进化至HT3.0标准,频率由1.4G提升至最高2.6G,带宽则提升至空前的41.6GB/s,系统带宽瓶颈被彻底解决,重负载状态下,处理器的性能将得到充分的发挥。在当前DDR3时代尚未到来之前Phenom X3支持最高1066的DDR2高频内存,与K8时代不同的是,内置的内存控制器由128bit的单内存控制器拆解为双64bit的内存控制器,满足多核心的单独调用和独立的占有内存资源,进一步提升了调度和处理效率。

内核方面,Phenom进行了自K8时代以来最重大的改进:

1.SSE指令执行位宽的扩展改进最为明显,由于K8的SSE执行单元是两个并行64bit的结构,因此一条完整的128bitSSE指令必须拆解成两条64bit指令才能被执行,如今这一改进可以明显的提升Phenom在涉及SSE较为广泛的软件上的执行能力,例如视频编码等,而下面的测试也完全证实了这一说明。

2.在K8速龙处理器的基础上Phenom处理器加入了更高级的分支预测功能:增加了一倍返回堆栈容量,添加了更多分支历史比特数据,并且内建了一个512项的间接分支预测器(indirect branch predictor)。32字节的指令预取,通过减少预取指令的分拆来大幅提升处理效率。边带堆栈优化器(Sideband stack optimizer)的优化也减少了对单位带宽的占用。

3.浮点处理单元翻倍,这在与Phenom处理器同架构的服务器产品BARCELONA上改进最为明显,在巨大的带宽支持下,BARCELONA的浮点性能可以获得大幅的领先,在桌面领域中会根据应用软件的不同获得相应程度的性能提升。

4.内存控制器的细节部分有了进一步的改进,可以让更多内存分页处于开启状态,随时保证CPU的调度。内存控制器支持48位硬件寻址能力,理论上可寻址256TB容量的物理内存空间。

5.与服务器平台的BARCELONA处理器一样,Phenom拓展了虚拟化技术的应用,可使处理器中的物理内存地址和虚拟内存地址进行直接对话,使平台虚拟化性能有了明显的改进。

6.继K6处理器之后,再次引入了L3缓存的设计,为所有核心提供了共享2M容量32路的三级缓存供数据的存储和交换。同时也做到了性能与成本之间的平衡。

由于AMD内置内存控制器的设计,处理器与内存间的通讯延迟被显著的缩短,因此无需在缓存容量上向竞争对手那样的暴力规格看齐,在保持着512K的二级缓存设计的同时新增了2M容量的32路共享三级缓存,并且随着工艺的改进,L3缓存的容量还将不断的扩展。随着时间的推移,INTEL方面也公布了下一代的NEHALEM架构设计方案,人们惊讶的发现其核心互联的QPI传输总线与核心缓存体系的设计与AMD当前使用的HT总线及独享L2+共享L3设计方案非常相似,这也进一步证明了AMD在架构设计上的前瞻性。

 

提示:试试键盘 “← →” 可以实现快速翻页 

一键看全文

本文导航

相关阅读

每日精选

点击查看更多

首页 手机 数码相机 笔记本 游戏 DIY硬件 硬件外设 办公中心 数字家电 平板电脑