英特尔酷睿微架构产品发布日期一天天地临近,我们犹如感受到了五月天那样扑面而来的热浪。凤凰涅磐,六年的蛰伏,量的积累终于带来了一次质的飞跃。基于英特尔新一代微架构的产品势必将掀起台式机、服务器和笔记本产品的革新。
发布在即 CONROE架构详介及产品体验(11)
传统的乱序执行处理器都存在这样的一个准则,在指令修改某个内存地址内容前必须确定之前指令的对该地址内容的读取都完全执行了,这是乱序执行处理器重新对指令排序必需要遵从的一个重要准则。
内存混淆发生过程
当存储和载入对同一个地址产生操作,两条指令就发生了我们所说的“内存混淆”情况,超过97%的内存访存指令实际上都指向了正确单元,这样的操作实际上是无相关性的内存单元进行访问,是理论上的独立指令。但是就是为了剩余这3%的内存混淆情况,P6构架和Pentium 4都使用了偏向保守的访存排序策略:如果读取的地址尚未确定,那么它始终不能提升到储存操作之前,以此来避免后续获得的读取地址和存储地址相同发生的冲突。
这种做法看起来非常的安全,但是也非常保守,因为绝大多少的载入-存储操作不会发生内存混淆,这种大而化之的处理方法会带来性能的下降。
英特尔在酷睿™ 微架构中全新加入的内存消歧技术就是用来解决上述问题的。该技术能智能识别内存混淆是否发生,在确认不会发生后,以往在 P6构架和Pentium 4中载入操作不能提前到不明地址存储操作之前的限制就不存在了。这一设计会起到非常明显的性能提升。
除了内存消歧外,英特尔的智能内存访问还包含增强的预取器。预取器负责提前获得内存的内容,并将其放入处理器的高速缓存中,以备读取。增加从高速缓存而不是内核的装载量将会算短内存延迟并提高性能。为了让数据位于每个执行内核所需要的地方,酷睿™ 微架构为每一个以及高速缓存和二级高速缓存均配置两个预取器。这些预取器同时检测多个数据流和大跨度的存取类型。这样就可以在一级高速缓存中“及时”准备待执行的数据。二级高速缓存的预读器可以分析内核的访问情况,确保二级缓存拥有未来潜在需要数据。
通过内存消歧和增强型预取器,英特尔最大化的拓展了系统总线带宽和隐藏了内存子系统的延迟,从一定程度上拉近了和对手集成内存控制器的延迟差距。同样,要达到媲美集成内存控制器的效果,共享型高级智能缓存也功不可没。

网友评论