AMD皓龙及英特尔Nehalem的HPC比拼

互联网 | 编辑: 杨雪姣 2009-06-29 00:00:00转载

也许是对英特尔的四核至强5500处理器与AMD的六核皓龙2400系列处理器在运行超级计算机工作负载的基准测试对比结论的等待失去了耐心,高性能计算集群制造商Advanced Clustering Technologies公司为了取悦对这两款处理器感兴趣的用户,在他们自己的两款机架式双路Pinnacle服务器节点上进行了高性能Linpack基准测试。

他们执行的Linpack Fortran基准测试与半年一届的超级计算机世界500强排行榜排序所用的基准测试是一样的。本周最新的超级计算机世界500强排行榜已经在德国汉堡市举行的国际超级计算机大会上揭晓。

对于这些由数百,数千甚至上万个集群服务器节点组成的超级计算机系统级别的性能排行,这些系统的性能和使用信息传递界面(MPI)协议来运行仿真模型的任何集群都受到了连接节点的网络光纤的显著影响。为了进行正确的性能评估,你会对这些服务器节点进行严格的测试,然后评测这些使用各种连接方式的超级计算机集群的系统级性能。

为了让IT买家在伊斯坦布尔皓龙处理器和Nehalem EP至强处理器之间做出正确的采购决策,Advanced Clustering Technologies的集群工程师Shane Corder在配置这两款芯片的双路服务器上执行了Linpack基准测试,这两款机型使用的软件堆栈也是相同的。

你可以从Corder的测试结论报告上看出,由于Corder明白计算能力与性能和金钱是密不可分的,他对配置的系统进行了价格衡量,并作出了自己的性价比分析。不过Corder并不担心所测服务器的能耗,这也是许多高性能计算用户关心的问题。

一方面,一台Pinnacle机架服务器上配置了两个主频为2.66GHz的四核至强5500系列处理器,每个处理器采用了95瓦的热量封装(笔者可能会选择功耗为80瓦的2.53GHZ E5540处理器,这也是高性能计算集群更常有的配置)。这款服务器还配置了12GB的1.33GHz DDR3主存。

另一方面,另一台Pinnacle机架服务器配置的是两个主频为2.6GHz的六核伊斯坦布尔皓龙2435处理器,采用16GB 800MHZ DDR2主存。这款芯片的额定功耗可以低至75瓦(E5540可能是更好的选择,不过任何对比都有妥协性)。

Corder使用的是相同的电源,硬盘和操作系统(未指定品牌),但是几乎可以肯定的是Linux系统,Corder表示服务器上内存的数量是不同的,因为每个芯片的内存速度不同,芯片体系架构所支持的内存通道数量也不尽相同:至强处理器每个芯片上有3个通道,运行速度比每个处理器上有两个通道的皓龙处理器要快。因此Corder估计后者为了弥补这一点会使用更多的内存。

Corder表示,当系统中所有的可用内存都处于使用状态,Linpack基准的测试结论才是最好的,因此基准会允许Fortran测试来来扩展他们的矩阵尺度来实现这个目标,Advanced Clustering Technologies公司在皓龙处理器机型上的测试要比至强处理器服务器上的矩阵尺度稍大。

有趣的是Corder为两款服务器都选择了由英特尔公司提供的编译器和算术库。原因是所有这些堆栈都是Advanced Clustering Technologies公司在其用户需求下进行测试的,包括开源GNU编译器和来自Portland Group的编译器,以及来自德克萨斯大学的AMD
Core算术库和libGOTO library,英特尔的表现最好。

以下是测试结论。搭载至强5500处理器的服务器理论峰值数字计算性能为85.12千兆浮点计算,在Advanced Clustering Technologies公司运行的Linpack基准测试结果为每秒74。03千兆浮点计算。这就意味着搭载至强5500处理器的服务器运行实际工作负载的可交付理论性能比为86.97%。按照这种配置英特尔处理器服务器的售价大约在3800美元,也就是每千兆浮点计算的分摊费用为51.33美元。

搭载AMD六核皓龙处理器的服务器运行速度和英特尔处理器机型基本相同,你可能期望AMD的服务器要比这个结果更好,事实也是如此。搭载皓龙2435处理器的服务器理论峰值数字计算性能为124.8千兆浮点计算,在Advanced Clustering Technologies公司运行的Linpack基准测试结果为99.38千兆浮点计算,也就是说搭载皓龙六核处理器的服务器运行实际工作负载的可交付功效仅为79.63%。皓龙处理器服务器的售价为3500美元,每千兆浮点计算的分摊费用要比英特尔至强处理器低35.21美元。

显然六核处理器需要三个内存通道而四核芯片应该用两个内存通道就够了。但是对使用内存所争论的焦点可能是伊斯坦布尔芯片的效率更低。

但是伊斯坦布尔处理器实际性能要高出34.2%,系统价格要低了7.9%,在系统级别上所消耗的能量可能也要低上数十瓦。在这点上Advanced Clustering Technologies公司力挺皓龙处理器。

让我们来猜测一下谁可能从AMD处拿到伊斯坦布尔皓龙处理器的好折扣,谁又可能会收到英特尔的来电?让我们拭目以待吧。

相关阅读

每日精选

点击查看更多

首页 手机 数码相机 笔记本 游戏 DIY硬件 硬件外设 办公中心 数字家电 平板电脑