曾宇:透过HPC发展来看AMD四核的影响

互联网 | 编辑: 吴杰平 2007-08-30 16:57:00原创 返回原文

第一页

分析当前全球的HPC发展趋势,我们不得不回顾一下今年6月份在德国TOP500的榜单,在排名中我们可以看到,更高性能的高性能计算机层出不穷,可信计算、混合计算、更高的性能、更高的效率目,业界在技术方面都在进行不懈的努力。

企业计算的五个趋势
在TOP500我们排名到500名左右的机器大量我们是应用的机群,而且我们基于一些开放式的系统架构,以及一些成熟的商品化的CPU和操作系统来构建。可以说这样一个趋势,我们从05年开始,我们就一直没有变过,当时我们也把它叫做高性能计算机的平面化趋势。

这样一个趋势,实际上可以看到,在服务器领域我们的趋势,第一个就是刀片服务器的存储。从IDC我们得到的数据,到09年,整个服务器我们市场份额将会超过25%,出货量280万台,收入超过90亿美金。这样的转变的话,是由于我们的技术,包括我们使用更加有效的监控,比如我们在曙光里面使用远程监控,更智能的系统管理,动态功率管理。我们可以整合到可能让我们来实现百万次以及千万次的计算能力。同时我们使用越来越简洁和方便的存储,共享USB设备,或者我们基于USB设备进行远程互联。同时我们也整合更多的一些包括存储等等部件,我们都融合在一起,从而我们提供更加有效的扩展和更加灵活的网络扩展。比如说我们所有的技术都为我们打下了一个坚实的基础。也为构建我们未来的标准化打下了坚实的基础。从我们现在目前TOP500这样一个趋势就可以见证。

第二个趋势,我们应该看到,服务器节能技术趋于成熟。在今年越来越多的企业,越来越多的IT行业,据IDC数据估计的话,到下十年,我们的数据中心,我们的存储中心,可能花在能源消耗上的代价会超过我们购买服务器成本,以至于到今天,我们也欣喜的看到,服务器节能技术也趋于成熟。比如说今天我们看到的在AMD,集成了PowerNow!技术,IBM高热转到界面芯片冷却技术。其次我们也欣喜的看到,在系统节能方面,我们通过提高电源使用效率,基于负载情况动态调整节点状态,可以休眠。根据不同用户进程能耗的不同进行CPU任务队列的调度,将一些产生较多热量的任务从温度较高的CPU上迁移到温度较低的CPU上。这样的话可以实现系统的节能。还有我们也看到,我们有大量的一些原创性的技术在进行研究,包括业态架构制冷,包括液体冷却、金属制冷、智能温控风扇等。未来,这样一些更高性能的开发,业界已经提供从芯片到服务器这种节能的管理。

第三个趋势是效能服务浮出水面,对服务器及其资源集中管理、虚拟化供给,按照用户的需求动态的提供服务,虚拟化技术是效用服务器的核心技术之一。基于计算能力,存储能力、I/O能力,以及其他全局物理资源虚拟化,效用服务器渴望满足未来信息服务的扁平化趋势,为用户提供按需服务。包括虚拟化技术,以及在节点级和应用级的操作技术。包括软件模拟,硬件模拟,Grid等等,这些虚拟化和我们新的虚拟化密切相关。关于虚拟化,我们使用虚拟化技术有两个因素,第一个要提高我们基础设施的使用率,这样的因素应该来说可以降低我们的管理难度。如果说我们底层的硬件,我们不能提供非常有效的虚拟化支持,实际上我们再谈上层的虚拟化没有作用。实际上今天我们看到有些处理器本身能够提供功能强大的技术,以及我们快速的虚拟化的技术和能力。

第四个方面,可重构计算在当前构建更高效能的计算机提供强有力的手段,可重构计算已经成为当前构建千万亿次超级计算机,我们可能采用这样的手段。从TOP500来看,美国橡树岭国家实验室,将每秒54万亿次处理器速度提升到每秒119万亿次。排名第14的东京工业大学SUN  Fire  X4600机群系统+ClearSpeed+InfiniBand,我们都可以通过可重技术使得我们硬件可编译。应该来说,伴随着今天我们硅晶尺寸和速度的不断提升,可重构计算技术有宽广的应用领域,伴随着编译技术的不断改进,以及像AMD  Torrenza协处理平台的推动等有利因素都出现了。在曙光的话,我们当前已经有这样的计划,我们基于AMD  Torrenza实现桌面的计算能力。

(未完,请翻页)

第二页

第五个趋势,个人HPC新宠儿已经成为我们当前服务器领域的新的宠儿。根据IDC市场调查报告,中小规模集群是整个服务器市场中增长最快的,综合考虑各种用户的需求,个人高性能计算机可以满足10%以上的市场需求。谈到个人HPC,首先我们应该以非常低的价格,体现非常高的能力,比尔盖茨希望,在未来不远的将来,可以实现1万美金,1万亿次的性能,伴随着节能技术的重现,比如说10万人民币实现1 Teraflops这种计算能力。第二个需求,应该来满足办公环境的定位需求,在今天,假如在现在这样一个现场,我们来使用个人HPC,我们插上强电就应该满足我们的需求,而不是说像大实验室,通过一些网格计算完成,我们要买一台超级计算机,今天的计划,可能因为我们机房的构建不足,不得不推迟,在等待机房改造,到过年的话,这个计划就过时了,今天我们220V的电压就可以满足我们个人的需求。第三,满足桌面噪声要求。现在我们看到各个企业提供了第二服务器,我们现在不能想像在我们书桌上摆一个这样的机器,毫无疑问,那造价太大。我想有这三个条件,才能叫做个人HPC。我们已经欣喜的看到这样的趋势,我们对当前中小型以及高端市场我们做了这样一个细分,在高端市场,包括一些大的数据库中心,包括一些计算等等,包括Blade  PC,Personal  HPC  Blade  Server/Cluster,这中间有很大一个市场,未来将由个人HPC所取代,要大大的占领目前有一些企业推导的PC占领市场,这个市场未来将属于个人PC。

AMD四核巴塞罗那的优势以及对产业产生的影响
我们看到这五个趋势,接下来我们可以看一下AMD四核。我们基于四核,其中最重要的优势都是非常优秀的,基于IT总线我们可以构建这样一个图形。接下来我们看一下AMD 巴塞罗那。我个人观点上它的一些技术优势,AMD  巴塞罗那它的优势集中在我们对接了一些特定的提升。包括我们对点计算的提升,还有一些虚拟化方面。实际上巴塞罗那,我们本身可以支持每个核有单独的运行体系,这样的话,可以在当前工作状态比较繁忙的CPU处在比较高的运算上面,这样的话,可以有效的节约能源。其次,我们可以看到,在巴塞罗那芯片内部,我们可以根据自己的需求,有机的来关掉一些处理单位,这样的话,可以减少我们能源的开销。同时,在巴塞罗那上,我们整个内部处理器和内核采用不同的电路,假如我们的处理器在全部的运转,我们也没有必要让内存非常高的用电。如果我们对内存需要一个非常高的供电能力,而另外一方面,我们内核可能并不需要太多的空间,我们也可以分别来对待,这样的话,可以有效的节省能源的开销。其次通过AMD整合内存新技术,以及一些相关的内存化技术,我们可以大大提升在I/O方面的一些线路,同时我们还可以共享,有效的针对多线的程序运作,可以做得非常有效。在虚拟化方面,我们也提供这种快速的新的虚拟化技术。

我们通过这几个细节性的描述,我们认为AMD四核巴塞罗那,对产业的影响主要有以下五个方面。第一,巴塞罗那将加速高端工业标准化百万亿次超级计算机的进程。第二,中端加速工业标准化大SMP服务器及高效能刀片服务器普及。第三,将会进一步推动节能技术的发展。第四,基于Torrenza计划对FPGA的深层次发展意义深远,推动芯片级虚拟化技术的进一步发展。第五,推动个人HPC的成熟。

(未完,请翻页)

第三页

接下来我们看一下在这些领域巴塞罗那一个潜在的影响。

第一,巴塞罗那将加速高端工业标准化百万亿次超级计算机的进程。在今天的话,伴随着多核节能这样一个技术的推动,我们必须看到这样一个事实,基于多事这样一个思路,将是未来我们构建工业标准化百万亿次超级计算机的主流载体,我们不太可能基于我们单独的CPU来构建我们的百万亿次系统,因为诸多的这些通讯延迟,网络延迟散热等等问题,今天正是因为有了多核和节能这样的因素,我们可以看到越来越多的这样一些TOP100这样的一些技术。

在这里我们列出了,如果基于今天的巴塞罗那来构建的百万亿次的标准机群的配置,假如我们使用刀片服务器,比如说曙光2000,我们大概每个计算刀片可以实现64G服务器,这个控制的话我们指的是理论工程,实际我们有一些效能的预计,预计可以达到60%的性能。整个系统我们采用157个Dawning,27个计算机柜,我们可以基于英特网和千兆网络,整个技术功耗应该说是小于400千瓦,占地面积小于100平米,今天我们大中厂商,我们基于这样一个存储芯片就可以构建。曙光5000的话,一方面我们会基于商品化的CPU,另一方面我们还可以构建这种技术,未来的曙光标准化机群,我们惠及大众,推向市场的标准化机群我们一定会使用像AMD  巴塞罗那这样的芯片来构建。

这是我们整体的系统架构,包括我们计算网络,采用千兆以太这样的网络,大概是这样一个结构。其次我们也可以看到,我们基于巴塞罗那这样一个开放式四核的CPU,使得我们以工业化标准化多核的CPU来构建千万亿次计算也成为可能。我们的一些系统,大概根据我们每瓦特GFLOPS这样的性能,以及每平方英尺GFLOPS这样的性能,未来我们要构建这样一个千万亿次系统的话,我们希望我们的系统GFLOPS应该是到1.0,同样的话,未来我们期望,最终我们提供千万亿次每平方英尺应该达到100亿GFLOPS到1000亿GFLOPS。到今天的话,我们可以基于四核处理器这样一个芯片,来整合更高的计算力。

实际上从以上的分析我们也可以看到,业界已经有一些,已经正在研发或者即将推出的一些千万亿次研发计划,其中包括Cray,它计划在未来四年之内提供这样的系统,他们基于4P的Quad-core来构建超级千万亿次的系统,我们在Network,采用Cray专用Sea-star  3D。再有一个就是IBM,为美国洛斯阿拉莫斯国家实验室做的,整个系统上采用一种混合结构。同时在今年6月份,我们可以看到,在德国的第29届TOP500会议上面,我们也看到SUN发布的Constellation  System计划。我们基于四核这样的芯片,我们未来构建工业标准化的芯片我们提供了可能性。

第二,AMD  巴塞罗那在终端应用加速了标准化大SMP服务器普及。我们可以实现基于四核处理芯片,我们可以实现从2路到32路SMP架构服务器无缝扩展。尤其在我们金融行业,铁路、公安、电信等等领域,大部分服务器都是被国外一些品牌占领,而国内在高端服务器研发方面我们还差得很远,在中国目前电信、金融这样的领域,我们有大量的市场份额是被国外的一些服务器厂商,基于专有的服务器处理芯片,基于专有的系统等等来形成这样的巨额的技术垄断。基于四核处理器,我们可以基于开放式的IT机构,以及我们基于开放式的Windows等等这样一些操作系统,我们可以来轻松的构建这样的处理器,来保护和介入我们这样一个市场。

这个地方我有一个IDC的统计数据,实际上我们可以看到,IDC07年整个市场有这样一个数据,预测将占到整个服务器市场的大概4.2%,而这4.2%将达到整个销售额的49.9%的份额。这意味着我们当前,就是我刚才说的这种情况,大量的国外品牌的基于专有芯片和专有操作系统形成技术垄断,而今天我们可以基于这种开放式的CPU,构建我们大SMP处理系统。在这里我们列出了这样一个,我们可以通过互联体系架构,来轻松实现32核的服务器。实际上我们可以实现每个CPU,每个处理器来管理任何一个相邻的处理器的内存,从而达到非常好的基础性能。

(未完,请翻页)

第四页

第三,AMD巴塞罗那将会进一步推动节能技术的发展。AMD  巴塞罗那处理器,本身在节能方面有非常优异的表现。这个表现,我们刚才也谈到,在系统节能方面,比如说我们可以根据每个CPU对内存的需求采用不同的方式,可以单独供电。当无论出现计算瓶颈等等,我们可以根据瓶颈调整电压分配,从而有效的保护,有效的节约能源,并且可以大大提升我们的内部系统。比如说当内存处于非常繁忙的时段的时候,我们可以有效的增加内存电压,这是非常好的一个特性。

另一方面,实际说我们可以看到,在AMD  巴塞罗那处理器,我们可以看到根据我们CPU的情况,来动态的关闭或者打开一些没有使用的系统,这样也可以有效的保护整体能源的使用率。另外一个特性,体现在巴塞罗那处理器整合内存服务器,巴塞罗那本身支持两个通道的DDR2内存,实际上我们在谈DDR内存的时候,我们不得不看目前这样一个情况,当我们使用DDR2内存的话,我们消耗功率是4.625,当我们使用FBDIMM功率是11.94,这是一个实验性能的对比,这样的话,如果扩展到我们整个系统中,我们可能有8G内存,尤其是对内存有比较大需求的用户,这样毫无疑问巴塞罗那有比较大的优势。一个内存的话,我们可能节省10瓦的能源消耗,如果在8功耗我们就可能觉得更多。在这个地方,我们在SPEccpt2000当中,DDR2是36.94,FBDIMM是101.2。

第四,巴塞罗那处理器业提供虚拟化技术,支持快速虚拟化缩影的技术来支持虚拟化。基于Torrenza计划对FPGA的深层次发展意义深远,巴塞罗那将会推动芯片级虚拟化技术的进一步发展。

这个地方我们可以看一看AMD  巴塞罗那  Smart  Cache的系统图,如果我们看到第一个超过4兆的内存,不光要占用L2,还要占用L3,这种情况下,在第二第三格都可以使用L3。

第五,巴塞罗那也将有效的推动个人PC的成熟的应用。刚才我们谈到,我们基于四核和GFLOPS,我们未来的桌面机群的话,我们在抢占PC领域10%的空间,我们可以基于四核巴塞罗那这样一个处理器,可以有效的来构建桌面这样一个系统。本身巴塞罗那优异的性能,可以满足我们桌面的需求。我们基于四核这种成熟的技术,我们可以看到在今年下半年,个人HPC有这样的产品。

曙光的策略
接下来我们看曙光的策略。我们应该看到,在今天我们并没有基于多线程调度开发,部分应用仍需要改编以利用多核的并行性。CPU核的增加,时钟速度的降低,软件效率变得至为关键。从双核到四核,我们需要更多的关注软件的性能及效率。我们要让我们的软件更高效,我们可能需要更改我们的上级软件,我们要提供更有效,更高效内核资源的优势。怎么样体现在我们AMD里面,这需要我们进行优化。

接下来曙光我们可能会对软件这种并行的环境进行进一步优化。同时,我们会对我们现有的服务器做一个全面的四核平滑升级。AMD四核处理器它的最大好处可以基于现有的架构实现无缝的升级。曙光将同步在全国范围内推出基于AMD四核巴塞罗那处理器的服务器产品。

AMD四核处理器适用于什么领域,在这个图上我们可以看到,我们从1路到8路这些处理器,我们构建服务器系统的话,基本上我们可以更多的构建四路服务器,我们8路处理器更多的构建SMP等等,更多的包括虚拟化等等一些领域。今天我们实际上可以来基于现有的四核处理器,可以轻松的来整合,从2路到8路这样一些应用,我们可以基于四核处理器,2路到8路SMP服务器适合的场合。包括从数据处理,角色支持等等这样一些应用。在这个地方我们列出了不同的业务对性能的需求,实际上我们可以看到,真正对虚拟应用比较注重的一些应用领域,包括数据处理,HPC、SPS、商业计算等等,实际上这些领域的话,我们统统的都可以基于这个处理器构建我们的系统。

在细分的领域,我列出了一些图,当然也不全,气候模型、等离子物理、材料科学、基因组学、生物系统模型、核模型、汽车仿真、工业职能、银行、保险教育、信息平台。在未来的话,我们需要针对我们一些体系架构需求重点来推我的巴塞罗那处理器。实际上刚才通过我的介绍,大家也了解到,巴塞罗那的更多的是在浮点计算能力,主存规模、存储器带宽、存储器延迟,网络带宽、网络速度的提升。

下一步计划,我们将全面提升现有双路、四路、八路AMD  双核服务器产品。下半年我们将启动曙光四路四核曙光第四代刀片服务器研发,同时我们还会处理在石油、气象方面的计划。

返回原文

本文导航

相关阅读

每日精选

点击查看更多

首页 手机 数码相机 笔记本 游戏 DIY硬件 硬件外设 办公中心 数字家电 平板电脑