科学计算领域,服务器集群这种计算工具有相当重要的作用,通常一个集群可以有几十、几百颗处理器通过高速网络连接组合在一起,形成巨大的计算资源为特定的应用服务。
我们首先来介绍一下集群,Cluster集群技术可如下定义:一组相互独立的服务器在网络中表现为单一的系统,并以单一系统的模式加以管理。此单一系统为客户工作站提供高可靠性的服务。
大多数模式下,集群中所有的计算机拥有一个共同的名称,集群内任一系统上运行的服务可被所有的网络客户所使用。Cluster必须可以协调管理各分离的组件的错误和失败,并可透明地向Cluster中加入组件。
一个Cluster包含多台(至少二台)拥有共享数据存储空间的服务器。任何一台服务器运行一个应用时,应用数据被存储在共享的数据空间内。每台服务器的操作系统和应用程序文件存储在其各自的本地储存空间上。
Cluster内各节点服务器通过一内部局域网相互通讯。当一台节点服务器发生故障时,这台服务器上所运行的应用程序将在另一节点服务器上被自动接管。当一个应用服务发生故障时,应用服务将被重新启动或被另一台服务器接管。当以上任一故障发生时,客户将能很快连接到新的应用服务上。
由于组成集群的机器不尽相同,所以我们通常可以把集群分成两种:工作站集群和胖节点集群。
工作站集群(COW)
工作站集群的节点机规模一般都比较小,常常配备的示2-4颗处理器的服务器,采用通常的以太网或者InfiniBand来连接,一般采用Linux集群操作系统来对集群进行管理。
这种集群最常见的是PC服务器厂商的PC-Cluster集群或者刀片服务器集群,他的优点主要是价格便宜和容易部署,所以很多小的服务器厂商也可以做这种集群。在国外,很多大学生通过一个公用的高速专用网络,将数十台的PC联在一起,用Linux集群操作系统来管理,就构成了这种集群。
这种集群的缺点是不太稳定,不能运行大规模的商业应用软件。而且由于这种松散连接,使得占用的空间可能比较大,散热也成问题。
胖节点集群
胖节点集群的服务器节点多是8-16颗CPU的SMP服务器,其稳定性大大提高,通过专有技术用以太网或者InfiniBand连接,系统采用UNIX操作系统,应用经过优化的专用集群管理软件。常见的机器有IBM的 Cluster1600和HPQ AlphaServer SC,他的好处是节点机的性能比较稳定,系统节点不太容易出问题,这样就可以运行大型的应用程序,应用到商业或者科学计算中。它的扩展性也比较好,支持所有并行方式,但是相比于前一种,价格也要贵很多。国外和国内都有这种应用案例,当然这种价格也不是一般企业和机构可以采用的,多数是原来做商业计算或者科研。
IBM做集群的服务器
由于IBM System P系列的产品属于小型机范畴,所以拿它来做集群的自然不在少数。IBM除了上面说的IBM Cluster1600可以做集群以外,IBM System p5 505 服务器和IBM System p5 575都是比较适合做集群的。当然,也有人用IBM System p5 520或者IBM System p5 550来做集群,这主要是根据你自己的实际需求。我们在这里简单介绍一下IBM System p5 505 服务器和IBM System p5 575。
网友评论