服务器集群知识: 集群的形成和操作

互联网 | 编辑: 杨剑锋 2006-11-10 11:00:00转载
   一旦在服务器上安装并运行了集群服务,该服务器即可加入集群。集群化操作可以减少单点故障数量,并且实现了集群化资源的高可用性。下述各节简要介绍了集群创建和集群操作中的节点行为。 
  
    注意:有关安装集群服务器的信息,请参阅 Windows server 2003 产品家族的帮助和部署指南。 
  
    创建集群 
  
    在服务器集群产品中含有用来在服务器上安装集群软件和创建新集群的集群安装实用工具。创建新集群时,首先在选择作为集群的第一个成员的计算机上运行该实用工具。第一步是确定集群名称并创建集群数据库和初始的集群成员列表来定义新集群。 Windows server 2003 集群新增了一个集群管理设置向导以及使用 cluster.exe 命令行界面创建( 包括从远程创建 )集群的功能。 
  
    创建集群的第二步是,添加可供所有集群成员使用的共用数据存储设备。这样,创建的新集群将带有一个节点、自己的本地数据存储设备以及集群共用资源 ―― 通常是磁盘或数据存储和连接介质资源。 
  
    创建集群的最后一步是,在另外将要成为集群成员的每一台计算机上运行安装实用工具。每当将新节点添加到集群中时,新节点都会自动从集群的原始成员获得现有集群数据库的副本。当节点加入或形成集群时,集群服务会更新该节点私有的配置数据库副本。 
  
    形成集群 
  
    如果服务器运行了集群服务并且无法找到集群中的其它节点,它自己可以形成一个集群。要形成集群,节点必须能够获得对仲裁资源的独占权。 
  
    当最初形成集群时,集群中的第一个节点将包括集群配置数据库。每当有新节点加入集群时,新节点都会在本地获得并保持集群配置数据库的副本。仲裁资源用恢复日志(其中含有同节点无关的集群配置和状态数据)的形式存储配置数据库的最新版本。 
  
    在集群运行中,集群服务使用仲裁恢复日志执行以下操作 : 
  
    保证只有一组活动、可相互通讯的节点才能形成集群 
  
    仅当某个节点可以获得对仲裁资源的控制权时 , 才允许它形成集群 
  
    仅当某个节点可以同控制仲裁资源的节点通讯时 , 才允许它加入或留在现有集群中 
  
    从集群中的其它节点和集群服务管理接口的角度看,当形成集群时,集群中的每个节点可能处于三种不同状态中的一种。事件处理器会记录这些状态,而事件日志管理器会将这些状态复制到集群的其它节点。集群服务状态包括: 
  
    脱机。此时的节点不是完全有效的集群成员。该节点及其集群服务器可能在运行,也可能未运行。 
  
    联机。此时的节点是完全有效的集群成员。它遵从集群数据库的更新、对仲裁算法施加自己的影响、维护心跳通讯,并可以拥有和运行资源组。 
  
    暂停。此时的节点是完全有效的集群成员。它遵从集群数据库的更新、对仲裁算法施加自己的影响、维护心跳通讯,但它无法接受资源组。它只能支持它当前已拥有的那些资源组。之所以提供暂停状态,是为了允许执行某些维护。大多数服务器集群组件会将联机和暂停视为等价的状态。 
  
    加入集群 
  
    如果一个服务器要加入现有集群 , 则它必须运行集群服务并且必须成功找到集群中的其它节点。在找到其它节点后,加入的服务器必须接受集群成员资格验证,并获得集群配置数据库的副本。 
  
    加入现有集群的过程开始于 Windows Server 2003 或 Windows 2000 Service Control Manager 在节点上启动集群服务之时。在启动过程中,集群服务会配置并装入该节点的本地数据设备。它并不会试图将共用的集群数据设备作为节点联机,因为现有集群可能正在使用这些设备。 
  
    为了查找其它节点 , 会启动一个发现过程。当节点发现任何集群成员时,它将执行身份验证序列。第一个集群成员会对新加入者进行身份验证,并且在新服务器得到成功验证后返回成功状态。如果验证不成功(未能识别待加入节点的集群成员身份,或者它使用了无效的帐户密码),则加入集群的请求会被拒绝。 
  
    进行成功验证后,首先联机的集群节点会检查加入节点上的配置数据库副本。如果该副本已过时,对加入服务器进行验证的集群节点会为加入的服务器发送该数据库的更新副本。刚加入集群的节点在收到复制的数据库后,可以用它查找共享资源并根据需要将它们联机。 
  
    脱离集群 
  
    当节点关闭或集群服务被停止时,节点可能脱离集群。但当节点不执行集群操作(比如不向集群配置数据库提交更新)时,节点也可能被迫脱离(被逐出)集群。 
  
    如果节点根据预先的计划脱离集群 , 它会向其它所有节点成员发送 ClusterExit 消息,通知它们它将脱离集群。该节点不等待任何响应就会立即进行关闭资源和所有集群连接的操作。由于其余节点收到了退出消息,因此它们不会执行在节点意外失效或网络通讯停止时发生的重新分组过程以重新确立集群成员身份。

相关阅读

每日精选

点击查看更多

首页 手机 数码相机 笔记本 游戏 DIY硬件 硬件外设 办公中心 数字家电 平板电脑