一、前言
随着信息技术的不断发展,近年来在世界范围内掀起了兴建网络环境、传播数据信息的热潮。随着计算机存储信息量的不断增长,系统高可用性、数据安全、数据存储备份和灾难恢复就成为引人关注的话题。
企业最为宝贵的财富就是数据,要保证企业业务持续的运作和成功,就要保护基于计算机的信息。人为的错误、硬盘的损毁、电脑病毒、自然灾难等等都有可能造成数据的丢失,给企业造成无可估量的损失。这时,最关键的问题就在于如何提高系统的高可用性,如何保护企业的重要数据,如何尽快恢复计算机系统,使其能正常运行。
高可用性HA(High Availability)指的是通过尽量缩短因日常维护操作(计划)和突发的系统崩溃(非计划)所导致的停机时间,以提高系统和应用的可用性。HA系统是目前企业防止核心计算机系统因故障停机的最有效手段,而双机容错技术则是实现系统高可用性的一种方式。
由于数据存储备份所占有的重要地位,它已经成为计算机领域里相对独立的分支领域。一般来说,各种操作系统所附带的存储备份程序都有着这样或那样的缺陷,所以若想对数据进行可靠的存储备份,必须选择专门的存储备份软件、硬件,并制定相应的存储备份及恢复方案。在发达国家,几乎每一个网络都会配置专用的外部存储设备,而这些设备也确实在不少灾难性的数据丢失事故中发挥了扭转乾坤的作用。计算机界往往会用服务器和数据存储备份设备(如磁盘阵列、磁带机)的连接率,即一百台服务器中有多少配置了数据存储备份设备,来做为评价数据存储备份普及程度和对网络数据安全程度的一个重要衡量指标。如果每一台服务器或每一个局域网络都配置了数据存储备份设备以及相应的存储备份软件,那么无论网络硬件还是软件出了问题,都能够很轻松地恢复。
本方案正是经过了对软、硬件产品的综合考察,对各种双机系统和存储备份方案的深入分析而提出的。我们力图向某发电厂提供安全、可靠的双机系统,智能化、完备的、易管理的数据存储备份环境,从而为整个某发电厂数据保护系统的建设尽绵薄之力。
二、高可用性系统简介:
对现代企业来说,利用计算机系统来提供及时可靠的信息和服务是必不可少的;另一方面,计算机硬件与软件都不可避免地会发生故障,这些故障有可能给企业带来极大的损失,甚至整个服务的终止,网络的瘫痪。可见,对一些特别的企业或公司,系统的高可用性显得更为重要。因此,必须有适当的措施来确保计算机系统提供不间断的服务,以维护系统的可用性。
信息系统的可用性通常在两种情况下会受到影响,一种是系统宕机、错误操作和管理引起的异常失败,另一种是由于系统维护和升级,需要安装新的硬件或软件而需关机引起的系统中断。高可靠性软件必须为这两种情况提供不间断的系统服务。
2.1系统高可用性基本类型
通常可用性系统(Normal)
通常可用性系统没有容错功能,也没有特殊的软件来作错误处理,系统的错误检查和恢复完全依靠系统管理员来完成。
高可用性系统(High Availability)
高可用性系统是在冗余的通常可用性系统基础之上,运行高可靠性软件而构成。高可靠性软件用于自动检测系统的运行状态,在一台服务器出现硬件或软件故障的情况下,自动地切换到另一台服务器上。
集群容错系统(Cluster System)
集群容错系统是由高可靠性、高安全性的多机系统组成。错误处理能力是计算机硬件和操作系统本身提供。一般的应用软件也需要修改后方能在集群容错系统上面运行。
2.2系统高可用性基本功能
硬件故障的监测与报警
高可用性软件必须能够自动监测计算机系统中的相关硬件部件的使用状况,当硬件故障发生时可以及时快速的通过有关手段给高可用性系统报警,根据故障情况决定处理方法,并且将故障情况写入到有关系统日志中,以备过后分析。
例如,公用网是对外提供服务的,在UNIX上就可以使用两块网卡实现公用网网卡级的容错,正在使用着的公用网网卡出现故障,高可用性软件可以切换到备用网卡,而不是简单的进行整机系统的切换。这种功能在高可用性中叫做LocalFailOver。
软件故障的监测和恢复
计算机系统中的软件分为系统软件和应用软件两大类,系统运行的稳定与否与软件系统的正常工作密切相关,高可用性系统中使用最为广泛的应用是对数据库的高可用性,数据库使用需要系统卷、IP地址、主机名、文件共享以及有关的数据库服务,高可用性系统必须能够对这些软件资源进行监控,如果相关资源出现故障情况,总是先重新启动几次,如果故障不能消除就必须进行系统切换了,主服务器将所有有关资源释放出来,从服务器将所有资源接管过来,恢复系统的正常运行,同时将故障情况写入系统相关日志中。
网友评论