长时间断电,可造成系统数据的丢失或者出错,而且在再次通电时,还可能造成系统的“恢复时间”延长,UPS可以保护系统免受电源问题的损害。
1 长时间断电,可造成系统数据的丢失或者出错,而且在再次通电时,还可能造成系统的“恢复时间”延长,UPS可以保护系统免受电源问题的损害。
前几次拜访时,张宾和胡教授主要谈论的是数据中心和网络机房的制冷系统,并介绍了制冷设备的最佳选择。这一次,胡教授将为张宾介绍和讲解如何防治长时间断电时数据丢失或出错,并介绍了确保计算机正常运行的最佳方案。
胡教授:长时间电源断电随时都可能发生,并会妨碍到无保护的计算机启动其必需的关机程序。突然关机会导致数据丢失或损坏,造成电力恢复后计算机的恢复时间增长。
张宾:为何会导致长时间断电?又该如何去防止这种情况发生后数据的丢失和出错呢?
胡教授:导致长时间断电的原因有很多,譬如,由于闪电使得当地的变压器出了故障,或者整个地区的电网断了。此时,必须采取某些措施来保护计算机系统以及存储在计算机中的数据,以防止它们受到“硬”关机的损害。
在发生长时间断电时,造成数据丢失或出错的一个可能的原因是应用程序或操作系统在处理数据时被异常中止了。这不仅会给文档、关键的文件系统结构(如文件分配表)或动态应用程序数据造成影响,而且,还可能使系统的“恢复时间”延长。
不间断电源 (UPS) 可以保护系统免受电源问题的损害,而且,它允许用户在短时间断电期间仍可以继续工作,从而提高了服务器的可用性。断电时间超出UPS运行时间的任何断电事故,我们称之为“长时间断电”,在此期间,如果系统安装了 UPS关机软件,则系统可以在UPS 电池耗尽之前,与UPS进行通信并自动执行顺序关机过程。
张宾:我知道UPS的关机软件有几种配置,请您给我具体介绍一下。
胡教授:UPS软件推荐的配置有以下三种:
配置1:采用单个UPS保护单台计算机
在该配置中,每台计算机由自己的UPS保护,UPS通过串行电缆或USB电缆与计算机进行通信。计算机上安装有UPS软件,以备长时间断电时计算机能自动顺序关机。该配置中,UPS由与之相连的计算机管理。这是最简单的配置方案,广泛用于服务器和工作站部署中。
配置2:采用单个UPS保护两至三台计算机
在该配置中,多台计算机与一个较大的UPS(通常额定功率为1500VA或更高)相连。其中,一台计算机直接连接到UPS的串口,其他两台则连接到UPS中安装的串口扩展卡上,该串口扩展卡提供有两个串口。2
配置3:采用单个 UPS 保护三台或更多计算机
在该配置中,三台计算机都具备顺序关机能力,不过UPS是由与之直接相连的那台计算机进行管理的。请注意,由于USB标准只支持与单个系统通信,因此该配置无法使用USB连接。虽然可以通过菊花链将此方案扩展至保护24台计算机,不过,由于需要更多的电缆,所以并不建议采用这种方法。
一种日渐流行的方式是直接通过以太网管理UPS。UPS上安装有网络管理卡(包含实时操作系统和硬件看门狗芯片),因而不需要服务器对其进行管理。美国APC公司的英飞集成系统 (InfraStruXure)即采用了此配置方法。在该配置中,由于UPS自身内置了管理功能,因此,计算机上安装的软件只需包含关机功能即可。
胡教授:以下我来介绍几个确保计算机正常运行的最佳方案。
张宾:您能否应用一些数据或例子来讲解呢?
胡教授:好的。
购买具有长时间运行能力的UPS和/或购买发电机
有关交流电源可靠性的标准化数据并不太多。在美国,调查数据与APC公司的经验充分吻合,从中可得出以下基本数据:
一个典型的现场环境每年足以引发IT系统故障的平均断电次数大约为15次:
90%的断电持续时间不超过5分钟;99%的断电持续时间不超过1小时;总的累计断电持续时间每年大约为100分钟
这些数据因现场环境的不同差别很大,而且在美国的某些地区,断电率比平均值高出一个数量级。建筑问题也可能使断电率提高3个数量级。由于有10%的断电持续时间超过5分钟,1%的断电持续时间超过1小时,因此,如果停机成本很高的话,应当考虑购买具备长时间运行能力的UPS和/或购买发电机。
采用UPS保护网络设备
只有在网络正常的情况下,才能使用通过网络访问的应用程序。对集线器、路由器和交换机进行电源保护对于确保应用程序的可用性是必不可少的,但这一点经常会被忽略。此外,如果计算机运行的是以上配置3中的UPS关机软件,那么,在断电期间,UPS关机软件需要网络畅通才能正确通信。如果不对网络进行保护,则计算机的顺序关机功能将无法实现。
分别考虑每台服务器的关机时间要求
正常关闭操作系统所需的时间因系统而异,例如,某些包含大量账户的邮件服务器至少需要20分钟才能关机。在设置UPS软件时,应充分考虑每台计算机的特定要求并进行正确设置。
作者:董丽凤
网友评论