由于云计算和虚拟化等新技术的到来,数据中心的演进可能会把它自身变成一个非常不同的环境。然而,任何运作平稳且成功的数据中心总是需要一些基本要素的。
由于云计算和虚拟化等新技术的到来,数据中心的演进可能会把它自身变成一个非常不同的环境。然而,任何运作平稳且成功的数据中心总是需要一些基本要素的。不管数据中心的规模是像一个立式式衣柜还是一架飞机,甚至是传言中谷歌正在搭建游艇式数据中心,这些要素都是非常关键的。
1、环境控制
标准化、可预测的环境是任何高质量数据中心的基石。这不仅仅是关乎让设备冷却、维持适当的湿度(根据维基百科,推荐的温度范围是61-75华氏度/16-24摄氏度,40%-55%的湿度),你还需要考虑灭火、空气气流以及功率分配等因素。我曾经工作过的一家公司为了确保数据中心尽可能一尘不染,要求机房内不能存放任何纸板箱。这么做是因为纸板颗粒可能会进入气流中,潜在地污染服务器,因为分布机制是将冷空气送到机架前端。这个例子可能有些极端,但是说明了这一点的重要性。
2、安全性
不用说(但不管怎样我还是会说),物理安全是一个可靠的数据中心的基础。让你的系统处于严密的开启关闭状态,仅允许那些获得授权的人员进入,在配合只允许对服务器、应用和网络中传输的数据进行的必要访问。可以肯定地说,任何企业最有价值的资产都是在数据中心里。三流的小偷会偷笔记本电脑或者手机。职业偷盗者会把目光锁定数据中心。门锁是可以被攻克的,所以我建议同时使用警报器。当然,警报器也可能失效,所以想想你的下一步措施:把服务器机架也锁上?为你的安全系统配备备用电源?雇佣保安?这取决于你的安全需求,但是要记住,“安全是一段旅程,而不是终点。”
3、问责
作为一名系统管理员来说,我可以证明大多数IT人都是专业且值得信赖的。但是,我并不否认需要在数据中心方面有一定的问责制度来追踪其行为。数据中心应该记录通过准入访问的登录信息(而且我建议这些日志由IT部门之外的部门管理,例如安全部门,或者这些信息的副本保存在IT总监和副总裁等多人手中)。访客应该登录或者登出,任何时候都保持在监督的情况下。应该开启对网络、应用、文件资源的审查。最后,每个系统都应该有一个确定的负责人,不管是服务器、路由器、数据中心冷却器还是报警系统。
4、策略
每一个涉及数据中心的流程背后都应该有它的一套策略,以确保环境维护和管理。你需要系统访问和使用的策略(例如,只有数据库管理员可以完全控制SQL服务器)。你还应该有数据保留的策略——你保存备份多长时间?你是离站保存这些备份吗?如果这些备份内容过期的话怎么办?同样的道理也适用于安装新系统,检查过时的设备或者服务,以及拆除旧设备——例如,擦除服务器硬盘,捐赠或者回收硬件。
5、冗余
我拥有的第一辆车是一辆蓝色福特Pinto。当时它花了我父母400美元,油费是每加仑1美元,我开着它到处走。它有一个备用轮胎经常能派上用场。我说这件事并不是为了怀旧,而是为提出一个观点:即使我的老爷车也具备一定的冗余性。你的数据中心应该是更尖端、更昂贵以及非常关键的,因此你需要的不仅仅是一个“备用轮胎”来确保它的健康运行。你企业需要保持运转的一切事情都应该至少保存两份,不管是邮件服务器、ISP、数据光纤链路还是VOIP电话系统虚拟机。三份或者更多在很多情况下也不会有坏处的!
不仅仅是冗余组件很重要,测试和确保其稳定工作的流程也很重要——例如定期进行故障演练,研究新的方法等。
6、监控
监控所有系统的正常运行时间和监控状况,将带来巨大的正面价值,但这只是开始。你还需要监控带宽使用了多少,以及电力、存储、物理机架空间,以及其他数据中心作为一种“商品”提供的任何东西。
还有像Nagios这样的免费工具监控一些基本细节,更复杂的解决方案如Dranetz测量功率。流程中还包括停电或者低阀值警报——以确保给你的警报上个保险,这样就可以是独立于数据中心的(例如,如果你的电子邮件服务器是在一个VMWare ESX主机上,而这个主机发生故障,那么另一个系统应该监控到这个情况,能够及时发出通知)。
7、可扩展性
所以,今天你的公司需要25台服务器用于包括虚拟化、冗余性、文件服务器、电子邮件、数据库和分析等一系列任务?那么你下个月、明年或者下个十年需要的是什么?确保你有适当规模的数据中心,足够扩展的容量以增加电力、网络、物理空间和存储。如果你的数据中心需求不断增长——如果你的公司是盈利的,那么一定会出现这种情况——那么今天就开始做规划吧。
为可扩展性规划并不是唯一一件事,这是一个持续的过程。明智的企业会积极地追踪和报告这个理念。我在这些报告中看到了一些参考,其中谈到了必须尽快填补关键领域可扩展性中存在的差距。
8、变更管理
你可能会说,变更管理应该归在“策略”一项下,不过我会说这既是一项策略,也是一种理念。适当变更管理的准则会确保你那个尚未规划、讨论和商定提供故障措施或者B计划的数据中心不会发生任何问题。不管是引入新系统还是淘汰旧系统,你数据中心所有组件的生命周期都应该与变更管理的前景相符合。
9、布置
我认识的所有IT专业人员无不是时间紧迫的。部署新系统可能结果是由于痛苦的最后期限而砍掉了一些细节——这些细节似乎总是包括一些让环境整洁漂亮的东西。
成功的系统实施并不仅仅意味着接入并开启,还包括通过标准化和可支持的方法把设备集成到数据中心内。你的服务器机架应该是干净的、摆放有序的(生产系统在一个机架,测试系统在另一个机架)。线缆长度适中,遵循布线指南而不是随意地铺设。
10、文档记录
最后一点是适当的、有益的、及时的文档记录——如果你不严格遵循程序的话,你可能在实施过程中忽略这一点。只是罗列一堆关于交换机部署以及服务器接入的图表还不够,你的变更管理指南准则要求文档记录应该是具有相关性的,所有细节涉及到的人员都应该能够获得。
也许听上去有些变态,但是我一直坚守“被车撞”的规则。如果我明天被一辆车撞到,大家不用担心我的工作文档或者个人文档是否更新了,因为我每周都会确保所有变更和调整都被相应地记录下来。不夸张地说,如果我决定换工作地话,我不会花两个星期的时间在系统保存上。
全部细节
这些理念的好处在于它们是与硬件或者软件完全无关的。无论你的数据中心包含运行Linux、Windows还是其他操作系统的服务器,还是仅仅是网络交换机和大型机的集合,希望这些对于你和你的企业都是有用的。
将所有这些结合到一起,把你的IT环境想象成一个车轮,数据中心是枢纽,这10个要素就是周边的“轮胎”。
网友评论