随着数据中心日益成为企业的业务核心,人们对数据中心可靠性的要求也越来越来高。但是数据中心的设计并不是简单地进行基础设施冗余。数据中心的高层管理人员更加关注数据中心的可靠性和安全性,因此数据中心的设计比以往任何时候都更为重要,特别是满足特定的公司需求的时候。
在实际工作中,提高可靠性并不需要更多的冗余配置,也没有超出预算的必要。莫里森•赫什菲尔德工程公司关键业务总监史蒂芬•夏皮罗,曾经参与很多的数据中心项目建设,他表示企业数据中心的性能要达到预期,还要在冗余设计时进行调整。
最近在美国马里兰州国家港口召开的数据中心世界会议上,夏皮罗做了如何从可用性角度看待数据中心设计决策的演讲报告。以下是他演讲报告中一些亮点:
(1)更多的冗余并不意味着更高的可靠性
夏皮罗表示,重要的不仅仅是数据中心设计,尽可能多满足it设备应用程序的实际需求也很重要,更多的基础设施冗余并不会自动使系统更加可靠。事实上,在冗余组件增加一个点都会降低可靠性,因为这使系统变得更加复杂,更加难以管理。
(2)tieriv数据中心的成本是tierii数据中心的两倍
数据中心基础设施的可靠性水平必须匹配数据中心支持的应用程序需求。人们都希望设计和建设最可靠的数据中心,虽然客户为此可以负担高昂费用,但这种做法并不明智,特别是考虑到冗余的成本。
夏皮罗表示,引用数据中心设施咨询机构uptimeinstitute的调查,tieri级数据中心和tierii级数据中心的成本与tieriii和tieriv级数据中心的成本相比,之间差异很小。而数据中心的设计从tierii级到tieriii级,其费用增幅巨大:几乎是100%。以同样拥有15000平方英尺空间的数据中心为例,tieri级数据中心的ups电源每千瓦成本为10000美元,tierii数据中心的ups电源每千瓦的成本为11000美元。tieriii数据中心的ups电源成本为20000美元,tieriv级的ups电源成本为22000美元。可以看到,tieriii数据中心电源成本是tieri级数据中心的一倍。
(3)2(n+1)冗余配置ups系统并不比2n冗余ups系统更加可靠
更多的冗余并不意味着更高的可靠性,夏皮罗说,2(n+1)ups冗余配置的设计并不比2nups冗余配置更加可靠。夏皮罗表示,对于一个系统来说,2n冗余ups系统故障的概率与2(n+1)冗余ups系统故障概率基本相同。
(4)2n冗余发电机配置比n+1冗余发电机配置更加可靠
夏皮罗表示,2(n+1)发电机冗余系统的配置与n+1发电机冗余系统配置的差异很小。而2(n+1)冗余的ups系统中,具备双路供电配置,一个备用电源转换开关,以及双路it设备。n+1的ups冗余系统的失效概率2.94%,2nups冗余系统的失效概率约为1.5%,二者的失效概率相差4.41%。
即使在uptimeinstitute的评级系统中的最高级别tieriv数据中心,同样也不需要多余的发电机。tieriv数据中心只是要求必须有一台发电机连续运行,即使在维修过程中。夏皮罗说,所有主要的发电机制造商都很容易满足这个需求,
tieriii和tieriv级数据中心也要求这么做,但是,发电站冗余电源和燃料供应基础设施需要同时维护和容错。
(5)8小时运行发电机故障率为15%
发电机冗余很重要,因为发电机并不可靠。即使一台发电机启动成功,其it设备可以采用这台发电机的电力,但很难确保不发生意外,因为当数据中心断电事故发生时,发电机必须运行较长时间。
纽约遭遇了飓风桑迪袭击,这对于长时间运行的发电机的可靠性进行了一次罕见的测试,很多发电机在这个测试中失败。莫里森•赫什菲尔德工程公司的许多客户数据中心设施在电力中断之后转换到发电机供电。夏皮罗说。数据中心电力的故障发生的原因不尽相同,甚至出现了由于发电机组燃料箱底部积累的杂质并没有过滤掉,导致发电机最终失效的情况。
他援引爱达荷国家工程实验室的一项研究发现,15%的的柴油发电机在连续运行8小时后失效;1%的发电机24小时后失效;5%的柴油发电机半小时后失效;2%的柴油发没有启动。
(6)数据中心tier的级别不会决定可靠性
虽然uptimeinstitute定义了数据中心基础设施设计可靠性的级别,但影响数据中心设计可靠性的因素很多。其中包括数据中心的选址,施工建设的质量,设备的质量,设备的调试过程,数据中心的运行年限、数据中心维护与管理、人员培训、维修方法,以及人员技术水平等。