admin 管理员组

文章数量: 887021


2023年12月17日发(作者:恶组词)

高效数据中心十大关键要素

胡经国

本文作者的话

本文是根据有关文献和资料编写的《漫话云计算》系列文稿之一。现作为云计算学习笔录,奉献给云计算业外读者,作为进一步学习和研究的参考。希望能够得到大家的指教和喜欢!

下面是正文

云计算和虚拟化等新技术的出现,使得数据中心演变成一个迥然不同的环境。然而,任何数据中心都需要某些关键要素来保证其顺利地高效运作。无论数据中心只有更衣柜那么大,还是大如飞机场,或者甚至是传言在浮动驳船上建立的数据中心,以下十大关键要素都是不可或缺的。

一、环境控制

一个标准化的、可预测的环境是任何高质量数据中心的基础。

这不仅仅是冷却和保持适当的湿度;维基百科推荐的温度范围是61~75华氏度/ 16~24摄氏度,湿度为40% ~ 55%。而且,还必须考虑到消防、气流和功率分布等因素。

例如,有一家公司很认真地确保其数据中心尽可能地保持纯净,任何纸箱都不能存储在那个房间。这是因为,把冷空气引到前部机架的分布机制,会让纸板粒子进入气流,可能会污染服务器。这样做可能有点极端,但是它却说明了这一观念的重要性。

二、安全

物理安全是一个可靠数据中心的基础。保证安全是一个长期过程。

要妥善保护你的系统,只允许授权人员进入;并手持准许证通过网络对服务器、应用程序和数据进行必要的访问。

任何公司最有价值的资产(当然除了人)都存在于数据中心。三流小偷的目标是笔记本电脑或个人手机;而专业小偷则将目标锁定在数据中心。门锁可以被撬开,因此建议不如使用警报。

当然,警报也可能没有用。所以想想下一个方法:是锁住服务器机架,还为安全系统准备备用电源,还是雇佣保安?这取决于数据中心的安全需求。

三、问责制

应该说,大多数IT人员都是专业的和值得信赖的。然而,这并不能否定数据中心需要问责制来追踪人机的互动。

数据中心应该记录证件准入的细节(并且这些记录应该由IT以外的部门保

1

管,如安全部门,或者副本同时保存在IT主管和副总裁的手中)。访客应该在进入和离开时登记,并一直被监视着。应该开启网络/应用程序/文件资源的审计工作。最后,同样重要的是,每个系统都应该有一个确定的人掌管,无论它是一个服务器、路由器、数据中心冷却装置,还是警报系统。

四、策略

数据中心中的每一个过程背后,都应该有一个策略方针,以帮助维护和管理环境。

需要系统访问和使用策略(例如,只有数据库管理员能完全控制数据库)。应该有数据保留策略:备份应该被存储多长时间?要将它们保存在厂区外吗?如果这样的话,什么时候到期呢?同样的理念,也适用于新系统的安装,检查过时的设备/服务,删除旧设备。

五、冗余

正如旧汽车也需要备用轮胎一样,数据中心也许更新、更贵,并且非常重要,因此需要的不仅仅是备用一个轮胎来确保它保持高效运作。

对于企业赖以生存的一切,都至少需要两个备份,这无论是对于邮件服务器、ISP、数据光纤链接,还是对于VOIP语音电话系统都适用。三个或三个以上的备份,在很多情况下都不会有坏处。

除了冗余组件,测试及确保系统正常工作的过程也同样重要,比如定期的故障转移训练和新方法的研究。

六、监控

监控系统的正常运行时间和健康状况具有前瞻性的价值,但是这仅仅是开始。还需要监控使用了多少带宽、能源、存储、物理存储空间,及其它任何由数据中心提供的“商品”。Nagios等免费的工具,可以进行基本的监控。Dranetz可以完成功率测量等更复杂的解决方案。

运行中断或低阈值造成的警报,是监控的一部分。确保为你的警报布置一个失效保护,使它们能独立于数据中心(例如,若VMWare ESX主机上的电子邮件服务器发生了故障,则另一个系统要能够进行监控,并能够发出通知)。

七、可扩展性

如果公司现在需要25台服务器来完成包括虚拟化、冗余、文件服务、电子邮件、数据库和分析等在内的一系列任务,那么下个月、明年,或者是下一个10年,又将需要什么呢?必须确保数据中心具有足够的扩展性,以便增加电力、网络、物理空间和存储。

可扩展性的规划不是静止的东西,而是一个持续的过程。明智的公司对其积极地跟踪和报告。这些报告能指出可扩展性需要满足的下一个地方,比如物理存储空间匮乏。

八、变更管理

你也许认为,变更管理属于“策略方针”部分。然而,这既是策略又是哲

2

学。恰当地变更管理指导方针,能确保数据中心不出现计划外的事件。无论是上线新系统还是撤销旧系统,数据中心中所有元素的生命周期,都必须与变更管理的规划一致。

九、有条不紊

每一个IT专业人士都感觉时间紧迫。由于怕错过最后期限,可能导致一些“抄近路”行为。一旦如此,往往难以保证环境又好又整洁。

一个成功系统的实现,并不仅仅意味着装上它,然后打开。它还包括:以标准化和可技术支持的方法,对数据中心进行设备整合。

服务器机架应该是干净而符合逻辑的(生产系统在一个架子上,测试系统在另一个架子上)。电缆应该长度适中,根据电缆运行指南运作,而不是随意地折叠。

十、文档

最后一点是,需要有合适的、有用的和及时的记录。如果不遵循严格的程序,在实施中很容易产生问题。把交换机布局和服务器插头的位置匆匆拼凑成图表是不够的。变更管理指导方针,应该包括保存相关的文档,并且随着细节的补充可用于所有的相关人员。

这并不是危言耸听,而是以“车祸”原则为指导的。假设明天我被车撞,那么要让其他人至少不用担心:我的工作或个人文档是否是最新的。因为,我每周花时间来确保所有的变更和调整都有相应的记录。

更夸张的是,如果我决定换工作,我不用再花两个星期狂乱地记录我对系统所做的一切。

综上所述,这些关键要素或方法的伟大之处,在于它们完全不依赖硬件/软件就能够确保数据中心高效运作。无论数据中心服务器运行的是Linux、Windows或其他操作系统,还是只是一个网络交换机和主机的集合,这些对数据中心和企业高效顺利运作都是有所帮助的。

2017年8月29日编写于重庆

2019年6月24日修改于重庆

3


本文标签: 数据中心 系统 应该 服务器 需要