admin 管理员组

文章数量: 887021


2024年4月12日发(作者:客户信息采集软件)

8.1 容灾技术

忽视数据备份,没有容灾能力将会给企业或组织带来巨大的损失,据统计资料显示,当

受到数据灾难袭击的时候,30%受影响的公司被迫立即退出市场,另外有29%受影响的公司

会在两年内倒闭。所以当各种无法预知的事故或灾难导致重要的数据丢失时,能够及时采取

灾难恢复措施,可以将企业或组织的损失降低到最低。

8.1.1 容灾技术概述

据统计资料显示,2000年以前的10年间发生过灾难的公司中,有55%当时倒闭,剩下

的45%中,因为数据丢失,有29%也在两年之内倒闭,生存下来的仅占16%。在1993年发

生的美国世贸中心大楼爆炸事件,爆炸前,约有350家企业在该楼中工作,一年后,再回到

世贸大楼的公司变成了150家,有200家企业由于无法存取原有重要的信息而倒闭。2003

年,国内某电信运营商的计费存储系统发生两个小时的故障,造成400多万元的损失,这些

还不包括导致的无形资产损失。另外,大家熟悉的“9.11”事件带来的损失更是巨大,还有

许多举不胜举且触目惊心的例子,每一次都是惨痛的教训。由此可见,尽管小心谨慎,还是

不可避免地会发生各种各样的灾难。

1.容灾的定义

容灾是一个范畴很广泛的概念,是一个系统工程,包括支持用户业务的方方面面,可以

将所有与业务连续性相关的内容都纳入到容灾中。对于IT而言,容灾提供一个能防止用户

业务系统遭受各种灾难破坏的计算机系统。容灾主要表现为一种未雨绸缪的主动性,而不是

在灾难发生后的亡羊补牢。

容灾是指在发生灾难性事故时,能够利用已备份的数据或其他手段,及时对原系统进行

恢复,以保证数据的安全性以及业务的连续性。

从技术上看,衡量容灾系统有两个主要指标:RPO和RTO。

RPO(Recovery Point Object):即数据恢复点目标,主要是指当灾难发生时业务系统所

能容忍的数据丢失量。

RTO(Recovery Time Object):即数据恢复时间目标,主要是指所能容忍的业务停止服

务的最长时间,即从灾难发生到业务系统恢复服务功能所需要的最短时间周期。

RPO针对的是数据丢失,而RTO针对的是服务丢失,二者没有必然的关联性。RTO和

RPO的确定必须在进行风险分析和业务影响分析后,根据不同的业务需求确定。对于不同

企业的同一种业务,RTO和RPO的需求也会有所不同。RPO与RTO越小,系统的可用性

就越高,当然需要的投资也越大。

2.导致系统灾难原因

从广义上讲,对于一个计算机系统而言,一切引起系统非正常停机的事件都称之为灾难。

威胁数据的安全,造成系统失效的主要原因有以下几个方面。

(1)硬件故障。主要的硬件故障包括I/O和硬盘损坏、电源(包括电缆、插座)以及网

络故障等,如果是安装系统的磁盘故障,则还必须重建系统。

(2)人为错误。最容易忽略的故障原因,包括误操作、人为蓄意破坏,如对一些关键

系统配置文件的不当操作,或者人为删除一个文件或格式化一个磁盘,会导致系统不能正常

启动。另外还有黑客的攻击,黑客侵入计算机系统,并且破坏计算机系统。

(3)软件故障。最为复杂和多样化的故障原因,如系统参数设置不当或者由于应用程

序没有优化,造成运行时系统资源不合理分配或数据库参数设置不当等,都有可能导致系统

性能下降,甚至停机。

(4)病毒影响。病毒使计算机系统感染,损坏计算机数据,需要及早预防病毒的攻击。

(5)自然灾难。包括地震、台风、水灾、雷电、火灾等会无情地毁灭计算机系统,这种

灾难破坏性很大,影响面比较广。

灾难发生后,恢复的一般步骤如下。

第1步:恢复硬件。

第2步:重新装入操作系统。

第3步:设置操作系统(驱动程序设置、系统、用户设置)。

第4步:重新装入应用程序,进行系统设置。

第5步:用最新的备份恢复系统数据。

3.容灾的级别

容灾可以分为3个级别:数据级别、应用级别和业务级别。

(1)数据级容灾。

数据级容灾关注点在于数据,需要确保用户数据的完整性、可靠性、安全性和一致性,

即灾难发生后可以确保用户原有的数据不会丢失或者遭到破坏。数据级容灾较为基础,其中,

较低级别的数据容灾方案仅需利用磁带库和管理软件就能实现数据异地备份,达到容灾的功

效;而较高级的数据容灾方案则是依靠数据复制工具,例如卷复制软件,或者存储系统的硬

件控制器,实现数据的远程复制。

数据级容灾是保障数据可用的最后底线,当数据丢失时能够保证应用系统可以重新得到

所有数据。从这种意义上讲,数据备份属于该级别容灾,用户把重要的数据存放在磁带上,

如果考虑到高级别的安全性还可以把磁带运送到远距离的地方保存,当灾难发生后,从磁带

中获取数据。该级别灾难恢复时间较长,仍然存在风险,尽管用户原有数据没有丢失,但是

对于提供实时服务的信息系统,应用会被中断,用户业务也被迫停止。

(2)应用级容灾。应用级容灾在数据级容灾的基础上,把执行应用处理能力复制一份,

即在备份站点同样构建一套应用系统,在保证用户数据的完整性、可靠性、安全性和一致性

的前提下,提供不间断的应用服务,让客户的应用服务请求能够透明地继续运行,而感受不

到灾难的发生,保证整个信息系统提供的服务完整、可靠、安全和一致。一般来说,应用级

容灾系统需要通过更多软件来实现,它可以使企业的多种应用在灾难发生时进行快速切换,

确保业务的连续性。应用级容灾比数据级容灾要求更高。

(3)业务级别。

数据级容灾和应用级容灾都是在IT范畴之内,然而对于正常业务而言,仅IT系统的保

障还是不够的。有些用户需要构建最高级别的业务级别容灾。

业务级容灾的大部分内容是非IT系统,比如电话、办公地点等。当一场大的灾难发生

时,用户原有的办公场所都会受到破坏,用户除了需要原有的数据、原有的应用系统,更需

要工作人员在一个备份的工作场所能够正常地开展业务。

4.容灾系统

由于容灾所承担的是用户最关键的核心业务,其发挥的作用异常重要,容灾本身的复杂

性也是十分明显,这些决定了容灾是一项系统工程。

容灾首先涉及众多技术及众多厂商的各类解决方案。性能、灵活性及价格都是必须考虑

的因素,更重要的是,用户需要根据自己的实际需求量身打造。许多用户的生产站点都是经

过长期积累、多次改造后形成的,对于特殊的应用还采用特定的设备。那么当用户考虑构建

容灾站点时就必须把所有的情况都考虑进来,构建容灾方案的一条基本准则是“选择适合自

己的”。与此同时用户还要考虑长远一些,尽量采用先进而不是将要淘汰的技术,毕竟冗余


本文标签: 数据 系统 用户 灾难 容灾