admin 管理员组

文章数量: 887629


2024年3月6日发(作者:钢材z向性能要求)

DAS、NAS、SAN存储系统完全分析

DAS、NAS、SAN存储系统完全分析

目前磁盘存储市场上,存储分类(如下表一)根据服务器类型分为:封闭系统的存储和开放系统的存储,封闭系统主要指大型机,AS400等服务器,开放系统指基于包括Windows、UNIX、Linux等操作系统的服务器;开放系统的存储分为:内置存储和外挂存储;

开放系统的外挂存储根据连接的方式分为:直连式存储(Direct-Attached Storage,简称DAS)和网络化存储(Fabric-Attached Storage,简称FAS);开放系统的网络化存储根据传输协议又分为:网络接入存储(Network-Attached Storage,简称NAS)和存储区域网络(Storage Area Network,简称SAN)。由于目前绝大部分用户采用的是开放系统,其外挂存储占有目前磁盘存储市场的70%以上,因此本文主要针对开放系统的外挂存储进行论述说明。

表一

今天的存储解决方案主要为:直连式存储(DAS)、存储区域网络(SAN)、网络接入存储(NAS)。如下表二:

Page 1 of 16

DAS、NAS、SAN存储系统完全分析

表二

开放系统的直连式存储(Direct-Attached Storage,简称DAS)已经有近四十年的使用历史,随着用户数据的不断增长,尤其是数百GB以上时,其在备份、恢复、扩展、灾备等方面的问题变得日益困扰系统管理员。

直连式存储依赖服务器主机操作系统进行数据的IO读写和存储维护管理,数据备份和恢复要求占用服务器主机资源(包括CPU、系统IO等),数据流需要回流主机再到服务器连接着的磁带机(库),数据备份通常占用服务器主机资源20-30%,因此许多企业用户的日常数据备份常常在深夜或业务系统不繁忙时进行,以免影响正常业务系统的运行。直连式存储的数据量越大,备份和恢复的时间就越长,对服务器硬件的依赖性和影响就越大。

直连式存储与服务器主机之间的连接通道通常采用SCSI连接,带宽为10MB/s、20MB/s、40MB/s、80MB/s等,随着服务器CPU的处理能力越来越强,存储硬盘空间越来越大,阵列的硬盘数量越来越多,SCSI通道将会成为IO瓶颈;服务器主机SCSI ID资源有限,能够建立的SCSI通道连接有限。

无论直连式存储还是服务器主机的扩展,从一台服务器扩展为多台服务器组成的群集(Cluster),或存储阵列容量的扩展,都会造成业务系统的停机,从而给企业带来经济损失,对于银行、电信、传媒等行业7×24小时服务的关键业务系统,这是不可接受的。并且直连式存储或服务器主机的升级扩展,只能由原设备厂商提供,往往受原设备厂商限制。

存储区域网络(Storage Area Network,简称SAN)采用光纤通道(Fibre Channel)技术,通过光纤通道交换机连接存储阵列和服务器主机,建立专用于数据存储的区域网络。SAN经Page 2 of 16

DAS、NAS、SAN存储系统完全分析

过十多年历史的发展,已经相当成熟,成为业界的事实标准(但各个厂商的光纤交换技术不完全相同,其服务器和SAN存储有兼容性的要求)。SAN存储采用的带宽从100MB/s、200MB/s,发展到目前的1Gbps、2Gbps。

网络接入存储(Network-Attached Storage,简称NAS)采用网络(TCP/IP、ATM、FDDI)技术,通过网络交换机连接存储系统和服务器主机,建立专用于数据存储的存储私网。随着IP网络技术的发展,网络接入存储(NAS)技术发生质的飞跃。

早期80年代末到90年代初的10Mbps带宽,网络接入存储作为文件服务器存储,性能受带宽影响;后来快速以太网(100Mbps)、VLAN虚网、Trunk(Ethernet Channel) 以太网通道的出现,网络接入存储的读写性能得到改善;1998年千兆以太网(1000Mbps)的出现和投入商用,为网络接入存储(NAS)带来质的变化和市场广泛认可。

由于网络接入存储采用TCP/IP网络进行数据交换,TCP/IP是IT业界的标准协议,不同厂商的产品(服务器、交换机、NAS存储)只要满足协议标准就能够实现互连互通,无兼容性的要求;并且2002年万兆以太网(10000Mbps)的出现和投入商用,存储网络带宽将大大提高NAS存储的性能。NAS需求旺盛已经成为事实。首先NAS几乎继承了磁盘列阵的所有优点,可以将设备通过标准的网络拓扑结构连接,摆脱了服务器和异构化构架的桎梏;

其次,在企业数据量飞速膨胀中,SAN、大型磁带库、磁盘柜等产品虽然都是很好的存储解决方案,但他们那高贵的身份和复杂的操作是资金和技术实力有限的中小企业无论如何也不能接受的。NAS正是满足这种需求的产品,在解决足够的存储和扩展空间的同时,还提供极高的性价比。因此,无论是从适用性还是TCO的角度来说,NAS自然成为多数企业,尤其是大中小企业的最佳选择。

针对I/O是整个网络系统效率低下的瓶颈问题,专家们提出了许多种解决办法。其中抓住症结并经过实践检验为最有效的办法是:将数据从通用的应用服务器中分离出来以简化存储管理。

问题:

由图1可知原来存在的问题:每个新的应用服务器都要有它自己的存储器。这样造成数据处理复杂,随着应用服务器的不断增加,网络系统效率会急剧下降。

Page 3 of 16

DAS、NAS、SAN存储系统完全分析

图一

解决办法:

从图2可看出:将存储器从应用服务器中分离出来,进行集中管理。这就是所说的存储网络(Storage Networks)。

图二

使用存储网络的好处:

统一性:形散神不散,在逻辑上是完全一体的。

实现数据集中管理,因为它们才是企业真正的命脉。

容易扩充,即收缩性很强。

具有容错功能,整个网络无单点故障。

Page 4 of 16

DAS、NAS、SAN存储系统完全分析

专家们针对这一办法又采取了两种不同的实现手段,即NAS(Network Attached Storage)网络接入存储和SAN(Storage Area Networks)存储区域网络。

NAS:用户通过TCP/IP协议访问数据,采用业界标准文件共享协议如:NFS、HTTP、CIFS实现共享。

SAN:通过专用光纤通道交换机访问数据,采用SCSI、FC-AL接口。

什么是NAS和SAN的根本不同点?

NAS和SAN最本质的不同就是文件管理系统在哪里。如图:

图3

由图3可以看出,SAN结构中,文件管理系统(FS)还是分别在每一个应用服务器上;而NAS则是每个应用服务器通过网络共享协议(如:NFS、CIFS)使用同一个文件管理系统。换句话说:NAS和SAN存储系统的区别是NAS有自己的文件系统管理。

NAS是将目光集中在应用、用户和文件以及它们共享的数据上。SAN是将目光集中在磁盘、磁带以及联接它们的可靠的基础结构。将来从桌面系统到数据集中管理到存储设备的全面解决方案将是NAS加SAN

DAS、NAS、SAN、ISCSI比较

一、直接附加存储(DAS)

直接附加存储是指将存储设备通过SCSI接口直接连接到一台服务器上使用。DAS购置成本低,配置简单,使用过程和使用本机硬盘并无太大差别,对于服务器的要求仅仅是一个外接的SCSI口,因此对于小型企业很有吸引力。但是DAS也存在诸多问题:

1.服务器本身容易成为系统瓶颈;

2.服务器发生故障,数据不可访问;

3.对于存在多个服务器的系统来说,设备分散,不便管理。同时多台服务器使用DAS时,存储空间不能在服务器之间动态分配,可能造成相当的资源浪费;

4.数据备份操作复杂。

Page 5 of 16

DAS、NAS、SAN存储系统完全分析

二、网络附加存储(NAS)

NAS实际是一种带有瘦服务器的存储设备。这个瘦服务器实际是一台网络文件服务器。NAS设备直接连接到TCP/IP网络上,网络服务器通过TCP/IP网络存取管理数据。NAS作为一种瘦服务器系统,易于安装和部署,管理使用也很方便。同时由于可以允许客户机不通过服务器直接在NAS中存取数据,因此对服务器来说可以减少系统开销。NAS为异构平台使用统一存储系统提供了解决方案。由于NAS只需要在一个基本的磁盘阵列柜外增加一套瘦服务器系统,对硬件要求很低,软件成本也不高,甚至可以使用免费的LINUX解决方案,成本只比直接附加存储略高。NAS存在的主要问题是:

1.由于存储数据通过普通数据网络传输,因此易受网络上其它流量的影响。当网络上有其它大数据流量时会严重影响系统性能;

2.由于存储数据通过普通数据网络传输,因此容易产生数据泄漏等安全问题;

3.存储只能以文件方式访问,而不能像普通文件系统一样直接访问物理数据块,因此会在某些情况下严重影响系统效率,比如大型数据库就不能使用NAS.

三、存储区域网(SAN)

SAN实际是一种专门为存储建立的独立于TCP/IP网络之外的专用网络。目前一般的SAN提供2Gb/S到4Gb/S的传输数率,同时SAN网络独立于数据网络存在,因此存取速度很快,另外SAN一般采用高端的RAID阵列,使SAN的性能在几种专业网络存储技术中傲视群雄。SAN由于其基础是一个专用网络,因此扩展性很强,不管是在一个SAN系统中增加一定的存储空间还是增加几台使用存储空间的服务器都非常方便。通过SAN接口的磁带机,SAN系统可以方便高效的实现数据的集中备份。SAN作为一种新兴的存储方式,是未来存储技术的发展方向,但是,它也存在一些缺点:

1.价格昂贵。不论是SAN阵列柜还是SAN必须的光纤通道交换机价格都是十分昂贵的,就连服务器上使用的光通道卡的价格也是不容易被小型商业企业所接受的;

2.需要单独建立光纤网络,异地扩展比较困难;

四、iSCSI

使用专门的存储区域网成本很高,而利用普通的数据网来传输SCSI数据实现和SAN相似的功能可以大大的降低成本,同时提高系统的灵活性。iSCSI就是这样一种技术,它利用普通的TCP/IP网来传输本来用存储区域网来传输的SCSI数据块。iSCSI的成本相对SAN来说要低不少。随着千兆网的普及,万兆网也逐渐的进入主流,使iSCSI的速度相对SAN来说并没有太大的劣势。iSCSI目前存在的主要问题是:

1.新兴的技术,提供完整解决方案的厂商较少,对管理者技术要求高;

2.通过普通网卡存取iSCSI数据时,解码成SCSI需要CPU进行运算,增加了系统性能开销,如果采用专门的iSCSI网卡虽然可以减少系统性能开销,但会大大增加成本;

3.使用数据网络进行存取,存取速度冗余受网络运行状况的影响。

总结一下四种存储技术的区别

四种存储方式的区别(表)

描述

成本

数据传输速度

扩展性

DAS

基本无

NAS

较低

较低

SAN

极快

易于扩展

iSCSI

较高

较快

最易扩展

Page 6 of 16

DAS、NAS、SAN存储系统完全分析

服务器访问存储的方式

直接访问存储数据块

以文件的方式访问

直接访问存储数据块

直接访问存储数据块

服务器系统性能开销

安全性

是否集中管理存储

备份效率

网络传输协议

较低

较低

TCP/IP

Fibre Channel

较高

较高

TCP/IP

四种网络存储技术的主要区别

通过以上比较研究,四种网络存储技术方案各有优劣。对于小型且服务较为集中的商业企业,可采用简单的DAS方案。对于中小型商业企业,服务器数量比较少,有一定的数据集中管理要求,且没有大型数据库需求的可采用NAS方案。对于大中型商业企业,SAN和iSCSI是较好的选择。如果希望使用存储的服务器相对比较集中,且对系统性能要求极高,可考虑采用SAN方案;对于希望使用存储的服务器相对比较分散,又对性能要求不是很高的,可以考虑采用iSCSI方案

DAS、NAS、SAN、P2P等存储系统的体系结构

直接连接存储DAS

直接连接存储DAS(Direct Attached Storage)是对SCSI总线的进一步发展。它对外利用SCSI总线通道和多个主机连接,解决了SCSI卡只能连接到一个主机上的缺陷。对内利用SCSI总线通道或FC通道、IDE接口连接多个磁盘,并实现RAID技术,形成一个磁盘阵列,从而解决了数据容错、大存储空间的问题。

DAS是以服务器为中心的存储体系结构,难以满足现代存储应用大容量、高可靠、高可用、高性能、动态可扩展、易维护和开放性等多方面的需求。解决这一问题的关键是将访问模式从以服务器为中心转化为以数据和网络为中心,实现扩展容量、增加性能和延伸距离,尤其是实现多个主机数据的共享,这推动了存储与计算的分离,即网络存储的发展。

网络附属存储NAS

NAS(附网存储系统)系统是用一个装有优化的文件系统和瘦操作系统的专用数据存储服务器,提供跨平台的文件共享功能。NAS产品与客户之间的通讯采用NFS(Network File

System)协议、CIFS(Common Internet File System)协议,这些协议运行在IP之上。NAS的体系结构如图1所示。

Page 7 of 16

DAS、NAS、SAN存储系统完全分析

尽管NAS集成了系统、存储和网络技术,具有扩展性强、使用与管理简单、跨平台文件共享、性能优化等特点。然而,NAS系统也有其潜在的局限性。首先是它受限的数据库支持,NAS文件服务器不支持需大量依赖于数据库处理结果的应用(块级应用)。其次是缺乏灵活性,它是一种专用设备。最后,NAS备份与恢复的实现相当困难。

存储区域网SAN

SAN(存储区域网)是通过专用高速网将一个或多个网络存储设备(如磁盘阵列RAID)和服务器连接起来的专用存储系统。

SAN以数据存储为中心,采用可伸缩的网络拓扑结构,提供SAN内部任意节点之间的多路可选择的数据交换,并且将数据存储管理集中在相对独立的存储区域网内,实现最大限度的数据共享和数据优化管理,以及系统的无缝扩充。正是由于光纤通道技术的发展,使得SAN得以支持远距离通信、易于扩展、能够解决网络数据的存储备份、高可用性、灾难恢复等有关问题,它可以提供高性能数据管道和共享的集中管理的存储设备。因此采用网络和通道技术相互融合的光纤通道接口的SAN将LAN上的存储转换到主要由存储设备组成的专用网络上,使得数据的访问、备份和恢复不影响LAN的性能,在大量数据访问时,不会大幅度降低网络性能。

SAN主要用于存储量大的工作环境,并且SAN的适用性和通用性较差,在系统的安装和升级方面效率不高,且由于SAN使用专用网络(一般为光纤网络),相应的设备价格昂贵,总体实现费用较高,局限于大中型应用。

NAS和SAN技术都体现了数据存储从传统的服务器中独立出来的思想,它们是网络存储领域中的两个发展方向。随着NAS和SAN之间的界限越来越模糊,其中更重要的区别可能就是在NAS/SAN混合系统中所采用的协议了:IP、光纤通道,或者iSCSI等。

IP存储

传统的SAN一般采用光纤通道技术,其成本高,距离受限制,因此基于IP的存储正成为一个新的热点,主要有FCIP(Fibre Channel over IP)、iFCP(Internet Fibre Channel

Protocol)、mFCP(Metro Fibre Channel Protocol)、iSCSI(Internet SCSI)等技术。

上述协议有一个非常重要的共同点:都能充当SCSI命令集的传输机制。通过IP存储介质与存储设备通信的主机仍能表达SCSI的含意。而iSCSI则是从主机到存储设备的整个传输链路就是一条IP链路,没有采用光纤通道,基于主机的应用通过IP与网络存储设备通信。iSCSI保持了SCSI命令集的原状,同时用IP取代了传输协议。但由于iSCSI通过映射至IP来保留SCSI命令集,存在延时问题,已有专门的iSCSI芯片组把转换代码部署在硬件当中。IP-SAN的优势在于:容易扩展成超大规模的存储网络;不必受光纤通道SAN的距离限制,连接在IP网络上的服务器都能享用网络存储服务;连接灵活多样,廉价成熟的网络架构成本,使得高端也能达到Gbps速率,有较高的性能价格比。

集群存储

Page 8 of 16

DAS、NAS、SAN存储系统完全分析

由于目前一些存储应用受容量可扩展性、性能可扩展性、可用性、可管理性的挑战,“催生”了许多存储集群系统的产生。集群存储是将每个存储设备作为一个存储节点,通过高速互联网络连接起来,将数据分散开存储在多台独立的设备上,这些设备可以独立运作,相互之间又可以合作。每个I/O节点不仅可以访问本节点的存储空间,还可以访问其他节点的存储空间。所有存储节点的空间以一个虚拟磁盘的方式提供给客户端用户。组成集群存储可以是块级别的SAN集群、文件级别的NAS集群和并行文件系统的集群,它们的访问、特征与适用环境参见表1。

集群存储有效地提升了存储设备的容量可扩展性、性能稳定性及系统可管理性。集群存储非常适合那些持续增长的所有规模的不同环境,实现即时供应(Just-in-time)存储,避免破坏性升级和增加管理的复杂性。在大型数据中心或高性能计算中心的集群存储解决方案,具有高性价比,简单、易于维护,高可靠性/可用性,具有非常高的整合带宽等优点。集群存储最典型系统是Google体系结构,它是大量机器内硬盘的组合,含899个机架(每架80台PC,每台PC有2个硬盘),共79,112台PC机,有158,224个硬盘, 总容量为6180 TB。

对等(P2P)存储

对等结构(P2P)从用户的使用方式来看,系统中每个用户既向其他用户提供资源,也从其他用户那里获取资源。从体系结构来看,无中心结构,结点之间对等,通过互相合作来完成用户任务。P2P结构的优点表现在:没有中心结点,不易形成系统瓶颈、不易受攻击,可扩展性好,自组织性好。

用P2P的方式在广域网中构建大规模分布式存储系统,将很多机器用对等的方式组织起来共同为用户提供超大容量的数据存储服务,存储结点来自于存储服务方,用户使用存储空间并付费,用户还通过该平台自主寻找其他结点进行数据备份和存储空间交换。

P2P存储与SAN的应用特点不同。前者主要强调可用性,而SAN主要面向的是高性能;P2P存储易于维护、可扩展好、自配置功能强,特别是P2P存储可以大量加盟的PC机和服务器中的存储器来组合成存储系统,提供高带宽的视频服务和其他共享服务。

集群存储与P2P存储都是分布式存储。前者多在大型数据中心或高性能计算中心使用,后者是构建更大规模的分布式存储系统,可以跨多个大型数据中心或高性能计算中心使用。

网格存储

所有的存储、服务器和网络资源都被虚拟为一个资源池,并将其视作共享资源,这个资源池就是存储网格。存储网格的关键是虚拟化与统一性管理问题。

存储网格既可应用于SAN环境,又可应用于NAS环境,它提供快速简单的对于容量、性能、服务质量和/或连接协议的可升级性,可对公司所有数据进行统一查看和管理,远远超出当前有限的虚拟化实现途径,还可优化分布式企业远程数据访问的性能。存储网格架构可实现数据库和企业之间更紧密的应用整合,提供更高的数据保护,并可基于有关规定更简单地管理数据资源。这些优势极大降低了用户在购买、扩容和管理时的费用。

面向对象的存储

Page 9 of 16

DAS、NAS、SAN存储系统完全分析

对象存储模型综合了NAS和SAN结构的特点,存储对象具有文件和块二者的优点:像数据块一样在存储设备上被直接访问,通过一个对象接口,像文件一样,在不同操作系统平台上实现数据共享。在SAN中,定位逻辑和文件系统都位于主机中。而在面向对象的存储中,存储空间不再需要运行在主机上的文件系统管理,而由存储系统自己管理和分配。

一个存储对象是关于一个存储设备的逻辑字节集合,它有存储方法、数据属性和存储安全策略等。因此,对象存储系统在基于文件级的数据布局、服务质量的灵活性和可管理等方面有很大改善。另外,基于对象存储的最直接效果是将空间管理从存储应用中剥离,如图2所示,存储设备具有自管理特性,包括重新组织数据来提高性能、调用规则的备份和失败恢复等。

未来存储设备的特性可能包括自配置、自保护、自优化、自恢复和自管理。将块接口用对象来代替是一个发展方向。目前,面向对象的存储仍然处在标准制定之中,还没有得到广泛的接受。

内容寻址存储CAS

内容寻址存储(Content Addressed Storage,CAS)是针对固定内容存储需求的网络存储技术。CAS具有面向对象存储特征,基于磁记录技术,它按照所存储数据内容的数字指纹寻址,具有良好的可搜索性、安全性、可靠性和扩展性。CAS、SAN和NAS的区别参见表2。CAS存储技术的代表性产品是EMC公司的Centera 系统,目前还具有非常多的局限性。

数据库只针对的是结构化数据,而大量非结构化的数据管理有更大的存储需求,而内容管理的对象是以各类非结构化数据为主的数字内容。CAS技术的出现使非结构化数据管理(包括企业的各种文档、报表、账单、网页、图片、传真、扫描影像,以及大量的多媒体音频、视频信息等等的归档和查询)成为存储业新的热点。未来需要一种新的基于内容管理的存储系统平台,它扩展了最新的对象存储体系结构,支持对象仓储和联邦数据库技术,支持关系和 XML作为主要数据模型,并紧密地集成了内容管理服务、工作流、消息传递、分析和其他企业应用程序服务。

基于IB的存储

InfiniBand(IB)是针对处理器和智能I/O设备之间数据流而提出的一种新体系结构,用于在服务器中取代PCI总线。采用IB技术支持多处理器集群,将允许服务器提供更高的带宽和可扩展能力,并增强了存储设备扩充的灵活性,并用于支持远程I/O和远程存储器,如图3所示。IB作为一种能够为系统与存储之间提供低延迟和高带宽的连接解决方案,已经为一些用户所接受,预期基于IB的存储将在存储领域会占有一席之地。

Page 10 of 16

DAS、NAS、SAN存储系统完全分析

存储产品DAS NAS SAN 的选择

存储市场现状

存储市场近几年来的发展十分迅猛,令IT其他领域望尘莫及。自1997年以来,存储行业的增长率一直保持在20%以上,远远超过IT业的平均增长率。这一势头目前还没有丝毫减弱的趋势,据业内专家估计,2006年将是存储行业的顶峰之年。而同时,2000年的全球存储产品销售额已经超过300亿美元,由此可见,用“如日中天”来形容今天在IT业中的存储行业并不过分。

今天,存储系统在硬件和软件方面都已经从主机系统中脱离出来,成为完全独立的系统。用户早已经对磁盘阵列、磁带库和第三方存储管理软件等不再陌生。同时,在国内已经涌现出一批颇具实力的专项存储系统集成公司。很多大型IT系统的招标项目中,存储系统也被独立出来,单独进行招标。所有这些现象都表明,无论是在厂商、中间商还是在最终用户环节上, 存储系统的独立性都已经得到了充分的认同。

目前,存储行业主要包括三大阵营:

以EMC公司为代表的在线存储系统厂商,以STK公司为代表的离线存储系统厂商和以Veritas公司为代表的存储管理软件厂商。由于用户的存储系统往往由这三种产品共同组成,所以,这三大阵营之间的合作关系十分密切和深入。还有一些提供存储系统辅助设备的厂商,如以Adaptec公司为代表的主机适配器厂商和以Brocade公司为代表的连接设备厂商等。他们凭借自身的技术优势和精准的市场定位,在存储行业里也占有一席之地。除此之外,Cisco公司、CA公司和Lucent公司等一批非存储技术公司也凭借原有的市场、技术和资金优势,寻找突破口,以各种方式介入存储行业,想分得一杯羹。IBM公司、Compaq公司、HP公司和Sun公司等传统主机厂商也在迅速并购中小存储厂商或OEM其他产品,来丰富其原有的存储产品线。更有意义的是,这些公司一改自家存储产品支持自家主机的传统,纷纷成立开放存储事业部,把自己的存储产品独立出来,广泛支持各种开放平台。

存储架构浅析

存储行业的核心技术目前主要集中在数据保护、数据管理和数据访问三方面。至于数据挖掘这种专注于数据关系的技术,目前还没有包含其中。而存储产品的市场则主要是被磁盘阵列、磁带设备和存储管理软件这三方面的产品所瓜分。至于光介质存储产品,由于其技术更新缓慢,无论是在性能、容量还是在价格方面,都无优势可言,只是在一些比较特殊的环境中才会使用到。所以,本文中就不再就这类产品进行分析和评价了。

对最终用户而言,存储系统在整个IT系统中的地位很特殊,存储系统的架构往往决定了整个IT系统的架构及功能,所以,具有关键业务的用户在搭建自己的IT系统时,对存储系统部分应给予足够的重视。不能听信厂商的一面之词,更不能自行简单拼凑,而应该求助于具有一定资质和实践经验的存储系统专项集成公司。在规划IT系统之初就应该设计好存储系统架构和主要功能。下面我们就来了解和分析一下存储系统的基本架构。

存储架构的演变

Page 11 of 16

DAS、NAS、SAN存储系统完全分析

九十年代以前,存储产品大多作为服务器的组成部分之一,这种形式的存储被称为SAS(Server Attached Storage 服务器附属存储)或DAS(Direct Attached Storage,直接附属存储)。

随着技术发展,进入九十年代以后,人们逐渐意识到IT系统的数据集中和共享成为一个亟待解决的问题。于是,网络化存储的概念被提出并得到了迅速发展。从架构上来分,今天的网络化存储系统主要包括SAN(Storage Area Network,存储区域网)和NAS(Network Attached

Storage,网络附加存储)两大类。

SAN的特点及适用情况

所谓SAN,是指在网络服务器群的后端,采用光纤通道等存储专用协议连接成高速专用网络,使网络服务器与多种存储设备直接连接。SAN的最大特点就是可以实现网络服务器与存储设备之间的多对多连接,而且,这种连接是本地的高速连接。SAN架构的优势在于: 强大的扩展性、多种存储设备的集中和新架构支撑下的新型数据应用方式。

在SAN架构中最先引入的新技术就是LAN-Free的数据备份。这种备份方式与传统备份方式的最大区别就在于,海量的备份数据不再拥挤在宝贵的网络带宽上,而是通过SAN中的高速连接进行数据传输。这一技术进步大大提高了备份的效率,

同时节约了网络带宽资源,为数据库等应用进行在线备份提供了可能性。

以此类推,其他不适合在传统以太网中传输的数据应用方式,在SAN架构下都可以大大提高工作效率,甚至出现全新的工作方式。一个典型的例证是视频行业的非线性编辑系统。在DAS架构下,各台非编机之间传输视频数据时的等待时间,往往要占到整个工作时间的三分之一左右。在引入SAN架构之后,由于数据是被各个非编机所共享的,交换数据时完全不用等待。同时,由于冗余数据的减少,系统的总存储容量需求大大降低。

SAN与FC协议

正是因为以上这些明显的优势,SAN概念从出现以来,一直受到厂商、集成商和最终用户的关注和重视。一些厂商还联合开发了专门针对SAN的存储设备连接协议,这就是大名鼎鼎的Fibre Channel协议(光纤通道协议)。这个协议与传统的SCSI协议相比,具有明显的先进性。这也是今天光纤存储设备得以流行的原因。至于在SAN架构中,则几乎无一例外地采用光纤通道协议作为连接协议。

NAS的优缺点及适用环境

所谓NAS,是一种将分布、独立的数据整合为大型、集中化管理的数据中心,以便于对不同主机和应用服务器进行访问的技术。

目前,SAN解决方案的最大问题是成本较高,一般中小用户还难以承受每端口1000美元左右的光纤交换设备和相对较昂贵的光纤存储设备。

Page 12 of 16

DAS、NAS、SAN存储系统完全分析

而NAS产品正是以其较低的价格、简单方便的使用方式满足了相当一部分用户的需求。简单地说,NAS就是经过专门优化的文件服务器系统加上大容量存储。其优点在于结构简单,配置和使用非常方便。在数据共享方面,因为采用的是传统NFS或者CIFS协议,所以不需要任何附加软件,即可在几乎所有平台之间实现跨平台的数据共享。

曾经有人认为,因为NAS与应用服务器之间交换的是文件,而不像SAN或DAS架构下,服务器与存储设备交换的是数据块,所以NAS产品比较适合于文件存储,而不适合数据库应用。事实上,的确有些数据库不允许把库建立在NFS或CIFS卷上,但是对于像Oracle这样的数据库而言,库文件可以建立到几乎任何卷区上。在性能方面,实际测试结果表明,当网络环境理想时,在本地磁盘上运行Oracle,性能与在NAS上运行并无明显差异。相反,倒是对一些大型数据文件连续读写操作为主的应用来说,NAS并不十分合适。

SAN与NAS特点的比较

SAN NAS

数据集中的实现 好 较好

数据共享的实现 一般 好

系统成本 较高 较低

系统复杂程度 高 低

系统性能 好 受网络环境影响

系统配置 复杂 简单

系统使用 简单 简单

系统灵活性 好 较好

系统扩展性 好 一般

应用限制 无 视频、测绘等大文件传输

数据保护能力 好 较好

NAS产品的主要问题就是对网络带宽资源的占用,好在网络带宽也在迅速增长。对于备份问题,NAS产品可以将备份磁带设备直接连接到本地,以此来避免海量数据对网络带宽的占用。

如何选购存储产品

在确定了存储系统基本架构之后,我们还需要进行产品选型。如何选择合适的存储产品,基本可以从数据保护能力、性能、容量、连接性、管理性和附加功能这几个方面来考虑。

数据保护能力

数据保护能力是指在存储设备的设计方面,对各种偶然性错误和意外情况的预期,以及采取的预防或补救措施。这里,用户需要注意的是,存储系统是一个从软到硬的复杂系统,所以,对数据保护能力的评价应当考虑到整个系统。一些低端磁盘阵列厂商宣称他们的产品由于采用了RAID、热交换磁盘、双电源等技术,数据将永不丢失。对一些中小型用户,这些数据保护技术基本可以满足要求,但是对关键性业务的用户来说,这些技术只能算数据保护的最Page 13 of 16

DAS、NAS、SAN存储系统完全分析

基本前提。只有对数据完整性的保护,对写缓存的保护,对主机连接的保护以及对远程容灾的支持等方面,才能够体现出存储产品的真正数据保护能力。

性能

存储产品的性能评价是最容易的,因为这一指标可以被充分量化。对磁盘阵列产品来说,性能指数主要有两个:带宽和IOPs(每秒I/O次数)。带宽决定于整个阵列系统,与所配置的磁盘个数也有一定关系;而IOPs则基本由阵列控制器完全决定。在Web、E-mail、数据库等小文件频繁读写的环境下,性能主要由IOPs决定。在视频、测绘等大文件连续读写的环境下,性能主要由带宽决定。可见,在不同的应用方式中,需要考察的侧重点也不同。对NAS产品来说,主要性能指数也是两个:OPS和ORT,分别代表每秒可响应的并发请求数和每个请求的平均反应时间。对磁带存储设备来说,单个磁带驱动器的读写速度是最重要的性能指标。

容量

容量是最简单的一个方面,这里需要留意的是,用户不仅要关心产品的最大容量,还要关心厂商推荐使用容量以及扩容成本等问题。而对磁带产品来说,容量决定于磁带纪录格式。因为磁带驱动器都具有硬件压缩功能,所以磁带容量有压缩容量和非压缩容量之分。一般压缩容量按非压缩容量的二倍计算。

连接性

在SAN环境中,以光纤连接设备为中心,要连接主机、磁盘阵列、磁带库等设备,环境比较复杂。因此在产品选型时,要充分考虑设备间的连接性。选择具有良好的开放性和连接性的产品,不仅是当前系统正常连接和运行的保障,也为系统将来扩展提供更大的空间和灵活性。

管理性

管理性是任何产品的重要方面之一。首先,用户应考虑产品所提供的管理功能或方式是否实用可靠。其次,支持中心化管理和远程管理的产品一定会令用户省事不少。还有,很多产品的故障自动通知机制给用户带来了方便,但同时也是数据安全的隐患。最后,在配置改变或系统扩容时,不需宕机或尽可能缩短宕机时间,是企业级产品的重要特征。

附加功能

今天的存储产品,尤其是部门级和企业级的在线存储产品,已经不仅仅是存储数据的盒子,而是一个智能的小型系统。各厂商将很多功能性软件都整合到自己的存储设备中,以向用户提供更好的解决方案。目前,比较常见的附加功能主要有以下几种: 数据快照功能、LUN

Masking功能、异地数据复制功能等。

存储市场前景

Page 14 of 16

DAS、NAS、SAN存储系统完全分析

网络化存储是存储技术的主流发展方向,无论SAN还是NAS,在用户IT系统中都出现得越来越频繁。随着各行各业信息化的深入,以信息载体和信息保护为中心的存储市场,前景无可限量。

近来,存储行业中一轮新的浪潮正在兴起。这就是引起媒体和业界广泛关注的SoIP技术或称iSCSI技术。这一技术融合了SAN和NAS的优势,同时成本低廉,具有相当好的发展潜力。另外,Cisco等非存储业内厂商也借此施展才能。目前,IBM、Cisco、Adaptec和Falcon等公司已经有相关软硬件产品交付使用。但是,由于SoIP的标准尚未完全统一,支持的厂商有限,用户对这类产品应持谨慎态度。

网络存储系统的瓶颈分析

存储网络系统由存储设备、网络设备和主机三个部分组成。存储设备是指该系统中采用的NAS、iSCSI、FC-SAN等磁盘阵列设备,网络设备是指FC交换机或以太网交换机,主机是指安装了以太网卡、FC HBA卡,并安装了一定应用软件的主机设备。存储系统的瓶颈分析主要是看这三个部分中哪一种会首先达到其性能的最大值。

存储成为整个系统的瓶颈是指存储设备的带宽达到最大值,或IOPS达到最大值,存储设备限制了系统性能的进一步提升,甚至影响了整个系统的正常运行。由于不同业务系统对存储的性能要求不同,一般小文件(小于1MB)读写型的系统中对IO的要求较高,大文件的读写型系统对存储设备带宽的要求比较高。不用应用模式下系统对存储设备的要求不同,瓶颈点出现的位置和特点也不一样。

应用模式1:小型网站系统,应用大多集中于远程用户对WEB页面访问,网站内部为WEB服务器和数据库之间的读写,应用系统对存储的压力非常小,差不多所有类型、所有档次的存储设备都可以作为核心存储,存储设备的带宽和IOPS很难会达到极限。在这样的系统中,与存储设备连接的网络设备一般都千兆以太网交换机,交换机本身的交换能力大多都是10Gb,只有接入网部分的可用带宽较小,一般只有100Mb/s左右的接入带宽,因此接入网最有可能成为存储网络的瓶颈。

应用模式2:如果该网站是一个大型的网络视频系统,支持大量用户在线进行视频节目播放和下载,这种类型的网站前端接入网一般都在2Gb/s以上。此时要分析瓶颈位置,首先要比较接入网带宽和存储带宽,同时还要比较在线用户的最大IO访问量和存储设备的IOPS值。一般来讲,由于NAS设备的带宽和IOPS相对较小,因此NAS比iSCSI和FC-SAN设备更容易成为系统的瓶颈,而iSCSI和FC-SAN较难成为瓶颈。如果存储设备采用NAS,则存储系统成为瓶颈的机率大于接入网,如果存储设备采用FC-SAN,则存储系统成为瓶颈的机率小于接入网。

瓶颈还经常会出现在负责节目播放和下载功能的视频服务器处。如果视频服务器配置的数量不足,或视频服务器之间无法正常地实现自动地网络负载均衡,那么整个系统的性能压力瓶颈就会出现在视频服务器,使用整个视频网站无法给远程用户提供流畅的节目画面。

应用模式3:数据库系统,数据库系统的存储应用一般都表现为大量的IO访问,对带宽要求较低。如果存储设备的IOPS较小时,会降低数据库的检索和查寻速度,从来影响整个业务的效率。因此建议数据库系统采用IOPS(可按业务规模、工作站数量、每秒的读写访问次数和估算)比较大的FC-SAN设备,不建议采用IOPS相对较小的NAS或iSCSI设备。大型数据库存储最好能采用15000RPM的高速FC磁盘,这样才能将数据库服务器成为整个系统的Page 15 of 16

DAS、NAS、SAN存储系统完全分析

压力瓶颈。由于SATA硬盘在随机IO读写时的性能不佳,因此存储设备不建议采用SATA磁盘,否则存储设备极有可能数据库系统的IOPS瓶颈。

应用模式4:非线性编辑制作系统。在非线性编辑制作网络中,所有工作站共享式地访问核心存储系统,每台工作站同时以50-200Mb/S的恒定码率访问存储设备。业务系统对带宽的压力非常,而IOPS压力较小。

存储设备的总可用带宽越大,存储设备就能支持更多数量的编辑制作工作站,网络的规模就越大,网络系统所能承担的业务就越重要。因此编辑制作网的存储一般都会选择主机端口多、特别是磁盘端口多、带宽大的FC-SAN设备。存储设备内部设计时,一般会通过增加磁盘数量、增加扩展柜数量、跨扩展柜创建RAID组、增加主机通道数量等方式最大限度地利用存储控制器前端和后端的总可用带宽,使得磁盘、磁盘通道、主机通道等的总带宽大于控制器的总带宽,这样在工作站访问时存储设备时,才能最大地发挥出控制器的带宽性能。带宽瓶颈在控制器部位才能说明是最好的存储系统设计方案。

Page 16 of 16


本文标签: 数据 系统 服务器 网络 存储设备