信息时代的核心无疑是信息技术,而信息技术的核心则在于信息的处理与存储。当我们每天关注于CPU主频的不断提高、操作系统版本的不断升级以及计算机网络技术的日新月异的时候,我们或许不应该忽略这样一个事实,即无论信息处理技术多么的先进,我们都必须将信息存储于一定的介质之上,信息和信息技术本身都需要依托于一定的存储介质而存在。
近几年来,计算机在商业和个人方面的应用得到了显著的增长,现在几乎每一间办公室都拥有微机,许多家庭都已经拥有或者正打算购买微机,而大多数的公司都建立了一个计算机网络来共享应用程序和数据。所有这些变化使数据字节取代了纸张,提高了生产力和生产效率,减小了冗余,并增加了信息的可用性。
由于越来越多的信息变成了电子信息,这就使信息存储技术显得更加重要,特别是计算机网络应用的迅速增长更大大增加了对信息存储产品的需求量和对信息存储技术的安全性、可靠性的要求。根据3M公司对800名网络微机用户的调查发现,每次硬盘的失效将造成5天以上的无效工作日。而在一个典型的商业应用中,重建1000MB数据平均耗时间3.5个月,费用为95000美元。由此可见,信息存储对最终用户来说是非常重要的,它将会:
* 允许保存电子数据;
* 为防止数据丢失而提供备份保护;
* 防止因丢失数据带来的费用;
* 防止停机时间影响成本;
* 允许现场或非现场文档的存储。
一、信息存储技术的发展历程
信息存储技术在近几年的发展非常迅速,各种新产品、新技术层出不穷,但从总体上看它们呈现出一种类似金字塔的结构,其中塔尖为CPU,距离CPU越近则存储速度越快、每兆字节的存储成本越昂贵,容量也越小;反之则存储速度越慢、每兆字节的存储成本越低,容量也越大。
计算机的存储设备从体系结构上看可分为内存储器和外存储器。内存储器(即内存)直接与计算机的CPU相连,处于金字塔的最上层。它的存取速度要求能与CPU相匹配,通常由半导体存储器芯片组成,由于成本高,容量通常不太大。而对于大量数据的保存通常要使用外存储器。外存储器又可以分成几个层次。与内存储器相连接的是联机存储器(或称在线存储器),如硬磁盘机、磁盘阵列等。再下一层是后援存储器(或称近线存储器),它由存取速度比硬盘更慢的光盘机、光盘库等设备组成。最底层是脱机存储器(或称离线存储器),由磁带机和磁带库组成。它的存取速度比较慢仅是秒数量级,由于存储介质可脱机保存,可以更换,因此容量几乎是无限大。
对于普通的个人电脑用户,使用硬盘、软盘和光盘等存储介质来进行数据存储就已经够用了,但对于商业用户和一些网络系统来说,磁带机、磁带库和光盘库则是必不可少的数据存储与备份设备。
每个企业都会产生大量的关键数据,这些数据需要“备份”。这意味着这些数据要存储在容易访问和检索的地方。在企业中,没有人会知道将要发生什么事。每家企业都可能遭遇停电、火灾、盗窃、洪水和意外损坏等天灾人祸。如果企业没有备份关键的数据和信息,将会导致灾难性的后果,恢复这些数据的成本将是高昂的。
数据存储已经成为目前的一个热点技术,也是继互联网热之后的又一次技术浪潮,它将网络带入以数据为中心的时代。
数据存储经过了三个发展阶段:直接外挂存储(DAS)、存储域网络(SAN)、网络附加存储(NAS)。DAS是在以CPU为中心的计算为王时代的产物,适应于最初计算机工业的发展,而对于SAN和NAS,其技术上最大的区别在于是采用专门的协议还是现有的IP技术,以及数据共享等问题的分别考虑,SAN的优势在于最初解决网络带宽问题的考虑,而NAS更侧重于通用性和数据共享的考虑。
光纤通道目前是建立SAN架构的唯一选择,但是随着新技术和市场的双重作用,将来可能会用G/10G以太网和/或InfiniBand架构(简称IBA)来实现SAN。
人们对数据存储备份一词并不陌生,然而对备份的真正内涵并不完全了解。在一般人脑海里,往往把备份和拷贝等同起来,把备份单纯看作是更换磁带、为磁带编号等一个完全程式化的、单调的操作过程。其实不然,因为除了拷贝外,还包括更重要的内容即管理。备份管理包括备份的可计划性,磁带机的自动化操作、历史记录的保存以及日志记录等。事实上,备份管理是一个全面的概念,它不仅包含制度的制定和磁带的管理,而且还能决定引进备份技术,如备份技术的选择、备份设备的选择、介质的选择乃至软件技术的挑选等。
有不少人往往也把双机热备份、磁盘阵列备份以及磁盘镜象备份等硬件备份的内容和数据存储备份相提并论。事实上,所有的硬件备份都不能代替数据存储备份,硬件备份只是拿一个系统、一个设备等作牺牲来换取另一台系统或设备在短暂时间内的安全。若发生人为的错误、自然灾害、电源故障、病毒侵袭等,引起的后果就不堪设想,如造成所有系统瘫痪,所有设备无法运行,由此引起的数据丢失也就无法恢复了。事实证明,只有数据存储备份才能为人们提供万无一失的数据安全保护。
因此,用户特别是网络用户理想的数据存储备份就是用一种容量大、具有先进自动管理功能、价格又相对便宜的设备对整个系统,特别是对整个网络系统的数据进行备份,才是人们所希望的数据存储备份。
目前市场上的存储产品主要有磁盘阵列、磁带机与磁带库、光盘库等,其中磁带设备以其技术成熟、价格低廉、产品线齐全、使用方便等优点占据了存储市场的重要地位。
二、数据存储备份技术介绍
1、磁盘阵列
磁盘阵列又叫RAID(Redundant Array of Inexpensive Disks——廉价磁盘冗余阵列),是指将多个类型、容量、接口,甚至品牌一致的专用硬磁盘或普通硬磁盘连成一个阵列,使其能以某种快速、准确和安全的方式来读写磁盘数据,从而达到提高数据读取速度和安全性的一种手段。因此,磁盘阵列读写方式的基本要求是,在尽可能提高磁盘数据读写速度的前提下,必须确保在一张或多张磁盘失效时,阵列能够有效地防止数据丢失。磁盘阵列的最大特点是数据存取速度特别快,其主要功能是可提高网络数据的可用性及存储容量,并将数据有选择性地分布在多个磁盘上,从而提高系统的数据吞吐率。另外,磁盘阵列还能够免除单块硬盘故障所带来的灾难后果,通过把多个较小容量的硬盘连在智能控制器上,可增加存储容量。磁盘阵列是一种高效、快速、易用的网络存储备份设备。
2、磁带库
广义的磁带库产品包括自动加载磁带机和磁带库。自动加载磁带机和磁带库实际上是将磁带和磁带机有机结合组成的。自动加载磁带机是一个位于单机中的磁带驱动器和自动磁带更换装置,它可以从装有多盘磁带的磁带匣中拾取磁带并放入驱动器中,或执行相反的过程。它可以备份100GB—200GB或者更多的数据。自动加载磁带机能够支持例行备份过程,自动为每日的备份工作装载新的磁带。一个拥有工作组服务器的小公司或分理处可以使用自动加载磁带机来自动完成备份工作。
磁带库是像自动加载磁带机一样的基于磁带的备份系统,它能够提供同样的基本自动备份和数据恢复功能,但同时具有更先进的技术特点。它的存储容量可达到数百PB(1PB=100万GB),可以实现连续备份、自动搜索磁带,也可以在驱动管理软件控制下实现智能恢复、实时监控和统计,整个数据存储备份过程完全摆脱了人工干涉。磁带库不仅数据存储量大得多,而且在备份效率和人工占用方面拥有无可比拟的优势。在网络系统中,磁带库通过SAN(Storage Area Network-存储局域网络)系统可形成网络存储系统,为企业存储提供有力保障,很容易完成远程数据访问、数据存储备份,或通过磁带镜像技术实现多磁带库备份,无疑是数据仓库、ERP等大型网络应用的良好存储设备。
另外,随着制造技术和生产工艺的不断改进,磁带机的性能还将得到很大的提高。包括:磁带将被做得越来越小;存储能力越来越大;磁带机的自动化程度也将越来越高……而且,随着自动化程度越来越高,磁带机的优势越来越明显,从而在未来的存储市场中将长期扮演主流的角色。
3、光盘塔、光盘库和光盘网络镜像服务器
目前最好的多媒体海量信息存储载体或重要文献资料备份媒体,非光盘莫属。因为光盘不仅存储容量巨大,而且成本低、制作简单、体积小,更重要的是其信息可以保存100年至300年。因此,光盘普遍用于重要文献资料、视听材料、教育软件、影视节目和游戏动画等媒体信息存储,供广大用户重复只读。然而,一张光盘的存储容量毕竟有限,对于海量信息存储的网络系统来讲是远远不够的。要想获得海量信息的网络存取,就必须将保存有大量不同信息的几十张甚至几百张光盘组合起来使用。
光盘塔由几台或十几台CD-ROM驱动器并联构成,可通过软件来控制某台光驱的读写操作。光盘塔可以同时支持几十个到几百个用户访问信息。
光盘库实际上是一种可存放几十张或几百张光盘并带有机械臂和一个光盘驱动器的光盘柜。光盘库也叫自动换盘机,它利用机械手从机柜中选出一张光盘送到驱动器进行读写。它的库容量极大,机柜中可放几十片甚至上百片光盘片,这种有巨大联机容量的设备非常适用于图书馆一类的信息检索中心,尤其是交互式光盘系统、数字化图书馆系统、实时资料档案中心系统、卡拉OK自动点播系统等。光盘库的特点是:安装简单、使用方便,并支持几乎所有的常见网络操作系统及各种常用通讯协议。由于光盘库普遍使用的是标准EIDE光驱(或标准5片式换片机),所以维护更换与管理非常容易,同时还降低了成本和价格。又因光盘库普遍内置有高性能处理器、高速缓存器、快速闪存、动态存取内存、网络控制器等智能部件,使得其信息处理能力更强。
光盘网络镜像服务器是继第一代的光盘库和第二代的光盘塔之后,最新开发出的一种可在网络上实现光盘信息共享的网络存储设备。光盘网络镜像服务器不仅具有大型光盘库的超大存储容量,而且还具有与硬盘相同的访问速度,其单位存储成本(分摊到每张光盘上的设备成本)大大低于光盘库和光盘塔,因此光盘网络镜像服务器已开始取代光盘库和光盘塔,逐渐成为光盘网络共享设备中的主流产品。
在网络海量存储备份系统中,磁盘阵列、磁带库、光盘库等存储设备因其信息存储特点的不同,应用环境也有较大区别。磁盘阵列主要用于网络系统中的海量数据的即时存取;磁带库更多的是用于网络系统中的海量数据的定期备份;光盘库则主要用于网络系统中的海量数据的访问。
4、SAN(存储域网络)
存储域网络(Storage Area Network)的支撑技术是Fibre Channel(FC)技术,这是ANSI为网络和通道I/O接口建立的一个标准集成。支持HIPPI,IPI,SCSI,IP,ATM等多种高级协议,它的最大特性是将网络和设备的通讯协议与传输物理介质隔离开.这样多种协议可在同一个物理连接上同时传送,高性能存储体和宽带网络使用单I/O接口使得系统的成本和复杂程度大大降低。如通过Switch扩充至交换仲裁复用结构则可将用户扩至很多。FC使用全双工串行通讯原理传输数据,传输速率高达1062.5Mbps,Fibre Channel的数据传输速度为100MB/S,双环可达200MB/S,使用同轴线传输距离为30米,使用单模光纤传输距离可达10公里以上。光纤通道支持多种拓扑结构,主要有:点到点(Links)、仲裁环(FC-AL)、交换式网络结构(FC-XS)。点对点方式的例子是一台主机与一台磁盘阵列透过光纤通道连接;其次为光纤通道仲裁环(FC-AL),在FC-AL的装置可为主机或存储装置。第三种FC-XS交换式架构在主机和存储装置之间透过智能型的光纤通道交换器连接,使用交换架构需使用存储网络的管理软件。
FC技术具有以下优越性:
(1)既具有单通道的特点,又具有网络的特点,它是把设备连接到网络结构上的一种高速通道。而这种网络结构描述了连接两套设备的单条电缆以及连接许多设备的交换机产生网状结构。
(2)光纤通道最大优点是速度快,它可以给计算机设备提供接近于设备处理速度的吞吐量。
(3)协议无关性,它有很好的通用性,是一种通用传输机制。适用范围广,可提供多性价比的系统,从小系统到超大型系统,支持存在的多种指令集,如IP、SCSI、IPI。
光纤通道规范定义的速率最高可到4Gbps,目前T11工程组对10Gbps传输速度的FC规范也在紧锣密鼓的制定之中。
5、NAS(网络附加存储)
网络附加存储设备(Network Attached Storage,NAS)是一种专业的网络文件存储及文件备份设备,或称为网络直联存储设备、网络磁盘阵列。NAS是基于LAN的,按照TCP/IP协议进行通信,面向消息传递,以文件的I/O方式进行数据传输。在LAN环境下,NAS已经完全可以实现异构平台之间的数据级共享,比如NT、UNIX等平台的共享。但是,在10/100M的带宽条件下,只有其中的30%左右可以用做存储,所以NAS无法发挥其应有的性能,这就需要等待G/T比特级以太网络的大规模普及应用。
一个NAS包括处理器,文件服务管理模块和多个的硬盘驱动器用于数据的存储。 NAS 可以应用在任何的网络环境当中。主服务器和客户端可以非常方便地在NAS上存取任意格式的文件,包括SMB格式(Windows)NFS格式(Unix, Linux)和CIFS格式等等。NAS 系统可以根据服务器或者客户端计算机发出的指令完成对内在文件的管理。另外的特性包括:独立于操作系统,不同类的文件共享,交叉协议用户认证,浏览器界面的操作/管理,和增加和移除服务器不会中断网络服务,NAS是在RAID的基础上增加了存储操作系统,因此,NAS的数据能由异类平台共享。
一般地,NAS的结构如图2所示:

图2: NAS体系结构
我们可以看出,NAS 结构和SAN最大的区别就在于NAS有文件操作和管理系统,而SAN却没有这样的系统功能,其功能仅仅停留在文件管理的下一层,即数据管理。从这些意义上看,SAN和NAS的功能互为补充,同时SAN的服务器访问数据的时候不会占LAN的资源,但是NAS结构的服务器都需要和文件服务器进行交互,以取得自己请求的数据,因此,NAS结构在速度慢的LAN(如10/100M网络)上几乎不具有任何优势和意义。由于G位和10G位以太网的出现,使得NAS结构的这一缺陷自然消失,NAS方案一下子就获得了巨大的生命力和发展空间。同时SAN和NAS相比不具有资源共享的特征,因此SAN最近越来越感觉到了NAS的巨大冲击力。
SAN和NAS并不是相互冲突的,是可以共存于一个系统网络中的,但NAS通过一个公共的接口实现空间的管理和资源共享,SAN仅仅是为服务器存储数据提供一个专门的快速后方通道,在空间的利用上,SAN和NAS也有截然不同之处,SAN是只能独享的数据存储池,NAS是共享与独享兼顾的数据存储池。因此,NAS与SAN的关系也可以表述为:NAS是Network-attached(网络外挂式),而SAN是Channel-attached(通道外挂式)。 |