中科院某所数据备份方案

用户环境描述 :

某公司数据备份方案

数据处理层,主要包括数据库处理服务器主机、应用服务器、文件共享设备、备份及管理处理主机等。按照功能考虑建立各种业务服务器集群,这些服务器可以按分布式架构,保证应用系统的扩展性。各业务服务器数据集中存储到存储设备层的存储设备中,为各个业务服务器分配专署的数据空间,共享存储设备,实现透明的数据访问。尊敬的贵单位业务系统所需的非结构化数据,可以统一存储到文件共享设备中,由文件共享设备来集中管理和控制文件的读写,并将数据通过网络交换层存储到核心存储设备中。

网络交换层,采用SAN交换机构成冗余和负载均衡的存储网络,由它来连接数据库/应用服务器到存储设备的数据访问,实现数据处理层和存储设备层的透明访问,同时数据处理层和存储设备层的设备,在统一SAN结构下,可以透明的横向扩展。

数据存储层,建议采用集中存储的先进理念,配置为统一的核心存储系统,统一管理业务数据、保证数据的集中,同时为未来系统建设打下基础。各种类型数据集中存储在磁盘阵列中,将数据库存储空间和文件存储空间分配独立的存储分区,确保两类不同特点的数据互不争用存储资源,特别是存储缓存资源不会发生争用。对于定时备份的需求,可以考虑通过备份软件定时备份到备份设备中实现。

SAN技术优势:

(1)性能:

FC SAN网络中是将光纤通道设备映射为一个操作系统可访问的逻辑驱动器的一个串行协议,这个协议使得以前基于SCSI的应用不做任何修改即可使用光纤通道。所以在FC本身的结构即为数据提供了高效率的传输途径。而在以太网的传输中是以单帧为单位,其中在传输过程中还必须进行层层的封装与解包,从而大大影响了整个链路的传输效率,并且在处理过程中也大大增加对系统本身性能的影响,而且在实际的对比测试中,FC的实际利用率在70%到80%左右,而千兆以太网在20%左右。从此看来,以太网并不能提供针对如存储等大数据量及I/O应用所需要的高性能。FC SAN网络是基于流控制的封闭网络,而其他存储架构多是以以太网基础架构为核心的(例如iSCSI、NAS等IP SAN),以太网设计之初是没考虑到要通过无流控制的公网,而是基于CSMA/CD机制来进行传输的,因此它在阻塞发生时,在一个时间段之后返回并重发包,消耗额外的CPU周期,并且负载越大,其可能重发包的几率也相应增大,从而引起可能消耗大量的CPU资源。在基于以太网的数据传输与存取中,虽然在物理上可体现为总线或者星型连接,但其实质为带CSMA/CD方式进行广播式数据传输的总线拓扑,因此随着负载以及网络中通信客户端的增加,其实际效率会随着相应的降低。在FC SAN中所使用的光纤交换机与HBA卡均是基于高可靠性及高性能的ASIC芯片设计,使整个处理过程完全基于硬件级别的高效处理。而以太网交换机在专用的I/O数据传输处理中,实际处理效率不高,而网卡在处理信息的同时会消耗大量的主机资源来进行处理网络通信。因此使用FC SAN进行大数据量的数据传输与处理有着绝对的优势。

(2)稳定性:

FC SAN由于使用高效的光纤通道协议,因此大部份功能是基于硬件来实现的;而IP SAN使用通用的IP协议,而所有的协议处理和转换时,绝大部份依赖于软件来实现,而其不稳定因素也随软件的复杂度增减而呈指数级增加,整个系统的稳定性也随之降低。因此建议尊敬的贵单位业务系统尽可能建立在SAN基础上,尤其是数据库系统。

(3)可扩展性:

SAN存储基于光纤通道协议,是基于数据连接的,因此一般都具有更高的扩展能力。而使用IP存储时,通常需要采用专用的存储虚拟软件,所有的存储虚拟与分配均通过软件来实现。所以在进行存储的扩展时,很大程度上取决于存储软件的设计性能及架构等。

(4)高可靠性:

存储系统的设计初衷是基于企业级的核心数据以及应用而设计的,因此在其兴起、发展直至成熟,对整个系统的可靠性均有很高的要求。在整个系统中,所有设备均采用双冗余、高性能、高可靠性设计。

(5)可管理性:

在FC SAN的发展与成熟过程中,产生了非常丰富的管理与监控软件,基于FC的管理简单、清晰。