备份始终是最昂贵的存储应用。可能这将有所改变。如果你为了异地备份不得不交换磁带,可以设想一下你能节省的时间和金钱。这个可能性是无限的。
越来越多的用户已经开始使用硬盘作为备份介质。若仅是将备份以文件的方式写入硬盘,那无异于简单的拷贝。
BakBone的存储管理软件—NetVault,其中的虚拟带库(Virtual Library)的特性在这样的潮流驱使下提供了强大的备份/恢复功能。
1.安装配置的简单性:可以在NetVault的GUI中直接点击安装,并在Device Management窗口中进行点击配置,并可以根据用户的实际需求配置成所需要的驱动器和介质数。
2. 使用的方便性:像真实的带库一样方便地使用,可以设置各种属性并对其进行各项操作。
3. 和磁带存储的统一性,以及实现数据备份的完整性:能很方便地形成持续的数据流,从磁盘将数据拷贝到真正的磁带上,可以真正保证磁带的异地保存。
4. 恢复的快速性:可以直接从虚拟带库进行数据的恢复。
5. 备份的快速性和完整性:备份的实时性,可以随时将数据快速地备份到磁带上,并保证备份数据的完整性。
6. NetVault的虚拟带库(Virtual Library)的功能适用于任何厂牌的硬件设备。
正当你觉得你知道了怎样去设计一个备份系统的时候,一切都改变了。一系列新的磁盘阵列产品承诺了备份概念的革新。然而,在描述它们如何工作、成本如何之前,需要适当地解释一下它们要解决的问题。重点是,为什么要进行备份,为什么经常要将备份输入到磁带上。
每个人都知道,我们进行备份的唯一的理由就是为了能够恢复。需要进行恢复有3个理由:
从它们的故障点恢复被破坏的文件、文件系统或者单独的系统
一个数据中心已经被破坏,或者某人需要一个已经在一年前就被删除掉的文件,这样的大多数恢复在现实生活中是不能做到的。而大多数因为某人不经意间删除了一个重要的文件、一个RAID阵列遭到损坏或者某个系统管理员不小心删除了一个错误表格这样的恢复一般均会成功地完成。
从最后可用的异地备份中恢复被破坏的一个数据中心
虽然现在的形势使需要进行灾难恢复的人越来越多了,但是,大多数的人担心不得不做这样的一个恢复。显而易见,要从一个灾难中恢复过来,唯一可行的方法就是将所有的备份拷贝一份做异地保存。
及时地从最初的点恢复一个文件、文件系统或者系统
有时,数据被误用或者被破坏,在有人意识到之前,已经很长时间过去了,数据不再可用。在有的时候,一个重要问题的答案只在一个文件或者数据库里面,而这个文件或者数据库在18个月之前还存在。用归档模式恢复的最大困难就是在一定长的时间里只能存储一定量的信息。
在很长的时间里,磁带驱动器和磁带库是完成三个备份目的的唯一的可以接受的方式。每兆字节的光盘介质(如:MO, CD, DVD)的成本太高,在极大多数的环境下不能和磁带相竞争,同样的道理,SCSI连接的磁盘也不能。只有磁带符合下面提到的所有的标准。
磁带的持久性足够满足对数据的长期的存储。由于磁带是如此便宜,所以你能存储那些可能不需要的数据。同时,虽然磁带库很贵,但它们能一次又一次地装载磁带,所以费用大约为光盘介质的十分之一。磁带能在各地之间方便地运输。预备灾难恢复的最常用的方法就是将每盘备份磁带再做一份拷贝,并将其运输到其他的地方进行异地保存。
磁带的应用趋势
鉴于磁带的这些独特性能,它始终是实现灾难恢复和备份的归档目的的最好的方法。然而,这些类型的恢复不包含整批恢复。大多数的恢复用磁盘能更好地完成—如果它够便宜的话。
使用磁带进行备份,有时候是一项很有挑战性的提案。已经有很多人更多地使用这些争议,甚至是它们的一些不存在的假装点。例如:现在的磁带速度太快。即使没有压缩,9840B(19MB/s/38 MB/s), AIT-3(15MB/s/30 MB/s), LTO(15MB/s/30 MB/s), Super DLT(11MB/s/22 MB/s)等驱动器也都因速度太快而不能使用一个单独的快速以太连接集成流。为了使它们集成流,许多驱动器支持多路技术。
多路技术是指你能同时将多个备份任务输入到一盘磁带上。这些多数据流能被多路化或者交叉存取到磁带上,从而有足够的吞吐量满足磁带驱动器形成流。但是,多路技术影响了恢复的性能。对一个和其他的数据流交叉存取的数据流的恢复不允许磁带驱动器形成流,这样就很明显的降低了恢复速度。
磁带到磁带的拷贝花费太多的时间。由于一些这儿没有提到的细节,磁带到磁带的拷贝是不易的—当将一盘磁带作为拷贝源,另外一盘作为拷贝的目标的时候,很难保持两个磁带驱动器的数据流的一致性。结果是有许多人不能制作异地拷贝。
大多数人都知道,一个恢复需要的磁带数直接和两个全备份之间的时间长成比例。你等待一个全备份的时间越长,执行一个完整的恢复所需要的磁带就越多。当然,你需要的磁带越多,出现能破坏整个恢复的错误的机会就越大。这就是为什么许多人每周都要进行全备份,即使提高了介质的成本。
另外一个普遍的问题是:使用各种备份软件包进行增量备份的方式。一个大的文件系统的增量备份可能要花费1个小时以上,但仅仅提供了有限的几百兆字节的数据。当然,这不能使磁带驱动器形成流。即使是像Legato的DDS或者Veritas的SSO这些动态驱动器共享软件允许多服务器之间的磁带驱动器的共享,但是也不允许从多个服务器同时将数据写入到同一磁带驱动器。
就像前面提到的,一盘坏的磁带能引起整个完整的恢复的失败。你的备份所存放的磁带越多,单盘磁带引起恢复失败的机会也就越大。当然,当你需要磁带的时候,你也从不知道它是否有损坏—这可能就是磁带相比磁盘最大的不利之处。
ATA/IDE磁盘阵列
磁盘能解决上面提到的磁带的不足之处,但是服务器级别的SCSI磁盘驱动器太贵,在大多数的环境下都不用作备份驱动器。
但是,已经有人意识到,SCSI磁盘并不是这个城堡中唯一的游戏,这样ATA/IDE磁盘阵列就诞生了。每TB8,000到10,000元的价格,使ATA/IDE阵列(阅读“磁盘备份产品的举例”)和其它的磁盘阵列相比是便宜的,大约为它们的1/3或者1/4。当这些磁盘阵列和带库相比的时候,你一定要包括带库和它相应装载的介质的价钱。其中机械臂通常是一个带库中相对最贵的部分,机械臂能控制的槽位越多,每个TB的成本就越低。因此,你会发现,小型带库的每个TB的价格在10,000元以上,而大型带库的每个TB的价格会一路下滑到3,000元。
在软件方面,几乎所有的备份软件包都能将数据备份到磁带上。但是,如果你使用磁盘,有些软件也会有更好的全面解决方案。例如:Legato的NetWorker的磁盘存储特性就很好;BakBone的NetVault的磁带虚拟化—用磁盘就像是用磁带一样—同样也工作良好。
如何做
假设你要在你现场的带库中存储大约3TB的数据,你就要在一个空间去存放大约1TB的异地拷贝。你可以买3TB的磁盘和1TB的磁带库,而代替买4TB的带库,将你所有的数据备份到磁盘上并保存在那儿。正如你将备份存放到磁带上,并允许设定使用期和被重写那样,你也可以在磁盘虚拟带库中进行同样的操作。所有现场的恢复都可以直接来自磁盘,没有磁带地交换,也不需要机械臂的纠正—是一台快速的虚拟磁带库。
为了异地备份和归档,在每天晚上都将备份从虚拟带库拷贝到真正的带库中。然后,这些磁带就可以被拿出来,为了归档恢复进行异地保存,万一你的虚拟带库受到损坏,就可以使用。虚拟带库系统和传统的带库相比有一定的优势:不需要持续的数据流;磁盘驱动器能和你需求的一样快或者一样慢。驱动器不需要多路技术—因为你没有必要使驱动器形成流,也不需要使驱动器多路化。
这些驱动器能在多个服务器之间共享。有些磁盘阵列允许你创建你可能需要多的虚拟磁带驱动器,允许每个备份客户端都有它们各自的虚拟磁带驱动器,使磁盘驱动器能更快地拷贝数据。不像磁带到磁带的拷贝,磁盘到磁带的拷贝允许磁带驱动器能在最大的吞吐量情况下很方便地形成流—因为它的本地拷贝来自一个随机存储的驱动器。
磁盘到磁盘的恢复是否真的像人们想象的那样快,似乎还有些争论。在一个恢复操作中,磁盘要比磁带快得多,很简单的原因就是:磁盘不需要加载数据,并快速向前和跳跃通过。在恢复中,每卷磁带的加载/跃进,根据磁带的型号不同时间为30秒到250秒。其跳跃通过必须使用多路技术进行。由于人们趋向于同时传输几个备份到一卷磁带上,从磁带中进行单个备份的恢复就必须读数据、跳跃数据,读数据、跳跃数据这样地循环下去。首先,你可能不需要将数据多路化输入到磁盘上,因此就不需要跳跃/读/跳跃。第二,即使你使用了多路技术,跳跃/读/跳跃也会因为这是磁盘而很快。
磁盘不需要介质管理,因为没有磁带的加载。最后,你没有必要经常做全备份。一个虚拟带库和相同大小的真实带库相比,实际上可能会给你更大的容量,那就是因为不经常作全备份不会增加恢复的时间或者减少备份的完整性。

网友评论