第二页
一般来说,通用重复数据删除系统可以进行in-line重复数据删除操作,因为这是效率最高的方法。而且在理想状态下,重复数据删除系统应该可以识别不同长度的数据组来选择最有效的重复数据删除策略。例如,重复数据删除系统可以提取并且只保存数据库中发生改变的数据组,而不是对整个数据库进行备份。
而且,具备复制功能的通用重复数据删除系统提供了将数据备份到远程站点的最佳解决方案。重复数据删除系统只需要复制网络中的新数据。
最高效的系统可以进行重复数据删除复制、in-line重复数据删除以及多站点之间的重复数据删除。到目前为止存储厂商中Data Domain做到了以上三点。除此之外,in-line重复数据删除可以在系统开始接收数据的时候就启动复制流程。这与VTL系统有所不同,VTL系统通常采用的是post-process重复数据删除,因此在复制流程开始之前会有一个延迟的时间,这也提高了灾难恢复数据的风险。
VTL解决方案
飞康(FalconStor)、NetApp和Sepaton等VTL解决方案提供商通常会认证一系列备份应用,但是他们在数据来源和目标设备方面却不是一视同仁的。
VTL解决方案仿效的是磁带库。因此,只有支持磁带库的应用才能使用VTL,这本身就具有一定的局限性。
目前数据中心常用的设备会将数据传输到磁盘中,而且不支持磁带协议。许多数据保护功能不支持将数据复制到VTL的操作。
目前VTL解决方案在重复数据删除方面的局限性大多集中在附加的管理复杂性和in-line与post-process的争论上。总的来说,附加的虚拟磁带管理需要在磁盘上模拟磁带,这让已经就很复杂的环境更加复杂。
Post-processing还使未来日常管理工作变得更加复杂,而且对重复数据删除的时间和复制时间有负面的影响。Post-processing还需求有额外的磁盘空间来支持重复数据删除技术。
最后,更多的空间就意味着需要管理更多的磁盘、更多的能源支持、冷却设备、当然还需要更多的占地空间、购买更多磁盘。到目前为止,厂商大多是通过使用较低效的post-processing重复数据删除方式向现有的VTL产品中增加重复数据删除功能。
基于软件的重复数据删除技术和单实例
备份软件厂商开始向他们现有的功能特性中增加重复数据删除功能。除此之外,CommVault等备份软件厂商开始使用单实例等数据缩减技术,这项技术可以在备份主机接收到数据并进行文件级的比较时启动这项功能。
虽然这种方法消除了备份流程对存储空间的要求,但是却无法解决房网络带宽问题,也不能解决同样数据产生多个副本的问题(只有在某些特定应用中运行的数据才能进行冗余比较)。
单实例存储不能解决备份存储的其他问题——一段时间内变动很小的文件。
有了单实例存储,那些每天没有变化的文件被剥离备份流程。然而,在任何备份策略中,不发生变化的文件都不会成为问题,有问题的往往是那些每天都会有小变动的大型文件。
网友评论