第二页
WAFL 如何确定哪两块可以共享?答案是 WAFL 会为每块计算出"指纹",这是块数据的哈希。具有相同指纹的两个块即可用于共享。
在卷上启用 A-SIS 重复数据删除后,它会为备份卷中所有正在使用的块计算出一个指纹数据库(此过程称为"收集")。完成初步设置后,卷即可用于重复数据删除。
为了不减缓普通文件操作,副本搜索将作为一个单独的批次处理来完成。由于文件系统会在正常使用过程中进行更新,WAFL 将创建描述其数据块更改的日志。该日志不断累积,直到出现以下某种情况:
管理员发布 sis start 命令
sis config 计划中指定的下一次发生
日志更改超出了预定的阈值
这些事件中的任何一件都会触发重复数据删除过程。启动重复数据删除过程后,A-SIS 会使用变更块的指纹作为密钥来给日志排序,然后将排好序的列表与指纹数据库文件合并。一旦两个列表中出现相同的指纹,则可能有两个相同的块可折叠成一个。这种情况下,WAFL 会弃用其中一个块,并用另一个块的参考将其替换。因为文件系统时刻在变,除非两个块确实仍在使用并且含有相同的数据,否则我们当然可采取这一步骤。
A-SIS 重复数据删除实施利用了 WAFL 的某些特殊功能,从而使重复数据删除的成本降到最小。NetApp 很早以前就发现,要确保存储在磁盘上的数据的完整性,应该采用皮带与吊带式 (belt-and-suspenders) 方法。(事实上,最好有几双吊带。)因此,磁盘上的每个数据块都通过校验和得到保护。
A-SIS 使用该校验和作为它的指纹。由于无论如何都会计算指纹,相当于"无消耗",因此不会给系统增加任何负担。且由于 WAFL 绝对不会覆盖正在使用的数据块,因此在闲置数据块之前,"指纹"将保持有效。A-SIS 重复数据删除与 WAFL 的紧密集成也意味着更改日志是一种高效的操作。其结果是 A-SIS 重复数据删除可用于广泛的工作负荷,而不仅是用于备份,其它重复数据删除实施的情况也是如此。
哪些类型的环境较使用适合 A-SIS?
首先,您的数据应是使用了很长时间。如果您想马上更改数据,则努力寻找重复数据意义不大。系统还应具有 CPU 剩余空间。更改日志和指纹匹配是为效率而设计的,但都要耗用 CPU。如果您的系统长时间处于高 CPU 利用率,则重复数据删除带来的额外负载将是致命一击。
节约磁盘空间的其它方法
NetApp 提供了许多其它可更加高效地使用磁盘空间的方法,它们各具优缺点。不必仅选择一个;因为它们大部分都可以结合使用。
Snapshot 副本
从一开始,WAFL 就允许通过 Snapshot 技术共享数据块。由于文件会随时改变,您可使用 Snapshot 副本捕获该文件的多个版本,并且存储成本仅与版本之间的更改量相对应。
网友评论