分析：确保重复数据删除系统的高可用性

互联网 | 编辑: 杨雪姣 2007-11-28 11:20:00转载

在部署重复数据删除系统时，考虑其可伸缩性和可靠性很重要。随着存储容量和重复数据删除粒度性的增加，系统性能需要保持在可接受性的水准之上。如果由于重复删除算法错误而产生数据损失，重复数据删除应能够不受影响。

可伸缩性与哈希冲突

重复数据删除产品检测重复的数据元素，判断一个文件、块或比特是否和另一个文件、块或比特相同。重复数据删除产品将每个数据元素用数学的"哈希"算法来进行处理，并得到一个名叫哈希码的唯一的认证数。每个数字都被编译到一个清单，这个清单经常被称为哈希索引。

当新的数据元素被处理时，它们所产生的哈希码将和已经在索引表中的哈希码相比较。如果新的数据元素所得到的哈希码和另一个已经在索引表中的哈希码相同，那么这个新数据将被认为是一个重复数据，将不被保存到磁盘--只有一个很小的参照"存根"能够相联到已经被存储的同一数据。如果索引表中没有这个新的哈希码，那么该数据元素将被认为是新数据而被正常保存到磁盘中。

即使这个数据不是和已保存的那个数据完全相同，这个数据元素还是可能会产生同样的哈希码。这就是误确认，或者称为哈希冲突，这将导致数据丢失。有几种方法可以缓解误确认。重复数据删除厂商可以选择在每个数据元素上使用多于一个的哈希算法。例如，FalconStor 软件公司的虚拟磁带库（VTL）上的单实例存储（SIR）技术就用SHA-1和MD5算法来进行带外索引。这在很大程度上减少了误确认的机率。另一个选择就是使用一个哈希算法，但是在数据元素的比较上精确到比特单位。

这两种方法的共同问题是它们需要主机系统更多的处理能力，降低了索引效率，减缓了重复数据删除进程。随着重复数据删除进程越来越粒化，所检验的数据块也越来越小，索引变得更加庞大，而哈希冲突的机率也随之增加，更加拖累了性能。

可伸缩性和加密

另一个问题就是在一个公司的存储架构中，重复数据删除和传统的压缩及加密之间的关系。普通的压缩是将冗余数据移出文件，而加密则是"打乱"数据，使得数据完全随机而不可读。在数据存储中，压缩和加密都扮演着重要的角色，但是删除冗余数据可能影响重复数据删除进程。如果加密或传统的压缩和重复数据删除一起被请求进行，那么编制索引和重复数据删除应当先进行。

每日精选

手机价格或迎来拐点：小米上调出货 OV拒涨报价

存储芯片持续涨价成为压在手机行业身上的重担，市面上所有机型售价一路走高。随着小米上调出货，OV拒绝了涨价报价，似乎手机价格要迎来拐点了。

标签：存储| 涨价| 降价| 2026-07-25
白色装机党的新答案：技嘉B850 雕妹颜值性能一次拉满

纯白ICE设计、二次元雕妹元素、16+2+2相数字供电、PCIe 5.0、Wi-Fi 7、DDR5高频支持以及完善的DIY易用性，技嘉B850 AORUS ELITE-P ICE雕妹兼顾颜值、性能与扩展能力，为AMD AM5平台白色装机玩家提供了一套均衡且具备长期升级潜力的解决方案。

标签：技嘉| B850雕妹| 主板| 导购| 2026-07-25
618拉动家用路由器销量回暖，均价回落头部格局稳固

6月中国家用路由器线上主流市场（含京东、天猫等电商平台）的销量为103.6万台，同比下降7.9%，环比增长18.8%；销额为2.6亿元，同比下降9.5%，环比增长17.3%。

标签：路由器| 618| 2026-07-25
全新米家无线洗地机5C预约中三重防缠，售价999元

小米推出了全新洗地机——米家无线洗地机5C，采用三重防缠绕技术，拥有45分钟超长续航，支持60℃热流净味透烘。

标签：小米| 米家| 洗地机| 2026-07-26
高通全系芯片涨价下半年旗舰手机涨价已成定局

据美国媒体报道，高通于当地时间7月24日向全部合作客户下发官方调价通知，宣布上调全系列芯片供货价格，整体涨幅达两位数。

标签：高通| 涨价| 2026-07-25
用户零责任！铂智7电池事故起火厂家全担责

广汽丰田推出行业首个“电池事故起火厂家全担责”政策，覆盖非品质问题，并提供三电终身质保。此举结合OTA升级与王心凌代言，彰显其扎根中国、用户为本的转型决心。

标签：铂智7| 2026-07-25
游戏手机必备骁龙8E6 Pro独占1440P超分超帧

骁龙8E6 Pro支持LPDDR6内存，独占1440P超分、AI插帧两大游戏专属功能，游戏综合体验大幅升级。

标签：骁龙| 骁龙8E6Pro| 1440P超分| 2026-07-27
2026上半年智能投影销量大跌市场连续九季度下滑

上半年，中国智能投影市场（不含激光电视）全渠道的销量为205.6万台，同比下降26.0%；销额为33.4亿元，同比下滑27.0%。自2024年第二季度起，市场已连续九个季度发生了规模的同比下滑。

标签：智能投影| 投影| 极米| 坚果| Vidda| 2026-07-27
苹果积极游说使用中国存储芯片美光强烈反对

苹果正游说美国政府，希望获准在海外销售的苹果设备中搭载中国供应链的存储产品，以此缓解全球存储供货紧张局面，还能从源头控制硬件成本，进而降低终端产品售价。

标签：苹果| 长鑫存储| 长江存储| 美光| 2026-07-27
首款机器人手机荣耀Robot Phone定档8月12日

荣耀手机正式官宣，荣耀Robot Phone将于8月12日发布，这款新品由荣耀与专业影视器材品牌阿莱（ARRI）联合研发。

标签：荣耀| 荣耀RobotPhone| 2026-07-27