NetApp重复数据删除 缓解数据爆炸压力

互联网 | 编辑: 杨雪姣 2008-07-07 15:11:00转载-投稿 返回原文

第一页

作者简介

Brett Battles 和 Mark Woods

Brett(右)在 NetApp主管存储子系统和 OEM 解决方案的产品管理工作。在加入 NetApp 之前,Brett 曾先后担任过工程和业务发展领域的多项职务。他获得了乔治亚理工学院的理学学士学位和斯坦福大学的博士学位。

Mark拥有15年以上的产品管理和营销经验。在加入 NetApp 之前,Mark 曾在 Hewlett-Packard 公司就职,主要从事服务器业务领域的工作。他获得了科罗拉多大学的电子工程学士学位和德克萨斯大学的 MBA 学位。

如果您被告知“每次要为数据中心引入一个新系统或应用程序时,都必须放弃一个现有的系统或应用程序”,您会怎么做?

当数据中心面临电力、空间不足或冷却设备能力不足时,必须进行大幅度改动才能继续工作。新建一个数据中心几乎不切实际;新的企业数据中心需要花费成百上千万美元,经历数年时间才能建成。有些公司开始要求管理员做出一些退让以便为数据中心引入新系统或应用程序,即让现有系统或应用程序让位给新进的系统或应用程序。
 
数据中心的年用电量在稳步上升。如果继续保持这种态势,将需要新增 10 座发电站才能满足未来三年的用电量增长。

效率是数据中心节省电力、冷却和空间的关键因素。通过使用刀片和虚拟化软件将服务器资源集中,可以提高服务器资源的利用效率。通过选用合适的存储系统,您可以在存储基础设施中实现与虚拟化服务器基础设施相同的效率类型。NetApp 制定了一个简单的替代方案以满足快速增长的电力、空间和冷却要求:我们采用创新技术,通过更有效地存储数据,减少用电的机器和磁盘。

NetApp 的提升数据中心效率的技术将让您立即并持续获益。您可以降低裸存储开支,享受相应的节省电力、冷却、数据中心空间的好处,同时还可以降低数据中心的碳排放。另外,还可能带来的最大好处在于,您可以避免因着手建立新数据中心而产生的巨大费用和人力投入。

NetApp 的存储效率技术包括:

•重复数据删除,以消除冗余数据对象

•RAID-DP,提供比镜像更强的数据保护,同时大大减少所用磁盘数量

•FlexVol 简化配置,以尽可能缩小分散的存储容量

•SATA 磁盘驱动器,其耗电量比同等容量的 FC 驱动器少 40%

•Snapshot™ 的时间点恢复技术,只占用非常少的存储

•FlexClone 可写的 Snapshot 副本,用于测试和开发

第二页

存储效率始于平台

许多数据中心为每项存储需求(业务应用程序、文件服务、备份、存档等)使用不同的存储系统。这种做法不仅增加复杂性,浪费存储,而且降低了宝贵的数据中心资源(人力、电力、冷却和空间)的利用效率。使用以 Data ONTAP 操作系统为特征的 NetApp 统一存储平台,就不再需要使用独立的存储系统和特殊网关。

通过重复数据删除技术去除重复的数据对象

平均每个 UNIX 或 Windows 企业磁盘卷包含数千甚至上百万重复数据对象。当修改、分布、备份和归档这些对象时,这些重复的数据对象被反复存储,结果导致存储资源被低效使用,并耗费电量为其供电。重复数据删除技术将去除重复的数据对象,并创建一个数据指针指向磁盘上已存储的精确副本。

重复数据删除实际能节省多少空间?

重复数据删除供应商声称其产品可提供 20:1、50:1 甚至更高的数据减少比率。这些声称实际上是指重复性数据备份时重复数据删除的“基于时间的”空间节省效果。由于数据备份包含大量未改动的数据,因此在存储第一个完整备份之后,所有后续的完整备份可能需要频繁经历重复数据删除。

在非备份数据环境中(例如文件归档,或不常访问的非结构化数据),基于时间的数据减少比率的规则不适用。在这些环境中,卷不接收稳定的冗余完整备份,但是仍可能包含大量驻留的重复数据对象。通常采用术语“空间”来评测可通过重复数据删除来减少这些卷中空间需求的能力。例如,通过重复数据删除可将 500GB 的数据归档卷减少到 300GB,则空间减少率 40%。

采用 FlexVol 简化配置,提高存储利用率

根据行业估计,平均存储利用率在 25% 至 40% 之间。由于难以预测实际的存储需求,因此应用程序管理员请求的空间通常会比他们的预计量超出许多,以便当后面需要更多存储时,他们可以从容应对。这种常见做法确保会过度分配 — 估计已供电的总存储容量中有 60%-75% 处于未使用状态。如此低的利用率不仅造成存储浪费,还造成电力浪费。采用 NetApp FlexVol 技术则可以根据物理的磁盘组创建逻辑存储池。池中的容量可以在许多数据集之间自由分配,因此无需为每个数据集分配物理预留。采用 FlexVol 简化配置之后,存储利用率通常从平均 40% 上升到 60% — 节省了 33%。

第三页

•威廉•博蒙特医院(William Beaumont Hospital)运行了 25 个 Oracle 数据库,当采用 Data ONTAP 7G 中的 Flex Vol 技术,并且将九个系统合并成三个主存储系统及一个近线系统之后,其利用率提升了 50%。
使用 SATA 磁盘,将能耗降低 40% 或更多

SATA 驱动器提供每基于驱动器的最高可用存储密度,其平均能耗比同等容量的光纤通道磁盘低 40%,使您可以尽量缩减数据中心的每 TB 瓦特数。根据最新研究显示,通过 SATA 驱动器,Oracle 的能耗可以降低 40%。

使用 RAID-DP 提高存储利用率

为进一步最大化效率及灵活性,您可以将 NetApp SATA 磁盘与我们的专利 RAID-DP 配和使用。我们的双奇偶校验 RAID-DP 是 Data ONTAP 操作系统的一项基本功能。与 RAID 10 数据镜像相比,通过 RAID-DP 提升的存储利用率高达 46%。此外,通过 RAID-DP,您可以在两台驱动器同时出现故障时进行恢复,这一点与其它 RAID 级别不同,后者只能承受一台驱动器发生故障。RAID-DP 的提升性能优势使您可以使用更便宜的 SATA 存储作为主存储,不必担心数据丢失,同时还可以降低您的存储采购成本。

采用 NetApp Snapshot 技术,为 Snapshot 副本使用最少存储

NetApp Snapshot 副本提供两大主要效率优势。首先,Snapshot 副本占用的存储空间最少。其次,通过这些副本,您可以将一份数据副本用于多项用途,从而降低对专用存储系统的依赖。减少所使用的专用存储系统数量可以从根本上降低用电需求。

通过 FlexClone 产生可写的 Snapshot 副本,减轻测试的存储负载

测试和开发需要大量的数据副本,并会加大存储基础设施的压力。采用 NetApp FlexClone 技术之后,您可以制作多个未实际占用存储开销的即时的数据虚拟副本。可写副本产生的节省量等于克隆的数据集大小减去任何后续改动过的块。

•自使用 NetApp FlexClone 之后,Blackboard ASP 将公司在测试和开发环境下的存储需求削减了 33%。
 
•实施 NetApp FlexClone 并移到网格基础设施之后,Oracle 的存储利用率增长到 403%。
 
汇聚所有这些技术

避免数据增长失控的唯一办法是在数据妨碍工作之前阻止数据激增。我们的多项技术有助于减少裸存储需求,消除系统中的重复数据。Snapshot、FlexClone、重复数据删除、FlexVol 和 RAID-DP 只是其中的一部分,将对存储空间产生重大影响。

因此,当将所有这些技术汇聚在一起时,与其他存储供应商相比,NetApp 将对效率产生怎样的影响呢?由于 NetApp 解决方案需要的每可用 TB 的存储更低,因此使用 NetApp 系统的用户可显著减少存储其数据所需的硬盘驱动器及盘柜的数量。根据 Oliver Wyman 的研究报告,从客户部署收集的信息显示,采用 NetApp RAID-DP、FlexVol 和 Snapshot 技术的直接结果是,在典型环境下与其他存储供应商的对等系统相比,NetApp 存储系统的客户每可用存储 TB 需要的电力减少 50%,产生的热量减少 50%。

返回原文

本文导航

相关阅读

每日精选

点击查看更多

首页 手机 数码相机 笔记本 游戏 DIY硬件 硬件外设 办公中心 数字家电 平板电脑