加1等于几?幼儿园的小孩子会毫不犹豫的回答2,但是今天我们知道,很多情况下,1加1的结果并不是那么绝对,正如今天我们也能从多角度来证明集体的力量大于个人力量的叠加。
存储集群正是一种集体力量的体现,他是多个存储实体的有机的结合,每一个存储实体都包含独立的I/O系统和处理器,因而每个单元拥有独立的运算和处理能力,而这些单元都在一个共享的网络环境下并行工作,就像一个团队一样带来了极大的带宽突破和运行效率的大幅提升。
通过应用集群技术,不仅可有效提升数据中心服务器系统的稳定性、可用性及可管理性,同时允许用户使用价格相对低廉的配置(如刀片)捆绑来替代昂贵的单块集成电路的高端服务器,在不影响性能的情况下节约了存储成本。下面让我们来了解一下存储集群系统。
分而治之提高整体效率
传统的存储系统受限于物理组件(磁盘数量、连接的服务器数量、缓存的大小和控制器的性能)和功能以及逻辑约束(可支持的文件系统数量、快照或拷贝的数量等)。这些预先确定的或真或假的界限迫使用户只要在存储系统受到限制时,就需要升级到更大的存储系统和使用更多的管理工具。这些传统存储系统的瓶颈可以通过存储集群较好的解决。
一般集群衡量特性包括:
处理大量连续读写操作或者时间敏感的面向事物的随机读写操作的性能(带宽、IOPs或者组合操作);
可用性——消除单点故障、透明的故障转移或者自我修复的能力;
存储容量和服务器访问连接(光纤通道、以太网、InfiniBand接口);
在块设备(iSCSI、FC、InfiniBand)或通过网络连接起来的存储设备上的NFS、CIFS或专用的文件系统以及数据共享方面的可达性;
通过紧凑或松散的互连接,可控的共享级别架构可以基于开放或者专有的硬件和软件。
目前市面上有多种不同的集群存储解决方案,包括了集群并行文件系统,集群文件服务器,集群NAS,集群iSCSI和FC存储,不一而足。大部分集群的部署解决的是容量和可用性的问题。还有一些集群存储解决方案支持输入输出的吞吐性能调节,以及简化使用和管理。
集群存储的潜能在调整容量、性能、可访问性(块或文件)、可靠性和易用性等方面是不尽相同的。集群存储并不仅仅用于在高性能计算环境下处理大量的连续带宽或者并行文件系统存取。通用的集群存储支持传统的业务应用,例如电子邮件、数据库以及联机事务处理等等。
有机组合满足多样应用环境
多样的应用和环境得益于弹性的集群存储系统的可量测性(性能、容量、可靠性、模块化)和抽象化(虚拟化)能力。举例来说,一个中小企业的环境可以初始配置一个小的多节点存储系统来满足特定应用的需求,并根据需要来提升存储系统的性能,扩大容量,增进功能。
消除单点故障对于加强数据可用性、可访问性和可靠性方面十分重要。有效的集群存储解决方案应该可以估计出可能的单点故障,并包含N+1个冗余,热交换组件被设计成具有可以识别、隔离、并限制故障爆发的自我修复能力。
还有另外一类存储解决方案,很难说清它们是否属于集群的范畴,这些存储系统拥有为冗余而构建的N+1架构,在这种N+1架构的模式中,有两个或以上(N个)主要输入输出节点或者控制器,也叫做NAS网关,以及备用存储或故障转移节点,代表产品是EMC的Celerra NSX 和Pillar Axiom。而让N+1模式更加混乱的是主机架构,包括部署双控制器RAID阵列或者双NAS网关解决方案作为有效的集群。
集群是网格吗?那取决于你对网格如何定义,看你是否把网格定义为服务、架构、基于硬件或者软件、跨越距离或提供其他一些能力。因此,目前对于服务器和存储环境的网格或者集群的构成有很多不同的厂商和业内定义及观点。笔者有着多年的电力生产和传输工作经验,发现有些在关于网格的讨论中漏掉了——而且还是一个重要的组件——即数据采集与监视控制系统。因此,在网格-集群的对抗中,为存储系统的透明命令和控制而存在的数据采集与监视控制系统类似的功能是否存在于网格系统中这一问题被抛了出来。
不同的集群存储解决方案的差异包括:
节点之间如何相互连接(松耦合或紧耦合,开放或私有);
输入输出亲合性和吞吐量在节点之间的负载均衡;
专有硬件,开放的,随时可用或支持第三方服务器和存储;
文件共享,包括集群文件系统软件,基于主机的代理程序或驱动程序;
本地及远程镜像或拷贝,以及快照;
模块化存储随着为自动负载均衡的虚拟化技术增长而增长
为连续读写操作或随机更新操作进行性能调整;
分布式锁管理和集群连贯性功能。
了解了集群存储不同的含义、种类和部署,可以让你从容解决手头的任务。集群存储可以很好适应不断增长和变化的环境,来保证即时存储的能力,却不增加升级或管理的复杂性。
网友评论