第一页
去年十月份,国外媒体采访了业内专家Garth Gibson先生。Garth Gibson是卡内基梅隆大学的一位研究RAID计算的顶尖计算机科学家,他领导着Peta级数据存储设备学会(PDSI),该学会主要研究如何解决与存储海量数据有关的各种问题,而其中最主要的研究项目是探索计算机为什么会出现故障。
现在,一年过去了,Gibson又接受了有关媒体的专访,谈及了PDSI学会是否找到了计算机出故障的原因以及在Peta级存储设备的开发研究方面取得了什么样的进展。
“我们在我们的系统中使用的驱动器的数量以及我们在那些驱动器上储存的数据量在过去十年发生了急剧的增长,计算机的故障总量也增加了。”Garth Gibson这样说到。
设定一个新的标准
Gibson是领先的大型存储设备厂商Panasas公司的创始人兼首席执行官,据Gibson说:“对于企业和科学研究界的大型用户来说,2007年存储设备业界发生的最重要的事情是并行NFS标准草案的完成。”他说他预计这个标准草案将于12月2日被提交给因特网工程特别工作组(Internet Engineering Task Force)审核。Gibson表示:“那将创立一个多源的、竞争性的、标准化文件系统,可以满足各种Peta级系统的要求。”他还指出,到目前为止可缩放文件系统界还没有形成一个开放的标准。 “因此,各个解决方案都有新机会。”
这项标准其实是下一代NFS即NFS 4.1,它是为了替代NFS 4.0而开发的。Gibson说:“在4.1标准中的所有东西都是可选择的,因此你可以象往常一样继续使用NFS 4.0,并且开始体验新功能。”Gibson说,对于那些要求高性能、可缩放存储系统但是不愿意进行巨额投资购买需要经常进行升级的所有权系统的企业来说,他相信新的开放标准最终会提供一个更好的投资回报。
弥补介质故障
为了解决计算机出现的故障,并试图在更低故障率条件下建造大型存储系统,磁盘驱动器厂商们正在不断对产品进行完善,研究人员们也不断研究开发出新的技术。
Gibson说:“企业们将重新认识规模的含义,它们将采取措施改善存储系统在故障方面的容许量。”那些措施包括加快维修系统的速度、大规模并行重建数据、增加对检查点、完整性代码和纠错码的使用以防止出现更多种类的故障,并将RAID磁盘的故障容错率提高2倍到3倍。 虽然Gibson避免将这些故障称作是重要故障,但是他声称这表明了提供更强大的纠错机制已经形成一个总体趋势。
更重要以及更值得一提的是,驱动器会变得更加可靠。不过问题仍然存在,我们在系统中使用的驱动器的数量和我们在驱动器上存储的数据量在过去10年里发生了急剧的增长,这就导致故障总量也增加了很多。
企业和研究人员们特别关心的问题是介质故障率,也被称作无法修正的读误差或者潜在介质故障。虽然这个问题并不是经常发生,但是时不时尤其是当里在使用Peta级系统时还是会不时发生这样的故障并引发重要问题。
未完,请翻页
网友评论