为什么列式数据库对IT很重要?

PChome | 编辑: 何毅 2014-01-20 06:30:00原创

如果列式数据库使用不当,将无法从数据中获取最佳价格与性能,甚至结果会背道而驰。列式数据库技术可让大数据分析更深入,加速企业报告生成速度,并减少存储所需的管理员数量。

如果列式数据库使用不当,将无法从数据中获取最佳价格与性能,甚至结果会背道而驰。列式数据库技术可让大数据分析更深入,加速企业报告生成速度,并减少存储所需的管理员数量。

如果与拥有列式相关的压缩技术的厂商合作,列式数据库就能大量节省数据仓库所需存储的成本。在处理数据时还能获得更好的用户支持、更好的性能,还能与现有的关系型数据库和谐工作。我这边关于总体拥有成本的研究表明,添加列式到关系型数据库会产生额外的管理复杂度,因为需要处理两个而不是一个数据库,不过列式数据库通常不太复杂,而且数据高度压缩,所以对管理员来说还是能搞定。

了解数据库结构

列式数据库存储数据,顾名思义,是列(所有给定区域的数据)而不是行(所有给定用户记录的数据)。列式技术最常用于商业智能与分析应用领域。但也有一些厂商通过列式架构来解决OLTP与混合应用负载,比如典型的企业应用。

事实上,列式数据库的应用甚至比我们所熟悉的行式数据库的历史更长。当IBM引入第一个面向行的关系型数据库时,来自美国的Computer公司已经在销售非关系型的列式Model 204数据库了。在90年代,Sybase推出了Sybase IQ产品,这样列式存储技术才真正应用到关系型数据库当中。

面向行的数据库技术擅长做随机读取、单个插入与更新,可访问拥有两到三个字段以上的单个记录。列式擅长跨大量包含共性的列(或字段)记录查询,以便有效压缩。目前列式数据库不涉及个人记录的更新,但处理大量上传到数据仓库还是可以的。

完全取代面向行的关系型数据库没有意义,比如SAP上的DB2与Peoplesoft上的Oracle。列式数据库技术将逐渐接管数据仓库与分析,是对现有运营型数据库的补充。IT经理可根据项目需求购买某个厂商的解决方案,比如用来支持大数据分析,但也可以将更多的核心数据仓库转移到列式数据库上。

另外,列式数据库是否能成为Hadoop的好基友还尚待分晓,因为MySQL和其他面向行的关系型技术也能很好地满足Hadoop环境。虽然来自社交媒体的半结构化与非结构化的数据能从一些列式压缩中受益,但真正的用户案例还是比较少。

如果你的企业决定采用列式数据库处理技术,那么需要制定正确的工具来进行。四大厂商甲骨文、惠普、SAP与IBM在列式数据库市场都有一席之地。

相关阅读

每日精选

点击查看更多

首页 手机 数码相机 笔记本 游戏 DIY硬件 硬件外设 办公中心 数字家电 平板电脑