整合或分解:使大数据策略立于不败

互联网 | 编辑: 何毅 2013-10-30 07:52:00转载 一键看全文

大数据策略会失败吗?是时候该讨论一下这个问题了。企业才刚刚掌握如何集成ERP(企业资源规划)及其他业务应用来消除业务流程中妨碍效率的孤岛。

关系数据库仅能提供部分解决方法

由于数据量大而且种类不同,因此采用工具和技术管理非结构化数据就变得非常困难。非关系型NoSQL、XML以及关键/数值数据存储都可以协助企业解决多数大数据的可伸缩性和可访问性问题。例如Hadoop这样的解决方案使用MapReduce及Hive Query Language,为企业提供管理大数据的一个起点,并获取商业情报。如MongoDB和Cassandra这样的NoSQL数据库管理系统已经实现Hadoop集成,使客户获得至少一个客户端接口或者覆盖连接不同的数据流变得更加容易一些。

如今数据本身在企业中变得更加灵活。并行流程及智能数据将JitterBit这样的工具分块应用,将其设计成允许数据从一个应用程序传输到下一个应用程序,并保证传输的数据质量。这种通过数据类型及应用进行的集成对于时间敏感的企业活动来说非常重要,这些活动中也会涉及即时分析。一般地,这种形式的分析必须查询当前数据和历史数据,来识别新趋势。这就是SQL经常再次发挥作用的原因。

SQL、NoSQL以及大数据技术

新型数据的来临并不是否定过去几十年精心收集并整理出来的业务数据。SQL数据存储中的内部企业数据可以解释大数据与其他数据在精确性及相关性之间的差异。多数组织发现他们仍然需要为了企业数据而保持SQL结构,来支持企业最佳业务实践。将一切数据变为非结构化格式并不是集成,这仅仅是趋同化处理。与此同时,试图迫使结构化数据向非结构化数据转变也都是白费力气的努力。

从企业角度来说,集成的目标并不是关注数据结构化而是关注组织化。像新型Oracle Data Integrator这样的工具试图通过加载和转换数据的Hadoop来寻找平衡点,所以,结合传统企业数据就更容易进行分析。分析流程中,这种方法使得来自多种信息源及存储中的数据相融合,此时就更需要数据集成。这种折中的方法使得原始数据比最初的状态更加自由,维持这种隐含价值可能更适合于未来分析的新方法。 

提示:试试键盘 “← →” 可以实现快速翻页 

总共 2 页< 上一页12
一键看全文

本文导航

相关阅读

每日精选

点击查看更多

首页 手机 数码相机 笔记本 游戏 DIY硬件 硬件外设 办公中心 数字家电 平板电脑