规划数据仓库的困惑

互联网 | 编辑: 2006-07-11 15:15:00转载 一键看全文

很多企业在实施数据仓库项目时,都有这样或那样的困扰,本文通过一个典型案例,分析了企业数据仓库的规划.

    有一个企业,是一个非常传统的制造业。

    在很艰苦的环境下,信息部门自力更生,通过几代人的努力,用Foxbase、VB、乃至Delphi、Powerbuilder等建立了自己一系列的应用系统,包括生产统计、财务、物资管理、设备维修等,到现在还在继续使用,有些系统甚至还运行在DOS上。

    前一段时间为了申报政府信息化项目建设扶持资金,他们就面临着很大的困惑:虽说从应用的情况来看,目前这些系统都运行得非常好。

    但从技术层面上讲,他们现在的应用系统难以上大雅之堂。难道真的要为了采用所谓的先进技术而对现在的系统进行推倒重来,重新建设吗?

    其实,很多企业搞IT在很多时候尽管不是很得法,但是很执着,以自己的方式进行,效果也还不错。而信息化方面的权威和专家,他们总是在各种场合提出最先进的理论和技术,告诉企业什么是对的、什么是错的。

    为了显示自己的权威性,到处指手划脚,给企业指出这里不对,那儿需要修改,否则就是不完整的、不规范的、不先进的信息化了,甚至会告诉你这根本就不是信息化,搞得企业无所适从。

    话题绕远了,还是回过头来说数据仓库的问题。

    其实,数据仓库也好,数据集市也罢,还有什么商业智能之类的,都是概念。

    说到底,最终都是为了在现有信息化应用的基础上,对数据进行有效的利用,对决策提供支持信息。

    二者的区别无非是实施的过程和方法不同而已。数据集市自下而上,数据仓库则自上而下。

    理想的“自上而下”,即一个企业建立惟一的数据中心,就像一个数据的仓库,其中数据是经过整合、经过清洗、去掉脏数据的、标准的、能够提供统一的视图。

    要建立这样的数据仓库,并不从它需要支持哪些应用入手,而是要从整个企业的环境入手,分析其中的概念,即应该有什么样的数据达成概念的完整性。

    而“自下而上”的做法,则是强调应用决定数据,有什么应用就获取什么数据。

    到底该如何选择,其实企业自身的决定往往会更正确。企业的信息化规划、主动权一定要抓在自己的手里。

    专家的意见只能用于参考、扩展视野、开阔思路,千万不能照搬照用。要相信自己,真正的专家就在企业内部。

    到底该如何选择,其实企业自身的决定往往会更正确。企业的信息化规划、主动权一定要抓在自己的手里。

    分步实施 急用先行----孙林 AMT企业资源管理研究中心咨询顾问

    数据仓库项目的建设,同大多信息系统的实施相比较,往往是个持久的过程。这是由于数据仓库软件所发挥的决策支持作用所决定的。

    数据仓库不同于流程管理软件,对于ERP、CRM等系统,其覆盖的企业业务活动,无论是采购、制造还是发货,成熟企业内部的业务运作流程往往比较稳定,变更并不频繁;而面对激烈的市场竞争,管理层决策所需要的信息却不断变化、日益复杂。

    数据仓库的建设,就是为管理层的分析、决策提供支持。就拿烟草企业来讲,对于烟草销量的分析,一开始的需求可能仅仅是从卷烟名称、销售网点地区分布的维度来分析就足够了,随着管理的精细化和销售预测的需要,可能又会逐渐地增加卷烟系列、卷烟价格、焦油含量等维度。

    随着企业从粗放型转向集约型,什么好卖就生产什么的时代已经一去不复返。越来越多的企业越来越注重市场和消费者行为调研,根据产品的历史销售情况进行多维度分析,寻找高利润弱竞争的市场并制定相应的营销计划,寻找适合企业的市场定位和目标选择,并且有计划地开展营销活动,最终使企业低成本、高效率的实现业务扩张。

    而在市场定位和目标市场选择的决策过程中,管理者往往需要大量的信息支持。这些信息,包括分析的内容、切分的维度,往往随着市场环境的变化以及消费者行为的变化而变化。而市场环境和消费者行为的不确定性,要求数据仓库对其提供的支持也就相应地在不同阶段会有所不同,体现在数据仓库的模型设计,可能会经常性的增加或减少一些分析主题和维度。

    一成不变的数据仓库设计,是无法满足企业管理者的决策需要。

    除此之外,数据仓库作为企业绩效管理软件,可以为企业、部门以及员工提供及时的KPI监测。随着企业管理的关注点不同,KPI的设计基本上也是以年为频率,不断变化。可能今年关注成本、明年关注效率。这一点,也要求数据仓库能够满足变化的需求。

    另外,从企业的实际情况来看,分步实施也是比较现实、可行的解决方案。

    一方面,从系统实施的角度上,分步实施的风险比较小、成功率较高。作为数据仓库项目的关键用户,至少要进行一些简单报表的开发,以及自定义主题的分析,这些内容往往有较高的技术要求。

    在实际的实施和培训过程中,用户的理解和接受过程可能比较慢。如果对用户的要求过高,一次性的将各种内容全盘接受,并运用到日常工作中去,风险还是比较大的。

    因此,大部分企业还是采取了先理解基础概念,到系统的基本操作,再到简单报表开发,最后是自定义主题分析的培训过程,容易使用户感觉受益,效果往往更好。对应的系统实施过程,则是一期项目以固定格式报表,二期以多维分析为主,后续则增加复杂分析、管理仪表板等内容。

    另一方面,从企业的信息化现状来看,分步实施甚至是不得已的选择。在企业实施了大量业务管理软件之后,的确积累了大量的业务数据可供分析。然而这些数据往往质量不高,难以进行统计分析。

    比如某企业销售管理系统里的经销商字段,同一个经销商可能被用多个不同的名称进行了记录,编码也不同,其对应的销售流水根本没有办法进行统计和合并。这样的问题,往往是导致数据仓库项目失败的重要原因。

    因此,很多企业只能选择数据质量较好的系统,从里面抽取数据进行分析。对于数据质量不好的系统数据,只能通过逐步的数据标准化和数据清洗转换项目,使数据质量达到统计分析要求后,才能够考虑抽取到数据仓库进行分析。

    最后,从成本角度讲,分步实施并不比追求一步到位的成本高。数据仓库如果分步实施,数据集市和数据模型重建的成本较高;然而,只要做好规划,前期的数据模型大部分还是可以复用的。

    对于大型的数据仓库项目,一次性的投入往往比较大,尤其是对于主机、存储等硬件设备的投资。如果数据仓库项目进展不顺利,大笔的投资将给企业和CIO带来很大的压力。

    因此,数据仓库建设还应贯彻分步实施的规则,有步骤地开展。从覆盖的业务范围来讲,先考虑企业的核心业务环节,比如产品销售、订单履行,再考虑其它业务环节,比如采购、生产质量控制等,往往能发挥最大的效益。

    从技术角度来看,首先选择数据质量好、容易采集的数据源,能够降低系统的实施难度。从应用层次上,从定制格式报表到多维度分析,到自定义主题和管理仪表板,能够最大程度得到用户的接受和认可。综合考虑各方面因素、制定合理的规划,分步实施,是数据仓库项目成功的必要保障。

    数据仓库建设应贯彻分步实施的规则,有步骤地开展。

    ◎《中国计算机用户》周刊读者俱乐部会员评论

    寻求一个适合的

    数据仓库作为决策支持系统(DSS)的基础,具有面向主题的、集成的、不可更新的、随时间不断变化的特性。

提示:试试键盘 “← →” 可以实现快速翻页 

一键看全文

本文导航

相关阅读

每日精选

点击查看更多

首页 手机 数码相机 笔记本 游戏 DIY硬件 硬件外设 办公中心 数字家电 平板电脑