目前,国内不少企业开展数据挖掘业务面临的最大难题是数据不全、数据不准确等。许多企业已经建立了包括ERP、CRM、POS等多个信息系统。
链接:复杂的前后期工作
沈跃明说:“最理想的状况是,一家人所用浙江电信的所有产品都挂在你一个人头上,你这个客户积累的电信消费额越高,企业就认为你对企业的贡献越大,企业反馈的的优惠也越多。”有时候,一家人可能既用了浙江电信的固定电话,又用了小灵通,还安装了宽带,但登记的时候丈夫一个、妻子一个、儿子一个,因为计算机无法识别三个客户之间的关系,只能按照三个客户来统计。针对这种现象,浙江电信特意推出了星级家庭优惠套餐,凡是同时安装了浙江电信固话、小灵通和宽带的客户送两个月宽带费,年底还有积分返礼。
除了数据分散外,数据不准确也是CIO们不得不应对的挑战之一。美国有一句谚语:“GarbageIn,GarbageOut(进去的是垃圾,出来的还是垃圾)”。刘世平说:“数据挖掘不是变废为宝,由于信息系统内积累的很多数据不准确,做项目的时候,常常要花费大量的时间校验数据。”在新加坡做项目的时候,有一次刘世平发现一个新加坡人的收入是2.8×1014。刘世平开玩笑说,他一个人的收入能养活整个新加坡,而且日子过得还不错。在国内做项目期间,这种明显违反常规的数据错误更是经常发生。
当然,做任何数据挖掘项目都需要有足够的数据积累,否则数据挖掘就成了“巧妇难为无米之炊”。例如,一家公司可能要花好几年时间积累有关不同营销方法的数据,然后才有足够的信息对某项广告活动的效果进行可靠的分析。DDBMatrix是美国恒信传媒集团(DDBWorldwide)旗下的一家广告公司,戴尔公司聘请DDBMatrix花了7年时间帮助它建立一个数据库,这个数据库收录了戴尔公司在平面媒体、广播电台和电视网和有线电视等各种媒体所做的150万条记录,以及做过这些广告的所有地区在广告出现前后的销售数据。这些信息帮助戴尔公司对它在每个地区的每一媒体促销活动进行仔细调整。
链接:复杂的前后期工作
自从BI(商业智能)20世纪90年代末引进中国以来,不断有企业试点数据挖掘项目或者实施BI软件,但成功的项目似乎并不很多。为什么数据挖掘业务进展平缓?为什么明知“数堆”里有“黄金”,用了全球最先进的软件却挖不到“金子”?
托马斯·达文波特认为,亚马逊公司、万豪国际集团等企业利用它们收集、分析数据的卓越能力成为业界的翘楚,但他们并不只是简单的数字处理工厂,他们在应用技术来解决多方面问题时,既具有强大的力量又带着精湛的技巧。同时,他们也集中精力寻找那些应该关注的重点,建立合适的文化以及聘用合适的员工,从而更好地利用公司不断获得的数据。最终,给这些企业带来强大力量的不只是信息技术,还有人才和战略。
刘世平说,利用软件“跑”数据只占数据挖掘项目总工作量的5%~10%,数据挖掘项目最难的不是数据挖掘本身,而是前期的准备工作和后期的解释工作。运用BI软件“跑”数据前,吉贝克公司总要花费大量时间和客户一起确定数据挖掘的主题,并进行前期的数据准备工作,包括数据校验等;“跑”完数据后,还要结合各种非技术因素,解释为什么会出现这样的数据运行结果,然后根据数据挖掘结果给客户提出政策建议。
项目前期除了大量的数据准备工作外,还要谨慎确定数据挖掘的主题。刘世平说:“很多客户不知道自己要做什么,也不知道数据挖掘能解决什么问题。”通常,在项目启动之初刘世平都会花大量的时间与客户的管理层沟通,分析客户当前迫切需要解决的问题,然后分析解决这些问题需要哪些信息,这些信息存储在什么地方等,最后才根据客户业务需求和数据支撑能力共同确定数据挖掘的主题。沈跃明说:“由于数据挖掘业务还处在起步阶段,稍有不慎就会出现一些令人啼笑皆非的结果,个别对数据挖掘业务不理解的人可能会因此更不信任项目组,打击项目组的积极性。”因此,最好选择数据资源较为准确的点而且容易出效果的主题作为数据挖掘项目的试点。
信息化是“一把手工程”,数据挖掘业务更需要管理层的热情支持。托马斯·达文波特认为,如果数据分析成为企业的竞争手段,必然会引起许多员工在业务流程、行为和技能方面的变化,因此像企业内任何重大管理变革一样,需要由热心于量化分析方法的高层管理人员来领导。最理想的情况是,主要倡导者是公司的一把手。萨拉·李面包集团前CEO巴里·贝拉查退休前在他的办公桌上一直放着一块牌子,上面总结了他个人以及公司的哲学:“我们只相信上帝的话,其他人请拿数据来。”

网友评论