目前,国内不少企业开展数据挖掘业务面临的最大难题是数据不全、数据不准确等。许多企业已经建立了包括ERP、CRM、POS等多个信息系统。
“科学算命”
“五一”期间,哪些型号的卫生洁具需要打折促销?打多大折扣企业效益才能达到最高?”“3G即将开通,我们该重点向谁推销?”“可透支的信用卡发给哪些人才不会赖账?”这些问题,任何单一的信息系统都无法“回答”,这时候就需要把多个业务系统的数据整合一起,建设数据仓库,进行横向分析,从而实现精确营销、精确决策。
浙江电信、中国建设银行、兴业银行、默洛尼卫生洁具公司等正在利用收集、分析数据的卓越能力,找出最有价值的客户、精确预测产品生命周期等,从而实现精确营销、精确决策。它们是怎么做的呢?
“精确营销的本质是,先对客户进行分群,分析不同客户群的消费行为和消费习惯,然后根据不同消费行为有针对性地设计营销套餐!”
“科学算命”
去年夏天,宁波电信推出了彩铃业务。刚开始宁波电信的主要推广方式是由社区经理通过97系统的客户资料给每个客户打电话,客户经理每天要打几百个电话。由于缺乏针对性,这种“全面撒网”式营销的成功率只有7%左右。后来,通过对潜在彩铃用户资料进行分析、归类、定位后,从20万潜在客户中挑选出10%购买可能性较高的客户,进行有针对性的外呼,成功率高达40%。宁波电信是如何实现精确营销的呢?
这得从宁波电信的MR(市场营销再造)项目说起。去年1月20日,中国电信市场营销再造项目宁波MR项目试点正式启动,核心任务是变地毯式营销为精确营销。长期以来,电信企业实行的是地毯式营销,要么不优惠,要么给23万用户全优惠。如何对23万公众用户进行针对性营销?浙江电信企业信息化部副经理沈跃明发现,精确营销的核心障碍是缺乏一套准确的客户数据仓库和对应的客户分群模型。沈跃明说:“精确营销的本质是,先对客户进行分群,分析不同客户群的消费行为和消费习惯,然后根据不同消费行为有针对性地设计营销套餐!”
于是,沈跃明和宁波电信局营销中心副总监兼市场拓展部经理毛宁飞建立了数据支撑小组,整个2月份都在进行数据准备工作。他们首先通过数据仓库建立了包括243张表的宁波数据视图,然后又根据用户呼叫行为、数据业务使用行为等客户特征提炼出39张关键表和337个变量。据介绍,宁波电信把客户行为分为呼叫行为和价值行为两个变量,然后画一张拓扑图,根据每个客户的呼叫行为数据和价值行为数据在拓扑图上不停地打点;这时发现很多客户的呼叫行为或价值行为很相近,很多点打在了一起,累积起来就逐渐形成了一座座“小山”,于是又根据这些“小山”进行客户分群,。
沈跃明和毛宁飞把宁波电信的客户分为11个客户群,如传统长途偏好群、经济商务群、网上冲浪群等;然后,根据每个客户群的消费行为,分析其客户特征和需求偏好。数据挖掘发现,宁波有一部分客户宽带的使用量非常高,而且对价格不敏感,客户流失率也很低,沈跃明和毛宁飞把这个人群称做网上冲浪群。进一步的数据挖掘发现,网上冲浪群的显著特征是,一般在30岁左右,收入普遍较高,对互联网有着强烈的偏好,而且对新事物的接受能力较强,但对产品质量要求很高。沈跃明说:“如果将来开通3G业务,网上冲浪群将是最先推的第一波客户。”
在推广彩铃业务过程中,宁波电信通过MR工具先对客户数据仓库进行关联分析,对类型基本一致的客户进行“聚类分群”,形成统一的客户视图;然后用IDM(IntelligenleDataMining)等数据挖掘工具对客户列出多条聪明变量,如:月平均费用、区内费用、是否特定机型、是否有小灵通短信功能、年龄、性别等;再通过均值等算法对各种聪明变量建立购买概率模型,按照概率对客户列表进行排序,选择购买可能性较高的用户作为目标客户,营销的成功率得到了很大提升。原来营销人员须对20多万客户进行地毯式营销,20人的营销团队需要200天时间,成功率仅为7%;使用预测模型后,营销人员只需挑选购买可能性高的10%即20000客户进行营销,20人的营销团队只需20天的时间,成功率则提高到了40%。
此外,在数据挖掘过程中沈跃明还发现了很多颇有价值的客户群,使得企业对当前的竞争态势有了准确认识。例如,一些老人购买小灵通后只接电话不打电话,对浙江电信来说就是每月收月租费,以传统眼光看这个人群没有拨打行为,其ARPU(每户平均收益)值肯定是很低的,属于限制发展的业务。但把小灵通、固定电话等产品数据集成在一起,挖掘发现这些老人用小灵通接很多外地电话,而且是外网移动电话打进来的。按照协议,移动电话通过中国电信的网关,每通话一分钟中国电信可以赚6分钱,如果每个电话打10分钟、每月接30个电话,每部小灵通每月可以为浙江电信赚18元钱,有时候还不止18元。这些用户对浙江电信来说,虽然收入很低,但价值是中等的。进一步数据挖掘发现,这些老人家里还装了固定电话和宽带,而且经常用浙江电信的IP卡打长途电话。沈跃明说:“把这些业务统一算在一个客户的头上,其ARPU值是很高的。”
后来,为了推广用数据分析去竞争的策略,沈跃明等数据仓库项目组又简化了数据挖掘过程,从337个变量中找出十几个关键变量来,然后用计算公式把一些常用的计算方法固定下来,形成某个专题应用的计算方法。项目组把这些关键变量称做“聪明变量”,例如对180的投诉次数就是挖掘最易流失客户的聪明变量,因为客户除非在忍无可忍的时候才会打180投诉。目前,浙江电信数据仓库项目和 项目一道共总结了11个套餐模型算法,沈跃明经常开玩笑说:“这11个算法是科学算命”。如今,浙江电信的本地网要设计业务套餐,只需要根据省公司提供的11个算法来修改参数即可。
数据挖掘主要解决三方面的问题:一是找出最有价值的客户、最易流失的客户和满意度最高的客户;二是分析他们的消费行为和消费习惯;三是推出有针对性的产品和服务,实现从以产品为中心到以客户为中心的转变。
描绘产品生命周期
描绘产品生命周期
随着信息化建设的深入,尤其是随着金融、电信等行业数据大集中的基本完成,电信、银行、零售以及部分大型制造企业不仅能够做到依靠数据分析去竞争,而且他们也应当这样做。美国巴布森学院信息技术及管理学教授托马斯·达文波特认为,现在许多行业的公司都提供类似的产品并使用类似的技术,在这样一个时代,业务流程成为最后剩下的可以创造差异的亮点之一。分析型竞争者擅长做的事就是从业务流程中挤出全部的价值,一点都不剩。因此,他们不仅像其他公司一样知道自己的客户需要什么产品,而且要知道这些客户愿意支付什么价格,每个客户一生中将会购买多少商品,以及什么会刺激人们购买更多的商品。他们不仅像其他公司一样知道什么时候库存不足,而且能够预测需求和供应链方面可能出现的问题,从而保持很低的库存率和很高的完美订单率。
中国建设银行青岛市分行个人金融部副总经理初顺起认为,数据挖掘主要解决三方面的问题:一是找出最有价值的客户、最易流失的客户和满意度最高的客户,分析他们的消费行为和消费习惯,然后推出有针对性的产品和服务,实现从以产品为中心到以客户为中心的转变。二是分析同类产品的历史数据,确定现有产品的生命周期,指导企业在每个产品上的态度和动作。三是做好业务发展预测工作。目前,多数企业制定发展规划时,往往按照往年的发展速度,乘以相应的比例系数,作为下一年的发展目标,其实这样做没有什么真正的依据,只有通过分析每个产品的状况,结合企业战略重点和国内外经济环境,才能科学地制定企业发展规划。
当前,对电信、金融、零售等行业来说,除了挖掘客户信息实现从以产品为中心向以客户为中心转变外,还要加强对产品生命周期的预测,指导企业在合适的时间、合适的地点以恰当的折扣开展市场营销活动。如何精确预测产品生命周期呢?
刘世平是吉贝克信息技术公司的总裁,回国创业前他在IBM公司率领其数据挖掘团队从美国的美洲银行、富国银行“挖”到加拿大,又“挖”到亚洲的泰国和新加坡,为20多家国际知名银行建立起商业智能管理系统。刘世平说:“一个产品投入市场能否给企业带来效益?能带来多大效益?首先要分析同类产品的历史销售数据,精确描绘出产品生命周期图,才能预测新产品将要发生的行为。”
一个产品的生命周期分为研发期、市场接纳期、成熟期、衰退期等。刘世平的做法是,首先以时间为序列分析历史同类产品的销售数据,如产品推出3个月时销售如何、推出6个月时销售如何、什么时间竞争对手做出反应等,把历史同类产品每个时间点的“生存状况”搞清楚,尤其是产品生命周期转折的时间点搞清楚,画出产品生命周期图。然后,分析新产品推出后一段时间内市场的反应,画出新产品的现有生命周期图,再把两张产品生命周期图对比,准确预测新产品生命周期转折点的不同时间点,为企业决策提供支持服务。
每年“五一”期间,默洛尼卫生洁具(中国)有限公司都搞很多促销活动,但究竟打多大折扣企业效益才能最高,谁也说不清,只能跟着感觉走。去年实施完BI(商业智能)后,IT和物流经理彭元华立刻成了“香饽饽”。彭元华说:“现在,默洛尼公司搞促销活动前,先分析各地区的历史销售数据,预测各地区不同产品的销量,然后分析不同产品的生命周期,再结合不同地区的消费习惯,确定每个产品在不同地区的促销方案。”
与彭元华关注的焦点不同,初顺起更看重利用数据挖掘延长产品的生命周期。随着市场竞争的加剧,产品的半衰期越来越短,即从鼎盛起进入衰退期的时间越来越短,如何延长产品生命周期呢?初顺起说,和理想状态相比,产品刚推出时可能有70%的优点、30%的缺点,由于是新产品客户对这些缺点是可以容忍的;随着产品的推广,一方面竞争对手会逐渐推出同质化产品,客户有了更多的选择,另一方面客户自身对产品的要求也越来越高,客户对产品的缺点越来越难以容忍,这就迫使企业对产品使用过程中客户的反馈进行挖掘,及时改进产品质量;但产品质量不可能无限制地改进,当产品进入鼎盛期后,企业继续改进产品的成本可能越来越高,而产品改进带来的收益则不断下降,这就意味着企业需要加速推出新产品,而不再是继续改进老产品。
许多企业已经建立了包括ERP、CRM、POS等多个信息系统,能够确保所有的交易或其他重要往来情况都留下记录;但要依靠这些信息进行竞争,企业必须用标准格式记录这些信息,还要对其进行整合,并把他们存储进数据仓库,才能使得技术人员很容易地获取这些信息。
力量的源泉
目前,国内不少企业开展数据挖掘业务面临的最大难题是数据不全、数据不准确等。许多企业已经建立了包括ERP、CRM、POS等多个信息系统,能够确保所有的交易或其他重要往来情况都留下记录;但要依靠这些信息进行竞争,企业必须用标准格式记录这些信息,还要对其进行整合,并把它们存储进数据仓库,使得技术人员能很容易地获取这些信息。为了实施BI系统,彭元华花了一年多的时间整理存储在不同系统内的数据。彭元华说:“不仅要把存储在不同系统内的数据整合到一起,还要统一不同信息系统的数据格式和数据含义。”在实施MR项目前,浙江电信已经实现了全省本地网的数据大集中,但在数据挖掘过程中,沈跃明仍然遇到了数据分散的难题。
据介绍,目前浙江电信的数据仓库中有11个本地网的83套信息系统,除去总公司的信息系统,平均每个本地网有六七套信息系统,包括宽带网计费系统、小灵通计费系统等。针对数据分散的现实,一方面通过统一数据模型,进行格式转换;另一方面在结合专题分析等应用时,沈跃明等项目组成员摸索了一套宽表设计的数据集成方法。原来,小灵通收费一张表、宽带收费一张表、固话收费一张表,在客服部门还有一张客户信息表,通过把不同表上的客户信息集成在一起,设计了一张宽表,包括客户姓名、家庭住址、小灵通收费、宽带收费、长话收费、市话收费等十几项内容,在数据库内一个客户在浙江电信的所有消费就变成了一条记录。
链接:复杂的前后期工作
沈跃明说:“最理想的状况是,一家人所用浙江电信的所有产品都挂在你一个人头上,你这个客户积累的电信消费额越高,企业就认为你对企业的贡献越大,企业反馈的的优惠也越多。”有时候,一家人可能既用了浙江电信的固定电话,又用了小灵通,还安装了宽带,但登记的时候丈夫一个、妻子一个、儿子一个,因为计算机无法识别三个客户之间的关系,只能按照三个客户来统计。针对这种现象,浙江电信特意推出了星级家庭优惠套餐,凡是同时安装了浙江电信固话、小灵通和宽带的客户送两个月宽带费,年底还有积分返礼。
除了数据分散外,数据不准确也是CIO们不得不应对的挑战之一。美国有一句谚语:“GarbageIn,GarbageOut(进去的是垃圾,出来的还是垃圾)”。刘世平说:“数据挖掘不是变废为宝,由于信息系统内积累的很多数据不准确,做项目的时候,常常要花费大量的时间校验数据。”在新加坡做项目的时候,有一次刘世平发现一个新加坡人的收入是2.8×1014。刘世平开玩笑说,他一个人的收入能养活整个新加坡,而且日子过得还不错。在国内做项目期间,这种明显违反常规的数据错误更是经常发生。
当然,做任何数据挖掘项目都需要有足够的数据积累,否则数据挖掘就成了“巧妇难为无米之炊”。例如,一家公司可能要花好几年时间积累有关不同营销方法的数据,然后才有足够的信息对某项广告活动的效果进行可靠的分析。DDBMatrix是美国恒信传媒集团(DDBWorldwide)旗下的一家广告公司,戴尔公司聘请DDBMatrix花了7年时间帮助它建立一个数据库,这个数据库收录了戴尔公司在平面媒体、广播电台和电视网和有线电视等各种媒体所做的150万条记录,以及做过这些广告的所有地区在广告出现前后的销售数据。这些信息帮助戴尔公司对它在每个地区的每一媒体促销活动进行仔细调整。
链接:复杂的前后期工作
自从BI(商业智能)20世纪90年代末引进中国以来,不断有企业试点数据挖掘项目或者实施BI软件,但成功的项目似乎并不很多。为什么数据挖掘业务进展平缓?为什么明知“数堆”里有“黄金”,用了全球最先进的软件却挖不到“金子”?
托马斯·达文波特认为,亚马逊公司、万豪国际集团等企业利用它们收集、分析数据的卓越能力成为业界的翘楚,但他们并不只是简单的数字处理工厂,他们在应用技术来解决多方面问题时,既具有强大的力量又带着精湛的技巧。同时,他们也集中精力寻找那些应该关注的重点,建立合适的文化以及聘用合适的员工,从而更好地利用公司不断获得的数据。最终,给这些企业带来强大力量的不只是信息技术,还有人才和战略。
刘世平说,利用软件“跑”数据只占数据挖掘项目总工作量的5%~10%,数据挖掘项目最难的不是数据挖掘本身,而是前期的准备工作和后期的解释工作。运用BI软件“跑”数据前,吉贝克公司总要花费大量时间和客户一起确定数据挖掘的主题,并进行前期的数据准备工作,包括数据校验等;“跑”完数据后,还要结合各种非技术因素,解释为什么会出现这样的数据运行结果,然后根据数据挖掘结果给客户提出政策建议。
项目前期除了大量的数据准备工作外,还要谨慎确定数据挖掘的主题。刘世平说:“很多客户不知道自己要做什么,也不知道数据挖掘能解决什么问题。”通常,在项目启动之初刘世平都会花大量的时间与客户的管理层沟通,分析客户当前迫切需要解决的问题,然后分析解决这些问题需要哪些信息,这些信息存储在什么地方等,最后才根据客户业务需求和数据支撑能力共同确定数据挖掘的主题。沈跃明说:“由于数据挖掘业务还处在起步阶段,稍有不慎就会出现一些令人啼笑皆非的结果,个别对数据挖掘业务不理解的人可能会因此更不信任项目组,打击项目组的积极性。”因此,最好选择数据资源较为准确的点而且容易出效果的主题作为数据挖掘项目的试点。
信息化是“一把手工程”,数据挖掘业务更需要管理层的热情支持。托马斯·达文波特认为,如果数据分析成为企业的竞争手段,必然会引起许多员工在业务流程、行为和技能方面的变化,因此像企业内任何重大管理变革一样,需要由热心于量化分析方法的高层管理人员来领导。最理想的情况是,主要倡导者是公司的一把手。萨拉·李面包集团前CEO巴里·贝拉查退休前在他的办公桌上一直放着一块牌子,上面总结了他个人以及公司的哲学:“我们只相信上帝的话,其他人请拿数据来。”
网友评论