发展大数据需翻过“三座山”

互联网 | 编辑: 何毅 2013-06-17 11:29:00转载

大数据,正成为当今世界最炙手可热的产业,企业、政府纷纷对其趋之若鹜。然而我市一些业内人士表示,尽管大数据前景被普遍看好,但发展上也不能操之过急,只有翻过数据来源......

大数据,正成为当今世界最炙手可热的产业,企业、政府纷纷对其趋之若鹜。然而我市一些业内人士表示,尽管大数据前景被普遍看好,但发展上也不能操之过急,只有翻过数据来源、成果应用和隐私保护这“三座山”,大数据产业才能有光明未来。

数据“山”:海量数据是基础

顾名思义,大数据的首要特点就是“大”,没有大,一切都无从谈起。专家预测到2020年,全球每年新创的数据容量将会达到40泽字节,如果要用DVD光盘储存一天在互联网里传送的数据的话,大约需要2.5亿张光盘。

东北财经大学教师屈超说,大数据取得成功的前提是有足够多的样本供应,“小数据”时代的分析预测采用的是随机样本分析的方法,弊端就在于一旦采样过程存在偏见,分析结果就会相去甚远;而大数据“样本=总体”的分析方法,让产生误差的概率大大缩小。

应用“山”:有应用才有价值

大连某科技公司总经理说,我市发展大数据产业,一定要先期、至少要同步解决好需求、应用的问题,否则可能陷入高投入、低产出的窘境。他认为,阿里巴巴集团之所以近年在大数据业务上发展迅速,并已经将其作为未来集团三大战略方向之一,正是因为其背后有强劲的应用需求和驱动。

专家建议:一定要提前找准和确定几个确切的应用方向和领域,之后再加快大数据产业本身所需的基础设施、技术等方面的投入。要让市场牵着产业发展,让效益支撑技术进步,不能不计产出地盲目投入。

隐私“山”:法律边界要先厘清

今天的互联网领域,隐私安全已经越来越成为一个问题。大数据带来的不仅是各种便利及机会,同样也会让人们时刻都暴露在“第三只眼”之下。专家表示,跨不过“隐私山”,大数据的前途注定会非常坎坷。

中科院大连化物所研究人员李国辉说,数据的采集必然包括客户的性别、年龄、办公地址、家庭住址、消费能力水平、消费偏好等内容,甚至还包括客户的消费行为特点等详细的信息,通过对这些信息进行分析从而洞察客户的需求和意向。而问题在于,上述信息对客户来说可能属于个人隐私,客户可以接受这些信息存在于本次交易过程中,而不一定接受信息“被存储”、“被分析”,甚至“被营销”。李国辉认为,这种状况持续下去必然会遭遇反弹,如减少提供个人信息,或者提供虚假伪造信息等,这样会造成大数据中冗余数据过多的情况,阻碍大数据的健康发展。

专家建议:发展大数据产业,隐私安全和保护等法律问题必须厘清、完善,许多问题企业无力单独解决,需要政府在其中发挥重要作用。

相关阅读

每日精选

点击查看更多

首页 手机 数码相机 笔记本 游戏 DIY硬件 硬件外设 办公中心 数字家电 平板电脑