大数据的安全理解及应对策略研究

互联网 | 编辑: 何毅 2014-08-18 05:00:00转载

随着对大数据的广泛关注。有关大数据安全的研究和实践也已逐步展开,包括科研机构、政府组织、企事业单位、安全厂商等在内的各方力量。

1.引言

大数据的产生使数据分析与应用更加复杂,难以管理。据统计,过去3年里全球产生的数据量比以往400年的数据加起来还多,这些数据包括文档、图片、视频、Web页面、电子邮件、微博等不同类型,其中,只有20%是结构化数据,80%则是非结构化数据。数据的增多使数据安全和隐私保护问题日渐突出,各类安全事件给企业和用户敲醒了警钟。在整个数据生命周期里,企业需要遵守更严格的安全标准和保密规定,对数据存储与使用的安全性和隐私性要求越来越高,传统数据保护方法常常无法满足新变化网络和数字化生活也使黑客更容易获得他人信息,有了更多不易被追踪和防范的犯罪手段,而现有的法律法规和技术手段却难于解决此类问题。因此,在大数据环境下数据安全和隐私保护是一个重大挑战。

但是也应该看到,在大数据时代,业务数据和安全需求相结合能够有效提高企业的安全防护水平。通过对业务数据的大量搜集、过滤与整合,经过细致的业务分析和关联规则挖掘,企业能够感知自身的网络安全态势,预测业务数据走向。了解业务运营安全情况,这对企业来说具有革命性的意义。目前,在一些运营商的业务部门已经开始使用安全基线和大数据分析技术,及时检测与发现网络中的各种异常行为和安全威胁,从而采取相应的安全措施。据Gartner公司预测,2016年40%的企业(以银行、保险、医药、电信、金融和国防等行业为主)将积极地对至少10TB数据进行分析,以找出潜在的安全危险。

随着对大数据的广泛关注。有关大数据安全的研究和实践也已逐步展开,包括科研机构、政府组织、企事业单位、安全厂商等在内的各方力量,正在积极推动与大数据安全相关的标准制定和产品研发,为大数据的大规模应用奠定更加安全和坚实的基础。

2.不同领域的大数据安全需求

在理解大数据安全内涵、制定相应策略之前,有必要对各领域大数据的安全需求进行全面了解和掌握,以分析大数据环境下的安全特征与问题。

(1)互联网行业

互联网企业在应用大数据时,常会涉及数据安全和用户隐私问题。随着电子商务、手机上网行为的发展,互联网企业受到攻击的情况比以前更为隐蔽。攻击的目的并不仅是让服务器宕机,更多是以渗透APT的攻击方式进行。因此,防止数据被损坏、篡改、泄露或窃取的任务十分艰巨。同时,由于用户隐私和商业机密涉及的技术领域繁多、机理复杂。很难有专家可以贯通法理与专业技术,界定出由于个人隐私和商业机密的传播而产生的损失,也很难界定侵权主体是出于个人目的还是企业行为。因此,互联网企业的大数据安全需求是:可靠的数据存储。安全的挖掘分析,严格的运营监管,呼唤针对用户隐私的安全保护标准、法律法规、行业规范,期待从海量数据中合理发现和发掘商业机会和商业价值。

(2)电信行业

大量数据的产生、存储和分析,使得运营商在数据对外应用和开放过程中面临着数据保密、用户隐私、商业合作等一系列问题。运营商需要利用企业平台、系统和工具实现数据的科学建模,确定或归类这些数据的价值。由于数据通常散乱在众多系统中,信息来源十分庞杂,因此运营商需要进行有效的数据收集与分析,保障数据的完整性和安全性。在对外合作时,运营商需要能够准确地将外部业务需求转换成实际的数据需求,建立完善的数据对外开放访问机制。在此过程中,如何有效保护用户隐私,防止企业核心数据泄露,成为运营商对外开展大数据应用需要考虑的重要问题。因此,电信运营商的大数据安全需求是:确保核心数据与资源的保密性、完整性和可用性。在保障用户利益、体验和隐私的基础上充分发挥数据价值。

(3)金融行业

金融行业的系统具有相互牵连、使用对象多样化、安全风险多方位、信息可靠性、保密性要求高等特征。而且金融业对网络的安全性、稳定性要求更高。系统要能够高速处理数据,提供冗余备份和容错功能,具备较好的管理能力和灵活性,以应对复杂的应用。虽然金融行业一直在数据安全方面追加投资和技术研发,但是由于金融领域业务链条的拉长、云计算模式的普及、自身系统复杂度的提升以及对数据的不当利用。都增加了金融业大数据的安全风险。因此,金融行业的大数据安全需求是:对数据访问控制、处理算法、网络安全、数据管理和应用等方面提出安全要求,期望利用大数据安全技术加强金融机构的内部控制,提高金融监管和服务水平,防范和化解金融风险。

(4)医疗行业

随着医疗数据的几何倍数增长,数据存储压力也越来越大。数据存储是否安全可靠,已经关乎医院业务的连续性。因为系统一旦出现故障,首先考验的就是数据的存储、灾备和恢复能力。如果数据不能迅速恢复,而且恢复不到断点,则对医院的业务、患者满意度构成直接损害。同时,医疗数据具有极强的隐私性,大多数医疗数据拥有者不愿意将数据直接提供给其他单位或个人进行研究利用,而数据处理技术和手段的有限性也造成了宝贵数据资源的浪费。因此,医疗行业对大数据安全的需求是:数据隐私性高于安全性和机密性,同时需要安全和可靠的数据存储、完善的数据备份和管理,以帮助医生与病人进行疾病诊断、药物开发、管理决策、完善医院服务,提高病人满意度,降低病人流失率。

(5)政府组织

大数据分析在安全上的潜能已经被各国政府组织发现,它的作用在于能够帮助国家构建更加安全的网络环境。例如,美国进口安全申报委员会不久前宣布,通过6个关键性的调查结果证明,大数据分析不仅具备强大的数据分析能力,而且能确保数据的安全性。美国国防部已经在积极部署大数据行动,利用海量数据挖掘高价值情报,提高快速响应能力,实现决策自动化。而美国中央情报局通过利用大数据技术,提高从大型复杂的数字数据集中提取知识和观点的能力,加强国家安全。因此,政府组织对大数据安全的需求是:隐私保护的安全监管、网络环境的安全感知、大数据安全标准的制定、安全管理机制的规范等内容。

3.大数据环境安全

通过上述分析可知,各领域的安全需求正在发生改变,从数据采集、数据整合、数据提炼、数据挖掘、安全分析、安全态势判断、安全检测到发现威胁,已经形成一个新的完整链条。在这一链条中,数据可能会丢失、泄露、被越权访问、被篡改,甚至涉及用户隐私和企业机密等内容。通常,大数据安全具有以下6个方面的特征和问题。

(1)移动数据安全面临高压力

社交媒体、电子商务、物联网等新应用的兴起。打破了企业原有价值链的围墙,仅对原有价值链各个环节的数据进行分析,已经不能满足需求。需要借助大数据战略打破数据边界,使企业了解更全面的运营及运营环境的全景图。但是,这显然会对企业的移动数据安全防范能力提出更高的要求。此外。数据价值的提升会造成更多敏感性分析数据在移动设备间传递,一些恶意软件甚至具备一定的数据上传和监控功能,能够追踪到用户位置、窃取数据或机密信息,严重威胁个人的信息安全,使安全事故等级升高。在移动设备与移动平台威胁飞速增长的情况下,如何跟踪移动恶意软件样本及其始作蛹者。分析样本相互间关系,成为移动大数据安全需要解决的问题。

(2)网络化社会使大数据易成为攻击目标

在网络空间里,大数据是更容易被发现的大目标。一方面,网络访问便捷化和数据流的形成,为实现资源的快速弹性推送和个性化服务提供基础。正因为平台的暴露,使得蕴含着潜在价值的大数据更容易吸引黑客的攻击。另一方面,在开放的网络化社会,大数据的数据量大且相互关联,使得黑客成功攻击一次就能获得更多数据,无形中降低了黑客的进攻成本。增加了收益率。例如,黑客能够利用大数据发起僵尸网络攻击,同时控制上百万台傀儡机并发起攻击,或者利用大数据技术最大限度地收集更多有用信息。

(3)用户隐私保护成为难题

大数据的汇集不可避免地加大了用户隐私数据信息泄露的风险。由于数据中包含大量的用户信息,使得对大数据的开发利用很容易侵犯公民的隐私,恶意利用公民隐私的技术门槛大大降低。在大数据应用环境下,数据呈现动态特征,面对数据库中属性和表现形式不断随机变化,基于静态数据集的传统数据隐私保护技术面临挑战。各领域对于用户隐私保护有多方面要求和特点擞据之间存在复杂的关联和敏感性,而大部分现有隐私保护模型和算法都是仅针对传统的关系型数据,不能直接将其移植到大数据应用中。

(4)海量数据的安全存储问题

随着结构化数据和非结构化数据量的持续增长以及分析数据来源的多样化。以往的存储系统已经无法满足大数据应用的需要。对于占数据总量80%以上的非结构化数据,通常采用NoSQL存储技术完成对大数据的抓取、管理和处理。虽然NoSQL数据存储易扩展、高可用、性能好,但是仍存在一些问题。例如,访问控制和隐私管理模式问题、技术漏洞和成熟度问题、授权与验证的安全问题、数据管理与保密问题等。而结构化数据的安全防护也存在漏洞,例如物理故障、人为误操作、软件问题、病毒、木马和黑客攻击等因素都可能严重威胁数据的安全性。大数据所带来的存储容量问题、延迟、并发访问、安全问题、成本问题等,对大数据的存储系统架构和安全防护提出挑战。

(5)大数据生命周期变化促使数据安全进化

传统数据安全往往是围绕数据生命周期部署的,即数据的产生、存储、使用和销毁。随着大数据应用越来越多,数据的拥有者和管理者相分离,原来的数据生命周期逐渐转变成数据的产生、传输、存储和使用。由于大数据的规模没有上限,且许多数据的生命周期极为短暂,因此,传统安全产品要想继续发挥作用,则需要及时解决大数据存储和处理的动态化、并行化特征,动态跟踪数据边界,管理对数据的操作行为。

(6)大数据的信任安全问题

大数据的最大障碍不是在多大程度上取得成功,而是让人们真正相信大数据、信任大数据,这包括对别人数据的信任和自我数据被正确使用的信任。例如,近年来工资“被增长”、CPI“被下降”、房价“被降低”、失业率“被减少”,因百姓的切身感受与统计数据之间的差异以及国家和地方之间GDP数据严重不符。都导致了市场对统计数据的质疑。同时,大数据的信任安全问题也不仅是指要相信大数据本身,还包括要相信可以通过数据获得的成果。但是,要让人们相信和信任通过大数据模型获得的洞察信息却并不容易,而证明大数据本身的价值比成功完成一个项目要更加困难。因此,构建对大数据的安全信任至关重要,这需要政府机构、企事业单位、个人等多方面共同建设和维护好大数据可信任的安全环境。

4.大数据安全内涵

(1)保障大数据安全,即大数据自身的安全问题

大数据安全不同于关系型数据安全,大数据无论是在数据体量、结构类型、处理速度、价值密度方面,还是在数据存储、查询模式、分析应用上都与关系型数据有着显着差异。大数据意味着数据及其承载系统的分布式,单个数据和系统的价值相对降低,空间和时间的大跨度、价值的稀疏,使得外部人员寻找价值攻击点更不容易。但是,在大数据环境下完全的去中心化很难。只要存在中心就可能成为被攻击的穴道,而对于低密度价值的提炼过程也是吸引攻击的内容。针对这些问题,传统安全产品所使用的监视、分析日志文件、发现数据和评估漏洞的技术在大数据环境中并不能有效运行。很多传统安全技术方案中,数据的大小会影响到安全控制或配套操作能否正确运行。多数安全产品不能进行调整,无法满足大数据领域,也不能完全理解其面对的信息。而且,在大数据时代会有越来越多的数据开放,交叉使用,在这个过程中如何保护用户隐私是最需要考虑的问题。

为解决大数据自身的安全问题,需要重新设计和构建大数据安全架构和开放数据服务,从网络安全、数据安全、灾难备份、安全风险管理、安全运营管理、安全事件管理、安全治理等各个角度考虑,部署整体的安全解决方案。保障大数据计算过程、数据形态、应用价值的安全。

相关阅读

每日精选

点击查看更多

首页 手机 数码相机 笔记本 游戏 DIY硬件 硬件外设 办公中心 数字家电 平板电脑