备份徒劳无功，社保基金中心丢失80万份文档

互联网 | 编辑: 杨雪姣 2007-05-15 17:59:00转载

某社保基金中心IT部门负责人王东近来一直苦恼不堪疲于奔命，他和他的同事连续加班工作了三个多月，终于把该社保基金中心丢失的80万份文档资料重新扫描进电脑中。这一切都是源于三个多月前的一次系统非正常宕机，由于整个备份过程中的一连串错误，该社保中心备份系统徒劳无功，无法起到应有的数据保护作用，而最关键的，造成备份系统无效的原因与备份软件和设施本身并没有关系，完全是由于人为因素。

如果数据无法恢复，那么备份就是浪费时间和金钱。王东的案例并非偶然，根据业务分析公司 Enterprise Strategy Group(ESG)调研数据分析，全球大约有40%的数据恢复失败了，失败的原因并不在于备份软件或者磁带上，而是由于备份本身的复杂性所决定的。

这次意外让该社保基金中心承受了灾难性的打击，最终的数据补救工作完成后，王东重新审视了一下这次灾难的发生过程，以及他们所采用的预防和备份系统：

灾难的缘起

王东所在的社保基金中心使用的是某国际品牌的集群服务器，运行Microsoft SQL 2005，连接到大约有3TB可用空间的存储阵列上，构成双机热备方案。该社保基金中心的数据库包括大约1.5TB的数据和图像文件，而且以每年300-500MB的数据量递增。

社保基金中心的数据库主要保存的由纸质文件扫描得来的数字图像文件。因为图像文件对于磁盘空间的要求很高，所以数据库中图像文件的部分包括一个分割成文件组的分区表，以年为单位在文件组中作为一个单独的分区来保存相应的文件。

当年的数据是一个读/写文件组，而一旦关闭，就标记成只读。然后整个数据库使用文件组（部分的）备份，接着备份事务日志。这些数据库备份文件再备份到磁带上，并妥善保管在各处。分区表是SQL 2005的新功能，可以让备份大型数据库的操作变得更加简便。因为在只读文件组里的数据不会改变，就不需要像读/写文件组里的信息那样经常性地做备份了。

然而，这种灵活性增加了文件管理的复杂度。当新的读/写文件组加入数据库中时，这个文件组必须在同一时间作为另一个文件组进行备份，同时还要备份事务日志，这样才能完全恢复数据库并上线使用。

问题的根源

去年六月，一个磁盘阵列处理器报错了，王东给硬件的厂商打了一个电话，得到的建议是运行后台校验来修复RAID数据，这个建议非常合理，但是实际操作中却并没有奏效。

要修复RAID数据，首先必须先解除LUN绑定，然后重新绑定两个损坏的LUNs。因此，王东必须把损坏的LUNs上存储的数据库文件组移动到另外一个准备好的LUN上。这个步骤是修复RAID数据必不可少的步骤，然而无法挽回的损失也正是发生在这个步骤。

王东通过一台远程计算机上进行解除和重新绑定的操作，与此同时还有一个厂商工程师在帮助做相同的操作，在实际操作中，由于以前备份策略的设置的文档已经完全丢失，无论是王东还是厂商工程师都很难把LUN编号和服务器驱动器编号对应起来，而且有些文件被错误的挪到了要重新绑定的LUNs上。两个人最终勉强完成了重新绑定的工作，他们却发现有一个重新绑定的LUN里面错误的包含了数据文件和SQL备份文件。

王东试图从磁带上恢复数据库的备份文件，有一个重要的文件，对于社保基金中心的数据库来说最主要的文件组（MDF），在正常的备份过程中被不经意地忽视了，这个文件就没有备份到磁带上。而如果没有这个文件，数据库就不能恢复并正常工作。这个时候王东才意识到，要想从备份磁带中把数据恢复完成，已经彻底不可能了。而他们平时所依赖的数据备份系统，在真正的问题来临的时候，并不能保护数据安全。

王东在周末加班，使用以前手工备份的MDF文件把所有只读的历史文件都恢复了，也就是2000年至2005年的数据，但是2006年的所有数据却永远丢失了，因为即使有2006年当前的备份和事务日志的备份，相对应的MDF文件的备份也是需要的。为了尽快恢复业务，系统先调用了一个没有数据的2006年的文件组。2006年夏天，王东和他的同事们用了三个半月的时间把纸质文档重新进行了扫描。

全新的备份架构

这次意外的灾难给社保中心带来不小的损失，社保中心也因此开始重视数据保护方面的投入和评估，并重新审视了以往的备份架构。

以前，王东他们是文件组和日志每天都做备份，完全备份（包括所有的文件组）则是一个季度做一次。

现在，王东和他的同事对于如何从文件组备份成功恢复数据库有何要求已经相当清楚了，其中有一些是MS SQL 2005的新功能。现在，王东增加了额外的磁盘到阵列中，保证有7TB的可用空间，恢复数据库和执行常规检查的操作变得更加容易了，同时备份方案也变得更加完善和成熟。
现在该社保基金中心安排了一组IT人员每天都会检查和验证备份日志，每月都会检查所有的数据库性能、备份程序和脚本。循环备份的文件也会得到检查，而且每一个预定的备份现在要三个人检查才算完成。该社保基金中心还执行端到端的备份，并每季度保存一次，保证整个数据库可以通过磁带上保存的每季度的完全备份得到恢复。

该社保基金中心的事故带给我们的经验就是一定要保证备份/恢复的过程是有效的。没有实时记录一个重要的地址文件是该社保基金中心备份恢复失败的关键，这样的人为错误而造成的数据损失比我们想象的更为普遍，虽然一般并没有这么大的损失量。

在意外删除之后，人们使用备份、快照或其他方式来恢复数据的过程，就叫做数据恢复。然后我们通常就会发现备份、快照或档案文件不起作用的情况，这就是向Ontrack这类恢复服务提供商寻求帮助的时候了，看看他们能不能帮你从服务器或者存储阵列中恢复你想要的数据。

此外，整个故事还包括一个隐藏的信息：如果只依赖于RAID镜像，本地或远程复制/镜像，如果在一个地点有什么文件被删除了，另一个地方的也同样会被删除。所以如果你只依赖于复制和镜像，那么至少要使用常规快照作为补充，另外，尽快把这些快照备份到别的介质上去。

每日精选

全新米家无线洗地机5C预约中三重防缠，售价999元

小米推出了全新洗地机——米家无线洗地机5C，采用三重防缠绕技术，拥有45分钟超长续航，支持60℃热流净味透烘。

标签：小米| 米家| 洗地机| 2026-07-26
游戏手机必备骁龙8E6 Pro独占1440P超分超帧

骁龙8E6 Pro支持LPDDR6内存，独占1440P超分、AI插帧两大游戏专属功能，游戏综合体验大幅升级。

标签：骁龙| 骁龙8E6Pro| 1440P超分| 2026-07-27
2026上半年智能投影销量大跌市场连续九季度下滑

上半年，中国智能投影市场（不含激光电视）全渠道的销量为205.6万台，同比下降26.0%；销额为33.4亿元，同比下滑27.0%。自2024年第二季度起，市场已连续九个季度发生了规模的同比下滑。

标签：智能投影| 投影| 极米| 坚果| Vidda| 2026-07-27
苹果积极游说使用中国存储芯片美光强烈反对

苹果正游说美国政府，希望获准在海外销售的苹果设备中搭载中国供应链的存储产品，以此缓解全球存储供货紧张局面，还能从源头控制硬件成本，进而降低终端产品售价。

标签：苹果| 长鑫存储| 长江存储| 美光| 2026-07-27
首款机器人手机荣耀Robot Phone定档8月12日

荣耀手机正式官宣，荣耀Robot Phone将于8月12日发布，这款新品由荣耀与专业影视器材品牌阿莱（ARRI）联合研发。

标签：荣耀| 荣耀RobotPhone| 2026-07-27
PC鲜辣报：AMD公布新一代EPYC 技嘉推出40周年纪念板卡

上周，AMD发布新一代AI计算平台；Intel公布第二季度财报；NVIDIA公开Rubin GPU架构多项技术细节；技嘉推出40周年AORUS INFINITY系列板卡。

标签： PC鲜辣报| AMD| EPYC| 技嘉| 2026-07-27
OPPO启动小布Next计划端侧主动智能新突破

OPPO宣布启动「小布Next计划」，开放行业首个端侧Multi-Agent协同系统内测。OPPO Find X8、X9系列用户及一加13、13T、15、15T用户可参与内测。

标签： OPPO| 小布Next| 端侧主动智能| 2026-07-27
荣耀手环11系列全渠道开启预约专业运动续航全面升级

荣耀官方宣布荣耀手环11系列今天开启全渠道预约，新品在外观设计上推出多款清新多彩配色，新增专业羽毛球运动模式。

标签：荣耀| 荣耀手环| 手环| 2026-07-27
韬定律芯片配风扇华为Mate90系列性能暴增

华为年度旗舰Mate 90系列预计于今年9月正式登场。新机补足性能短板，搭载全新麒麟9050 Pro芯片，该芯片依托华为韬定律打造，搭配系列延续的风驰版主动式散热方案，整机性能跨越式升级。

标签：华为| Mate90| 性能| 2026-07-28
SK海力士量产LPDDR6 小米或将成为首批客户

三星和SK海力士计划于今年下半年正式量产LPDDR6内存，据韩国媒体报道成，小米有望成为该规格内存的首批客户。而这也预示着，小米18系列会提供一款满血版规格的机型。

标签： SK海力士| LPDDR6| 小米| 2026-07-28