人肉搜索助力救灾谷歌本土化现新图景

互联网 | 编辑: 张蓉 2008-05-22 10:28:00转载 返回原文
第一页

“谷歌这一次是以小时为单位来做。”柯化成特别向记者提到了两个时间点:寻亲搜索的原型系统只用了半个小时就开发出来了;到第一个正式版本做好,只用了短短的20个小时。

柯是谷歌中国负责寻亲搜索项目的工程师。5月15日,谷歌的很多员工发现,“5·12汶川大地震”发生后,由于通信、交通的不畅,失散的人们难以确知自己亲人的下落。尽管有关政府部门、医院、报纸、网站都在以不同的形式,发布着遇难者或幸存者的信息,但这些杂乱的信息即使用常规的搜索引擎也难以有效查询。

能不能为地震受灾者提供一个专门寻找亲人的搜索引擎?取得共识后,谷歌中国迅速行动起来。

谷歌中国的寻亲搜索之所以显得有些不同寻常,主要是在外界看来,这家全球最大搜索引擎运营商在中国的分支机构一直被其本土竞争对手所压制着,而造成这种局面的重要因素就是不够本土化。

而在此次地震后的不到10天时间内,谷歌中国已经相继推出地震形势图、全球募捐平台、寻亲搜索、灾区卫星地图等多项产品。这些产品显然对中国众志成城的抗震救灾很有帮助,但它是否也预示着谷歌中国的新图景?

寻亲搜索始末

“我们当时都是在熬夜干活儿。”柯化成向记者说。在发现寻亲搜索的需求后,他和几个同事通过简单的联系,花半个小时的时间就做出了产品的原型系统,并在内部进行了讨论,认定这样的产品能够帮助救灾。

与此同时,寻亲搜索也得到了谷歌全球副总裁兼大中华区总裁李开复的支持。于是,这个自发的项目迅速启动,并加班做出了产品的第一个版本。5月16日早上6点,寻亲平台正式发布。此时距离项目动议恰好20个小时。

对于能够迅速开发出寻亲搜索的原因,柯化成总结道:谷歌有独特的技术结构,例如CSE、AppEngine等,这些提供了快速开发的工具,节省了大量的时间。

同时,谷歌全球范围的配合也提供了帮助。在这次开发中,谷歌分布在美国、中国、瑞士等地的工程师进行了不间断地接力式开发,保证了每时每刻都有人参与到开发中来。

当然,即使是在谷歌这样的高科技公司,面对紧急任务时,也不得不部分依赖于最原始的方式。

从5月16日凌晨3点开始,谷歌的寻亲搜索团队发动了几十人一起开始了浩如烟海的“人肉搜索”,从各大门户、论坛、特别是四川的各主要网站上,收录了近3000条URL pattern。

在柯化成看来,当前的网络和搜索技术虽然达到了一定程度的自动化,但距离全自动还有很远的距离。于是,当面临紧急任务的时候,开发人员不得不放下架子,做一些手工查找的工作。这种在网络上如同爬虫一般寻找信息资源的作业方式,对他们来说是一种“体力活”。

谷歌中国的寻亲搜索平台发布后,流量迅速增长。根据谷歌中国方面提供的数据,该平台发布的第一天,用户使用次数就达到10万次,第二天就已经涨到4倍以上。

工程师们还在不断对该平台进行改进。5月17日11点,寻亲搜索平台的第二个版本发布,更多的网站信息被加入了进来。同时,用户也可以通过发手机短信的方式在平台上发布信息。

“有的医院和安置点的消息都是以纸质形式发布的,有的就直接贴在门外的电线杆子上,再由好心的网友用手机拍摄成图片发布在了网络上。我们要负责查找这样的图片,并且手工录入这些数据,这又是人肉部队干的活儿,太辛苦了。”柯化成说。

截至5月21日凌晨,谷歌中国的这个平台已经收录了344个网站的147473个网页,以及80家医院的38284条记录。

第二页

志愿者的工具

除了谷歌的开发人员之外,对于这个寻亲搜索平台有强烈参与意识的还包括那些抗震救灾中的志愿者。

在美国卡耐基梅隆大学(Carnegie Mellon University)上学的钱敏杰告诉记者,他在5月12日当天就从豆瓣网知道了汶川地震,并迅速在海外发起了“汶川需要你的帮助”的小组,联系香港的救援组织,并且汇总国内的灾情报道。

当天晚上,这个小组已经有了5000人。5月14日,人数进一步增加到12000人。分布在世界各地的这些小组成员纷纷把和灾情相关的消息,聚合到该小组开发的主页上。开始的时候,这些消息集中于血库信息,后来由于灾区缺乏物资,内容也慢慢转到了物资需求信息上。

“开始我们的信息发布平台在豆瓣网。但豆瓣的发布方式是文字的,前方人员看起来不直观。”钱敏杰告诉记者,“我们在17号,开始意识到需要利用地图更好的显示信息,为前方提供第一线消息。”

此后,他们联系了谷歌中国,并加入了其寻亲平台的运行,把得到的消息发布在平台上。

“我们希望全国其他各地的捐物者能了解前方的信息,让捐物更有针对性一点。”钱敏杰说。各地的志愿者或能够获得信息的网友,通过现场调查或者从可靠的渠道得到消息后,在平台上发布物资紧缺消息并留下联系方式,后方拥有资源的人们可以根据网络上的消息和前方取得联系,提供物资。

一位在成都的NGO负责人也对记者表示,其也把所获得的情况,发布到谷歌的平台上。

“我们的主要精力放在了学校救助方面,调查地震灾区的学校毁损情况,把主要精力放在灾后校舍的重建。”这个主要针对学校救助的NGO人士表示,其把前方人员派到各个灾区调查学校的毁损情况,获得关于校舍的第一手的资料,同时也能获得其他的情况,他们把这些情况发布在网络平台上,不仅包括物资,也包括校舍的资料。

在这位人士看来,救灾已经离不开网络了。

开放平台的问题

然而,目前评估网络救灾的效果似乎还为时过早。

当记者问谷歌中国和志愿者们,他们是否可以评估自己在救灾中起到了多大的作用,双方都没有明确答复。事实上,到目前为止,还没有足够的反馈让人们做出一个合理的评价。

网络只是提供了一个必要的平台,并且展示了利用这个平台能够做出什么样的事情。至于该平台最后能起到什么样的作用,还在于使用这个平台的机构和个人的共同配合和协调。

网络数据由于海量和分散的特点,给信息查询和整合带来了麻烦。谷歌力图在定向检索上为人们提供一个集中的便捷的查询平台,把所有分散的信息统一在一个数据库中。

然而,这同时也带来了数据的不准确性。比如,如何判断从网络上检索的信息是准确的?据记者了解,谷歌中国已经采取了技术手段,避免虚假数据,但目前这并不能完全杜绝不真实消息的存在,其搜索出来的数据也都已经标明“仅供参考”。

“在目前阶段,我们宁肯把可能的答案都告诉寻亲的人们。在快速的基础上再提高准确性。”柯化成说。

在他看来,如果要让数据更加准确,还需要更多的官方或者半官方机构参与,“一方面,我们离不开民间的参与,如果没有民间志愿者,就没有足够的材料;另一方面,由于无法完全过滤掉错误信息,如果有比较权威的机构参与更新数据,会让信息更加可靠”。

“最起码谷歌给人们带来了想象力,它的开放性真的有点儿维基百科的味道了。只是如何保证垃圾信息的过滤还是一个问题。”一位业内人士如此评价。

见习记者 郭建龙

返回原文

本文导航

相关阅读

每日精选

点击查看更多

首页 手机 数码相机 笔记本 游戏 DIY硬件 硬件外设 办公中心 数字家电 平板电脑