PageRank将过时 搜索引擎遇范式转移

互联网 | 编辑: 徐晓赟 2006-09-12 00:00:00转载 一键看全文

第2页
呈现方式的革命

Clusty、bbmao等元搜索引擎的自动分类、聚类功能一出,即大受用户追捧,专家也认为其提供了比之Google更精准、细分的呈现方式,殊不知Clusty、bbmao等所提供的自动分类、聚类功能本身一点都不新鲜。早在10年前,英国的企业搜索巨擘Autonomy已经提供了同类乃至更智能的呈现方式。

例如,Autonomy基于某种专有的模式匹配和概念搜索的算法,可以自动根据文本中的概念进行分类,自动标引,并基于用户兴趣自动匹配出个性化、多侧面的直接或隐含的相关档案。当用户在搜索框中键入某个关键词,出现的结果可能被系统自动分为10类(或更多类),若其中9类与用户的查询期望距离较大,用户就可以将接近的那个结果作为查询条件,进行第二次查询,直到找到最需要的搜索结果。而Google、百度等第二代搜索引擎则主要使用SVM和 KNN算法进行分类,因为算法的先天缺陷,分类准确率仅能达到80%到85%。并且,如果分类树有变更,如增加、修改或删除某个分类节点,整颗分类树就必须重新学习。

同样因为基于概念的理解,Autonomy还可以通过抽取文档中包含的重要概念,把相似的文档聚类到一起(相关性算法),自动生成类别的标题,并支持二维岛图、二维趋势图以及三维立体图的图形化结果展示。前不久Google趋势搜索以及百度指数的推出,在某些方面可视为对这一功能的一种模仿。

更值得一提的是,模式识别算法还可以分析信息间的主要关系,进而实现内容间的交叉索引对照和自动关联,并实时生成超链接。换句话说,该算法可以不仅可以做到精准定位用户的搜索意图,还可以提供用户可能压根想不到的搜索列表。当用户不知道用什么关键词去搜索的时候,这种对相关信息的引发就可以满足用户的一些“模糊需求”,而这是Google等第二代搜索所不具备的。

浮现中的第三代搜索

作为对第二代搜索的一种超越,第三代搜索的范式革命不光见于呈现方式,而是表现为参差多态的演化路径,例如个性化搜索、社会化搜索、本地化搜索、知识问答社区、社区内容搜索等等。而在核心搜索技术上,则大致包含人工智能、模式识别、语义分析、神经网络等发展方向。由于神经网络搜索和人工智能搜索耗资巨大,目前还没有出现成型的搜索引擎,不过,包括Google、微软、IBM、Roussinov等在内的搜索引擎均已将人工智能搜索的研发提上了议事日程。在国内,Aisou等公司也跃跃欲试,随时准备推出人工智能搜索产品。

值得一提的是,Autonomy的模式识别技术本身也包含有语义分析技术和部分人工智能技术。虽然迄今为止,计算机还无法做到完全理解语言,但通过采用基于统计学、概率论和信息论的概念识别技术,Autonomy可以理解信息的意义和信息间的连接。用户搜索时可以直接以自然语言输入一句话或一段文字,甚至一篇文章,Autonomy会自动判断用户查询条件所描述的概念,从企业文档库中查找所有和用户搜索概念相关的文档。显然,语义搜索比传统关键词搜索更能精准定位用户的搜索意图。

由于是基于对概念和概念之间关系的理解,Autonomy还可以利用精选内容中完整的上下文,实现概念提炼或基于例子的提炼,进而聚焦用户所感兴趣的概念结果,并提供自动建立档案、社区及协作、信息自动推送等个性化搜索功能。不光如此,该系统还可以自动判别使用者的身份,并通过不断学习更新系统的知识库。

关于第三代搜索,众多的创新者已经为我们勾勒出一个大致的轮廓,但可以预言并且相信的是,

浮现中第三代搜索引擎今后的进化之旅,还会有很多很多超出我们的想象。
 

提示:试试键盘 “← →” 可以实现快速翻页 

总共 2 页< 上一页12
一键看全文

本文导航

相关阅读

每日精选

点击查看更多

首页 手机 数码相机 笔记本 游戏 DIY硬件 硬件外设 办公中心 数字家电 平板电脑