分析用户与分析内容同样重要
说到企业搜索的未来,当然要关注谷歌。
但最近一家名叫Powerset的新兴公司颇受媒体的关注,原因在于它发布了其搜索引擎的测试版,该版本与其他搜索引擎一样也采用自然语言处理技术,让用户可以通过问问题的方式来搜索想要的信息。
不过,搜索尤其是企业搜索的未来不仅仅局限于处理查询或者解析内容。观察人士声称,未来的搜索系统不但能了解它所搜寻、分析及检索的内容,还能了解用户及用户社区。
伯顿集团的分析师Guy Creese在电子邮件中说: “搜索结果相关性因人而宜——有些用户也许觉得结果具有相关性,另一些用户也许觉得不具有相关性。因而,既需要用户的配置文件(兴趣、词汇、以前的搜索和工作头衔等),也需要内容的配置文件(作者、标题、日期和阅读者等)。好的搜索技术能让两者匹配起来。”
他说: “为此,这些配置文件就需要同样详细。长期以来,企业搜索开发商投入了大量的精力来分析内容,但没有分析用户。随着亚马逊之类的搜索系统表明了这一点: 深入了解用户便于查找及提供相关内容,这种情况会逐渐改变。”
Creese举例说,如果用户是一名网络工程师,输入“ATM”来搜索,智能搜索系统就会把“异步传输模式”的结果列在“自动柜员机”的前面。
几种类型的竞争者
据Gilbane集团的分析师Stephen Arnold声称,虽然有许多公司可以推出切实可行的产品,但如果想要知道企业搜索的发展方向,那么从长远来看,谷歌是值得关注的公司。
最近他在波士顿举行的Infonortics搜索引擎大会上发表演讲时说: “如果你听到一些大公司称‘我们在开发企业搜索解决方案,谷歌不是个问题’,你一定要问问自己: 这些公司在结合实际吗?听信华尔街那些人认为谷歌是家广告公司的观点,实在太荒谬了。”
与此同时,搜索市场分成了几个不同的类别: 有些是知名开发商,比如IBM、Oracle以及最近收购了搜索公司FAST Search & Transfer的微软; 有些是比较大的独立开发商,比如Autonomy; 还有些是比较小的专业开发商。
Arnold最近撰写了一份名为《超越搜索》的近300页长的调查报告,深入研究了企业搜索市场的方方面面。虽然从规模上来看,关注搜索的公司只分为几个类别,但它们的技术重心大不一样。以下是Arnold列出来的几个小类:
● 以数据库为中心的系统,比如Teratext和Intelligenx。他写道: “正由于此,这些系统善于处理数据管理、改变内容用途以及利用位于系统数据库的内容来生成报告。”
● 涉足“深度分析”内容的公司,这包括Attensity和Siderean Software。“使用迭代级联的多个流程指明了搜索与内容处理正在前进的方向。对这些开发商经过微调的搜索机器来说,简单的关键字检索是其特长。”
● 还有像SchemaLogic这些销售软件、帮助客户组织及准备待搜索内容的“工具”公司。Arnold认为: “大多数搜索系统的使用者连自己需要知道哪些方面的知识都不明白。一旦你对防火墙后面的搜索有了一些体验,就会比较清楚地了解及管理元数据。”
Arnold写道,还有从事“构建模块”、“语言处理”和“模式分析”等工作的开发商。
到达引爆点
虽然众多公司正在争夺市场份额,但可能人人都能分得一杯羹。调研公司Gartner最近预测,到2012年年底,搜索技术会定位及分析全球2000强公司当中超过半成公司的90%以上的数据。
一些观察人士提到,微软收购FAST表明了搜索市场已到达了某个引爆点。
微软在FAST方面的计划仍处于开始阶段。微软公司的发言人Jared Spataro称,最初,其SharePoint协作平台会充当“重心”。
他表示,微软试图收购雅虎(一方面是为了提升其在互联网搜索方面的技能),但迄今为止以失败告终。它会把企业搜索技术嵌入到所有产品中。“将来,搜索会无所不在; 会出现在每个应用程序接口中。”
Spataro说: “要是让我来说,那就是,搜索仍是一个新兴的市场。对我们来说真正的机会是,这方面有待开发的商机比其他领域都要多。”
渐入佳境
从如今企业市场的现状来看,这番话非常贴切。肯谈论各自实施方案的搜索公司透露,尽管检索内容、为内部用户提供搜索结果的基本工作已经在开发当中,但用户可能要过好几年才能充分利用这些。
霍尼韦尔公司的运输系统部门很早就采用了谷歌的搜索设备(Search Appliance)。这家公司新兴技术与创新部门的IT主管Jerry Ibrahim说,搜索设备取代了功能有限、比较旧的搜索工具。
该公司当初之所以被谷歌的这个搜索产品所吸引,原因在于该搜索产品基于硬件,而且安装过程“轻而易举”。它使用内部开发的工具与诸多数据源和应用进行集成, 现正在试用谷歌用来实现这些连接的OneBox应用编程接口(API)。
为了解释霍尼韦尔公司的企业搜索目标,Ibrahim举了这样一个例子: 向一名新招的工程师询问有关公司其中一个产品的某个具体问题。“你要是问在霍尼韦尔呆了十年的员工,他们准知道。要是某人进来才一个月,就不知道。他要花一周的时间才能了解清楚。”
但如果Ibrahim向这名员工询问一般性的问题,比如世界上有多少只蜂鸟,他很可能会上谷歌,几分钟之内查出答案。他说: “这就是我们的搜索之旅,目的是用同样的方式来搜索我们自己的内部信息。”
展望未来,这家公司正考虑设法获取用户信息、提高结果的准确性。他说: “我们希望开始收集这些统计数字,并且把一些更先进的思想、逻辑和偏向性融入到搜索系统中。”
在美国东海岸拥有及开发购物中心的Edens & Avant公司也许离Creese等观察人士勾勒的未来道路稍稍近了一点。
公司的副总裁兼首席信息官Dale Johnston说,公司使用Oracle的安全企业搜索(Secure Enterprise Search)产品。Johnston称,这项搜索技术与该公司进行了“个性化”的网络门户协同工作。
该门户还包括了社交网络组件,员工能够维护配置文件。他说: “我们希望,我们能够根据员工从事的工作性质,确定搜索结果的优先级别。”
他说,不过,社交网络组件的采用“非常糟糕”,这限制了可用数据的价值。
Johnston预测: “如果员工觉得这在帮助自己从中得益,他们就会使用。”据他声称,公司计划设置自动触发器,以便提醒用户更新配置文件。
不过,即使霍尼韦尔的搜索战略在日趋完善,该公司仍在从事基本的IT工作。
Johnston说,公司大约有32个数据源,已完成了为搜索处理其中7个数据源的工作。这个项目从2007年3月就开始了,他预计需要36个月才能全部完成。
网友评论