Google搜索背后的故事、数字大揭密

互联网 | 编辑: 吴宏 2012-01-26 00:00:00转载 一键看全文

Google搜索背后的故事、数字大揭密(1)

Google有一个专门介绍搜索技术的网站Inside Search,其中的Under The Hood页面是告诉大家Google为了让搜索更快且更有效率,默默在背后做了多少事情,比如说Google的页面索引(Index)可是有1亿多GB的内容,加入Google Instant动完成技术也都是为了加快搜索速度。

Under the hood的表面意思是打开引擎盖,语意则是接近知其然、知其所以然的意思。

实验室所做的努力

Google会与使用者一同测试最先进的搜索技术,当使用者每次进行搜索,也是在一同参与实验。

实验室进行的工作:

1、自动完成实验(Auto complete experiments):Google持续尝试不同的方法以加快Google Instant呈现结果速度,Google的实验还包含在打出完整字句前就开始进行搜索。

2、搜索排名实验(Search Ranking experiments):Google会测试即将推出的最新版运算法改进,帮助使用者找到更高品质的搜索结果。

3、使用者介面实验(User Interface Experiments):当Google推出新功能给全世界的使用者前,会先把主要功能开放给1/100的使用者,你现在可能就已经见到Google即将推出的新功能。

4、2010年的实验(Experiments in 2010):Google始终不断在进行实验,在2010年已经实现超过6000项特定的搜索实验。

搜索已经是生活中的一部分

身为全球最大的搜索引擎,你可以想像Google首页干净简洁的白色页面背后,究竟有多少夸张的数字呢?Google的索引(index)可是有超过1亿GB的内容,光是庞大的资料量就得付出许多功夫来整理。

搜索背后的小故事:

1、100万小时运算:Google花了100万小时建立索引资料(index)。

2、每天10亿次搜索次数:Google每天要处理超过10亿次搜索。

3、4500亿个独特查询:自从2003年以来,Google回答了4500亿个新的独特查询(也就是Google以往从没见过的关键字搜索)。

4、1000人工年:Google花上超过1000人工年(1000 man-years,意旨1000个人工作1年、或1人工作1000年)进行Google搜索演算法的开发。

5、闪电般的预览速度:Instant Preview的平均载入时间只需要1/10秒。

6、独特查询:每天都会出现20%的独特查询(unique queries,以往没见过的关键字搜索)。

7、跨越1500英里的回答:每个搜索平均要跨越1500英里的距离取得答案,回到使用者的电脑中。

8、索引规模:过去数年间Google索引内容增加超过数10亿个,Caffeine索引的内容也超过1亿GB。

快!还要更快!

Google每天处理超过10亿则来自世界各地的查询,平均回复搜索结果为0.25秒,如何更快、更有效率的搜索就是一大挑战。

提示:试试键盘 “← →” 可以实现快速翻页 

总共 2 页12
一键看全文

本文导航

相关阅读

每日精选

点击查看更多

首页 手机 数码相机 笔记本 游戏 DIY硬件 硬件外设 办公中心 数字家电 平板电脑