近万个网站被GOOGLE拒之门外

互联网 | 编辑: 吴杰平 2007-02-10 18:15:00转载

近日,石家庄某站长反应,自己的数个网站不能被GOOGLE抓取,但BAIDU,YAHOO等其他各大搜索都正常收录。

眼镜蛇在了解情况后,首先怀疑这个IP是不是因为大规模做弊被GOOGLE屏蔽掉,测试了同在此机房(石家庄联通机房)的其他网站,GOOGLE也是没有收录。因为做弊屏蔽的可能性排除了,同时经过与机房技术人员联系,他们表示没有做相关的屏蔽。

是不是测试的网站太少,或者这些IP都被封过?眼镜蛇又拿中国联通河北分公司的网站(域名:www.he.chinaunicom.com)去GOOGLE查看有无收录和更新,答案是搜索结果依然是几年前的老数据。眼镜蛇只有猜测整个机房的两个IP段可能被GOOGLE屏蔽掉了,听技术人员讲有近500台服务器,客户不仅有政府的,还有多个大中型企业,难道这么重要的数据源就无缘GOOGLE搜索了?

为了求证是GOOGLE屏蔽掉这个机房IP,眼镜蛇又用tracert去测试google.com。数据从61.240.131.9内网出去,一直到219.158.3.30这个IP下,就不往下走了,这个IP是网通的。得出结论,联通的国际出口要走网通的。

石家庄联通机房的网站无缘GOOGLE,为什么北京联通机房就没问题?会不会某些运营商为了减少出口流量,将GOOGLE屏蔽掉?一系列的猜测产生了,在没有得到最终确认之前,眼镜蛇只有猜测一下。

据称GOOGLE有数万台服务器去支持其数据的抓取、储存、分析等,为什么将google.cn的搜索服务移至国内,但抓取数据的服务器还依然在美国或者其他地区?眼镜蛇遇到的这起网站被拒事件,也许是因为国际出口问题,导致几百台服务器,数千个网站不能被GOOGLE抓取或者更新,这也许只是目前发现的,或者有更多机房的网站因为出口问题被GOOGLE拒之门外。

之前台湾地震导致海底光缆断裂,大规模的影响了MSN聊天工具,事必也会影响到身在国外的GOOGLE数据服务器,大家也许会发现当时GOOGLE的搜索结果有几天没有更新。如果再发生一次类似的事件,针对强大的Google.cn,用户也是干着急。

GOOGLE要进军中国,要超越百度,连最起码的网站内容抓取都不能保证,还怎样去发展你的用户?

相关阅读

每日精选

点击查看更多

首页 手机 数码相机 笔记本 游戏 DIY硬件 硬件外设 办公中心 数字家电 平板电脑