摘要:
正常访问Google网页快照的方法以及插件代码。目前,Google的网页快照几乎完全无法访问,对Google的使用者来说非常不便,本文将从Google网页快照无法访问的原理出发,逐步分析出一个可以正常访问Google网页快照的方法。关键字:
Google 网页快照 正文:
目前,Google的网页快照几乎完全无法访问,对Google的使用者来说非常不便,本文将从Google网页快照无法访问的原理出发,逐步分析出一个可以正常访问Google网页快照的方法。
根据Google自己的介绍,“Google储存网页的快照,当存有网页的服务器暂时出现故障时仍可浏览该网页的内容”。因此说,网页快照服务器本身出问题的可能性非常小,否则就成笑话了,那么为什么我们都无法访问Google网页快照呢?我们只要分析出不能访问的具体原因,就能知道正常访问Google网页快照的方法。
举个例子分析一下,比如使用Google来搜索“搜索引擎”这个词,这时我们看一下“网页快照”的URL地址,可以发现是下面的地址:
http://72.14.235.104/search?q=cache:aPVaeKi1wxcJ:www.baidu.com/+%E6%90%9C%E7%B4%A2%E5%BC%95%E6%93%8E&hl=zh-CN&ct=clnk&cd=1
根据我们的测试,72.14.235.104这个IP是可以访问的,完全可以ping通,这说明网页快照服务器本身实际没有任何问题,完全可以直接访问到。
但是我们点击“网页快照”链接后,却出现“该页无法显示”的提示。这显然是关键字过滤的现象。
为了分析出具体是什么词语影响,我们还可以在Yahoo下搜索“search?q=cache”这个词,会发现Yahoo也出现了“该页无法显示”的提示。
现在,聪明的读者应该已经明白这意味着什么了。既然知道了原因,那么解决方法应该很简单了。就是在search?和q=cache中插入一些字符,将这个词分开即可,就可以让Google的网页快照“恢复正常”。
还是上面提到的这个页面的网页快照,我们将“网页快照”的URL地址复制到地址栏,然后将“search?q=cache”中间插入一个“&”符号,使得该词语变成“search?&q=cache”,这时候按下回车,我们就可以看到了久违了的Google网页快照。
当然,这是分析出网页快照无法使用的原理,具体使用中,如果我们每次都这样用快照,那就显得非常麻烦了,如果大家需要频繁使用,建议安装一些浏览器的开发插件,自动将搜索结果中的字符串进行替换,这样就可以完全自动实现Google网页快照的正常浏览访问。
===================
昨天介绍的“正常访问Google网页快照的方法”一文的最后,我提到了使用一些浏览器的开发插件来自动进行字符串进行替换,不少读者希望我能将的更详细一些,下面,我就将详细介绍一下如何使用插件代码实现字符串替换。
首先,正如“浏览器的GreaseMonkey和Trixie插件”一文介绍的,不同的浏览器使用的插件是不同的,FireFox使用的是GreaseMonkey插件,而IE使用的是Trixie,不过两者功能基本一样,使用的js代码也一样,这里我就以FireFox为例详细说明一下如何安装使用。
首先,使用FireFox浏览GreaseMonkey网站,点Install Greasemonkey来安装GreaseMonkey插件。
其次,访问这个地址,点Install来安装Google Cache代码,现在你再使用一下Google搜索,看看网页快照是不是全都好了。
代码本身很简单,如下所示,Trixie插件也可以使用这段代码:
(function() {
var allLinks = document.links;
if (allLinks != null)
{
for (i = 0; i <allLinks.length; ++i)
{
if (allLinks [i].href.indexOf ("/search?q=cache:") > 0)
{
allLinks [i].href = allLinks [i].href.replace ("/search?q=cache:", "/search?&q=cache:");
}
}
}
}
)();
需要注意的是,如果某一天72.14.235.104这个IP不能访问了,那么你需要在代码里加入一段代码来替换快照服务器的IP地址,具体方法是,在上面的replace那段替换代码后增加下面一行:
a
[1][2]