应用错误收集

我可以使用谷歌网络缓存以编程方式打开页面吗？

时间：2011-02-16 09:34:59

标签： caching web-scraping google-search

我正在使用snoopy和phpQuery。如果我有一个网址，我想在谷歌上打开该网址的缓存版本。任何日期都没关系，只要版本存在我就会接受它。

关于如何做到这一点的任何想法？

手动复制：

选择您的网址，让我们说http://www.abc.net.au/news/infographics/qld-floods/beforeafter.htm
加载http://www.google.com.au
在搜索框中输入此网址
第一个结果是网址，点击其下方的“缓存”。

所以我想抓住那个看起来像这样的网址：

http://webcache.googleusercontent.com/search?q=cache:BOtHTvfch7UJ:www.abc.net.au/news/infographics/qld-floods/beforeafter.htm+http://www.abc.net.au/news/infographics/qld-floods/beforeafter.htm&cd=1&hl=en&ct=clnk&gl=au&source=www.google.com.au

1 个答案:

答案 0 :(得分：3)

好的，只是解决了

http://webcache.googleusercontent.com/search?q=cache:http://www.abc.net.au/news/infographics/qld-floods/beforeafter.htm ＆安培; HL =烯＆安培;条= 1

strip = 1会加载没有css或javascript的页面（我猜这是机器人看到的内容吗？）。

那真棒。谷歌岩石。