我可以使用谷歌网络缓存以编程方式打开页面吗?

时间:2011-02-16 09:34:59

标签: caching web-scraping google-search

我正在使用snoopy和phpQuery。如果我有一个网址,我想在谷歌上打开该网址的缓存版本。任何日期都没关系,只要版本存在我就会接受它。

关于如何做到这一点的任何想法?

手动复制:

  1. 选择您的网址,让我们说http://www.abc.net.au/news/infographics/qld-floods/beforeafter.htm
  2. 加载http://www.google.com.au
  3. 在搜索框中输入此网址
  4. 第一个结果是网址,点击其下方的“缓存”。
  5. 所以我想抓住那个看起来像这样的网址:

    http://webcache.googleusercontent.com/search?q=cache:BOtHTvfch7UJ:www.abc.net.au/news/infographics/qld-floods/beforeafter.htm+http://www.abc.net.au/news/infographics/qld-floods/beforeafter.htm&cd=1&hl=en&ct=clnk&gl=au&source=www.google.com.au

1 个答案:

答案 0 :(得分:3)

好的,只是解决了

http://webcache.googleusercontent.com/search?q=cache:http://www.abc.net.au/news/infographics/qld-floods/beforeafter.htm &安培; HL =烯 &安培;条= 1

strip = 1会加载没有css或javascript的页面(我猜这是机器人看到的内容吗?)。

那真棒。谷歌岩石。