如何获取任何网址或网页的Google缓存时限?

时间:2010-12-30 06:06:38

标签: html url hyperlink web-scraping

在我的项目中,我需要将Google缓存年龄添加为重要信息。我尝试搜索Google缓存时代的来源,即Google上次重新索引所列页面的天数。

我在哪里可以获得Google缓存时代?

7 个答案:

答案 0 :(得分:373)

使用网址

https://webcache.googleusercontent.com/search?q=cache:<your url without "http://">

示例:

  

https://webcache.googleusercontent.com/search?q=cache:stackoverflow.com

它包含这样的标题:

  

这是Google的https://stackoverflow.com/缓存。这是该页面的快照,因为它出现在2012年8月21日格林威治标准时间11:33:38。在此期间,当前页面可能已发生变化。了解更多
  提示:要在此页面上快速找到您的搜索字词,请按 Ctrl + F + F (Mac)并使用查找栏。

答案 1 :(得分:19)

您需要抓取生成的页面,但您可以使用此URL查看最新的缓存页面:

http://webcache.googleusercontent.com/search?q=cache:www.something.com/path

Google信息放在正文标记的第一个div中。

答案 2 :(得分:16)

您可以使用CachedPages网站

缓存页面通常由具有强大Web服务器的大公司保存和存储。由于此类服务器通常非常快,因此通常可以比实时页面本身更快地访问缓存页面:

  • Google通常会保留该页面的最新副本(1至15天)。
  • 珊瑚也保留了最近的副本,尽管它通常不像谷歌那样新近。
  • 通过Archive.org,您可以访问多年来保存的网页的多个副本。

答案 3 :(得分:4)

太简单了,你只需键入&#34; cache:&#34;在页面的URL之前。例如 如果您想查看此页面的最后一个漫画,只需在URL栏cache:http://stackoverflow.com/questions/4560400/how-can-i-get-the-google-cache-age-of-any-url-or-web-page

上输入

这将显示该页面的最后一个网络摄像头。请点击此处:

enter image description here

但请记住,网页的缓存只会显示该网页是否已在搜索引擎(Google)上编入索引。为此,您需要检查该页面的元机器人标签。

答案 4 :(得分:1)

您可以使用此网站:https://cachedviews.com/。缓存视图或任何网站的缓存页面 - 任何网站的Google缓存页面

答案 5 :(得分:0)

您可以使用此网站:https://www.cachedview.me

它支持多种提供商,例如Google,Archive.org,Archive.is,Megalodon。

答案 6 :(得分:-1)

这也适用于查看缓存页http://www.cachepage.net

  1. 通过google缓存页面视图:webcache.googleusercontent.com/search?q=cache:您的网址

  2. 通过archive.org缓存页面视图:web.archive.org/web/*/您的网址