如何从Google Cache下载网站?

时间:2008-12-16 19:12:13

标签: web-crawler googlebot

一位朋友意外删除了他的论坛数据库。这通常不是一个大问题,除了他忽略了执行备份的事实。 2年的内容刚刚消失。显然,他已经吸取了教训。

然而,好消息是Google会保留备份,即使个别网站所有者是白痴也是如此。坏消息是,传统的爬行机器人会在网站的Google Cache版本上窒息。

是否有任何可以帮助搜索Google缓存的内容,或者我将如何自行推广?

3 个答案:

答案 0 :(得分:4)

您可能还想考虑抓取archive.org缓存。如果你在那里,通常会有更好的结构。

答案 1 :(得分:1)

答案 2 :(得分:0)

如果网站足够小,您可以手动抓取,this userscript无缝导航Google的缓存非常有用。