一位朋友意外删除了他的论坛数据库。这通常不是一个大问题,除了他忽略了执行备份的事实。 2年的内容刚刚消失。显然,他已经吸取了教训。
然而,好消息是Google会保留备份,即使个别网站所有者是白痴也是如此。坏消息是,传统的爬行机器人会在网站的Google Cache版本上窒息。
是否有任何可以帮助搜索Google缓存的内容,或者我将如何自行推广?
答案 0 :(得分:4)
您可能还想考虑抓取archive.org缓存。如果你在那里,通常会有更好的结构。
答案 1 :(得分:1)
答案 2 :(得分:0)
如果网站足够小,您可以手动抓取,this userscript无缝导航Google的缓存非常有用。