我想从Google缓存中检索一个包含数千页的网站。有什么办法可以使用Google缓存或其他网络抓取工具/归档程序快速恢复吗?
答案 0 :(得分:9)
我创建了一个free service to recover your website,它可以从搜索引擎缓存中检索大多数页面。
该服务的输出是一个压缩文件,其中包含来自搜索引擎缓存的HTML。它仍处于测试阶段,因此仍需要大量调整和错误修正,但希望它可以帮助您或遇到同样问题的其他人。
更新:我没有时间继续开发服务,因此已关闭。
答案 1 :(得分:5)
您可以使用site
限制来查看Google(仍然)对网站的了解:
http://www.google.com/search?q=site:[domain]
您也可以查看Internet Archive。
(在任何一种情况下,你可能都想做一些重型自动化来获取数千页。)
答案 2 :(得分:-1)
为了更快地访问,我开发了这个网站:https://www.cachedview.me/
它还支持更多缓存页面,例如Archive.org,Archive.is和Megalodon。