保存网页

时间:2012-02-06 07:49:50

标签: html web web-scraping

我想定期抓取我的博客链接并存档我链接的页面,以免它们在时间的流逝中永远丢失。保存它们的最佳方法是什么,以便当我以后想要查看它们时,我可以看到它们,如果我们在它们还在上升时单击链接会出现它们?

许多网络浏览器似乎都将此功能绑定到Ctrl / Cmd-S。是否有一种以编程方式执行此操作的好方法?

2 个答案:

答案 0 :(得分:1)

你没有谈论技术堆栈,所以可能有任何事情发生。

在我看来,phantomjs可能就是你想要的东西,它是一个无头的webkit,所以可以抓住你的网站并以PDF格式写出来。

http://code.google.com/p/phantomjs/wiki/QuickStart#Rendering

答案 1 :(得分:0)

我想你可以尝试ifttt

创建一个任务让ifttt定期抓取你的帖子(可能是通过RSS),然后做一些事情来保存它。您可以选择发送有关内容的电子邮件,或将其发送到Evernote。我正在使用第二种方式。