我想定期抓取我的博客链接并存档我链接的页面,以免它们在时间的流逝中永远丢失。保存它们的最佳方法是什么,以便当我以后想要查看它们时,我可以看到它们,如果我们在它们还在上升时单击链接会出现它们?
许多网络浏览器似乎都将此功能绑定到Ctrl / Cmd-S。是否有一种以编程方式执行此操作的好方法?
答案 0 :(得分:1)
你没有谈论技术堆栈,所以可能有任何事情发生。
在我看来,phantomjs可能就是你想要的东西,它是一个无头的webkit,所以可以抓住你的网站并以PDF格式写出来。
http://code.google.com/p/phantomjs/wiki/QuickStart#Rendering
答案 1 :(得分:0)
我想你可以尝试ifttt
创建一个任务让ifttt定期抓取你的帖子(可能是通过RSS),然后做一些事情来保存它。您可以选择发送有关内容的电子邮件,或将其发送到Evernote。我正在使用第二种方式。