报废下载文件

时间:2015-07-06 15:37:15

标签: screen-scraping

我有一个网站,其中包含一些数据和一些超链接,以查看pdf文档。我必须创建一个应用程序,可以使用scraping下载该文件并在内部存储它。怎么可能实现这个目标?

提前感谢任何帮助...

1 个答案:

答案 0 :(得分:0)

您可以使用任何抓取库来执行此操作。获取文件网址并下载。 Mechanize就是一个例子