应用错误收集

如何从网站下载多个PDF文件？

时间：2013-12-07 16:53:07

标签： python pdf download

我必须访问此网址：http://tinyurl.com/3ypvx24并从2003年到2013年下载每个pdf文件。正如您所看到的，当您点击某个数字时，该链接会将您带到数字问题，然后您必须点击每张纸去另一个网址，最后下载pdf。非常讨厌。

我可以更轻松地完成这项工作吗？

我发现只有这个网址：/REIS/jsp/REIS.jsp?opcion=articulo&ktitulo=1967&autor=我只需更改数字即可访问包含pdf的最后一个网址（ 1967年的例子）。

谢谢！

1 个答案:

答案 0 :(得分：1)

您可以使用库urllib2，pycurl或mechanize来自动执行此过程。这是一个漫长的过程，你必须自己写这个： - ）

尝试Google使用这些库，并检查它们是如何从Python代码中使用的。