如何使用Python下载pdf文件?

时间:2017-05-10 12:08:51

标签: python python-2.7 pdf download downloading-website-files

我一直在寻找一种在python中下载pdf文件的方法,我看到了推荐urllib模块的其他问题的答案。我尝试使用它下载pdf文件,但是当我尝试打开下载的文件时,会显示一条消息,说明该文件无法打开。

error message

这是我使用的代码 -

import urllib
urllib.urlretrieve("http://papers.gceguide.com/A%20Levels/Mathematics%20(9709)/9709_s11_qp_42.pdf", "9709_s11_qp_42.pdf")

我做错了什么?此外,该文件会自动保存到我的python文件所在的目录中。如何更改保存的位置?

编辑 - 我再次尝试使用示例pdf http://unec.edu.az/application/uploads/2014/12/pdf-sample.pdf

的链接

代码正在使用此链接,那么为什么它不适用于另一个呢?

2 个答案:

答案 0 :(得分:2)

试试这个。它有效。

recyclerView.setHasFixedSize(true);

答案 1 :(得分:0)

  • 您无法使用给定网址下载pdf内容 requestsurllib
  • 因为最初给定的网址在此之后被指向另一个网页 只加载pdf。
  • 如果您有疑问请将回复保存为html而不是pdf。
  • 您需要使用panthomJS之类的无头浏览器来下载文件 来自这些网页。