Python-从自动开始下载的链接中保存PDF

时间:2019-07-02 14:20:12

标签: python

我提交了FOIA请求,以便能够大量下载研究项目所需的pdf文件,他们为我提供了以下链接列表:

https://www.askebsa.dol.gov/BulkFOIARequest/Listings.aspx/GetFacsimile?ack_id=20190520223538P030126872271001&year=2018

我想编写一个脚本,将pdf自动下载到我的计算机上。链接不是.pdf链接,它们只是重定向到pdf的自动下载,因此我需要为每个链接单击“保存”按钮。.我在想我可以将PyAutoGui与Apple脚本一起使用来自动执行密钥按下一些编程的保存按钮快捷方式..但是我想知道在走这条路线之前是否有更简单的方法来做到这一点?

1 个答案:

答案 0 :(得分:1)

我遇到的问题是该链接(在我发布此问题时,我没有意识到您必须登录才能单击该链接)不会呈现任何html,而只是打开如下所示的下载屏幕在Mac上:

enter image description here

我试图找出一种自动单击“保存”按钮的方法,以便可以循环下载文件链接。解决方案最终是仅将硒与chrome驱动程序一起使用,不需要您单击“保存”按钮。

url = 'https://www.askebsa.dol.gov/BulkFOIARequest/Listings.aspx/GetFacsimile?ack_id=20190520223538P030126872271001&year=2018'
driver = webdriver.Chrome() 
driver.get(url)

它会像这样自动下载:

enter image description here