下载在Iframe中打开的PDF

时间:2017-03-02 19:07:00

标签: selenium pdf firefox selenium-webdriver web-scraping

我试图使用Selenium(python绑定)自动下载一些pdf。问题是pdf是在服务器上动态生成的,并嵌入在iframe中。我尝试了几个在类似问题中引用的东西,设置了以下首选项:

fp = webdriver.FirefoxProfile()
fp.set_preference("browser.download.dir", os.getcwd())
fp.set_preference("browser.helperApps.neverAsk.saveToDisk", "application/pdf")
fp.set_preference("pdfjs.disabled", True)
fp.set_preference("plugin.scan.Acrobat", "99.0")
fp.set_preference("plugin.scan.plid.all", False)

driver = webdriver.Firefox(firefox_profile = fp)

问题似乎是我得到了#34;需要一个插件来显示这些内容"在使用("pdfjs.disabled", True)时嵌入pdf的iframe中。当它设置为false时,pdf会加载,但不会下载。

另一件事是文件扩展名是大写的,即* .PDF

0 个答案:

没有答案