我试图使用Selenium(python绑定)自动下载一些pdf。问题是pdf是在服务器上动态生成的,并嵌入在iframe中。我尝试了几个在类似问题中引用的东西,设置了以下首选项:
fp = webdriver.FirefoxProfile()
fp.set_preference("browser.download.dir", os.getcwd())
fp.set_preference("browser.helperApps.neverAsk.saveToDisk", "application/pdf")
fp.set_preference("pdfjs.disabled", True)
fp.set_preference("plugin.scan.Acrobat", "99.0")
fp.set_preference("plugin.scan.plid.all", False)
driver = webdriver.Firefox(firefox_profile = fp)
问题似乎是我得到了#34;需要一个插件来显示这些内容"在使用("pdfjs.disabled", True)
时嵌入pdf的iframe中。当它设置为false时,pdf会加载,但不会下载。
另一件事是文件扩展名是大写的,即* .PDF