点击按钮后,使用href,不带网址或.pdf下载PDF

时间:2017-04-20 08:59:11

标签: python html pdf selenium-webdriver beautifulsoup

我试图在模拟链接上的点击按钮后保存我得到的内容" PDF"在网页上。当我这样做时,下载PDF但我想将其保存在特定文件中。我使用urllib库中的retrieve读了一些东西,但是我无法获得PDF的URL。让我解释一下:

@DateLong
Date startDate;

当我提交点击按钮时,我可以轻松下载PDF,但是我将它保存在正确的位置有一个大问题。 激活点击按钮的代码:

<a class="at-actionDownloadPdfLink" href="/candidates/downloadSeekerDocument.aspx?sPath=private_0/resumes/4ykqgejxuh95ib6r">PDF</a>

感谢&#39; s

1 个答案:

答案 0 :(得分:0)

如果您希望能够自动将文件下载到所需的文件夹,可以使用Preferences,如下所示:

my_folder = "/I/Want/to/save/file/here"

from selenium.webdriver.firefox.firefox_profile import FirefoxProfile

profile = FirefoxProfile ()
profile.set_preference("browser.download.folderList",2)
profile.set_preference("browser.download.manager.showWhenStarting",False) 
profile.set_preference("browser.download.dir", my_folder)
profile.set_preference("browser.helperApps.neverAsk.saveToDisk",'application/pdf')
driver = webdriver.Firefox(firefox_profile=profile)
driver.get(URL)
submit3 = driver.find_element_by_id("linkResumeTitle")
submit3.click()

或者您可以{/ 1}}

URL

然后尝试

link = driver.find_element_by_id("linkResumeTitle").get_attribute('href')

下载文件