检索即时生成并嵌入HTML页面的PDF文件

时间:2017-04-06 09:57:56

标签: python-2.7 pdf beautifulsoup

我正在尝试使用Python 2.7检索嵌入在HTML页面中的PDF文件。我尝试过使用urllib和BeautifulSoup,但没有成功。我的问题是,当我显示页面的源代码时,我找不到任何PDF链接。

以下是我尝试下载的PDF示例:link

如何使用Python在我的电脑上下载此文件?

编辑:我刚刚意识到PDF可能是即时生成的。甚至可以自动下载这种类型的文件吗?

1 个答案:

答案 0 :(得分:0)

侨,

这就是我的工作解决方案:

from bs4 import BeautifulSoup
from selenium import webdriver
import time
import pyautogui

browser = webdriver.Firefox()
browser.get('your-link')  # Load page
browser.find_element_by_id('download').click()  # here I press the download button of the PDF   
time.sleep(0.5)
pyautogui.hotkey('enter')
time.sleep(0.5)
pyautogui.hotkey('enter')
browser.close()