我正在尝试使用Python 2.7检索嵌入在HTML页面中的PDF文件。我尝试过使用urllib和BeautifulSoup,但没有成功。我的问题是,当我显示页面的源代码时,我找不到任何PDF链接。
以下是我尝试下载的PDF示例:link。
如何使用Python在我的电脑上下载此文件?
编辑:我刚刚意识到PDF可能是即时生成的。甚至可以自动下载这种类型的文件吗?
答案 0 :(得分:0)
侨,
这就是我的工作解决方案:
from bs4 import BeautifulSoup
from selenium import webdriver
import time
import pyautogui
browser = webdriver.Firefox()
browser.get('your-link') # Load page
browser.find_element_by_id('download').click() # here I press the download button of the PDF
time.sleep(0.5)
pyautogui.hotkey('enter')
time.sleep(0.5)
pyautogui.hotkey('enter')
browser.close()