Question

我正在尝试使用Python 2.7检索嵌入在HTML页面中的PDF文件。我尝试过使用urllib和BeautifulSoup，但没有成功。我的问题是，当我显示页面的源代码时，我找不到任何PDF链接。

以下是我尝试下载的PDF示例：link。

如何使用Python在我的电脑上下载此文件？

编辑：我刚刚意识到PDF可能是即时生成的。甚至可以自动下载这种类型的文件吗？

Answer 1

侨，

这就是我的工作解决方案：

from bs4 import BeautifulSoup
from selenium import webdriver
import time
import pyautogui

browser = webdriver.Firefox()
browser.get('your-link')  # Load page
browser.find_element_by_id('download').click()  # here I press the download button of the PDF   
time.sleep(0.5)
pyautogui.hotkey('enter')
time.sleep(0.5)
pyautogui.hotkey('enter')
browser.close()

检索即时生成并嵌入HTML页面的PDF文件

1 个答案: