需要使用python selenium下载PDF

时间:2017-12-29 09:16:27

标签: javascript python html selenium pdf

我正在尝试使用python中的Selenium Webdriver自动化PDF下载

但问题是下载按钮隐藏在HTML

中的embed标记内
<embed width="100%" height="100%" name="plugin" id="plugin" src="www.abc.com/123.pdf" type="application/pdf" internalinstanceid="4" title="">

,页面就像这个page view before download button view

如果我将鼠标移到PDF顶部

after i move the mouse button over the top of the PDF

我需要点击下载按钮,但是当我尝试通过单击f12检查其元素时,该元素首先不可见但是当我通过右键单击它来检查元素时,它将加载新的单独HTML文档,我不知道如何操纵HTML,任何想法都会非常有用。

1 个答案:

答案 0 :(得分:0)

为什么要使用Selenium?

使用请求可以轻松高效。

import requests
url='https://www.cs.uky.edu/~keen/115/Haltermanpythonbook.pdf'
page = requests.get(url) # get url

name = url.split('/')[-1] # to get filename
f = open(name,'wb')  # make a file object

f.write(page.content) # write data
f.close()

这使您可以灵活地下载任何地方,并且比硒快得多。