Question

我正在尝试使用python中的Selenium Webdriver自动化PDF下载

但问题是下载按钮隐藏在HTML

中的embed标记内

<embed width="100%" height="100%" name="plugin" id="plugin" src="www.abc.com/123.pdf" type="application/pdf" internalinstanceid="4" title="">

，页面就像这个page view before download button view

如果我将鼠标移到PDF顶部

after i move the mouse button over the top of the PDF

我需要点击下载按钮，但是当我尝试通过单击f12检查其元素时，该元素首先不可见但是当我通过右键单击它来检查元素时，它将加载新的单独HTML文档，我不知道如何操纵HTML，任何想法都会非常有用。

Answer 1

为什么要使用Selenium？

使用请求可以轻松高效。

import requests
url='https://www.cs.uky.edu/~keen/115/Haltermanpythonbook.pdf'
page = requests.get(url) # get url

name = url.split('/')[-1] # to get filename
f = open(name,'wb')  # make a file object

f.write(page.content) # write data
f.close()

这使您可以灵活地下载任何地方，并且比硒快得多。

需要使用python selenium下载PDF

1 个答案: