我正在尝试使用python中的Selenium Webdriver自动化PDF下载
但问题是下载按钮隐藏在HTML
中的embed标记内<embed width="100%" height="100%" name="plugin" id="plugin" src="www.abc.com/123.pdf" type="application/pdf" internalinstanceid="4" title="">
,页面就像这个page view before download button view
如果我将鼠标移到PDF顶部
after i move the mouse button over the top of the PDF
我需要点击下载按钮,但是当我尝试通过单击f12检查其元素时,该元素首先不可见但是当我通过右键单击它来检查元素时,它将加载新的单独HTML文档,我不知道如何操纵HTML,任何想法都会非常有用。
答案 0 :(得分:0)
为什么要使用Selenium?
使用请求可以轻松高效。
import requests
url='https://www.cs.uky.edu/~keen/115/Haltermanpythonbook.pdf'
page = requests.get(url) # get url
name = url.split('/')[-1] # to get filename
f = open(name,'wb') # make a file object
f.write(page.content) # write data
f.close()
这使您可以灵活地下载任何地方,并且比硒快得多。