我尝试使用Selenium获取页面源代码。 我的代码如下所示:
#!/usr/bin/env python
from selenium import webdriver
browser = webdriver.Firefox()
browser.get('https://python.org')
html_source = browser.page_source
print html_source
当我运行脚本时,它会打开浏览器,但没有任何反应。当我在没有做任何事情的情况下等待时,它会在大约15秒之后抛出“拒绝连接”。
如果我输入地址并进入网站,也没有任何反应。
为什么不起作用?在我看来,脚本看起来很好,它应该可以工作
我这样做是因为我需要在JS脚本执行后获取页面源代码,我怀疑它可以由Selenium完成。
或许你知道在加载JavaScript之后获取页面源的任何其他方法吗?
答案 0 :(得分:0)
根据您的问题,您已调用get()
方法将参数传递为https://python.org
。相反,您必须将参数作为 https://www.python.org/ 传递,如下所示:
from selenium import webdriver
browser = webdriver.Firefox()
browser.get('https://www.python.org/')
html_source = browser.page_source
print (html_source)
注意:确保您使用的是最新的
Selenium-Python v3.8.0
客户,GeckoDriver v0.19.1
二进制文件以及最新的< strong>Firefox Quantum v57.x
网络浏览器。