通过Python + Selenium获取页面源不起作用,连接被拒绝

时间:2018-01-03 07:57:44

标签: python selenium

我尝试使用Selenium获取页面源代码。 我的代码如下所示:

#!/usr/bin/env python

from selenium import webdriver

browser = webdriver.Firefox()

browser.get('https://python.org')

html_source = browser.page_source

print html_source

当我运行脚本时,它会打开浏览器,但没有任何反应。当我在没有做任何事情的情况下等待时,它会在大约15秒之后抛出“拒绝连接”。

如果我输入地址并进入网站,也没有任何反应。

为什么不起作用?在我看来,脚本看起来很好,它应该可以工作

我这样做是因为我需要在JS脚本执行后获取页面源代码,我怀疑它可以由Selenium完成。

或许你知道在加载JavaScript之后获取页面源的任何其他方法吗?

1 个答案:

答案 0 :(得分:0)

根据您的问题,您已调用get()方法将参数传递为https://python.org。相反,您必须将参数作为 https://www.python.org/ 传递,如下所示:

from selenium import webdriver

browser = webdriver.Firefox()
browser.get('https://www.python.org/')
html_source = browser.page_source
print (html_source)
  

注意:确保您使用的是最新的 Selenium-Python v3.8.0 客户, GeckoDriver v0.19.1 二进制文件以及最新的< strong> Firefox Quantum v57.x 网络浏览器。