Selenium:如何将整个html作为字符串?

时间:2014-10-22 02:13:52

标签: python selenium

我正在使用Selenium和python。请参阅以下代码:

from selenium.webdriver.common.keys import Keys
import selenium.webdriver
driver = selenium.webdriver.Firefox()
driver.get("http://finance.yahoo.com/q?s=APP")

现在,我想做一件简单的事情:从driver获取该网页的html作为字符串。然后,我可以使用BeautifulSoup来解析它。有谁知道这个?

实际上,我不知道如何访问此driver的信息,例如,在这种情况下获取苹果的股票价格。

我对Selenium来说是全新的。一个很好的教程非常感谢。

谢谢!

2 个答案:

答案 0 :(得分:1)

您正在寻找page_source

继续您的示例:

soup = BeautifulSoup(driver.page_source)

正如另一位评论者指出的那样,您可以使用像requests这样的库来达到同样的效果:

r = requests.get('http://finance.yahoo.com/q?s=APP')
soup = BeautifulSoup(r.content)

答案 1 :(得分:0)

查看以下代码。

from selenium.webdriver.common.keys import Keys
import selenium.webdriver
driver = selenium.webdriver.Firefox()
driver.get("http://finance.yahoo.com/q?s=APP")
page_html = driver.page_source

在page_html中,您将拥有已打开页面的HTML。