我正在使用Selenium和python。请参阅以下代码:
from selenium.webdriver.common.keys import Keys
import selenium.webdriver
driver = selenium.webdriver.Firefox()
driver.get("http://finance.yahoo.com/q?s=APP")
现在,我想做一件简单的事情:从driver
获取该网页的html作为字符串。然后,我可以使用BeautifulSoup
来解析它。有谁知道这个?
实际上,我不知道如何访问此driver
的信息,例如,在这种情况下获取苹果的股票价格。
我对Selenium来说是全新的。一个很好的教程非常感谢。
谢谢!
答案 0 :(得分:1)
您正在寻找page_source。
继续您的示例:
soup = BeautifulSoup(driver.page_source)
正如另一位评论者指出的那样,您可以使用像requests这样的库来达到同样的效果:
r = requests.get('http://finance.yahoo.com/q?s=APP')
soup = BeautifulSoup(r.content)
答案 1 :(得分:0)
查看以下代码。
from selenium.webdriver.common.keys import Keys
import selenium.webdriver
driver = selenium.webdriver.Firefox()
driver.get("http://finance.yahoo.com/q?s=APP")
page_html = driver.page_source
在page_html中,您将拥有已打开页面的HTML。