Question

我正在使用Selenium和python。请参阅以下代码：

from selenium.webdriver.common.keys import Keys
import selenium.webdriver
driver = selenium.webdriver.Firefox()
driver.get("http://finance.yahoo.com/q?s=APP")

现在，我想做一件简单的事情：从driver获取该网页的html作为字符串。然后，我可以使用BeautifulSoup来解析它。有谁知道这个？

实际上，我不知道如何访问此driver的信息，例如，在这种情况下获取苹果的股票价格。

我对Selenium来说是全新的。一个很好的教程非常感谢。

谢谢！

Answer 1

您正在寻找page_source。

继续您的示例：

soup = BeautifulSoup(driver.page_source)

正如另一位评论者指出的那样，您可以使用像requests这样的库来达到同样的效果：

r = requests.get('http://finance.yahoo.com/q?s=APP')
soup = BeautifulSoup(r.content)

Answer 2

查看以下代码。

from selenium.webdriver.common.keys import Keys
import selenium.webdriver
driver = selenium.webdriver.Firefox()
driver.get("http://finance.yahoo.com/q?s=APP")
page_html = driver.page_source

在page_html中，您将拥有已打开页面的HTML。

Selenium：如何将整个html作为字符串？

2 个答案: