我使用Python和Selenium。我发现,或许很糟糕,如果我通过Firefox驱动程序加载driver.get(view-source:http://www.example.com)
,网站加载速度更快,并解决了我遇到的其他一些问题。但是,driver.page_source
未加载显示的html。相反,加载了一种类似于以下内容的模板:
<html webdriver="true">...
<spand id="line2">...
<spand id="line3">...
<spand id="line4">...
此结果中不存在任何页面内容。如果它有意义,那么id标签就会被包含在自己的标签中。例如,通常页面有行
<Header id="NewsHeadline">Some text here</Header>
现在,该页面看起来像<spand id="line4"><header>id="Newsheadline"</header></span>
为了简化我的问题,是否有一些方法可以在不使用driver.page_source
的情况下获取可见文本(恰好是html)?谢谢!