Selenium在page_source对象中更改html标记的顺序

时间:2014-11-24 19:37:28

标签: python html selenium

我正在编写一个正则表达式来捕获Selenium返回的page_source对象中的一些文本,并注意到以下奇怪的行为。 Selenium返回的页面,无论我是否登录,都包含以下HTML字符串:

>>> from selenium import webdriver
>>> driver = webdriver.Firefox()
>>> driver.get(url)
>>> selenium_page = driver.page_source.encode('utf-8')
>>> print selenium_page
...
<a href="http://www.meetup.com/Russian-Brooklyn/" title="Meetup Group: The 4th Ave Brooklyn Russian Language Meetup Group" class="omnCamp omngj_pcg4">
...

但是,如果我点击&#34;查看页面来源&#34;在Selenium打开的浏览器窗口中,等效行如下所示:

<a class="omnCamp omngj_pcg4" title="Meetup Group: The 4th Ave Brooklyn Russian Language Meetup Group" href="http://www.meetup.com/Russian-Brooklyn/">

这里发生了什么?

由于

0 个答案:

没有答案