应用错误收集

我正在编写一个正则表达式来捕获Selenium返回的page_source对象中的一些文本，并注意到以下奇怪的行为。 Selenium返回的页面，无论我是否登录，都包含以下HTML字符串：

>>> from selenium import webdriver
>>> driver = webdriver.Firefox()
>>> driver.get(url)
>>> selenium_page = driver.page_source.encode('utf-8')
>>> print selenium_page
...
<a href="http://www.meetup.com/Russian-Brooklyn/" title="Meetup Group: The 4th Ave Brooklyn Russian Language Meetup Group" class="omnCamp omngj_pcg4">
...

但是，如果我点击＆＃34;查看页面来源＆＃34;在Selenium打开的浏览器窗口中，等效行如下所示：

<a class="omnCamp omngj_pcg4" title="Meetup Group: The 4th Ave Brooklyn Russian Language Meetup Group" href="http://www.meetup.com/Russian-Brooklyn/">

这里发生了什么？

由于

Selenium在page_source对象中更改html标记的顺序

0 个答案: