我正在编写一个正则表达式来捕获Selenium返回的page_source对象中的一些文本,并注意到以下奇怪的行为。 Selenium返回的页面,无论我是否登录,都包含以下HTML字符串:
>>> from selenium import webdriver
>>> driver = webdriver.Firefox()
>>> driver.get(url)
>>> selenium_page = driver.page_source.encode('utf-8')
>>> print selenium_page
...
<a href="http://www.meetup.com/Russian-Brooklyn/" title="Meetup Group: The 4th Ave Brooklyn Russian Language Meetup Group" class="omnCamp omngj_pcg4">
...
但是,如果我点击&#34;查看页面来源&#34;在Selenium打开的浏览器窗口中,等效行如下所示:
<a class="omnCamp omngj_pcg4" title="Meetup Group: The 4th Ave Brooklyn Russian Language Meetup Group" href="http://www.meetup.com/Russian-Brooklyn/">
这里发生了什么?
由于