硒的预期条件

时间:2015-03-31 05:22:55

标签: python html selenium selenium-webdriver web-scraping

如何使用预期条件检查HTML中是否存在br标记。这是HTML代码:

<br>
<a href="member.php?u=12455" rel="nofollow">Smatta</a>
<a>, </a>
<a href="member.php?u=14305" rel="nofollow">Nyunyu</a>
<a>, </a>
<a href="member.php?u=20892" rel="nofollow">moyo</a>
<a>, </a>
<a href="member.php?u=21040" rel="nofollow">Masikini_Jeuri</a>
<a>, </a>
<a href="member.php?u=27429" rel="nofollow">Job K</a>
<a>, </a>
<a href="member.php?u=38124" rel="nofollow">Adoe</a>
<a>, </a>
<a href="member.php?u=39196" rel="nofollow">enhe</a>
<a></a>

这是我的代码。

wait = WebDriverWait(browser, 10)
wait.until(EC.visibility_of_element_located((By.XPATH, '//<br>')))

完整代码。

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

browser = webdriver.PhantomJS()
browser.maximize_window()
browser.get("http://www.jamiiforums.com/kenyan-news/225589-kenyan-and-tanzanian-surburbs.html")

username = browser.find_element_by_id("navbar_username")
password = browser.find_element_by_name("vb_login_password_hint")

username.send_keys("MarioP")
password.send_keys("codeswitching")

browser.find_element_by_class_name("loginbutton").click()

wait = WebDriverWait(browser, 20)
wait.until(EC.visibility_of_element_located((By.XPATH, '//h2[contains(., "Redirecting")]')))
wait.until(EC.title_contains('Kenyan & Tanzanian'))
wait.until(EC.visibility_of_element_located((By.ID, 'postlist')))

browser.find_element_by_xpath('//div[@class="vbseo_liked"]/a[contains(@onclick, "return vbseoui.others_click(this)")]')
browser.find_element_by_class_name("vbseo_liked").click()

wait.until(EC.visibility_of_element_located((By.TAG_NAME, 'br')))
print (browser.page_source)

print 'success!!'
browser.close()

我这样做的原因是因为只有在点击链接后才会显示br标记。我试图在点击操作后获取页面源,但它在点击操作之前为我提供了页面源。我想在获取页面源之前检查br标签的存在。

这是打印出来的错误。

  

文件&#34; sele.py&#34;,第29行,in       wait.until(EC.visibility_of_element_located((By.TAG_NAME,&#39; br&#39;)))

1 个答案:

答案 0 :(得分:1)

只是你的XPath表达式不正确,应该是:

//br

或者,您可以使用&#34;标记名称&#34;定位器:

wait.until(EC.visibility_of_element_located((By.TAG_NAME, 'br')))

作为旁注,我不确定您的意图是什么,但我从未见过有人会依赖测试自动化或网络中存在br标记的情况-scraping。它并不一定意味着你做错了什么,但要确保有充分的理由。