比赛统计数据显示,网上抓取Tennis24

时间:2020-09-09 21:49:06

标签: python selenium xpath screen-scraping webdriverwait

我一直在尝试找出如何在Tennis 24“ https://www.tennis24.com/match/4xFaW6fP/#match-statistics;0”这样的页面上抓取实时数据并更新统计信息,但是当我尝试使用硒,没有任何回报。即使我只是尝试返回1元素,例如

<div class="statText statText--awayValue">4</div>

有人可以给我一些提示,因为这是我的第一个抓图项目?

1 个答案:

答案 0 :(得分:1)

要打印文本 4 ,您需要为visibility_of_element_located()引出WebDriverWait,并且可以使用以下Locator Strategies中的任意一个:

  • 使用XPATH text 属性:

    driver.get('https://www.tennis24.com/match/4xFaW6fP/#match-statistics;0')
    print(WebDriverWait(driver, 20).until(EC.visibility_of_element_located((By.XPATH, "//div[@class='statText statText--titleValue' and text()='Aces']//following::div"))).text)
    
  • 使用XPATHget_attribute('innerHTML')

    driver.get('https://www.tennis24.com/match/4xFaW6fP/#match-statistics;0')
    print(WebDriverWait(driver, 20).until(EC.visibility_of_element_located((By.XPATH, "//div[@class='statText statText--titleValue' and text()='Aces']//following::div"))).get_attribute('innerHTML'))
    
  • 注意:您必须添加以下导入:

    from selenium.webdriver.support.ui import WebDriverWait
    from selenium.webdriver.common.by import By
    from selenium.webdriver.support import expected_conditions as EC
    
相关问题