我正在尝试从该网站获取一些数据:
http://www.espn.com.br/futebol/resultados/_/liga/BRA.1/data/20181018
当我在浏览器上检查页面时,可以在HTML上看到所需的所有值。我想获取游戏结果和玩家名称(对于每个日期,在此示例中为2018-10-18)
在无比赛日,网站显示:
“ Sem jogos nesta数据”,在浏览器检查中很容易找到:
但是使用
时url = 'http://www.espn.com.br/futebol/resultados/_/liga/todos/data/20181018'
page = requests.get(url, "lxml")
输出基本上是我找不到短语“ Sem jogos nesta data”的网站
如何获取包含脚本结果的HTML?可以要求吗? urllib?
答案 0 :(得分:1)
看起来您要查找的数据来自其后端API。我将使用selenium-python
软件包而不是requests
。
以下是示例:
driver = webdriver.Firefox()
driver.get("http://www.espn.com.br/futebol/resultados/_/liga/todos/data/20181018")
value = driver.find_elements(By.XPATH, '//*[@id="events"]/div')
drive.close()
我没有检查代码,但是它应该可以工作