我正在使用带有以下代码的rvest软件包:
library(rvest)
url.tournament <- "https://www.whoscored.com/Regions/247/Tournaments/36/Seasons/5967/Stages/15737/Fixtures/International-FIFA-World-Cup-2018"
df.tournament <- read_html(url.tournament) %>%
html_nodes(xpath='//*[@id="tournament-fixture-wrapper"]') %>%
html_nodes("table")
html_table()
没有提取任何元素。
答案 0 :(得分:3)
查看网站的源代码,您可以看到该表实际上并不存在于HTML源代码中-它是使用JavaScript动态生成的。因此,您的XPath查询返回空的<div>
。
因此,在这种情况下,您不能依靠{rvest},需要使用诸如{RSelenium}之类的动态抓取工具来解释JavaScript。