用rvest刮掉足球评分

时间:2018-06-11 21:13:49

标签: r xpath rvest

我正在尝试使用rvest收集world football elo ratings,但我一直在获取一个空列表

使用 google chrome 中的检查元素,我得到xpath //*[(@id = "maintable_2014_World_Cup_start")]/div[6]

library(rvest)
library(dplyr)

page<-"http://www.eloratings.net/2014_World_Cup_start"

elo_rating<-read_html(page)%>%
   html_nodes(xpath='//[@id="maintable_World"]/div[6]')%>%
   html_table()

我得到一个空列表

在线搜索和在SE中搜索,我遇到了this,也许它必须用javascript(我对... :)一无所知。此外,当在页面源(使用谷歌浏览器)时,我看到很多调用javascript

最后,我遇到了this R出版物,其中有一个从同一网站提取数据的例子,但是当我尝试复制R代码时,我仍然得到空列表和空字符对象

我在SE(thisthisthis中经历了很多主题,但我无法找到解决方案

如果障碍物是javascript,我可以做些什么来提取数据吗?

1 个答案:

答案 0 :(得分:1)

障碍似乎是javascript,因为表是由它生成的。我认为你需要使用PhantomJS来渲染表并抓住它们。 See this page for help.