Question

我正在尝试使用rvest收集world football elo ratings，但我一直在获取一个空列表

使用 google chrome 中的检查元素，我得到xpath //*[(@id = "maintable_2014_World_Cup_start")]/div[6]

library(rvest)
library(dplyr)

page<-"http://www.eloratings.net/2014_World_Cup_start"

elo_rating<-read_html(page)%>%
   html_nodes(xpath='//[@id="maintable_World"]/div[6]')%>%
   html_table()

我得到一个空列表

在线搜索和在SE中搜索，我遇到了this，也许它必须用javascript（我对... :)一无所知。此外，当在页面源（使用谷歌浏览器）时，我看到很多调用javascript

最后，我遇到了this R出版物，其中有一个从同一网站提取数据的例子，但是当我尝试复制R代码时，我仍然得到空列表和空字符对象

我在SE（this，this，this中经历了很多主题，但我无法找到解决方案

如果障碍物是javascript，我可以做些什么来提取数据吗？

Answer 1

障碍似乎是javascript，因为表是由它生成的。我认为你需要使用PhantomJS来渲染表并抓住它们。 See this page for help.

用rvest刮掉足球评分

1 个答案: