解析XML节点以获取R中的表数据

时间:2016-09-27 07:53:13

标签: r xml

我尝试将XMLInternalElementNode解析为数据框。 我已阅读How to parse XML to R data frameHow to get table data from html table in xml但这些解决方案都不适用于我的案例。

下面的代码没有给我一张表格:

    web=getURL("http://www.tocom.or.jp/market/kobetu/rubber.html", header=FALSE, httpheader = c(Accept="text/html"), verbose = TRUE)
    doc=htmlParse(web, asText=TRUE, encoding="Windows-1252")
    tableNodes = getNodeSet(doc, "//table")

    #this gives me error
    xmlParse(tableNodes[[2]])
    Error in as.vector(x, "character") : 
    cannot coerce type 'externalptr' to vector of type 'character'

    #This does not return me the table neither:
    xpathSApply(tableNodes[[2]], path = '//table//tr')

那么我应该如何从这个网站上检索该表呢?

1 个答案:

答案 0 :(得分:2)

怎么样:

library(rvest)
doc <- read_html("http://www.tocom.or.jp/market/kobetu/rubber.html")
doc %>% html_table(fill=TRUE)

其中列出了所有表格。