使用R - Error读取XML

时间:2014-07-13 14:38:34

标签: xml r xml-parsing

我正试图从这个网址抓取xml:data.gov.in/sites/default/files/Potato_2013.xml使用R(版本:3.1.0)

尝试

  

library(XML)

     

url< - “data.gov.in/sites/default/files/Potato_2013.xml”

     

doc< - xmlParse(url,useInternalNodes = TRUE)

但是收到错误说

  

错误:XML内容似乎不是xml:

有什么方法可以解决这个问题吗?

只需输入

  

DOC< -xmlParse(URL)

给出一个文件是空的错误。

我希望提取节点State,Commodity,Arrival Date等的值。

谢谢!

1 个答案:

答案 0 :(得分:0)

这取自this SO问题:

library(XML)
library(RCurl)
##
url<- "data.gov.in/sites/default/files/Potato_2013.xml"
Data <- getURL(url)
doc <- xmlParse(Data)