我正试图从这个网址抓取xml:data.gov.in/sites/default/files/Potato_2013.xml使用R(版本:3.1.0)
尝试
library(XML)
url< - “data.gov.in/sites/default/files/Potato_2013.xml”
doc< - xmlParse(url,useInternalNodes = TRUE)
但是收到错误说
错误:XML内容似乎不是xml:
有什么方法可以解决这个问题吗?
只需输入
DOC< -xmlParse(URL)
给出一个文件是空的错误。
我希望提取节点State,Commodity,Arrival Date等的值。
谢谢!
答案 0 :(得分:0)
这取自this SO问题:
library(XML)
library(RCurl)
##
url<- "data.gov.in/sites/default/files/Potato_2013.xml"
Data <- getURL(url)
doc <- xmlParse(Data)