R编程xmlTreeParse XML内容似乎不是XML

时间:2016-04-15 12:59:09

标签: r xml-parsing

我使用R来解析xml https://d396qusza40orc.cloudfront.net/getdata%2Fdata%2Frestaurants.xml。这个xml存在,但R提醒我它似乎不是XML。

2 个答案:

答案 0 :(得分:1)

尝试使用http代替https:

Base1

答案 1 :(得分:0)

我遇到了同样的问题。我了解到xmlTreeParse不能与https一起使用。虽然Grothendieck推荐的解决方案可行,但有时您必须使用https来增加安全性,因此如果您的情况如此,那么最好加载库RCurl并使用getURL获取文档。然后,您可以用XML解析它。它对我有用,如下:

library(RCurl)
library(XML)
temp <- getURL("https://d396qusza40orc.cloudfront.net/getdata%2Fdata%2Frestaurants.xml")
doc <- xmlTreeParse(temp, useInternalNodes = TRUE)