我使用R来解析xml https://d396qusza40orc.cloudfront.net/getdata%2Fdata%2Frestaurants.xml。这个xml存在,但R提醒我它似乎不是XML。
答案 0 :(得分:1)
尝试使用http代替https:
Base1
答案 1 :(得分:0)
我遇到了同样的问题。我了解到xmlTreeParse不能与https一起使用。虽然Grothendieck推荐的解决方案可行,但有时您必须使用https来增加安全性,因此如果您的情况如此,那么最好加载库RCurl并使用getURL获取文档。然后,您可以用XML解析它。它对我有用,如下:
library(RCurl)
library(XML)
temp <- getURL("https://d396qusza40orc.cloudfront.net/getdata%2Fdata%2Frestaurants.xml")
doc <- xmlTreeParse(temp, useInternalNodes = TRUE)