在R中下载/解析XML文件时出错

时间:2015-07-08 18:57:06

标签: xml r

我试过这个

$a = Get-ADPrincipalGroupMembership "me" 
$b = Get-ADPrincipalGroupMembership "new admin"

Compare-Object $a $b -Property Name | ft -AutoSize

此代码返回以下错误

xmlUrl <- "http://www.w3schools.com/xml/simple.xml"
doc <- xmlTreeParse(xmlUrl, useInternalNodes = T)

我尝试了这种解决方法:

Operation timed outfailed to load external entity "http://www.w3schools.com/xml/simple.xml"
Error: 1: Operation timed out2: failed to load external entity "http://www.w3schools.com/xml/simple.xml"

它也不起作用。它会下载一些xmlUrl <- "http://www.w3schools.com/xml/simple.xml" download.file(xmlUrl, "./data/w3schools.xml", method = "curl") doc <- htmlTreeParse("./data/w3schools.xml", useInternalNodes = T) 类型的错误页面。(当XML Parsing Error: mismatched tag. Expected: </META>.代替xmlTreeParse时,它会显示一些标记不匹配错误。)

任何人都可以解释一下代码中的问题究竟在哪里?是因为代理网络,因为我是经过身份验证的代理。但是htmlTreeParse运行正常,所以我不认为代理配置在这里是个问题。install.packages()也可以正常工作。getURL()包本身有问题吗?

R版本3.0.2

2 个答案:

答案 0 :(得分:2)

你应该试试这个:

fileUrl = "http://www.w3schools.com/xml/simple.xml"

download.file(fileUrl, destfile = "G:/Cleaning Data/data2/food.xml")

doc = xmlTreeParse(file = "G:/Cleaning Data/data2/food.xml", useInternalNodes = TRUE)

答案 1 :(得分:0)

如果使用XML包,则url参数存在一些问题。 下面的代码有效。请尝试...

library(XML)

fileUrl <- "http://www.w3schools.com/xml/simple.xml"
download.file(fileUrl, destfile = "./data/simple.xml")

doc <- xmlTreeParse("./data/simple.xml", useInternalNodes = TRUE)