阅读和理解R中的XML

时间:2014-06-10 10:54:52

标签: xml r

我正在尝试从位于https://d396qusza40orc.cloudfront.net/getdata%2Fdata%2Frestaurants.xml

的网站上读取XML

我在R中遇到以下错误:

Error: XML content does not seem to be XML: 'https://d396qusza40orc.cloudfront.net/getdata%2Fdata%2Frestaurants.xml'

我的代码:

install.packages("XML")
library(XML)
fileURL = "https://d396qusza40orc.cloudfront.net/getdata%2Fdata%2Frestaurants.xml"
doc = xmlTreeParse(fileURL)

我想阅读那个XML文件并找出有多少家餐馆有邮政编码21231?

由于

1 个答案:

答案 0 :(得分:6)

尝试下载xml文件:

library(XML)
fileURL <- "https://d396qusza40orc.cloudfront.net/getdata%2Fdata%2Frestaurants.xml"
download.file(fileURL, destfile=tf <- tempfile(fileext=".xml"))
doc <- xmlParse(tf)
zip <- xpathSApply(doc, "/response/row/row/zipcode", xmlValue)
sum(zip == "21231")
# [1] 127