我正在尝试在R中学习文本挖掘。
我不知道为什么会出现这个错误?
library(XML)
xml.url <- "http://www.w3schools.com/xml/plant_catalog.xml"
plants <- xmlParse(xml.url)
plants.l <- xmlToList(plants)
length(plants.l)
我很感激能得到的任何帮助。
答案 0 :(得分:2)
您已发现XML
个问题。它不适用于重定向(http -> https
,您的网址以http
开头)和https
。
您可以使用其他一些软件包下载该文件。以下是httr
的示例。
library(XML)
library(httr)
xml.url <- "http://www.w3schools.com/xml/plant_catalog.xml"
plants <- xmlParse(rawToChar(GET(xml.url)$content))
plants.l <- t(xmlToList(plants, simplify = TRUE))
length(plants.l)
我还添加了t()
和simplify = TRUE
,以便在R中有一个漂亮而简单的列表。