R从归档

时间:2015-09-25 16:46:25

标签: xml r

我有一个中等档案(拉链大约140Mb)。我只需要访问单个xml文件,因为大约有50.000个xml文件,我想使用unz - 函数来提取单个xml文件而不是解压缩整个文件夹。

使用提议的方法here,我的代码如下所示:

library(XML)
f.path <- "path to zip-archive/"
# establish a connection to the file
dat <- unz(paste0(f.path, "BKK-Download.zip"), filename = "lists/www_s100_bh8285_1_3.xml")
# trying to parse the xml code
xml.content <- xmlParse(dat)

# which returns
# Error in file.exists(file) : invalid 'file' argument

这个问题与this非常相似,但我想只提取一个文件而不是解压缩50k文件。

有关如何解决此问题的任何想法? 非常感谢任何帮助!

附录 您可以找到数据集here (direct link)(来源:Deutsche Bundesbank (website)

0 个答案:

没有答案