我有一个中等档案(拉链大约140Mb)。我只需要访问单个xml文件,因为大约有50.000个xml文件,我想使用unz
- 函数来提取单个xml文件而不是解压缩整个文件夹。
使用提议的方法here,我的代码如下所示:
library(XML)
f.path <- "path to zip-archive/"
# establish a connection to the file
dat <- unz(paste0(f.path, "BKK-Download.zip"), filename = "lists/www_s100_bh8285_1_3.xml")
# trying to parse the xml code
xml.content <- xmlParse(dat)
# which returns
# Error in file.exists(file) : invalid 'file' argument
这个问题与this非常相似,但我想只提取一个文件而不是解压缩50k文件。
有关如何解决此问题的任何想法? 非常感谢任何帮助!
附录 您可以找到数据集here (direct link)(来源:Deutsche Bundesbank (website))