我正在尝试加载一个中等大小的压缩档案(.zip文件~140 Mb),可以找到here (direct link)(来源:Deutsche Bundesbank (website))。下载文件后,它将保存为" BKK-Download.zip"。该文件包含〜50.000s xml文件,其中包含三个子文件夹中的一些相当奇怪的名称(例如" bbai3.q.de.n.v.bf90.f.kv.a1.s.2.n.e.z.xml和#34;)。
在第一步中,我尝试打开" tree.xml"文件在"树"文件夹,在第二步中,我将使用XML包打开文件。我使用解压缩函数尝试第一步:
f.path <- "path to the file"
dat <- unzip(paste0(f.path, "BKK-Download.zip"))
library(XML)
xml.content <- xmlParse(dat[1])
# for the case that "tree.xml" is the first xml-file
但是,unzip-command会返回以下错误:
Warning message:
In unzip(paste0(f.path, "BKK-Download.zip")) :
error 1 in extracting from zip file
如果我尝试使用带有多个文件夹和复杂文件名的测试zip-archive(如上所述),一切正常。
可能出现此错误的任何想法?