我有一些巨大的XML文件,里面有我需要的信息。文件是如此之大(4GB +),xmlToList()永远运行而没有完成。 16GB RAM就足够了。我使用R工作很多,但从未使用过XML。它不是HTML。
library(XML)
doc <- xmlInternalTreeParse("big_file.xml") # Works fine
doc.list <- xmlToList(doc) # Takes forever
test <- xpathApply(doc, "//parameter", xmlValue) # Works fine, when I know the parameter name
如果xmlToList()有效,那么我会使用names(),str(),summary(),doc.list [[1]] [1]等来深入研究数据并学习结构和包含的参数。但是对于“doc”,我不知道该怎么做。
是否有一种R-way将“doc”拆分为xmlToList()可以工作的子树?还是更好的方式?