应用错误收集

我有一些巨大的XML文件，里面有我需要的信息。文件是如此之大（4GB +），xmlToList（）永远运行而没有完成。 16GB RAM就足够了。我使用R工作很多，但从未使用过XML。它不是HTML。

library(XML)
doc <- xmlInternalTreeParse("big_file.xml")  # Works fine
doc.list <- xmlToList(doc)  # Takes forever
test <- xpathApply(doc, "//parameter", xmlValue)  # Works fine, when I know the parameter name

如果xmlToList（）有效，那么我会使用names（），str（），summary（），doc.list [[1]] [1]等来深入研究数据并学习结构和包含的参数。但是对于“doc”，我不知道该怎么做。

是否有一种R-way将“doc”拆分为xmlToList（）可以工作的子树？还是更好的方式？

探索R的XML结构

0 个答案: