探索R的XML结构

时间:2013-10-17 14:19:53

标签: r

我有一些巨大的XML文件,里面有我需要的信息。文件是如此之大(4GB +),xmlToList()永远运行而没有完成。 16GB RAM就足够了。我使用R工作很多,但从未使用过XML。它不是HTML。

library(XML)
doc <- xmlInternalTreeParse("big_file.xml")  # Works fine
doc.list <- xmlToList(doc)  # Takes forever
test <- xpathApply(doc, "//parameter", xmlValue)  # Works fine, when I know the parameter name

如果xmlToList()有效,那么我会使用names(),str(),summary(),doc.list [[1]] [1]等来深入研究数据并学习结构和包含的参数。但是对于“doc”,我不知道该怎么做。

是否有一种R-way将“doc”拆分为xmlToList()可以工作的子树?还是更好的方式?

0 个答案:

没有答案