标签: xml parsing
我的基本需求是解析一个非常大的xlsx文件(100MB,150万行和10-15列)。
我现在知道我最好的机会是处理基础XML文件,因为解析xml文件的内存占用比解析xlsx要少得多(如果我只是尝试解析xlsx文件,我无法避免内存不足错误直)。
到目前为止,我使用的是SAX解析器,它对于较小的文件工作正常,但是在60MB左右它失败并且丢失了内存错误。我想知道stax解析器或vdt-xml在我的情况下是否更好?或者就此而言,任何其他xml解析方法来处理大文件?