使用罗马解析大型RSS源,耗尽内存

时间:2010-07-13 16:38:25

标签: java rss rome

更具体地说是大型XML网页(RSS Feed)。我正在使用优秀的罗马库来解析它们,但我目前想要获取的页面非常大,并且在获取整个文档之前Java内存不足。

如何拆分网页以便将其传递给XMLReader?我是否应该自己完成并在添加自己的XML之后将部分内容传递给它们以开始和完成它们?

1 个答案:

答案 0 :(得分:0)

首先学会将Xms和Xmx的java命令行选项设置为适当的值,所有基于DOM的解析器每个垃圾负载的内存。再看看使用Pull Parser,它不必在处理之前将整个XML加载到文档中。