使用Apache poi从xlsx读取百万条记录

时间:2014-02-26 18:46:25

标签: java apache-poi

我有一个xlsx文件,有近百万条记录。我正在尝试使用Apache POI读取该文件。但是,它会抛出outOfMemory错误。我尝试增加Java堆空间,但它不能解决问题。有没有可以解决这些大文件的工作或替代API?

1 个答案:

答案 0 :(得分:1)

是的,您必须使用流API来处理apache POI - 它允许您随机读取工作表行而无需立即将整个文档提取到内存中。 查看更多详细信息。 http://poi.apache.org/spreadsheet/how-to.html#sxssf