使用gate处理文档时出现内存不足异常

时间:2014-02-14 05:38:24

标签: java nlp

我正在处理具有50000到60000个字符的大型文档(1000个文档的语料库)。处理完800-850个文件后,我的内存异常。 Jprofiler指向代码调用gate方法作为消耗最大内存的方法

错误行:

List<Annotation> sortedTokens = new ArrayList<Annotation>(document.getAnnotations().get(ANNIEConstants.TOKEN_ANNOTATION_TYPE).get(nChunkStart,nChunkEnd));

虽然我正在删除语料库和文档,例如:

Factory.deleteResource(corpus);
Factory.deleteResource(document);

我仍然遇到内存异常。

1 个答案:

答案 0 :(得分:0)

我遇到过类似的问题,你是否可以看到GATE窗口。导致占用大量内存并导致许多内存泄漏的原因。