我正在处理具有50000到60000个字符的大型文档(1000个文档的语料库)。处理完800-850个文件后,我的内存异常。 Jprofiler指向代码调用gate方法作为消耗最大内存的方法
错误行:
List<Annotation> sortedTokens = new ArrayList<Annotation>(document.getAnnotations().get(ANNIEConstants.TOKEN_ANNOTATION_TYPE).get(nChunkStart,nChunkEnd));
虽然我正在删除语料库和文档,例如:
Factory.deleteResource(corpus);
Factory.deleteResource(document);
我仍然遇到内存异常。
答案 0 :(得分:0)
我遇到过类似的问题,你是否可以看到GATE窗口。导致占用大量内存并导致许多内存泄漏的原因。