我正在使用opennlp training api,如下所示:
Blockquote opennlp DoccatTrainer -model en-doccat.bin -lang en -data Task_notes_1new.train -encoding ISO-8859-1 大段引用 这个api从训练数据集创建一个名为en-doccat.bin的模型 Task_notes_1new.train。
使用上述命令进行训练时会出现以下错误:
Exception in thread "main" java.lang.OutOfMemoryError: Java heap space
at opennlp.maxent.GISTrainer.trainModel(GISTrainer.java:301)
at opennlp.maxent.GIS.trainModel(GIS.java:256)
at opennlp.model.TrainUtil.train(TrainUtil.java:184)
at opennlp.tools.doccat.DocumentCategorizerME.train(DocumentCategorizerME.java:162)
at opennlp.tools.cmdline.doccat.DoccatTrainerTool.run(DoccatTrainerTool.java:61)
at opennlp.tools.cmdline.CLI.main(CLI.java:222)
我甚至尝试将堆大小增加到4GB,但错误仍然相同。