Apache OpenNLP持久模型到DB

时间:2017-07-25 20:19:08

标签: mongodb java-8 couchbase stanford-nlp opennlp

我正在我的项目中探索Apache OpenNLP产品,其中一个要求就是将训练有素的模型保存在DB-Mongo DB / couchbase中。 现在主要是我希望将文档分类程序模型输出存储到DB,这样我就不必重新运行,除非它被修改

我看到库类不可序列化,例如DocumentCategorizerME和我正在获取json deserilization异常,如果我尝试检索持久化记录,所以想知道是否有人已经这样做了。

一般来说,即使我想使用任何其他开源NLP产品,仍然存在的方法。

1 个答案:

答案 0 :(得分:0)

可以遵循的方法之一是使用DoccatModel.serialize将模型序列化并存储到Mongo DB - GridFs

Couchbase DB的硬件限制为20 MB,用于存储二进制数据。