我正在我的项目中探索Apache OpenNLP产品,其中一个要求就是将训练有素的模型保存在DB-Mongo DB / couchbase中。 现在主要是我希望将文档分类程序模型输出存储到DB,这样我就不必重新运行,除非它被修改
我看到库类不可序列化,例如DocumentCategorizerME和我正在获取json deserilization异常,如果我尝试检索持久化记录,所以想知道是否有人已经这样做了。
一般来说,即使我想使用任何其他开源NLP产品,仍然存在的方法。
答案 0 :(得分:0)
可以遵循的方法之一是使用DoccatModel.serialize将模型序列化并存储到Mongo DB - GridFs
Couchbase DB的硬件限制为20 MB,用于存储二进制数据。