我有一个模型“en-ner-organization.bin”,我是从apache网站下载的。它工作正常,但我更喜欢用我的组织数据库进行训练,以提高识别质量。但是在我用我的组织数据库训练“en-ner-organization.bin”之后 - 模型的大小变得越来越小。所以看来,它被我的数据覆盖了。
我看到没有可能重新训练现有的模型,但也许有一种合并模型的方法?
如果不是 - 我想我可以将我的列车数据添加到原始模型的.train文件中,因此生成的模型将包含默认数据以及来自db的数据。但我在网上找不到这样的文件。
因此,主要问题是:如何保留现有模型数据并将新数据添加到模型中?
由于
答案 0 :(得分:0)
据我所知,不可能合并不同的模型,但可以为查找器指定不同的文件。
从概要:
$ bin/opennlp TokenNameFinder
Usage: opennlp TokenNameFinder model1 model2 ... modelN < sentences