是否有可能训练新的斯坦福NER模型并将其与现有模型结合?

时间:2018-06-30 15:07:53

标签: stanford-nlp named-entity-recognition

全部

这就是我希望做的-

目前,Stanford NER可以识别人员,位置和组织。我想在这些类别中添加更多详细信息-例如,我想确保可以识别更多的位置/人员/组织。因此,我正在考虑训练自己的模型,如here所述。

here提供了另一本有关培训自己的NER标记器的优秀教程。

现在,我的问题是,一旦我使用自己的训练数据来创建新模型,是否有可能将这种新模型与现有的斯坦福模型进行组合?我想在现有模型中添加 extra 功能,我并不是真的想用我自己的模型完全替换它。

希望我的问题很清楚。非常感谢您的投入。

1 个答案:

答案 0 :(得分:2)

有关培训ner的更多信息:

https://stanfordnlp.github.io/CoreNLP/ner.html

ner注释器将连续运行一系列序列标记器。

您可以使用ner.model参数进行设置。

例如,您可以将其设置为:

my_model.ser.gz,edu/stanford/nlp/models/ner/english.all.3class.distsim.crf.ser.gz,edu/stanford/nlp/models/ner/english.muc.7class.distsim.crf.ser.gz,edu/stanford/nlp/models/ner/english.conll.4class.distsim.crf.ser.gz

这将使您获得所有这些模型的结果...尽管没有办法将它们“组合”为一个模型。它将一个接一个地运行每个模型。而且,后续模型无法覆盖先前模型的标记决策。

您还可以编写规则,这些规则也将适用。我可能会在不久的将来花费一些时间,以使您更加清楚/如何轻松地将自己的自定义模型/规则与我们提供的基准相集成。