全部
这就是我希望做的-
目前,Stanford NER可以识别人员,位置和组织。我想在这些类别中添加更多详细信息-例如,我想确保可以识别更多的位置/人员/组织。因此,我正在考虑训练自己的模型,如here所述。
here提供了另一本有关培训自己的NER标记器的优秀教程。
现在,我的问题是,一旦我使用自己的训练数据来创建新模型,是否有可能将这种新模型与现有的斯坦福模型进行组合?我想在现有模型中添加 extra 功能,我并不是真的想用我自己的模型完全替换它。
希望我的问题很清楚。非常感谢您的投入。
答案 0 :(得分:2)
有关培训ner
的更多信息:
https://stanfordnlp.github.io/CoreNLP/ner.html
ner
注释器将连续运行一系列序列标记器。
您可以使用ner.model
参数进行设置。
例如,您可以将其设置为:
my_model.ser.gz,edu/stanford/nlp/models/ner/english.all.3class.distsim.crf.ser.gz,edu/stanford/nlp/models/ner/english.muc.7class.distsim.crf.ser.gz,edu/stanford/nlp/models/ner/english.conll.4class.distsim.crf.ser.gz
这将使您获得所有这些模型的结果...尽管没有办法将它们“组合”为一个模型。它将一个接一个地运行每个模型。而且,后续模型无法覆盖先前模型的标记决策。
您还可以编写规则,这些规则也将适用。我可能会在不久的将来花费一些时间,以使您更加清楚/如何轻松地将自己的自定义模型/规则与我们提供的基准相集成。