Question

全部

这就是我希望做的-

目前，Stanford NER可以识别人员，位置和组织。我想在这些类别中添加更多详细信息-例如，我想确保可以识别更多的位置/人员/组织。因此，我正在考虑训练自己的模型，如here所述。

here提供了另一本有关培训自己的NER标记器的优秀教程。

现在，我的问题是，一旦我使用自己的训练数据来创建新模型，是否有可能将这种新模型与现有的斯坦福模型进行组合？我想在现有模型中添加 extra 功能，我并不是真的想用我自己的模型完全替换它。

希望我的问题很清楚。非常感谢您的投入。

Answer 1

有关培训ner的更多信息：

https://stanfordnlp.github.io/CoreNLP/ner.html

ner注释器将连续运行一系列序列标记器。

您可以使用ner.model参数进行设置。

例如，您可以将其设置为：

my_model.ser.gz,edu/stanford/nlp/models/ner/english.all.3class.distsim.crf.ser.gz,edu/stanford/nlp/models/ner/english.muc.7class.distsim.crf.ser.gz,edu/stanford/nlp/models/ner/english.conll.4class.distsim.crf.ser.gz

这将使您获得所有这些模型的结果...尽管没有办法将它们“组合”为一个模型。它将一个接一个地运行每个模型。而且，后续模型无法覆盖先前模型的标记决策。

您还可以编写规则，这些规则也将适用。我可能会在不久的将来花费一些时间，以使您更加清楚/如何轻松地将自己的自定义模型/规则与我们提供的基准相集成。

是否有可能训练新的斯坦福NER模型并将其与现有模型结合？

1 个答案: