斯坦福分类器ColumnDataClassifier

时间:2017-11-14 15:58:59

标签: stanford-nlp maxent

我正在使用斯坦福分类器提供的最大熵算法,以执行自定义的命名实体识别。 输出文件提供5列 - > word \ t ground-truth \ t label \ t P(clAnswer)\ t P(goldAnswer))

P(clAnswer) P(goldAnswer)之间的区别是什么?这些是如何计算的?

由于

亚历

1 个答案:

答案 0 :(得分:0)

P(clAnswer)是模型给出猜测的概率。 P(goldAnswer)是模型给出真金回答的概率。

如果您想了解分类器背后的算法,可以在此链接找到资源:https://nlp.stanford.edu/software/classifier.shtml

我应该注意,使用CRFClassifier来训练NER模型是标准的。这里有关于培训NER模型的详尽文档:

https://nlp.stanford.edu/software/crf-faq.html#a