我正在使用斯坦福分类器提供的最大熵算法,以执行自定义的命名实体识别。 输出文件提供5列 - > word \ t ground-truth \ t label \ t P(clAnswer)\ t P(goldAnswer))
P(clAnswer)和 P(goldAnswer)之间的区别是什么?这些是如何计算的?
由于
亚历
答案 0 :(得分:0)
P(clAnswer)是模型给出猜测的概率。 P(goldAnswer)是模型给出真金回答的概率。
如果您想了解分类器背后的算法,可以在此链接找到资源:https://nlp.stanford.edu/software/classifier.shtml
我应该注意,使用CRFClassifier来训练NER模型是标准的。这里有关于培训NER模型的详尽文档: