crfsuite预测的置信水平

时间:2015-01-22 07:44:47

标签: machine-learning nltk

我在这里使用CRFSuite包 http://www.chokkan.org/software/crfsuite/tutorial.html

我已成功使用它来构建分类器和标记文本。但是,我想知道我是否可以为每个预测获得一个置信度值?

似乎不是这样。我真正想要的是得到一个单词是每种类型标签的概率('PER','LOC','MISC'等),而不仅仅是预测本身。

2 个答案:

答案 0 :(得分:0)

API提供了提取条件概率。我猜你的意思是crfsuite二进制文件没有选项。您可以编辑源并自行添加选项

答案 1 :(得分:0)

我希望这可以作为答案。 Sklearn crfsuite为每个标签提供概率。

predict_marginals(X)
Make a prediction.

Parameters: X (list of lists of dicts) – feature dicts in python-crfsuite format
Returns:    y – predicted probabilities for each label at each position
Return type:    list of lists of dicts

来源:https://sklearn-crfsuite.readthedocs.io/en/latest/_modules/sklearn_crfsuite/estimator.html#CRF.predict_marginals