nltk pos_tagger的准确度是多少?

时间:2014-08-03 19:01:48

标签: python nlp nltk pos-tagger

我正在撰写一篇论文,并在我的工作中使用nltk.pos_tagger。我无法找到有关此算法准确性的任何信息。有谁知道我在哪里可以找到这样的信息?

1 个答案:

答案 0 :(得分:3)

NLTK默认pos标记器pos_tag是MaxEnt标记器,请参阅https://github.com/nltk/nltk/blob/develop/nltk/tag/init.py

中的第82行
from nltk.corpus import brown
from nltk.data import load

sents = brown.tagged_sents()
# test on last 10% of brown corpus.
numtest = len(sents) / 10
testsents = sents[numtest:]

_POS_TAGGER = 'taggers/maxent_treebank_pos_tagger/english.pickle'

tagger = load(_POS_TAGGER)

print tagger.evaluate(testsents)

[OUT]: