如何解释NLTK Brill Tagger规则

时间:2015-07-28 18:30:02

标签: nlp nltk part-of-speech

生成的Brill Tagger规则:

Rule('016', 'CS', 'QL', [(Word([1, 2, 3]),'as')])

我知道: 'CS'是从属关系 'QL'是限定符

我想: [(Word([1, 2, 3]),'as')]表示规则的条件。它代表单词'as'出现在目标单词之前的第一个,第二个或第三个位置。目标词是将被POS标记标记的词。

我不知道: '016'的含义是什么? 如何解释整个规则?

1 个答案:

答案 0 :(得分:5)

规则的文档是here. 016将是templateid,即用于创建规则的模板。 您还可以获取规则的说明:

q = Rule('016', 'CS', 'QL', [(Word([1, 2, 3]),'as')])
q.format('verbose')
'CS -> QL if the Word of words i+1...i+3 is "as"'

在这种情况下,它实际上是在目标词之后的词。 (由i+1...表示)