如何在Brill标记程序,NLTK中修改规则

时间:2018-07-16 19:54:12

标签: python nlp nltk brill-tagger

nltk中的brill标记器在标记指令数据时出错。例如:“加热到棕色”,将被标记为“ [[('heat','NN'),('until','IN'),('brown','JJ')]]“。指令数据集中的大多数动词都将被标记为“ NN”。

因此,我想修改brill标记器中的规则,并根据我的烹饪动词列表更改标记。例如:如果在“ IN”之前没有“ VB”,并且在“ IN”之前没有标记,并且在我的烹饪动词列表中标记为“ NN”,则将“ NN”更改为“ VB”。

但是,我不知道如何在brill标记器中插入自己的规则(特别是,我正在查看nltk源代码:https://www.nltk.org/_modules/nltk/tbl/template.html)。有人可以帮忙吗?

谢谢!

0 个答案:

没有答案