将tagger设置为使用CLAWS7而不是默认nltk.pos_tag

时间:2014-08-08 15:28:58

标签: python nlp nltk pos-tagger

如何设置我的标记器以使用CLAWS7标记集?我没有找到导入它的方法,我得到的意思是无法更改nltk.pos_tag函数。

1 个答案:

答案 0 :(得分:0)

nltk的pos_tag函数只加载并使用特定的已保存标记器,因此确实无法更改。但是训练你自己的标记器并不是很难,你可以使用它。您只需要一个标有CLAWS7标记集的大型语料库,以及等待训练的时间。 NLTK书中的Chapter 5引导您完成创建标记器的过程。