Question

我试图找出特定句子中的词性。我尝试使用下面给出的代码

from nltk import word_tokenize
import nltk.data
a=raw_input()
text = word_tokenize(a)
pairs=nltk.pos_tag(text)
print pairs

但它总是将'删除'显示为JJ（形容词），它应该是动词。我该如何改进代码？提前致谢

Answer 1

首先，您应该获得正确标记句子的语料库（如上所述）。只是增加你的nltk_data文件夹中的一些语料库可能已经很有用了。要从中训练自己的标记器，请参阅：http://nltk-trainer.readthedocs.org/en/latest/train_tagger.html