我试图找出特定句子中的词性。我尝试使用下面给出的代码
from nltk import word_tokenize
import nltk.data
a=raw_input()
text = word_tokenize(a)
pairs=nltk.pos_tag(text)
print pairs
但它总是将'删除'显示为JJ(形容词),它应该是动词。 我该如何改进代码? 提前致谢
答案 0 :(得分:0)
首先,您应该获得正确标记句子的语料库(如上所述)。只是增加你的nltk_data文件夹中的一些语料库可能已经很有用了。要从中训练自己的标记器,请参阅:http://nltk-trainer.readthedocs.org/en/latest/train_tagger.html