“红色”一词被识别为动词。 我相信这是因为它认为它是遵循这种模式的。 在模式中,带有'-ed'后缀的单词是动词...或类似的东西。
如何制作例外或解决此问题。以后可能会出现其他的话。
def LanguageTokenize(read):
read = word_tokenize(read)
read = nltk.pos_tag(read)
return read
>>> LanguageTokenize('the red cat')
*returns [('the', 'DT'), ('red', 'VBN'), ('cat', 'NN')]