标签: lemmatization
因此,我开始研究nltk,并找到了一种使用WordNetLemmatizer()对词进行词法化的方法。有些词没有被适当地修饰。示例-“更好”应该产生“好”而不是“更好”
from nltk.stem.wordnet import WordNetLemmatizer lmtzr = WordNetLemmatizer() print(lmtzr.lemmatize('better'))
输出:更好
输出应该是:good
有没有其他方法使lemmatize()单词?