如何使用NLTK(pos标记)获得动词的不定式形式

时间:2012-03-18 23:51:44

标签: python nltk part-of-speech

我正在尝试使用NLTK和Python学习自然语言处理(英语)。 有没有办法在POS标记期间或之后获得动词的不定式形式。

例如:

  • 是(VBZ)=>是
  • 提供(VBN)=>提供
  • 使用(VBG)=>使用

1 个答案:

答案 0 :(得分:15)

关闭,你需要在开头添加'to':

>>> from nltk.stem.wordnet import WordNetLemmatizer
>>> lemmatizer = WordNetLemmatizer()
>>> lemmatizer.lemmatize('is', 'v')
'be'
>>> lemmatizer.lemmatize('provided', 'v')
'provide'
>>> lemmatizer.lemmatize('using', 'v')
'use'