使用nltk查找句子中每个单词的正确定义

时间:2015-03-11 18:49:56

标签: python nltk wordnet

我目前正在制作用于书评的情绪分析器。我使用micro-WNOP而不是wordnet,因为它只包含与意见相关的同义词。 这是我的代码示例

while(z<len(lines)): #lines is an array where each element is a sentence
  word=lines[z]
  wor=nltk.word_tokenize(word)
  result=nltk.pos_tag(wor)
  while(x<len(result)):
      #token converts Penn Treebank POS tags to wordnet tags
      result[x]=result[x][0] + token(result[x][1])
      x+=1
  lines[z]=result
  z+=1
  x=0

我的问题是,虽然我可以将单词标记为名词,动词等,但我无法得到该单词的正确定义,即真实可能意味着真实或有形。这是一个问题,因为micro-MNOP的格式如下: 真实的#a#2,其中#a告诉我们它是一个形容词,#2意味着它是第二个定义。

我甚至确定这是可能的,但如果是的话,如果有人能指出我正确的方向,我将不胜感激。

我在哪里找到了micro-MNOP:http://www-3.unipv.it/wnop/

0 个答案:

没有答案