我目前正在制作用于书评的情绪分析器。我使用micro-WNOP而不是wordnet,因为它只包含与意见相关的同义词。 这是我的代码示例
while(z<len(lines)): #lines is an array where each element is a sentence
word=lines[z]
wor=nltk.word_tokenize(word)
result=nltk.pos_tag(wor)
while(x<len(result)):
#token converts Penn Treebank POS tags to wordnet tags
result[x]=result[x][0] + token(result[x][1])
x+=1
lines[z]=result
z+=1
x=0
我的问题是,虽然我可以将单词标记为名词,动词等,但我无法得到该单词的正确定义,即真实可能意味着真实或有形。这是一个问题,因为micro-MNOP的格式如下: 真实的#a#2,其中#a告诉我们它是一个形容词,#2意味着它是第二个定义。
我甚至确定这是可能的,但如果是的话,如果有人能指出我正确的方向,我将不胜感激。
我在哪里找到了micro-MNOP:http://www-3.unipv.it/wnop/