我正在尝试使用senti_synset对歌词进行情感分析。在对歌词进行预处理并对其进行POS标记后,我想为每个单词调用sentisynset。 我将所有标记的单词以及它们的(转换为与sentisynset匹配)POSTAG放在列表中。但是,我无法弄清楚这样做的语法。
Sentisynset希望使用这种语法(取自nltk网站):
ie breakdown = swn.senti_synset('breakdown.n.03')
表示第一个参数是(词义化的)单词,第二个参数是postag(名词),第三个参数与算法的深度有关。 我无法遍历列表中的项目并在每个项目中使用senti_synset。如果我尝试创建与上述语法匹配的字符串,例如
str="'"+tagged_words[0][0]+'.'+newtags[0]+".03"+"'"
sentiment=swn.senti_synset(str)
这会导致错误
“ ValueError:以10为底的int()的无效文字:” 03'“” 我尝试了其他几种方法来产生相同的字符串,但是我无法克服这个错误。 感谢您的阅读。