在nltk的语气(情感)分析中,我怎样才能在量表上有一个弱/强情绪的指标?

时间:2017-04-09 16:20:33

标签: python nltk sentiment-analysis emotion

有一个像“单剂量”这样的文本,我的python程序返回一个各种情绪的概率字典,如

<>

(使用NaiveBayes分类器和一组训练数据)

然而,如你所见,这段文字中并没有任何强烈的情感。 因此,我需要另一本词典来表明每种情绪的强弱程度。

作为客户评论的另一个例子,我希望它能为“操这个”返回一个强烈的情绪指标,而不是“meh”的弱情绪指标。 但更多的是我不想标记事实句子就像“我星期六买了这个”

我没有尝试任何东西,因为我没有找到任何线索。我唯一希望的是,我将上面的字典直接转换为具有弱点/强度等级的另一个字典,并为此目的避免单独的培训和分类过程。

另一件事是上面字典中的概率总和是1,但在我理想的输出中,它不一定是1.(即标准化的)

任何想法都表示赞赏。

1 个答案:

答案 0 :(得分:0)

如果你检查nltk Naive Bayes分类器的代码:

http://www.nltk.org/_modules/nltk/classify/naivebayes.html

您将看到通过此调用将分数标准化:

return DictionaryProbDist(logprob, normalize=True, log=True)

如果为normalize = False更改该行,您将获得原始概率。