有一个像“单剂量”这样的文本,我的python程序返回一个各种情绪的概率字典,如
<>
(使用NaiveBayes分类器和一组训练数据)
然而,如你所见,这段文字中并没有任何强烈的情感。 因此,我需要另一本词典来表明每种情绪的强弱程度。
作为客户评论的另一个例子,我希望它能为“操这个”返回一个强烈的情绪指标,而不是“meh”的弱情绪指标。 但更多的是我不想标记事实句子就像“我星期六买了这个”
我没有尝试任何东西,因为我没有找到任何线索。我唯一希望的是,我将上面的字典直接转换为具有弱点/强度等级的另一个字典,并为此目的避免单独的培训和分类过程。
另一件事是上面字典中的概率总和是1,但在我理想的输出中,它不一定是1.(即标准化的)
任何想法都表示赞赏。
答案 0 :(得分:0)
如果你检查nltk Naive Bayes分类器的代码:
http://www.nltk.org/_modules/nltk/classify/naivebayes.html
您将看到通过此调用将分数标准化:
return DictionaryProbDist(logprob, normalize=True, log=True)
如果为normalize = False更改该行,您将获得原始概率。