如何计算语句中单词的极性......如
"我成功地完成了这项任务,但徒劳无功。
每个单词的得分如何? (比如 - 成功 - 0.7完成 - 0.8但是 - -0.5 徒劳 - - 0.8) 怎么计算?每个单词的价值或分数如何?什么是落后的东西?由于我正在进行情绪分析,所以我很清楚这一点。如果有人帮忙,那就太棒了。提前谢谢
答案 0 :(得分:0)
如果您愿意使用Python和NLTK,请查看Vader(http://www.nltk.org/howto/sentiment.html并跳至维达部分)
答案 1 :(得分:0)
单个单词的分数可以来自预定义的单词列表,例如ANEW,General Inquirer,SentiWordNet,LabMT或我的AFINN。个别专家都为他们或学生或亚马逊机械土耳其工人打分。显然,这些分数并不是最终的真理。
单词分数也可以通过带注释文本的监督学习来计算,或者可以从单词本体或共现模式中估计单词分数。
对于单个词的聚合,有各种方法。一种方法是将所有单个分数(化合价)相加,另一种方法是将单词中的最大化合价,三分之一归一化(除以)单词的数量或得分单词的数量(即获得平均分数) ), - 或除以该数字的平方根。结果可能略有不同。 我用我的AFINN单词列表进行了一些评估:http://www2.imm.dtu.dk/pubdb/views/edoc_download.php/6028/pdf/imm6028.pdf
另一种方法是使用Richard Socher的模型等递归模型。单个词的情感值以树状结构聚合,并且应该发现"但是徒劳的" - 部分应该承载最多的权重。