应用错误收集

如何计算句子的极性??? （在情绪分析中）

时间：2016-04-20 09:51:58

标签： nlp text-mining sentiment-analysis

如何计算语句中单词的极性......如

＆＃34;我成功地完成了这项任务，但徒劳无功。

每个单词的得分如何？（比如 - 成功 - 0.7完成 - 0.8但是 - -0.5 徒劳 - - 0.8）怎么计算？每个单词的价值或分数如何？什么是落后的东西？由于我正在进行情绪分析，所以我很清楚这一点。如果有人帮忙，那就太棒了。提前谢谢

2 个答案:

答案 0 :(得分：0)

如果您愿意使用Python和NLTK，请查看Vader（http://www.nltk.org/howto/sentiment.html并跳至维达部分）

答案 1 :(得分：0)

单个单词的分数可以来自预定义的单词列表，例如ANEW，General Inquirer，SentiWordNet，LabMT或我的AFINN。个别专家都为他们或学生或亚马逊机械土耳其工人打分。显然，这些分数并不是最终的真理。

单词分数也可以通过带注释文本的监督学习来计算，或者可以从单词本体或共现模式中估计单词分数。

对于单个词的聚合，有各种方法。一种方法是将所有单个分数（化合价）相加，另一种方法是将单词中的最大化合价，三分之一归一化（除以）单词的数量或得分单词的数量（即获得平均分数））， - 或除以该数字的平方根。结果可能略有不同。我用我的AFINN单词列表进行了一些评估：http://www2.imm.dtu.dk/pubdb/views/edoc_download.php/6028/pdf/imm6028.pdf

另一种方法是使用Richard Socher的模型等递归模型。单个词的情感值以树状结构聚合，并且应该发现＆＃34;但是徒劳的＆＃34; - 部分应该承载最多的权重。