情绪分析 - wordNet,sentiWordNet词典

时间:2012-10-13 02:02:13

标签: nlp text-mining wordnet sentiment-analysis

我需要一个正面和负面单词列表,其中权重根据单词的强度和周数分配给单词。我有:

1。)WordNet - 它为每个单词提供+或 - 分数。

2。)SentiWordNet - 给出[0,1]范围内的正负值。

我用几句话检查了这些,

爱 - wordNet给出了名词和动词的0.0,我不知道为什么我认为它至少应该是积极因素。

压制 - wordNet给出-9.93
         - SentiWordNet给出了pos和neg的0.0。 (应该是否定的)

休息 - wordNet - 2.488
         - SentiWordNet - {pos - 0.125,neg - 0.5}(应该是正面的)

我需要一些帮助来决定使用哪一个。

感谢。

3 个答案:

答案 0 :(得分:2)

程度和/或极性通常取决于领域和/或背景,因此单单这个词并不足以做出决定。

如果您有一些带注释的数据,我建议使用两个资源提供的分数作为特征来训练分类器。如果不这样做,一种选择是使用与所讨论的域匹配的可用情感注释语料库之一。在没有任何数据的情况下,整个任务变得有些棘手,尽管在无监督的情感分类方法方面有大量工作,我相信,例如, Unsupervised Sentiment Analysis

答案 1 :(得分:1)

如果您认为SentiWordNet错误,有一个界面可以给出不同的意见:   http://sentiwordnet.isti.cnr.it/search.php?q=repose

我下载了最新的Wordnet 3.1,并检查了file format documentation,但没有看到您提到的情绪数字。它也没有显示在online search

因此,出于这两个原因,我建议选择SentiWordNet!

(我看到你的问题已经有一年了,所以也许你可以告诉我们你做了什么,为什么?)

答案 2 :(得分:-1)

极性程度不仅取决于单独的单词,还取决于句子或短语的背景。 因此,如果对于同一个单词有不同的结果,则是因为上下文中的差异。