我需要一个正面和负面单词列表,其中权重根据单词的强度和周数分配给单词。我有:
1。)WordNet - 它为每个单词提供+或 - 分数。
2。)SentiWordNet - 给出[0,1]范围内的正负值。
我用几句话检查了这些,
爱 - wordNet给出了名词和动词的0.0,我不知道为什么我认为它至少应该是积极因素。
压制 - wordNet给出-9.93我需要一些帮助来决定使用哪一个。
感谢。
答案 0 :(得分:2)
程度和/或极性通常取决于领域和/或背景,因此单单这个词并不足以做出决定。
如果您有一些带注释的数据,我建议使用两个资源提供的分数作为特征来训练分类器。如果不这样做,一种选择是使用与所讨论的域匹配的可用情感注释语料库之一。在没有任何数据的情况下,整个任务变得有些棘手,尽管在无监督的情感分类方法方面有大量工作,我相信,例如, Unsupervised Sentiment Analysis
答案 1 :(得分:1)
如果您认为SentiWordNet错误,有一个界面可以给出不同的意见: http://sentiwordnet.isti.cnr.it/search.php?q=repose
我下载了最新的Wordnet 3.1,并检查了file format documentation,但没有看到您提到的情绪数字。它也没有显示在online search。
中因此,出于这两个原因,我建议选择SentiWordNet!
(我看到你的问题已经有一年了,所以也许你可以告诉我们你做了什么,为什么?)
答案 2 :(得分:-1)
极性程度不仅取决于单独的单词,还取决于句子或短语的背景。 因此,如果对于同一个单词有不同的结果,则是因为上下文中的差异。