用于文档级和句子级分析的最佳词典是什么?我目前正在使用Vader进行句子级别的分析,但是我担心,当我移至文档级别时,Vader的表现可能不如其他。
与帖子here类似的问题,但更具体。
答案 0 :(得分:1)
除了链接文章中列出的情感词典外,我还可以推荐一个Finn情感词典。
对于情感分析,仅取决于lexica可能不是最佳解决方案,尤其是在文档级别上。语言是如此灵活,以至于它的属性和概念(除了充满情感的词汇之外)都会深深地影响语义。
一些核心概念是对比性的劝阻标记(尤其是在文档级别),否定和情态。
文档中存在着既有优点又有缺点的观点,我们通过“但是”,“不过”等标记将这些观点联系起来,以传达含义或想法。对于一袋单词的方法,下面的句子被相同地对待,但是如果人们用一个标签来注释他们的情感,他们可能不会使用相同的标签来注释他们:
The laptop has amazing features, but its screen is killing me.
The laptop's screen is killing me, but it has amazing features.
通常,我们用“ but”之后的子句来评估这类句子或段落。其他有影响力的劝阻标记也有其自己的语义。这是在一个称为“障碍分析”的区域中进行检查的。
这些概念也改变了语义。因此,在两个层面上都不能忽视它们。有研究和论文将否定词和情态词与词法词汇结合使用。您可以在“情感分析的否定和情态”中用Google搜索它,看看能做什么。
最后我建议,如果您具有特定于域的数据集,则可以使用远程监管来构建自己的词典。
希望这会有所帮助,
欢呼