句子与文档级别分析的最佳词典

时间:2018-07-25 13:55:34

标签: nlp nltk sentiment-analysis lexicon

用于文档级和句子级分析的最佳词典是什么?我目前正在使用Vader进行句子级别的分析,但是我担心,当我移至文档级别时,Vader的表现可能不如其他。

与帖子here类似的问题,但更具体。

1 个答案:

答案 0 :(得分:1)

除了链接文章中列出的情感词典外,我还可以推荐一个Finn情感词典。

对于情感分析,仅取决于lexica可能不是最佳解决方案,尤其是在文档级别上。语言是如此灵活,以至于它的属性和概念(除了充满情感的词汇之外)都会深深地影响语义。

一些核心概念是对比性的劝阻标记(尤其是在文档级别),否定和情态。

  • 话语对比标记

文档中存在着既有优点又有缺点的观点,我们通过“但是”,“不过”等标记将这些观点联系起来,以传达含义或想法。对于一袋单词的方法,下面的句子被相同地对待,但是如果人们用一个标签来注释他们的情感,他们可能不会使用相同的标签来注释他们:

The laptop has amazing features, but its screen is killing me.
The laptop's screen is killing me, but it has amazing features.

通常,我们用“ but”之后的子句来评估这类句子或段落。其他有影响力的劝阻标记也有其自己的语义。这是在一个称为“障碍分析”的区域中进行检查的。

  • 否定与情态

这些概念也改变了语义。因此,在两个层面上都不能忽视它们。有研究和论文将否定词和情态词与词法词汇结合使用。您可以在“情感分析的否定和情态”中用Google搜索它,看看能做什么。

最后我建议,如果您具有特定于域的数据集,则可以使用远程监管来构建自己的词典。

希望这会有所帮助,

欢呼