如何解决情绪分析中的歧义?

时间:2018-05-15 03:35:31

标签: text-mining sentiment-analysis naivebayes

我对文本挖掘很陌生,我正在挑战自己今天进行情绪分析。但在进行情绪分析时我遇到了一些问题。 在我的语言中,一个词可以有一些不同的含义。像“setan”意思是:1)恶魔2)诅咒的话。如何解决情绪分析中的这种模糊性? 同样对于每个人的信息,我使用的算法是朴素的贝叶斯分类器。对于这些工具,我使用的是RapidMiner。 我需要你的帮助。任何提示都会很棒。谢谢!

1 个答案:

答案 0 :(得分:3)

在朴素贝叶斯分类器上训练您的数据将使模型为您尝试分类的每个不同类别分配每个单词的概率。在您的情况下,由于它的情绪分析,如果您有两个类的正面和负面,那么 setan 有可能是正面和负面。

记住这一点,如果一个词有多种含义可以解释正面和负面的情绪,我会说确保在你的数据中包含这两种实例,以便在训练模型时使用相应的概率将新文本分类为正面或负面类。

在你的情况下,似乎 setan 的含义都有负面含义,这不应该是一个问题。喜欢""," a"在正面和负面的情况下都存在着名的停用词应该被删除,因为它们并不真正计入分类。

在您的情况下,如果您尝试使用其具体含义训练模型,您可以参考本文https://pdfs.semanticscholar.org/fc01/b42df3077a512620456d8a2714951eccbd67.pdf