应用错误收集

情感分析（意见挖掘）中最具挑战性的问题是什么？

时间：2011-01-26 15:15:34

标签： nlp sentiment-analysis

意见挖掘/情感分析是自然语言处理的一个近期的子任务。有些人将其与文本分类进行比较，有些人对此采取了更为深刻的立场。您如何看待情感分析（意见挖掘）中最具挑战性的问题？你能举几个名字吗？

4 个答案:

答案 0 :(得分：19)

情绪分析的主要挑战是： -

1）命名实体识别 - 实际谈论的人是什么，例如300斯巴达人是一群希腊人还是一部电影？

2）回指解决 - 解决代词或名词短语所指的问题。 “我们观看了这部电影，然后去吃饭;这太可怕了。” “它”指的是什么？

3）解析 - 句子的主语和宾语是什么，动词和/或形容词实际上指的是哪一个？

4）讽刺 - 如果你不认识作者，你不知道“坏”是否意味着坏或好。

5）Twitter - 缩写，缺乏大写，拼写错误，标点差，语法差，......

答案 1 :(得分：2)

我同意Hightechrider的观点，那就是情感分析准确性可以改善的领域。我还要补充一点，大多数情况下，情感分析倾向于在封闭域文本上进行。尝试在开放域文本上进行操作通常会产生非常糟糕的准确性/ F1测量/你有什么或者它是伪开放域，因为它只关注某些语法结构。因此，我会说主题敏感的情绪分析能够识别背景并根据这一点做出决策，这是研究（和行业产品）的一个令人兴奋的领域。

我还将他的第五点从Twitter扩展到其他社交媒体网站（例如Facebook，Youtube），其中短语，不合语法的话语是司空见惯的。

答案 2 :(得分：1)

我认为答案是语言复杂性，语法错误和拼写错误。人们有很多方式表达意见，例如，讽刺可能被错误地解释为非常积极的情绪。

答案 3 :(得分：0)

这个问题可能过于笼统，因为有几种类型的情绪分析（文档级别，句子级别，比较情绪分析等），每种类型都有一些特定的问题。

一般来说，我同意@Ian Mercer的答案，我还会补充其他3个问题：

如何更深入地发现情绪/情绪。正面和负面是一个非常简单的分析，其中一个挑战是如何提取情感，如内心有多讨厌，多少幸福，多少悲伤等等。
如何检测意见为正的对象以及意见为负的对象。例如，如果你说＆＃34;她赢了他！＆＃34;，这意味着对她的积极情绪和对他的负面情绪。
如何分析非常主观的句子或段落。有时甚至对人类而言，很难就这种高主观文本的情感达成一致。想象一下电脑......