情感分析(意见挖掘)中最具挑战性的问题是什么?

时间:2011-01-26 15:15:34

标签: nlp sentiment-analysis

意见挖掘/情感分析是自然语言处理的一个近期的子任务。有些人将其与文本分类进行比较,有些人对此采取了更为深刻的立场。您如何看待情感分析(意见挖掘)中最具挑战性的问题?你能举几个名字吗?

4 个答案:

答案 0 :(得分:19)

情绪分析的主要挑战是: -

1)命名实体识别 - 实际谈论的人是什么,例如300斯巴达人是一群希腊人还是一部电影?

2)回指解决 - 解决代词或名词短语所指的问题。 “我们观看了这部电影,然后去吃饭;这太可怕了。” “它”指的是什么?

3)解析 - 句子的主语和宾语是什么,动词和/或形容词实际上指的是哪一个?

4)讽刺 - 如果你不认识作者,你不知道“坏”是否意味着坏或好。

5)Twitter - 缩写,缺乏大写,拼写错误,标点差,语法差,......

答案 1 :(得分:2)

我同意Hightechrider的观点,那就是情感分析准确性可以改善的领域。我还要补充一点,大多数情况下,情感分析倾向于在封闭域文本上进行。尝试在开放域文本上进行操作通常会产生非常糟糕的准确性/ F1测量/你有什么或者它是伪开放域,因为它只关注某些语法结构。因此,我会说主题敏感的情绪分析能够识别背景并根据这一点做出决策,这是研究(和行业产品)的一个令人兴奋的领域。

我还将他的第五点从Twitter扩展到其他社交媒体网站(例如Facebook,Youtube),其中短语,不合语法的话语是司空见惯的。

答案 2 :(得分:1)

我认为答案是语言复杂性,语法错误和拼写错误。人们有很多方式表达意见,例如,讽刺可能被错误地解释为非常积极的情绪。

答案 3 :(得分:0)

这个问题可能过于笼统,因为有几种类型的情绪分析(文档级别,句子级别,比较情绪分析等),每种类型都有一些特定的问题。

一般来说,我同意@Ian Mercer的答案,我还会补充其他3个问题:

  • 如何更深入地发现情绪/情绪。正面和负面是一个非常简单的分析,其中一个挑战是如何提取情感,如内心有多讨厌,多少幸福,多少悲伤等等。
  • 如何检测意见为正的对象以及意见为负的对象。例如,如果你说"她赢了他!",这意味着对她的积极情绪和对他的负面情绪。
  • 如何分析非常主观的句子或段落。有时甚至对人类而言,很难就这种高主观文本的情感达成一致。想象一下电脑......