意见挖掘/情感分析是自然语言处理的一个近期的子任务。有些人将其与文本分类进行比较,有些人对此采取了更为深刻的立场。您如何看待情感分析(意见挖掘)中最具挑战性的问题?你能举几个名字吗?
答案 0 :(得分:19)
情绪分析的主要挑战是: -
1)命名实体识别 - 实际谈论的人是什么,例如300斯巴达人是一群希腊人还是一部电影?
2)回指解决 - 解决代词或名词短语所指的问题。 “我们观看了这部电影,然后去吃饭;这太可怕了。” “它”指的是什么?
3)解析 - 句子的主语和宾语是什么,动词和/或形容词实际上指的是哪一个?
4)讽刺 - 如果你不认识作者,你不知道“坏”是否意味着坏或好。
5)Twitter - 缩写,缺乏大写,拼写错误,标点差,语法差,......答案 1 :(得分:2)
我同意Hightechrider的观点,那就是情感分析准确性可以改善的领域。我还要补充一点,大多数情况下,情感分析倾向于在封闭域文本上进行。尝试在开放域文本上进行操作通常会产生非常糟糕的准确性/ F1测量/你有什么或者它是伪开放域,因为它只关注某些语法结构。因此,我会说主题敏感的情绪分析能够识别背景并根据这一点做出决策,这是研究(和行业产品)的一个令人兴奋的领域。
我还将他的第五点从Twitter扩展到其他社交媒体网站(例如Facebook,Youtube),其中短语,不合语法的话语是司空见惯的。
答案 2 :(得分:1)
我认为答案是语言复杂性,语法错误和拼写错误。人们有很多方式表达意见,例如,讽刺可能被错误地解释为非常积极的情绪。
答案 3 :(得分:0)
这个问题可能过于笼统,因为有几种类型的情绪分析(文档级别,句子级别,比较情绪分析等),每种类型都有一些特定的问题。
一般来说,我同意@Ian Mercer的答案,我还会补充其他3个问题: