使用Lingpipe识别情绪分析中的实体

时间:2011-09-29 08:05:53

标签: nlp machine-learning sentiment-analysis

我使用Lingpipe的情绪分析模块实现了情绪分析。我知道他们使用动态LR模型。它只是告诉我测试字符串是积极情绪还是负面情绪。我可以用什么想法来确定表达情绪的对象?

如果文本被归类为积极情绪,我希望得到表达情绪的对象 - 这可能是电影名称,产品名称或其他。

2 个答案:

答案 0 :(得分:4)

虽然这个问题真的很陈旧,但我想为别人的利益回答这个问题。

您想要的是概念级别情绪分析。对于非常基本的版本,我建议您按照以下步骤操作:

  1. 应用句子分割器。您可以使用Lingpipe的Sentence Splitter或OpenNLP Sentence Detector。

  2. 应用部分拼写标记。您可以再次使用Lingpipe的POS标记器或OpenNLP POS Tagger。

  3. 然后,您需要识别POS标记器标识为“ Nouns ”的标记。这些令牌有可能成为句子中的目标实体。

  4. 然后你需要在句子中找到感情词。最简单的方法是使用带有词语的情感词典。你可以在网上找到很多这样的词典。

  5. 下一步是找出句子中的依赖关系。这可以通过使用Stanford Dependency Parser来实现。例如,如果您在online demo中尝试使用“此手机很好。”这句话,您可以看到以下“已键入的依赖关系”:

    det(phone-2,This-1), nsubj(good-4,phone-2), 警察(good-4,is-3), root(ROOT-0,good-4)

    此处依赖 nsubj(good-4,phone-2)表示电话是令牌的名义主题 ,暗示电话表示良好这个词。我确信您的情感词典将包含良好这个词,并且手机将被POS标记器识别为名词。因此,您可以得出结论,实体电话表达了情感良好

  6. 这是一个非常基本的例子。您可以更进一步,围绕依赖关系创建规则,以提取更复杂的情感 - 实体对。您还可以为您的情绪条款指定分数,并根据该句中情感词的出现次数得出句子的总分。

答案 1 :(得分:0)

通常情感句子意味着这种句子的主要实体是该情绪的对象。所以基本的启发式是NER并得到第一个对象。否则,您应该使用深度解析NLP工具包并编写一些规则来将情绪链接到对象。