应用错误收集

在文本挖掘中区分主语和谓词的情绪

时间：2013-09-16 06:29:12

标签： text-mining sentiment-analysis

我正在尝试搜索有关文本挖掘的文献，专门用于确定句子中主语和宾语的情感。例如，我可以有一句话“爱丽丝得分比鲍勃好得多”，或者“爱丽丝的收益是鲍勃的损失”，或者“爱丽丝的问题是鲍勃的机会”。

在每一个中，句子对Alice和Bob都有不同的看法。

我的问题是：我应该使用什么一般术语来搜索关于确定对主题或客体方面的情感的文献？对此有很好的参考吗？

问题2：许多这样的句子都使用了撇号。是否有一种标准的一次通过技术来改变句子，从“爱丽丝的好作品被欣赏”到“爱丽丝的好作品受到赞赏”？通常，tokenizer和lemmatizer阶段似乎删除了撇号。我可以看到做出POS的双通技术，确定“爱丽丝”和“好工作”之间的关系并执行转换，然后再做POS。我想知道是否有更简单的方法。

1 个答案:

答案 0 :(得分：1)

情绪分析中使用的一般术语是“比较句”。这是一篇博文，介绍不同的情绪分析API如何处理比较句：https://blog.bitext.com/comparing-apis-example-2

重新。问题2.你最好不要改变原来的句子。您可以使用依赖项解析器，例如Stanford解析器。它将为您提供单词之间的句法关系，根据这些单词，您将能够识别“X的Y”和“Y的X”之间的相似性，并找出哪些单词填写“X是任何比较形容词”比Y“。