如何使用imdb Movie_Reviews语料库在SVM分类(NLP)中实现否定特征

时间:2015-01-07 11:36:01

标签: python nlp scikit-learn nltk svm

我试图了解NLP中的否定功能,所以我想实现它。 我正在研究imdb电影评论数据集。 考虑我的数据如下 -

Movie was great but it's overly sentimental and at times terribly mushy , not to mention very manipulative but great action

从上面我可以提取它过分多愁善感,有时甚至是非常糊涂作为否定陈述,现在我留下了这些选择 -

  • 我提取特定的行,直到它以一些标点符号结束 我只是从肯定的语句中删除这一行并运行SVM分类器 其余的内容。
  • 我提取特定的行并用负和标记该行 将其添加到否定语句列表中以进行训练。

我不确定我在这里做了什么,所以请确切地说明我应该如何处理否定功能来即兴分类。

我正在使用scikit-learn svm.SVC()分类器

1 个答案:

答案 0 :(得分:1)

您可以使用否定检查此NRC Sentiment Analysis系统以进行文本分类。它解释得非常好。他们还声称他们的SemEval 2014 submission在否定处理方面有重大改进(我仍然无法阅读)。

我认为你在电影评论中解决了类似的任务,所以这一定是你正在寻找的。