情感分析有3个类别(正面,中立和负面)?

时间:2017-11-15 21:29:37

标签: python scikit-learn sentiment-analysis multiclass-classification

我想用3个类(正面,中立和负面)进行情绪分析。我已经看到很多关于情感分析的工作有两个类(正面和负面),但对于三个类则更少。如果我想在Scikit-learn中使用词袋方法和分类器(如Logistic回归或SVM),这将如何工作?我的输出用3个类预测的步骤是什么?

我是否必须将每个类视为二进制分类并执行某些操作来组合结果,或者是否能够为我做一些处理,所以我不必指定它?

1 个答案:

答案 0 :(得分:1)

有三种可能的方法:

  1. 使用multiclass algorithms,例如逻辑回归或决策树(它们本身就是多类),或者用于二进制算法(如SVM)的一对一或一对一的包装。
  2. 如果你想利用中性文本是"介于"之间的事实。正面和负面的,您可以使用有序的分类模型,例如mord包中的有序逻辑回归。
  3. 如果你想利用类的排序,但希望保持在scikit-learn中,我建议首先将任何回归模型拟合到你的数据中(例如梯度回归模型),然后在其顶部使用逻辑回归预测。