多类分类中的类不平衡问题

时间:2013-06-11 21:15:09

标签: python matlab classification svm

我需要一个多类分类器代码,它可以在以下类不平衡问题中工作:

  • 1级 - > 80%
  • 第2类 - > 7.5%
  • 3级 - > 6%
  • 第4类 - > 4%
  • 第5类 - > 2.5%

总共只有130个实例,每个实例大约有5000个功能。

我发现了一个多类SVM代码,但我认为它没有考虑到类不平衡问题。此外,我还需要进行某种k折叠交叉验证。

python或matlab代码确实会有所帮助。

1 个答案:

答案 0 :(得分:1)

我相信大多数想要在MATLAB中使用SVM的人都使用libSVM,它有一个MATLAB接口。它处理多类问题。 5000个功能和130个实例应该没问题。

我不确定您是否想要使用班级权重/先验或使用成本敏感型学习来对待您的班级不平衡,但您可以通过一些额外的工作来实现,请参阅here和{{3对于一些想法。

使用统计工具箱中的cvpartition可以在MATLAB中实现k-fold交叉验证(即使您没有统计Tolbox,也很容易编码)。