多类分类和不平衡数据集

时间:2014-11-30 22:57:31

标签: classification svm libsvm

我有一个五级SVM多类问题。数据集很小(大约160个例子)并且是不平衡的,即我有几个例子的类。到目前为止,我进一步将数据集限制为110个示例,以便使用平衡训练集...这是正确的方法吗?或者我应该使用不平衡的训练集?后一种情况有什么好处?提前谢谢!

1 个答案:

答案 0 :(得分:1)

减少一小组是一个坏主意。保留所有样品。如果类是可分的,一切都很好。如果没有,你可以使用'权重'功能来提升几乎没有代表性的类。